python—多协程爬取斗鱼高颜值美女图片

程序员文章站 2022-06-04 15:14:14

1 import requests 2 from bs4 import BeautifulSoup 3 from urllib import request 4 # import threading 5 import gevent 6 from gevent import monkey 7 8 mo... ......

 1 import requests
 2 from bs4 import beautifulsoup
 3 from urllib import request
 4 # import threading
 5 import gevent
 6 from gevent import monkey
 7 
 8 monkey.patch_all()
 9 
10 def get_html_text(url):
11     try:
12         r = requests.get(url, timeout=10)
13         r.raise_for_status()
14         r.encoding = r.apparent_encoding
15         return r.text
16     except exception as result:
17         print('错误类型：', result)
18 
19 
20 def html_text_parser(img_list, html):
21     soup = beautifulsoup(html, 'html.parser')
22     for link in soup.find_all('img'):
23         link = link.get('data-original')  #link.get('key')--->>获取属性值
24         if link:
25             img_list.append(link)
26     return img_list
27 
28 
29 def get_douyu_img(img_list):
30     for i,j in enumerate(img_list):
31         # name = j.split('.')[-1]
32         r = request.urlopen(j)
33         ima_content = r.read()
34         path = str(i)
35         with open(path, 'wb') as f:
36             f.write(ima_content)
37 
38 def main():
39     url = 'https://www.douyu.com/g_yz'
40     html = get_html_text(url)
41     img_list = list()
42     img_list = html_text_parser(img_list, html)
43     # print(img_list)
44     #t1 = threading.thread(target=get_html_text, args=(url,))
45     #t2 = threading.thread(target=html_text_parser, args=(img_list,html))
46     #t3 = threading.thread(target=get_douyu_img, args=(img_list,))
47     #t1.start()
48     #t2.start()
49     #t3.start()
50     gevent.joinall([
51         gevent.spawn(get_html_text, url),
52         gevent.spawn(html_text_parser, img_list, html),
53         gevent.spawn(get_douyu_img, img_list)
54     ])
55 
56 
57 if __name__ == '__main__':
58     main()




备注:
我一次性爬取了239张高颜值美女图片
权当娱乐，分享诸位
完全自己自学自练，欢迎指正。

上一篇： Electron打包vue项目成exe桌面应用程序

下一篇：冬季缺水肌肤燥 4款药膳变水嫩

python—多协程爬取斗鱼高颜值美女图片

python—多协程爬取斗鱼高颜值美女图片-2.0版本

python—多协程爬取斗鱼高颜值美女图片

知乎大神用Python爬取高颜值美女（爬虫+人脸检测+颜值检测）

听说知乎大神用python爬取高颜值美女,是怎么操作的？

python—多协程爬取斗鱼高颜值美女图片

知乎大神用Python爬取高颜值美女（爬虫+人脸检测+颜值检测）

python—多协程爬取斗鱼高颜值美女图片-2.0版本

听说知乎大神用python爬取高颜值美女,是怎么操作的？