Python爬虫爬图片需要什么
Python爬虫爬图片需要什么?下面用两种方法制作批量爬取网络图片的方法:
第一种方法:基于urllib实现
要点如下:
1.url_request = request.Request(url)
2.url_response = request.urlopen(url) 或者 url_response = request.urlopen(url_request)
3.data=url_response .read().decode('utf-8')
4.jpglist=re.findall(正则表达式,data)
5.request.urlretrieve(jpgUrl,'%s.jpg' %n) #下载,第一个参数网址,第二参数名称
相关推荐:《Python视频教程》
第一个案例,我们爬取了猫扑上的一个网页上的图片,案例代码如下。
需要说明的是代码request.urlretrieve(each,'pic2\\%s.jpg' %n)中“pic2\\”代表下载的图片放置在提前建好的文件夹pic2里。运行代码结束之后IDLE和最后结果如下图所示。
第二种实现方法:基于requests实现
要点如下:
1.data=requests.get(url).text
2.jpglist=re.findall(正则表达式,data,re.S)
3.pic=requests.get(pic_url,timeout=10)
4. fp=open(pic_name,'wb')
fp.write(pic.content)
fp.close()
在这个案例中我们爬取了一个壁纸网站的网页,预测应该图片质量比较高吧。完整代码如下:
我们来看一下运行代码的结果,如下图所示。真心不错,我们获得了42张壁纸,而且是在短短几秒钟内完成的。
以上就是Python爬虫爬图片需要什么的详细内容,更多请关注其它相关文章!