爬虫(图片)
程序员文章站
2022-04-13 14:10:38
...
从网站里爬图片
- 代码如下:
import re,os
"""
re.match 必须从头开始严格匹配
re.search 不追求在字符串开头
re.findall 查询结果集 -> list
"""
email_regex = '[\w][email protected][a-zA-Z0-9]+.[a-z]+'
# [email protected]
meinv_regex = '"objURL":"(.*?)"'
from urllib.request import urlopen,urlretrieve
url = '' # 在这里填入你要爬取的图片的地址
html = urlopen(url).read().decode('utf-8')
# print(html)
list_ = re.findall(meinv_regex,html)
# pattern, string,
index = 0
for v in list_:
path = 'img/' + str(index) + '.jpg'
try:
urlretrieve(v,path)
except:
pass
else:
index += 1
上一篇: Antlr语法