python3爬取图片

程序员文章站 2022-05-02 20:43:24

...

import requests
import time
import re\


# 请求网页
# header防止被禁止访问403，伪装成浏览器，不会被认为是python

headers = {
    'User-Agent':'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/79.0.3945.88 Safari/537.36'
}


response = requests.get('https://www.vmgirls.com//12985.html', headers=headers)
# print(response.request.headers)
html = response.text


# 解析网页

urls = re.findall('<a href=".*?" alt=".*?" title=".*?">', html)
print(urls)

# 保存图片

for url in urls:
    time.sleep(1)
    # 图片的名字,用split分割，找到最后一个即为文件名
    file_name = url.split('/')[-1]
    response = requests.get('https://www.vmgirls.com//12985.html', headers=headers)
    #打开文件，wb二进制写入
    with open(file_name, 'wb') as f:
        f.write(response.content)

相关标签：学习笔记 Python爬虫

上一篇： Python爬虫之BeautifulSoup模块

下一篇：单引号和双引号的小区别

python3爬取图片

Python实现爬取逐浪小说的方法

利用node.js写一个爬取知乎妹纸图的小爬虫

爬虫小项目！适合有基础的！爬取葡萄酒评分！哪个阶段和那种酒呢

爬取网易新闻排行榜

Python爬虫实战用 BeautifulSoup 爬取电影网站信息

python爬取网页转换为PDF文件

python爬取基于m3u8协议的ts文件并合并

python爬虫爬取奇书阁首页分类小说数据

Python爬取豆瓣电影信息遇到的问题

Python实现的爬取百度文库功能示例