Python爬虫基础编程

程序员文章站 2022-03-08 15:49:58

...

初学Python爬虫时都会从最简单的方法开始，以下为几种常见的基础做法。

"""
    简单的循环处理
"""
import requests


url_list = [
    "https://www.baidu.com",
"https://www.cnblogs.com/"
]

for url in url_list:
    result = requests.get(url)
    print(result.text)


"""
    线程池处理
"""
import requests
from concurrent.futures import ThreadPoolExecutor


def fetch_request(url):
    result = requests.get(url)
    print(result.text)


url_list = [
    "https://www.baidu.com/",
"https://www.cnblogs.com/"
]

pool = ThreadPoolExecutor(10)

for url in url_list:
    # 线程池中获取线程，执行fetch_request方法
pool.submit(fetch_request, url)

# 关闭线程池
pool.shutdown()

"""
    线程池+回调函数
"""
import requests
from concurrent.futures import ThreadPoolExecutor


def fetch_async(url):
    response = requests.get(url)
    return response


def callback(future):
    print(future.result().text)


url_list = [
    "https://www.baidu.com/",
"https://www.cnblogs.com/"
]

pool = ThreadPoolExecutor(10)

for url in url_list:
    v = pool.submit(fetch_async, url)
    # 调用回调函数
v.add_done_callback(callback)

pool.shutdown()

"""
    进程池处理
"""
import requests
from concurrent.futures import ProcessPoolExecutor


def fetch_requst(url):
    result = requests.get(url)
    print(result.text)


url_list = [
    "https://www.baidu.com/",
"https://www.cnblogs.com/"
]

if __name__ == '__main__':

    pool = ProcessPoolExecutor(max_workers=10)

    for url in url_list:
        pool.submit(fetch_requst, url)

    pool.shutdown()

"""
    进程池+回调函数
"""
import requests
from concurrent.futures import ProcessPoolExecutor


def fetch_async(url):
    response = requests.get(url)
    return response


def callback(future):
    print(future.result().text)


url_list = [
    "https://www.baidu.com/",
"https://www.cnblogs.com/"
]


if __name__ == '__main__':
    pool = ProcessPoolExecutor(10)

    for url in url_list:
        v = pool.submit(fetch_async, url)
        v.add_done_callback(callback)

    pool.shutdown()

Python爬虫基础编程

带你详细了解Python GUI编程框架

Python编程flask使用页面模版的方法

Python爬虫实战项目掌握酷狗音乐的加密过程

python基础面试题整理

python爬虫Scrapy框架:媒体管道原理学习分析

python-函数式编程实例教程

python中列表的基础知识与常用方法

Python 爬虫学习笔记(七)

Python爬虫入门教程 55-100 python爬虫高级技术之验证码篇

python爬虫学习之爬取169图片网站