欢迎您访问程序员文章站本站旨在为大家提供分享程序员计算机编程知识!
您现在的位置是: 首页

python爬虫:Requests库(一)

程序员文章站 2022-07-14 11:19:20
...

python爬虫:Requests库(一)

from mooc网络爬虫与信息提取

下面是爬虫的基本框架

import requests


def get_test_html(url):
    try:
        r = requests.get(url, timeout=30)  # 如果时间超过30则报错
        r.raise_for_status()  # 返回的是访问状态,200则成功,否则将会报错
        r.encoding = r.apparent_encoding
        return r.text
    except:
        return '发生异常'


if __name__ == '__main__':
    url = 'http://www.baidu.com'
    print(get_test_html(url))

基本方法的展示

python爬虫:Requests库(一)
post 提交的数据放到form表单里,如果data只是一个字符串则在data里面
python爬虫:Requests库(一)

requests库的一些基本方法与属性

python爬虫:Requests库(一)
python爬虫:Requests库(一)
python爬虫:Requests库(一)
python爬虫:Requests库(一)
python爬虫:Requests库(一)

kwargs里包含的参数

params

python爬虫:Requests库(一)

data

python爬虫:Requests库(一)

json

python爬虫:Requests库(一)

headers

python爬虫:Requests库(一)

cookies auth files 等

python爬虫:Requests库(一)

timeout

python爬虫:Requests库(一)

proxies 代理

python爬虫:Requests库(一)
python爬虫:Requests库(一)

相关标签: python爬虫