浅析Python requests 模块

程序员文章站 2022-04-26 12:37:55

python requests 模块　　requests 模块是我们使用的 python爬虫模块可以完成市场进80%的爬虫需求。安装pip install requests使用requests模块...

python requests 模块

　　requests 模块是我们使用的 python爬虫模块可以完成市场进80%的爬虫需求。

安装

pip install requests

使用

requests模块代码编写的流程：

- 指定url
- 发起请求
- 获取响应对象中的数据
- 持久化存储

-------------案例-------------------------
import requests
# 指定url
url="https://www.sogou.com/"
# 发起请求
response = requests.get(url)
# 获取响应对象中的数据
page_text = response.text
# 持久化存储
with open('./sogou.html','w',encoding='utf-8') as fp:
  fp.write()
-------------------------------------------

参数

# post 数据
response = requests.post(url=url,data=data,headers=headers)

# get 数据
response = requests.get(url=url,data=data,headers=headers)

# 返回二进制数据
response.content 

# 返回字符串数据  
response.text  

# 返回json对象   
response.json()

其他了解

1、该模块实现爬取数据前需要查找需要爬取数据的指定url，可通过浏览器自带抓包功能。

# 浏览器抓取 ajax 请求
f12 --> network --> xhr --> name --> response

2、上面的headers参数是进行ua伪装为了反反爬

反爬机制：ua检测 --> ua伪装

3、下面是http我们爬包是常用的请求头参数

- accept: 浏览器通过这个头告诉服务器，他所支持的数据类型
　　- accept-charset：浏览器通过这个头告诉服务器，它支持那种字符集
　　- accept-encoding：浏览器通过这个头告诉服务器，支持的压缩格式
　　- accept-language：浏览器通过这个头告诉服务器，他的语言环境
　　- host：浏览器同过这个头告诉服务器，想访问哪台主机
　　- if-modifiedsince：浏览器通过这个头告诉服务器，缓存数据的时间
　　- heferer：浏览器通过这个头告诉服务器，客户及时那个页面来的，防盗链
　　- connection：浏览器通过这个头告诉服务器，请求完后是断开链接还是保持链接
　　- x-requested-with：xmlhttprequest 代表通过ajax方式进行访问
　　- user-agent：请求载体的身份标识

以上就是浅析python requests 模块的详细内容，更多关于python requests 模块的资料请关注其它相关文章！

相关标签： Python requests 模块爬虫

上一篇：开果汁搞笑话

下一篇： 50万用户数据泄露谷歌将关闭旗下社交网络Google+

浅析Python requests 模块

c#调用python脚本实现排序（适用于python脚本中不包含第三方模块的情况）

Python学习日记(十四) 正则表达式和re模块

Python使用shelve模块实现简单数据存储的方法

python使用PyGame模块播放声音的方法

Python中subprocess模块用法实例详解

在Python中使用itertools模块中的组合函数的教程

Python命令行参数解析模块optparse使用实例

Python配置文件解析模块ConfigParser使用实例

Python随机生成数模块random使用实例

初步介绍Python中的pydoc模块和distutils模块