欢迎您访问程序员文章站本站旨在为大家提供分享程序员计算机编程知识!
您现在的位置是: 首页

2019 工作疑难杂症汇总(重定向篇)

程序员文章站 2022-05-06 16:02:19
...

重定向篇
大家有没有在请求的过程中遇到302重定向,在爬取某网时候我遇到4次重定向才能得到某数据,请各位看官看下图:
2019 工作疑难杂症汇总(重定向篇)
经过4次跳转我才能获取到我想要的url,那么这个时候很简单,一次次的盘他

import requests

url = "我是某url"
# allow_redirects=False的意义为拒绝默认的301/302重定向从而可以通过html.headers[‘Location’]拿到重定向的URL
result = requests.get(url,headers=headers,allow_redirects=False)
# 拿到重定向后的url
resume_url = result.headers['location'] 

当然你也可以使用session.get()方法,它重定向几次你就盘他几次,最后得到你想要的数据的url。

相关标签: python 重定向