python爬虫,请求地址中包含中文字符的解决办法
程序员文章站
2024-01-27 08:06:46
...
比如
r=requests.get('www.xxx.com/?city=上海')
这时候可能会导致urlerror,之所以说可能,是因为有的网站后台可能有转码机制,特别是大网站,他们会把地址做一次转码。
对于那些没有做转码的站,则需要自己先转码,转成类似于这种:
'%E4%B8%8A%E6%B5%B7' ‘上海’
这是中文字符的编码格式,16进制表示
所用到的包是
from urllib import parse
代码如下
from urllib import parse
url='www.xxx.com/?city={}'.format(parse.quote('上海'))
r=requests.get(url)
www.xxx.com/?city=%E4%B8%8A%E6%B5%B7
上一篇: IDEA Tomcat控制台乱码