欢迎您访问程序员文章站本站旨在为大家提供分享程序员计算机编程知识!
您现在的位置是: 首页  >  后端开发

python requests模块提交中文数据

程序员文章站 2022-06-12 21:58:37
...
我的环境:windows平台命令行编码GBK,python2.7.6。需要用python提交一个中文验证码,目标地址的网页编码为utf-8,目前自己模拟了服务端。http请求使用python的requests模块,但是返回的结果往往不正常,代码如下:

客户端:

# python代码
code = '中文验证'

# 这里面的code应该是unicode字符串了
post_data = {
    'name':'jack',
    'password':'123456',
    'code':code # u'\u4E2D\u6587\u9A8C\u8BC1'
}
res = requests.post('http://www.test.com',data=post_data)

# 使结果集正确显示中文
res = res.content
unicode(res,"utf-8")

if '验证码有误' in res:
    print 'authcode error,retry...'
else:
    print 'success'
#这是服务端的PHP代码
if ($_POST['code'] == '中文验证'){
    $result = $db->insert($_POST);
} else {
    echo '验证码有误';
    $_POST['code'] = $_POST['code'].'e';
    $result = $db->insert($_POST);
}

然后奇怪的事情出现了,数据库code字段里面插入了一些“中文验证” 和 一些“中文验证e”,请问这是什么情况?如果编码有问题,怎么会时而判断正确时而判断错误呢?

补充声明:
没有乱码的问题,插入数据库都是正常的,其实在定义post_data dic的时候,python本身已经把中文unicode了,但是为什么把这串unicode提交到服务器跟“中文验证”比对的时候,有时候出错,有时候正确呢?

回复内容:

我的环境:windows平台命令行编码GBK,python2.7.6。需要用python提交一个中文验证码,目标地址的网页编码为utf-8,目前自己模拟了服务端。http请求使用python的requests模块,但是返回的结果往往不正常,代码如下:

客户端:

# python代码
code = '中文验证'

# 这里面的code应该是unicode字符串了
post_data = {
    'name':'jack',
    'password':'123456',
    'code':code # u'\u4E2D\u6587\u9A8C\u8BC1'
}
res = requests.post('http://www.test.com',data=post_data)

# 使结果集正确显示中文
res = res.content
unicode(res,"utf-8")

if '验证码有误' in res:
    print 'authcode error,retry...'
else:
    print 'success'
#这是服务端的PHP代码
if ($_POST['code'] == '中文验证'){
    $result = $db->insert($_POST);
} else {
    echo '验证码有误';
    $_POST['code'] = $_POST['code'].'e';
    $result = $db->insert($_POST);
}

然后奇怪的事情出现了,数据库code字段里面插入了一些“中文验证” 和 一些“中文验证e”,请问这是什么情况?如果编码有问题,怎么会时而判断正确时而判断错误呢?

补充声明:
没有乱码的问题,插入数据库都是正常的,其实在定义post_data dic的时候,python本身已经把中文unicode了,但是为什么把这串unicode提交到服务器跟“中文验证”比对的时候,有时候出错,有时候正确呢?

以下是几个乱弹琴,仅供参考

  1. 用np++检查py2和php代码是不是utf8无bom
  2. py代码加入coding编码声明
  3. 服务端返回时最好用http代码表示错误,而不是用文字

我的建议是如果要比较中文字符串的话,一律转换成unicode之后再比较吧