解决python2.7 UnicodeDecodeError和UnicodeEncodeError问题
程序员文章站
2022-03-17 09:56:37
最近在项目中,读取上传的csv文件,并写入时,会报编码问题, UnicodeDecodeError: 'utf8' codec can't decode byte 0xc4 in position 0: invalid continuation byte 刚开始以为是对方上传的文本编码格式有问题,所 ......
最近在项目中,读取上传的csv文件,并写入时,会报编码问题,
with open(origin_file_path, mode='wb')as f: for chunk in file_obj: f.write(chunk)
UnicodeDecodeError: 'utf8' codec can't decode byte 0xc4 in position 0: invalid continuation byte
刚开始以为是对方上传的文本编码格式有问题,所以让对方用Notepad++,打开编辑后保存
刚开始一段时间,没有再出现错误,最近,错误再次发生,即使用上面说的编辑器也没用
with open(origin_file_path, mode='wb')as f: for chunk in file_obj: f.write(chunk.decode('gbk')
后面考虑,可能是因为有中文,需要进行gbk编码,所以在写入文件时我按gbk写入后,发现问题解决了,不会再报上面这个错误
但是当我把把更新的文件放到服务器上后,发现,又报另外一个错误错误
UnicodeEncodeError: 'ascii' codec can't encode characters in position 42-57: ordinal not in range(128)
可能是因为linux默认是utf-8编码。所以报错
然后我又转成utf-8,完美解决问题,代码如下
with open(origin_file_path, mode='wb')as f: for chunk in file_obj: f.write(chunk.decode('gbk').encode('utf-8'))
推荐阅读
-
vista和win7在windows服务中交互桌面权限问题解决方法:穿透Session 0 隔离
-
Python2和Python3.6环境解决共存问题
-
transport.js和jquery冲突问题的解决方法
-
通过过滤器(Filter)解决JSP的Post和Request中文乱码问题
-
php中curl和soap方式请求服务超时问题的解决
-
任正非:鸿蒙暂无计划用于手机 华为和谷歌都在努力解决问题
-
3招解决Word2003、Word2007和Word2010空格有点问题
-
win10专业版更新升级KB4025342和KB4025339蓝屏/更新失败等问题的解决方法
-
ASP 包含文件中的路径问题和使用单一数据库连接文件的解决方案
-
关于钱粮问题曹操和刘备分别是如何解决的?曹操比刘备直接多了!