[python] utf8 bom编码处理 程序员文章站 2022-05-25 22:57:35 ... utf8 bom编码处理 decode字符传乱码: 原因是从Facebook下载的csv文件是utf8 bom编码的, 直接decode(‘utf-8’)会出现’\ufeff’; 应该decode(‘utf-8-sig’) 原本以为是文件内容导致的问题,debug之后,发现文件开头有’\ufeff’; 不知道这个是什么东西,墨迹了一会儿之后,尝试Google了才有答案;豁然开朗了 data_str = file.read().decode('utf-8-sig') datas = data_str.split('\n') reader = csv.DictReader(datas) 相关标签: python python 乱码 上一篇: 最容易忽视BUG UTF8 BOM头 下一篇: UTF8去BOM脚本 推荐阅读 浅谈Python爬取网页的编码处理 Python 编码处理-str与Unicode的区别 Python 编码处理-str与Unicode的区别 Python设置默认编码为utf8的方法 详解Python中使用base64模块来处理base64编码的方法 Python处理JSON时的值报错及编码报错的两则解决实录 Python设置默认编码为utf8的方法 详解Python中使用base64模块来处理base64编码的方法 Python处理JSON时的值报错及编码报错的两则解决实录 python处理中文编码和判断编码示例