欢迎您访问程序员文章站本站旨在为大家提供分享程序员计算机编程知识!
您现在的位置是: 首页

UnicodeDecodeError: 'gbk' codec can't decode byte 0xff in position 0: illegal multibyte sequence

程序员文章站 2022-03-31 19:14:21
...

菜鸟学python习题17运行错误:
我的:
直接在open里加了一个,errors="ignore"即可。

第一个人:
使用python的时候经常会遇到文本的编码与解码问题,其中很常见的一种解码错误如题目所示,下面介绍该错误的解决方法,将‘gbk’换成‘utf-8’也适用。
(1)、首先在打开文本的时候,设置其编码格式,如:open(‘1.txt’,encoding=’gbk’);
(2)、若(1)不能解决,可能是文本中出现的一些特殊符号超出了gbk的编码范围,可以选择编码范围更广的‘gb18030’,如:open(‘1.txt’,encoding=’gb18030’);
(3)、若(2)仍不能解决,说明文中出现了连‘gb18030’也无法编码的字符,可以使用‘ignore’属性进行忽略,如:open(‘1.txt’,encoding=’gb18030’,errors=‘ignore’);
(4)、还有一种常见解决方法为open(‘1.txt’).read().decode(‘gb18030’,’ignore’)

第二个人:
近日python3读取文件出现UnicodeDecodeError: ‘gbk’ codec can’t decode byte编码错误,如下所示:

with open("part2id.txt","r") as f:
    f = f.readlines()

报错“UnicodeDecodeError: ‘gbk’ codec can’t decode byte 0xff in position 5657: illegal multibyte sequence”
解决方法:

1、指定编码格式

with open("part2id.txt","r",encoding="gbk") as f:
    f = f.readlines()

结果发现仍然报错:UnicodeDecodeError: ‘gbk’ codec can’t decode byte 0xff in position 5657: illegal multibyte sequence

2、ignore忽略

with open("part2id.txt","r",encoding="gbk",errors="ignore") as f:
    f = f.readlines()

这次正常读出!

相关标签: python gbk