欢迎您访问程序员文章站本站旨在为大家提供分享程序员计算机编程知识!
您现在的位置是: 首页

python 文件读写以及json封装解析中出现了编码错误的解决方案

程序员文章站 2022-05-28 12:22:56
...

json格式:简单来说就是我们使用list将许多的dict类型的数据存起来,就是json格式
for examp:[dict1, dict2, dict3, dict4, dict5]
我们平时编写程序的时候正常的编程方式:

    with open(classified_file, 'r', encoding='utf-8') as f, open(keyword_label_info, 'w', encoding='utf-8') as f1:
        for i in f:
            data = json.loads(i)
            new_data = add_topic_keyword_info(data)
            f1.write(json.dumps(data, ensure_ascii=False)+'\n')

1、这里我们一定要注意,我们写入文件的时候需要将字典格式的数据进行第一步的json格式的转化,在转化的过程中我们这个时候就要注意ensure_ascii=True/False, 这个属性属性的默认值是True, 代表使用ascii编码,但是ascii编码我们看到的是我们看不懂的一段数字码,不能直观的看到中文信息,所以我们要想在写入文件之后是我们能够认识的中文,我们就要将这个属性修改成ensure_ascii=False,
2、 在修改了这个属性之后我们直接运行的话,会报以下错误:

'ascii' codec can't encode characters in position 0-1: ordinal not in range(128)

这是编码错误,但是可能经过你的多次验证之后发现python编译器和pycharm都是使用的utf-8,理论上不应该出现这样的编码错误,
经过我多次验证之后才发现了这个一个问题:就是文件进行读写的时候必须也要加上编码格式

with open(classified_file, 'r') as f, open(keyword_label_info, 'w') as f1:
        for i in f:
            data = json.loads(i)
            new_data = add_topic_keyword_info(data)
            f1.write(json.dumps(data, ensure_ascii=False)+'\n')
'ascii' codec can't encode characters in position 0-1: ordinal not in range(128)

以上是我们报错的那段代码,本篇第一个代码块是经过修改,不会出现乱码和报错的。