python 文件读写以及json封装解析中出现了编码错误的解决方案

程序员文章站 2022-05-28 12:22:56

...

json格式：简单来说就是我们使用list将许多的dict类型的数据存起来，就是json格式
for examp：[dict1, dict2, dict3, dict4, dict5]
我们平时编写程序的时候正常的编程方式：

    with open(classified_file, 'r', encoding='utf-8') as f, open(keyword_label_info, 'w', encoding='utf-8') as f1:
        for i in f:
            data = json.loads(i)
            new_data = add_topic_keyword_info(data)
            f1.write(json.dumps(data, ensure_ascii=False)+'\n')

1、这里我们一定要注意，我们写入文件的时候需要将字典格式的数据进行第一步的json格式的转化，在转化的过程中我们这个时候就要注意ensure_ascii=True/False, 这个属性属性的默认值是True，代表使用ascii编码，但是ascii编码我们看到的是我们看不懂的一段数字码，不能直观的看到中文信息，所以我们要想在写入文件之后是我们能够认识的中文，我们就要将这个属性修改成ensure_ascii=False，
2、在修改了这个属性之后我们直接运行的话，会报以下错误：

'ascii' codec can't encode characters in position 0-1: ordinal not in range(128)

这是编码错误，但是可能经过你的多次验证之后发现python编译器和pycharm都是使用的utf-8，理论上不应该出现这样的编码错误，
经过我多次验证之后才发现了这个一个问题：就是文件进行读写的时候必须也要加上编码格式

with open(classified_file, 'r') as f, open(keyword_label_info, 'w') as f1:
        for i in f:
            data = json.loads(i)
            new_data = add_topic_keyword_info(data)
            f1.write(json.dumps(data, ensure_ascii=False)+'\n')

'ascii' codec can't encode characters in position 0-1: ordinal not in range(128)

以上是我们报错的那段代码，本篇第一个代码块是经过修改，不会出现乱码和报错的。

上一篇：链接云端Mysql 8.0

下一篇： ajax jquery 异步表单验证示例代码