python开发pickle和json序列化及json配置文件常见问题

程序员文章站 2024-01-04 14:45:58

在程序运行的过程中，变量都是在内存中，比如，定义一个dict：d = dict(name='rose', career='student', age='20')把变量从内存中变成可存储或传输的过程称之为序列化，反过来，把变量内容从序列化的对象重新读到内存里称之为反序列化。picklepickle.dumps()方法把任意对象序列化成一个bytes，然后，就可以把这个bytes写入文件。用另一个方法pickle.dump()直接把对象序列化后写入一个file-like Object：impor...

文章目录

pickle

提出问题

json

多个对象以json格式读写文件

注意问题

在程序运行的过程中，变量都是在内存中，比如，定义一个dict：

d = dict(name='rose', career='student', age='20')

把变量从内存中变成可存储或传输的过程称之为序列化，
反过来，把变量内容从序列化的对象重新读到内存里称之为反序列化。

pickle

pickle.dumps()方法把任意对象序列化成一个bytes，然后，就可以把这个bytes写入文件。
用另一个方法pickle.dump()直接把对象序列化后写入一个file-like Object：

import pickle

d = dict(name='rose', career='student', age='20')
fp = open('dump.txt', 'wb')
pickle.dump(d, fp)
fp.close()

当我们要把对象从磁盘读到内存时，可以先把内容读到一个bytes，然后用pickle.loads()方法反序列化出对象
也可以直接用pickle.load()方法从一个file-like Object中直接反序列化出对象。

fp = open('dump.txt', 'rb')
d = pickle.load(fp)
fp.close()
print(d)	# {'name': 'rose', 'career': 'student', 'age': 20}

变量的内容又回来了。

注意：使用pickle存取读取文件，一定要以二进制来读写

提出问题

这里我向大家提问一个问题，看到这里的伙伴可以回答我一下，征集一下看看有没有什么好的方法解决：
问：如果将多个dict存入到同一个文件，该如何处理？当然下面的json格式存储也可能需要回答这个问题，那么我会说明我在学习中json解决这个问题的一种方式（其实很简单啦），这也是我在做项目很喜欢使用的一种配置文件的方式。

json

如果我们要在不同的编程语言之间传递对象，就必须把对象序列化为标准格式，比如XML，但更好的方法是序列化为JSON，因为JSON表示出来就是一个字符串，可以被所有语言读取，也可以方便地存储到磁盘或者通过网络传输。JSON不仅是标准格式，并且比XML更快，而且可以直接在Web页面中读取，非常方便。
Python内置的json模块提供了非常完善的Python对象到JSON格式的转换。

json中的dump和load方法实际是字符串和dict互转的方法，只是添加了将对象和dict互相转换的方法，才实现了将对象转换为json字符串。

如果要把对象以json格式存储，那么先要这个对象有一个把属性和属性值以键值对形式（dict）的表示方式，那么有两种方式可以实现转换dict方法。

使用对象的__dict__属性，它就是一个dict，用来存储实例变量。也有少数例外，比如定义了__slots__的class。如下方式将对象转换为json字符串的方式

import json


class Student(object):
	def __init__(self, name='rose', age=22, id='11111'):
        self.name = name
        self.age = age
        self.id = id

if __name__ == '__maini__':
	s1 = Student()
	print(type(s1.__dict__))		# dict
    print(json.dumps(s1.__dict__))
    print(type(json.dumps(s1.__dict__)))

自行定义一个对象转dict的方法，在调用json.dumps()加入这个方法作为default参数值，如下：

def student2dict(stu):
    return {
        'name': stu.name,
        'age': stu.age,
        'id': stu.id
    }

print(json.dumps(s1, default=student2dict))
# {"name": "rose", "age": 22, "id": "11111"}

同样的道理，如果我们要把JSON反序列化为一个Student对象实例，loads()方法首先转换出一个dict对象，然后，我们传入的object_hook函数负责把dict转换为Student实例：

def dict2student(d):
    return Student(d['name'], d['age'], d['id'])

json_str = '{"name": "rose", "age": 22, "id": "11111"}'
d= json.loads(json_str)			# dict
s2 = json.loads(json_str, object_hook=dict2student)		# Student

多个对象以json格式读写文件

接下来说明把多个对象以json格式存入到文件中：
如下第一个方法将多个对象写入文件，写入一个对象为一行，然后会换行，
然后第二个方法是每次读取一行，然后将这一行json字符串转换为对象。

def write_Student_json(filepath, student_list):
    with open(filepath, 'w') as fp:
        for s in student_list:
            json.dump(s.__dict__, fp)
            fp.write('\n')


def get_students_from_file(filepath):
    student_list = []
    with open(filepath, 'r') as fp:
        for json_str in fp.readlines():
            s = json.loads(json_str, object_hook=dict2student)
            student_list.append(s)
    return student_list


if __name__ == '__main__':
	s1 = Student()
    s2 = Student('George', 30, '131313')
    s_l1 = [s1, s2]
    write_Student_json('student.txt', s_l1)

    s_l2 = get_students_from_file('student.txt')

    for s in s_l2:
        print(str(s.__dict__))

如下是写入的同文件夹下的student.txt文件

{"name": "rose", "age": 22, "id": "11111"}
{"name": "George", "age": 30, "id": "131313"}

注意问题

这里呢，是我最近在开发中遇见的两个问题，我最近在最初设计方案的时候，都会试着使用配置文件来调试，然后才会去设计将一些数据存入数据库……这是我在将多个对象存入json文件中遇到的问题，问题都是和文件相关，与也算是比较常见的了。
所以，我会提醒看到这的小伙伴，不要轻易改动json文件

字符串类型，使用json读取写入一律使用双引号
因为我试着去编辑配置，然后就习惯的把字符串类型写成了单引号，然后就报了如下的异常：

json.decoder.JSONDecodeError: Expecting property name enclosed in double quotes: line 1 column 29 (char 28)

所以，json文件中的字符串类型的引号要注意了

不要轻易多加换行
因为我在查看配置文件的时候，不知道什么时候点了回车，导致json文件最后多了一个换行，就报了如下的异常：

json.decoder.JSONDecodeError: Expecting value: line 2 column 1 (char 1)

所以如果在玩json文件的时候，尽量不要去改动，按照程序写入文件的格式即可。