第3章:字典和集合-第1节:泛映射类型+第2节:字典推导
dict
类型不但在各种程序里广泛使用,它也是 Python 语言的基石。模块的命名空间、实例的属性和函数的关键字参数中都可以看到字典的身影。跟它有关的内置函数都在__builtins__.__dict__
模块中。正是因为字典至关重要,Python 对它的实现做了高度优化,而“散列表”则是字典类型性能出众的根本原因。
集合(
set
)的实现其实也依赖于散列表,想要进一步理解集合和字典,就得先理解散列表的原理。
3.1 泛映射类型
collections.abc
模块中有 Mapping
和 MutableMapping
这两个抽象基类,它们的作用是为 dict
和其他类似的类型定义形式接口,详见图 :
图 3-1:collections.abc
中的 MutableMapping
和它的超类的 UML 类图(箭头从子类指向超类,抽象类和抽象方法的名称以斜体显示)
然而,非抽象映射类型一般不会直接继承这些抽象基类,它们会直接对 dict
或是 collections.UserDict
进行扩展。这些抽象基类的主要作用是作为形式化的文档,它们定义了构建一个映射类型所需要的最基本的接口。
标准库里的所有映射类型都是利用 dict
来实现的,因此它们有个共同的限制,即只有“可散列的”数据类型才能用作这些映射里的键(只有键有这个要求,值并不需要是可散列的数据类型)。
什么是可散列类型?
如果一个对象是可散列的,那么在这个对象的生命周期中,它的散列值是不变的,而且这个对象需要实现 __hash__() 方法。
另外可散列对象还要有 __eq__() 方法,这样才能跟其他键做比较。如果两个可散列对象是相等的,那么它们的散列值一定是一样的……
可散列数据类型:原子不可变数据类型(str、bytes、int、float) 都是可散列类型;
当元组( tuple )中包含的元素都是可散列类型时,元组也是可散列的;
frozenset 也是可散列类型;
不可散列数据类型:list、dict 等是不可散列类型;
3.2 字典推导
自 Python 2.7 以来,列表推导和生成器表达式的概念就移植到了字典上,从而有了字典推导(后面还会看到集合推导)。字典推导(dictcomp)可以从任何以键值对作为元素的可迭代对象中构建出字典。
示例 3-1 创建字典的各种方法和字典推导的应用
# 方法一:
b = {'one': 1, 'two': 2, 'three': 3}
# 方法二:
a = dict(one=1, two=2, three=3)
# 方法三:
c = dict(zip(['one', 'two', 'three'], [1, 2, 3]))
# 方法四:
d = dict([('two', 2), ('one', 1), ('three', 3)])
# 方法五:
e = dict({'three': 3, 'one': 1, 'two': 2})
print(a == b == c == d == e) # True
# 使用字典推导创建字典,并把值更转换为 str 类型
f = {key: str(value) for key, value in zip(['one', 'two', 'three'], [1, 2, 3])}
print(f) # {'one': '1', 'two': '2', 'three': '3'}
上一篇: Android intent之间复杂参数传递方法详解
下一篇: Django内容增加富文本功能的实例