欢迎您访问程序员文章站本站旨在为大家提供分享程序员计算机编程知识!
您现在的位置是: 首页

第3章:字典和集合-第1节:泛映射类型+第2节:字典推导

程序员文章站 2024-03-02 23:09:04
...

dict 类型不但在各种程序里广泛使用,它也是 Python 语言的基石。模块的命名空间、实例的属性和函数的关键字参数中都可以看到字典的身影。跟它有关的内置函数都在 __builtins__.__dict__模块中。

正是因为字典至关重要,Python 对它的实现做了高度优化,而“散列表”则是字典类型性能出众的根本原因。

集合(set)的实现其实也依赖于散列表,想要进一步理解集合和字典,就得先理解散列表的原理。

 3.1 泛映射类型

collections.abc 模块中有 Mapping 和 MutableMapping 这两个抽象基类,它们的作用是为 dict 和其他类似的类型定义形式接口,详见图 :

第3章:字典和集合-第1节:泛映射类型+第2节:字典推导

图 3-1:collections.abc 中的 MutableMapping 和它的超类的 UML 类图(箭头从子类指向超类,抽象类和抽象方法的名称以斜体显示)

        然而,非抽象映射类型一般不会直接继承这些抽象基类,它们会直接对 dict 或是 collections.UserDict 进行扩展。这些抽象基类的主要作用是作为形式化的文档,它们定义了构建一个映射类型所需要的最基本的接口。

        标准库里的所有映射类型都是利用 dict 来实现的,因此它们有个共同的限制,即只有“可散列的”数据类型才能用作这些映射里的键(只有键有这个要求,值并不需要是可散列的数据类型)。

什么是可散列类型?

如果一个对象是可散列的,那么在这个对象的生命周期中,它的散列值是不变的,而且这个对象需要实现 __hash__() 方法。
另外可散列对象还要有 __eq__() 方法,这样才能跟其他键做比较。如果两个可散列对象是相等的,那么它们的散列值一定是一样的……

可散列数据类型:原子不可变数据类型(strbytesintfloat) 都是可散列类型;
                             当元组( tuple )中包含的元素都是可散列类型时,元组也是可散列的;
                             frozenset 也是可散列类型;
不可散列数据类型:listdict 等是不可散列类型;

3.2 字典推导

        自 Python 2.7 以来,列表推导和生成器表达式的概念就移植到了字典上,从而有了字典推导(后面还会看到集合推导)。字典推导(dictcomp)可以从任何以键值对作为元素的可迭代对象中构建出字典。

示例 3-1 创建字典的各种方法和字典推导的应用

# 方法一:
b = {'one': 1, 'two': 2, 'three': 3}
# 方法二:
a = dict(one=1, two=2, three=3)
# 方法三:
c = dict(zip(['one', 'two', 'three'], [1, 2, 3]))
# 方法四:
d = dict([('two', 2), ('one', 1), ('three', 3)])
# 方法五:
e = dict({'three': 3, 'one': 1, 'two': 2})


print(a == b == c == d == e)  # True


# 使用字典推导创建字典,并把值更转换为 str 类型
f = {key: str(value) for key, value in zip(['one', 'two', 'three'], [1, 2, 3])}

print(f)  # {'one': '1', 'two': '2', 'three': '3'}