大话 Python:python 进阶提升 -- 如何理解垃圾回收机制及应用
在一般的高级编程语言中都提供了相应的垃圾回收机制,目的就是为了在合适的时候释放程序运行占用的内存资源,不用再像 C 语言中那样自己管理内存。合理的利用垃圾回收机制不仅能避免出现内存溢出等不必要的错误发生,也能适当的提升程序运行的性能。
1、Python 的内存管理机制有什么?
Python 中的内存管理机制主要有三种,一是引用计数、二是垃圾回收、三是内存池。这三种机制相辅相成完成了程序在运行过程中的内存管理。
引用计数:简单来说,引用计数就是一种内存管理的方式、并且具有较高的效率,所谓引用计数就是对象在被引用的时候进行计数操作,当被引用时计数结果加1、不被引用时减1,这样的计数方式说明当计数的结果为0时对象没有被使用。因此,计数结果为0可以执行对象的删除操作以便节约内存。循环引用无法回收,即一个对象在自身的属性中又引用了自身的对象这种情况便会无法回收,因为引用计数永远不能等于零。
垃圾回收:引用计数也是包含在垃圾回收机制的范畴里面,除此之外,还有两种垃圾回收机制分别是分代回收、标记清除。
内存池:内存池管理机制也叫 Pymalloc 机制,主要是为了管理碎片化的内存申请和释放。比如,在进行引用计数的时候 python 对象被频繁的引用和不被引用使得引用计数结果为0的频率非常的高,这样频繁的操作肯定降低程序执行的效率。因此,内存管理机制主要是为了解决这个问题,只有从内存池中申请到的内存可以归还到内存池中,相当于是一个管理员的角色。分代回收:分代回收是典型的用空间换取时间的技术模式,分代就是将程序里面的对象分成三代,创建时间最长的为最老的一代,也是越不可能被清理的一代,接下来是二代比一代的创建时间短比三代的创建时间长,最后一个是三代也是创建时间最短的、并且最有可能被回收。当一代存储的对象个数达到一定程度时就会将说有三代中存储的对象全部清除,当二代达到一定程度时就清除二代和三代中的对象,三代达到时则清除自己本身的所有对象。标记清除:标记其实可以理解为就是通过标记来检测垃圾对象,而清除就是将已经通过标记筛选出来的垃圾对象进行清理。首先,对除了根节点以外的所有对象统一打上一个标记,再对被引用的对象打上标记,通过这种方式筛选垃圾对象、最后清理垃圾对象。
2、如何使用 python 的扩展库来管理垃圾回收?
python 提供了 gc 的扩展库作为垃圾回收机制的使用,并且可以解决在引用计数中的循环引用无法回收的问题。一般情况下,想要主动回收垃圾只需要导入 gc 扩展库、并且调用垃圾收集函数即可完成垃圾回收。
-
手动触发垃圾回收,在合适的地方进行回收
1# 导入 gc 模块
2import gc
3# 在需要收集垃圾的地方调用垃圾回收
4gc.collect()
-
开启、关闭、检测垃圾回收机制
1# 导入 gc 模块
2import gc
3# 开启垃圾回收机制
4gc.enable()
5# 关闭垃圾回收机制
6gc.disable()
7# 检测垃圾回收机制是否开启
8gc.isenabled()
-
获取、设置自动回收的阈值
1# 导入 gc 模块
2import gc
3# 获取自动回收垃圾对象的阈值
4gc.get_threshold()
5# 设置自动回收垃圾对象的阈值
6gc.set_threshold(1000, 15, 5)
阈值:分别对应一、二、三代中对象的最大个数,一般来说,适当的加大阈值可以提高程序的执行效率。更多精彩前往微信公众号【Python *】,关注获取《python 从入门到精通全套视频》
下一篇: Python 3.1 发布