欢迎您访问程序员文章站本站旨在为大家提供分享程序员计算机编程知识!
您现在的位置是: 首页  >  IT编程

垃圾回收机制

程序员文章站 2022-05-17 16:46:07
我们定义变量会申请内存空间来存放变量的值,而内存的容量是有限的,当一个变量值没有用了(称为垃圾),就应该将其占用的内存给回收掉。变量名是访问到变量的唯一方式,所以当一个变量值没有任何关联的变量名时,我们就无法访问到该变量了,该变量就是一个垃圾,会被python解释的垃圾回收机制自动回收。 一、什么是 ......

  我们定义变量会申请内存空间来存放变量的值,而内存的容量是有限的,当一个变量值没有用了(称为垃圾),就应该将其占用的内存给回收掉。变量名是访问到变量的唯一方式,所以当一个变量值没有任何关联的变量名时,我们就无法访问到该变量了,该变量就是一个垃圾,会被python解释的垃圾回收机制自动回收。

  一、什么是垃圾回收机制

  垃圾回收机制(简称gc)是python解释器自带的一种机制,专门用来回收不可用的变量值所占用的内存空间

  二、为什么要有垃圾回收机制

  程序运行过程中会申请大量的内存空间,而对于一些无用的内存空间,如果不及时清理的话,会导致内存使用完(内存溢出),导致程序崩溃,因此,内存管理是一件重要且繁杂的事情,而python解释器自带的垃圾回收机制把程序员从繁杂的内存管理中解放出来。

  三、垃圾回收机制原理分析

  python的gc模块主要采用了‘引用计数’来跟踪和回收垃圾。在引用计数的基础上,还可以通过‘标记-清除’来解决容器对象可能产生的循环引用的问题,并且通过‘分代回收’来以空间换取时间的方式进一步提高垃圾回收的效率。

  1,引用计数

  引用计数就是:变量值被变量名关联的次数

  如:

  引用计数增加

  x=10(此时,变量值10的引用次数为1)

  y=x(此时,把x的内存地址给了y,此时,变量值10 的引用计数为2)

  引用计数减少

  x=3(此时,x和10解除关系,与3建立关系,变量值10的引用计数为1)

  del y(del是解除变量名y与变量值10之间的关系,变量值10的引用计数为0),变量值10的引用计数为0,其占用的内存空间就会被回收

  2,循环引用

  引用计数机制执行效率问题:变量值被关联次数的增加或减少,都会引发引用计数机制的执行,这明显存在效率问题,这就是引用计数的一个软肋,但引用计数还存在一个致命弱点,即循环引用(也称交叉引用)。

# 变量名l1指向列表1,变量名l2指向列表2,如下
>>> l1=['列表1中的第一个元素']  # 列表1被引用一次   
>>> l2=['列表2中的第一个元素']  # 列表2被引用一次 
>>> l1.append(l2)             # 把列表2追加到l1中作为第二个元素,列表2的引用计数为2
>>> l2.append(l1)             # 把列表1追加到l2中作为第二个元素,列表1的引用计数为2
# l1与l2
del l1     #列表1的引用计数为1
del l2 #列表2的引用计数为1

  现在列表1和列表2都没被其他变量名关联,但引用计数不为0,所以不会被回收,这就是循环引用的危害,为解决这问题,python引进了‘标记-清除’,‘分代回收’。

  3,标记-清除

  容器对象(list,set,dict,class,instance)都可以包含其他对象的引用,所以都可能产生循环引用。在了解‘标记-清除’之前,先得知道一个知识点:内存中有两块区域:堆区与栈区,在定义变量时,变量名放在栈区,变量值放在堆区,内存管理是对堆区的管理。

垃圾回收机制

  当有效内存空间被耗尽的时候,就会停止整个程序,然后进行两项工作,第一是标记,第二是清除

  标记:遍历所有的gc roots对象(栈区中的所有内容或者线程都可以作为gc roots对象),然后将所有gc roots对象可以直接访问或间接访问的对象标记为存活对象。

  清除:遍历堆区中所有的对象,将没有标记的对象全部清除

  4,分代回收

  基于引用计数的回收机制,每次回收内存,需要把所有的对象的引用计数都遍历一遍,这是非常耗费时间的,于是引入分代回收提高回收效率,采用‘空间换取时间的策略’。

  分代:在多次扫描的情况下,都没有被回收的变量值,gc机制会认为,该变量值的级别会增高,对其扫描的频率会降低。

  分代指的是根据存活时间来划分变量值的等级(也就是不同的代)

  新定义的变量值,会放在新生代中,假设每隔1分钟扫描一次,如果发现变量值依然存活,那该变量值的等级会提高,当权重大于3(假设为3),会放到青春代中,每隔5分钟扫描一次,继续存活下去,权重继续增高,当权重大于10(假设为10),会被放到老年代中,次时每隔10分钟扫描一次,以此类推。等级越高,被垃圾回收扫描的频率越低。

  回收:依然是引用计数作为回收依据