GC垃圾回收器
垃圾回收算法
01、垃圾回收的过程
在分代收集算法下:
- 当
jvm
内存不足时,就会触发年轻代得gc
; - 首先,会通过可达性分析来判断哪些对象垃圾对象;
- 接着,将这些对象放入死亡队列,进行对象得死亡判断与回收;
如果上述gc
后,内存还不够。就会触发老年代gc
。如果内存还不够,就会触发full gc
。
02、三种gc
(1)minor gc
- 在年轻代进行垃圾回收;
- 这种
gc
速度快、效率高、回收率高; - 当程序内存不足时,触发。
(2)major gc
- 在老年代进行垃圾回收;
- 这种
gc
速度慢、效率慢、回收率低; - 当
minor gc
后,还是没法满足后,就会触发major gc
;
(3)full gc
- 回收整个堆的对象
- 当
minor gc
、major gc
都没满足要求后,才会进行的gc
full gc
在java7、8
对于方法区的区别。
一、如何确定垃圾
01、引用计数
这里认为一个对象的引用没有被任何人持有的话,这个对象就是垃圾。
当一个对象被赋值给其他人时,其引用计数就会+1
。当引用对象不再引用它时,其引用计数就会-1
。当gc
发生时,就会认为这个对象是可以清除得。
1、优缺点分析
引用计数得优点在于快。当一个对象得引用计数为0时,就可以被gc
了,不需要进行可达性分析;
缺点在于无法处理循环引用,如上图红色部分。
现代
jvm
已经不使用这种方法
02、可达性分析
可达性分析会设置某些对象是gc root
,凡是某个对象通过引用链可以达到gc root
对象得话,就认为这个对象是活对象。反之,认为它是垃圾对象。
1、java
中哪些对象是gc root
对象?
- 所有得
thread
对象 - 栈帧中得局部变量表
- 方法区得静态成员
-
jni
持有得引用 monitor
- 其他
jvm
持有得gc root
:比如说:如果年轻代在gc
时,老年代里面得所有对象都是gc root
。
二、对象得死亡判定
通过可达性分析后,将不可达对象放入死亡队列;垃圾回收器调用这些不可达对象得finalize
方法最终判断是否回收他。
也就是说我们可以通过覆盖finalize
方法,让这个对象永远都不会垃圾回收。但是非常不推荐使用。
三、垃圾回收算法
java
中得gc
不仅要回收对象,还要压缩空间。压缩空间目的是让程序有更多连续内存使用,减少内存的碎片化。
gc
分代收集算法
01、分代假设
研究发现,jvm
中大部分对象都是用完后,立马就不再使用了。
02、内存分代
jvm
将对象分为3种年纪:
- 年轻代:
young
eden(tlabs)
survivor
- 老年代:
tenured(old)
- 永久代:
permgen/metaspace
(1)年轻代垃圾回收
- 当
eden
内存不够时,会触发年轻代gc
。此时,eden
内对象要不然作为垃圾回收了,要不然就进入s1
区; - 此时
s
区中对象得年龄会加1,并将s1
区对象汇合到s2
; - 汇合后,凡是对象超过
15
岁,就可以进入老年代了;
这里会涉及到一个gc
调优得现象:对象过早提升。
就是由于eden
区域过小,导致每次创建大对象时,eden
区域内存不够,只能在老年代上分配。这时候,就需要将eden
内存大小调大一点。
(2)老年代垃圾回收
老年代垃圾回收时,只会将垃圾对象清除掉,然后合并一下碎片空间。
相关知识
1、gc
的三种实现过程
mark-and-sweep
:标记清除
mark-sweep-compact
:标记、清除、压缩
mark-and-copy
:标记、拷贝
2、 gc
的mark
阶段
stop the world
(stw
)
stw
是指所有应用线程都到达safe point
点时,为了gc
工作需要,会停止所有的应用线程。这时候,gc
线程就可以开始扫描gc roots
。
这样直观的感觉就是应用卡顿,这也是gc
调优的关键指标。
注意:gc
的停顿与堆大小无关,只与活对象大小有关。有时候增加堆大小不仅不能减少延迟,反而会增加延迟。
垃圾回收器
一、serial gc
:串行垃圾回收器
单线程串行gc:serial、serial old
1、年轻代:mark-copy
2、老年代:mark-sweep-compact
3、相关配置:
-
-xx:+useserialgc
:开启serial gc
-
-xx:+printgcdetails
:开启打印gc详情 -
-xx:+printgcdatestamps
:开启打印gc时间戳 -
-xx:+printgctimestamps
:开启打印gc时间戳
4、应用介绍
(1)在jvm
启动参数上如下参数
-xx:+useserialgc -xx:+printgcdetails -xx:+printgcdatestamps -xx:+printgctimestamps
-xx
:代表这是一个非标准jvm参数,只在hotspot
虚拟机有效
+
:开始开启
(2)gc
日志的分析
# 时间戳 : gc花费的时间 2020-04-02t14:20:29.653+0800: 5.054: # gc开启的原因 gc开始的时间戳: [gc (allocation failure) 2020-04-02t14:20:29.653+0800: 5.054: # defnew表示我们使用的串行垃圾回收器:回收前年轻代大小->回收后年轻代大小(年轻代总的大小),花费的时间 [defnew: 151750k->5184k(157376k), 0.0180036 secs] # 回收堆的大小 -> 回收堆的大小(堆的总大小),花费的时间 162889k->24012k(506944k), 0.0180394 secs] # 时间:在用户模式下花费的时间,在系统模式下花费的时间,真实花费的时间 [times: user=0.02 sys=0.00, real=0.02 secs]
二、paraller gc
:并行垃圾回收器
- 年轻代:
mark-copy
- 老年代:
mark-sweep-compact
使用多个线程并发标记清除。
包含的垃圾回收器:parnew
、cms
、parallelscavenge
、parallel old
并发垃圾回收器经历了俩个阶段:
- 早期的时候,开发出
parallelscavenge
、parallel old
,分别回收年轻代和老年代 - 后来又开发出:
parnew
、cms
三、concurrent gc
:并发垃圾回收器
cms:concurrent mark sweep
1、paraller
vsconcurrent
并行、并发
2、优点
之前的垃圾回收器运行时,需要stw
,而这个时间可能很长。cms
为了减少stw
的暂停时间,就提出在部分时刻才需要所有应用线程停止,其他的时候应用线程和gc线程一样,一起工作。
3、缺点
-
cms
只能清除老年代,所以它需要搭配serial
、parnew
来清除年轻代。 -
cms
垃圾回收器只能实现mark-sweep
,无法做到compact
,因为应用线程在跟gc线程一起运行的;
4、过程
- 初始标记:
gc roots
直接引用 - 并行标记:大多数的活对象
- 重新标记:并发标记,因为上次并行走的时候,可能标记的不完全准确
- 并行清理: