欢迎您访问程序员文章站本站旨在为大家提供分享程序员计算机编程知识!
您现在的位置是: 首页

JAVA虚拟机之四:G1垃圾收集器

程序员文章站 2022-05-04 09:04:45
...

一、关于G1

G1 (Garbage-First)是一款面向服务器的垃圾收集器,主要针对配备多颗处理器及大容量内存的机器. 以极高概率满足GC停顿时间要求的同时,还具备高吞吐量性能特征. 在Oracle JDK 7 update 4 及以上版本中得到完全支持, 专为以下应用程序设计:

 

  • 可以像CMS收集器一样,GC操作与应用的线程一起并发执行 
  • 紧凑的空闲内存区间且没有很长的GC停顿时间. 
  • 需要可预测的GC暂停耗时. 
  • 不想牺牲太多吞吐量性能. 
  • 启动后不需要请求更大的Java堆. 

 

G1的长期目标是取代CMS(Concurrent Mark-Sweep Collector, 并发标记-清除). 因为特性的不同使G1成为比CMS更好的解决方案. 一个区别是,G1是一款压缩型的收集器.G1通过有效的压缩完全避免了对细微空闲内存空间的分配,不用依赖于regions,这不仅大大简化了收集器,而且还消除了潜在的内存碎片问题。除压缩以外,G1的垃圾收集停顿也比CMS容易估计,也允许用户自定义所希望的停顿参数(pause targets)。

 

 

在G1中,堆被划分成 许多个连续的区域(region)。每个区域大小相等,在1M~32M之间。JVM最多支持2000个区域,可推算G1能支持的最大内存为2000*32M=62.5G。区域(region)的大小在JVM初始化的时候决定,也可以用-XX:G1HeapReginSize设置。在G1中没有物理上的Yong(Eden/Survivor)/Old Generation,它们是逻辑的,使用一些非连续的区域(Region)组成的。这在内存使用上提供了更多的灵活性。 

 

G1执行垃圾回收的处理方式与CMS相似. G1在全局标记阶段(global marking phase)并发执行, 以确定堆内存中哪些对象是存活的。标记阶段完成后,G1就可以知道哪些heap区的empty空间最大。它会首先回收这些区,通常会得到大量的*空间. 这也是为什么这种垃圾收集方法叫做Garbage-First(垃圾优先)的原因。顾名思义, G1将精力集中放在可能布满可收回对象的区域, 可回收对象(reclaimable objects)也就是所谓的垃圾. G1使用暂停预测模型(pause prediction model)来达到用户定义的目标暂停时间,并根据目标暂停时间来选择此次进行垃圾回收的heap区域数量.

被G1标记为适合回收的heap区将使用转移(evacuation)的方式进行垃圾回收. G1将一个或多个heap区域中的对象拷贝到其他的单个区域中,并在此过程中压缩和释放内存. 在多核CPU上转移是并行执行的(parallel on multi-processors), 这样能减少停顿时间并增加吞吐量. 因此,每次垃圾收集时, G1都会持续不断地减少碎片, 并且在用户给定的暂停时间内执行. 这比以前的方法强大了很多. CMS垃圾收集器(Concurrent Mark Sweep,并发标记清理)不进行压缩. ParallelOld 垃圾收集只对整个堆执行压缩,从而导致相当长的暂停时间。

需要强调的是, G1并不是一款实时垃圾收集器(real-time collector). 能以极高的概率在设定的目标暂停时间内完成,但不保证绝对在这个时间内完成。 基于以前收集的各种监控数据, G1会根据用户指定的目标时间来预估能回收多少个heap区. 因此,收集器有一个相当精确的heap区耗时计算模型,并根据该模型来确定在给定时间内去回收哪些heap区.

注意 G1分为两个阶段: 并发阶段(concurrent, 与应用线程一起运行, 如: 细化 refinement、标记 marking、清理 cleanup) 和 并行阶段(parallel, 多线程执行, 如: 停止所有JVM线程, stop the world). 而 FullGC(完整垃圾收集)仍然是单线程的, 但如果进行适当的调优,则应用程序应该能够避免 full GC。

G1 的内存占用(Footprint)

如果从 ParallelOldGC 或者 CMS收集器迁移到 G1, 您可能会看到JVM进程占用更多的内存(a larger JVM process size). 这在很大程度上与 “accounting” 数据结构有关, 如 Remembered Sets 和 Collection Sets.

  1. Remembered Sets 简称 RSets, 跟踪指向某个heap区内的对象引用. 堆内存中的每个区都有一个 RSet. RSet 使heap区能并行独立地进行垃圾集合. RSets的总体影响小于5%. 
  2. Collection Sets 简称 CSets, 收集集合, 在一次GC中将执行垃圾回收的heap区. GC时在CSet中的所有存活数据(live data)都会被转移(复制/移动). 集合中的heap区可以是 Eden, survivor, 和/或 old generation. CSets所占用的JVM内存小于1%. 

 

 

推荐使用 G1 的场景(Recommended Use Cases)

G1的首要目标是为需要大量内存的系统提供一个保证GC低延迟的解决方案. 也就是说堆内存在6GB及以上,稳定和可预测的暂停时间小于0.5秒.

如果应用程序具有如下的一个或多个特征,那么将垃圾收集器从CMS或ParallelOldGC切换到G1将会大大提升性能.

  • Full GC 次数太频繁或者消耗时间太长. 
  • 对象分配的频率或代数提升(promotion)显著变化. 
  • 受够了太长的垃圾回收或内存整理时间(超过0.5~1秒) 

 

注意: 如果正在使用CMS或ParallelOldGC,而应用程序的垃圾收集停顿时间并不长,那么继续使用现在的垃圾收集器是个好主意. 使用最新的JDK时并不要求切换到G1收集器。

 

二、G1 GC

1、新生代收集

G1的新生代收集跟ParNew类似,当新生代占用达到一定比例的时候,开始出发收集。

JAVA虚拟机之四:G1垃圾收集器
            
    
    博客分类: java虚拟机 java虚拟机G1G1垃圾收集器 

JAVA虚拟机之四:G1垃圾收集器
            
    
    博客分类: java虚拟机 java虚拟机G1G1垃圾收集器 

被圈起的绿色部分为新生代的区域(region),经过Young GC后存活的对象被复制到一个或者多个区域空闲中,这些被填充的区域将是新的新生代;当新生代对象的年龄(逃逸过一次Young GC年龄增加1)已经达到某个阈值(ParNew默认15),被复制到老年代的区域中。

回收过程是停顿的(STW,Stop-The-Word);回收完成之后根据Young GC的统计信息调整Eden和Survivor的大小,有助于合理利用内存,提高回收效率。回收的过程多个回收线程并发收集。

 

2、老年代收集

和CMS类似,G1收集器收集老年代对象会有短暂停顿。

  1. 标记阶段,首先初始标记(Initial-Mark),这个阶段是停顿的(Stop the World Event),并且会触发一次普通Mintor GC。对应GC log:GC pause (young) (inital-mark)
  2. Root Region Scanning,程序运行过程中会回收survivor区(存活到老年代),这一过程必须在young GC之前完成。
  3. Concurrent Marking,在整个堆中进行并发标记(和应用程序并发执行),此过程可能被young GC中断。在并发标记阶段,若发现区域对象中的所有对象都是垃圾,那个这个区域会被立即回收(图中打X)。同时,并发标记过程中,会计算每个区域的对象活性(区域中存活对象的比例)。
    JAVA虚拟机之四:G1垃圾收集器
            
    
    博客分类: java虚拟机 java虚拟机G1G1垃圾收集器 
     
  4. Remark, 再标记,会有短暂停顿(STW)。再标记阶段是用来收集 并发标记阶段 产生新的垃圾(并发阶段和应用程序一同运行);G1中采用了比CMS更快的初始快照算法:snapshot-at-the-beginning (SATB)。
  5. Copy/Clean up,多线程清除失活对象,会有STW。G1将回收区域的存活对象拷贝到新区域,清除Remember Sets,并发清空回收区域并把它返回到空闲区域链表中。
    JAVA虚拟机之四:G1垃圾收集器
            
    
    博客分类: java虚拟机 java虚拟机G1G1垃圾收集器 
  6. 复制/清除过程后。回收区域的活性对象已经被集中回收到深蓝色和深绿色区域。
    JAVA虚拟机之四:G1垃圾收集器
            
    
    博客分类: java虚拟机 java虚拟机G1G1垃圾收集器 

 3、测试收集

    代码如下:

package com.tools138.com;

/**
 * 
 * @author alaric
 * 
 */
public class Test3 {

	private static int n = 20;

	/**
	 * @param args
	 * @throws InterruptedException
	 */
	public static void main(String[] args) throws InterruptedException {
		// TODO Auto-generated method stub

		byte[] b1 = getM(50);
		byte[] b2 = getM(50);
		byte[] b3 = getM(50);
		byte[] b4 = getM(50);
		byte[] b5 = getM(50);
		byte[] b6 = getM(50);
		byte[] b7 = getM(5);
		byte[] b8 = getM(5);
		byte[] b9 = getM(5);
		byte[] b10 = getM(5);
		byte[] b11 = getM(5);
		byte[] b12 = getM(5);
		byte[] b13 = getM(5);
		byte[] b14 = getM(5);
		byte[] b15 = getM(5);
		byte[] b16 = getM(5);
		byte[] b17 = getM(5);
		byte[] b18 = getM(5);
		byte[] b19 = getM(5);
		byte[] b20 = getM(100);
		byte[] b21 = getM(100);
		byte[] b22 = getM(100);
		byte[] b23 = getM(100);

	}

	public static byte[] getM(int m) {
		return new byte[1024 * 1024 * m];
	}

}

 

 

 vm参数配置如下:

 

-server -verbose:gc -Xms512m -Xmx512m -Xmn192m -XX:+UseG1GC -XX:MaxGCPauseMillis=100 -XX:InitiatingHeapOccupancyPercent=40  -XX:SurvivorRatio=8 -XX:MaxTenuringThreshold=15 -XX:G1HeapRegionSize=2  -Xloggc:D:/logs/gc.log -XX:+HeapDumpOnOutOfMemoryError -XX:HeapDumpPath=D:/logs/HeapDumpOnOutOfMemoryError.log -XX:+DisableExplicitGC -XX:+PrintGC -XX:+PrintGCDetails -XX:+PrintGCTimeStamps

 代码和参数配置的意思是直接让堆内存溢出,可以直接观察到G1 GC的收集过程,gc.log如下:

 

0.245: [GC pause (G1 Humongous Allocation) (young) (initial-mark), 0.0011950 secs]
   [Parallel Time: 1.0 ms, GC Workers: 4]
      [GC Worker Start (ms): Min: 245.0, Avg: 245.0, Max: 245.1, Diff: 0.0]
      [Ext Root Scanning (ms): Min: 0.3, Avg: 0.5, Max: 0.9, Diff: 0.7, Sum: 1.8]
      [Update RS (ms): Min: 0.0, Avg: 0.0, Max: 0.0, Diff: 0.0, Sum: 0.0]
         [Processed Buffers: Min: 0, Avg: 0.0, Max: 0, Diff: 0, Sum: 0]
      [Scan RS (ms): Min: 0.0, Avg: 0.0, Max: 0.0, Diff: 0.0, Sum: 0.0]
      [Code Root Scanning (ms): Min: 0.0, Avg: 0.0, Max: 0.0, Diff: 0.0, Sum: 0.0]
      [Object Copy (ms): Min: 0.0, Avg: 0.5, Max: 0.6, Diff: 0.6, Sum: 1.8]
      [Termination (ms): Min: 0.0, Avg: 0.0, Max: 0.0, Diff: 0.0, Sum: 0.1]
         [Termination Attempts: Min: 1, Avg: 1.0, Max: 1, Diff: 0, Sum: 4]
      [GC Worker Other (ms): Min: 0.0, Avg: 0.0, Max: 0.0, Diff: 0.0, Sum: 0.1]
      [GC Worker Total (ms): Min: 0.9, Avg: 1.0, Max: 1.0, Diff: 0.0, Sum: 3.9]
      [GC Worker End (ms): Min: 246.0, Avg: 246.0, Max: 246.0, Diff: 0.0]
   [Code Root Fixup: 0.0 ms]
   [Code Root Purge: 0.0 ms]
   [Clear CT: 0.0 ms]
   [Other: 0.2 ms]
      [Choose CSet: 0.0 ms]
      [Ref Proc: 0.0 ms]
      [Ref Enq: 0.0 ms]
      [Redirty Cards: 0.0 ms]
      [Humongous Register: 0.0 ms]
      [Humongous Reclaim: 0.0 ms]
      [Free CSet: 0.0 ms]
   [Eden: 2048.0K(192.0M)->0.0B(191.0M) Survivors: 0.0B->1024.0K Heap: 202.0M(512.0M)->200.6M(512.0M)]
 [Times: user=0.00 sys=0.00, real=0.00 secs]
0.246: [GC concurrent-root-region-scan-start]
0.247: [GC concurrent-root-region-scan-end, 0.0006084 secs]
0.247: [GC concurrent-mark-start]
0.247: [GC concurrent-mark-end, 0.0000903 secs]
0.259: [GC remark 0.259: [Finalize Marking, 0.0000809 secs] 0.259: [GC ref-proc, 0.0000390 secs] 0.259: [Unloading, 0.0005304 secs], 0.0022501 secs]
 [Times: user=0.00 sys=0.00, real=0.00 secs]
0.274: [GC cleanup 300M->300M(512M), 0.0003358 secs]
 [Times: user=0.00 sys=0.00, real=0.00 secs] 
黑色粗体说明一个完整的老年代GC过程,蓝色代表一次新生代GC过程。一个大对象进入后,触发新生代垃圾回收,然后进入老年代,同时老年代也开始初始标记-并发根扫描-并发标记-重新标记-清除。详细的日志理解请看https://blogs.oracle.com/poonam/entry/understanding_g1_gc_logs

 

三、垃圾收集器配置参数:

Option and Default Value Description
-XX:+UseG1GC Use the Garbage First (G1) Collector
-XX:MaxGCPauseMillis=n Sets a target for the maximum GC pause time. This is a soft goal, and the JVM will make its best effort to achieve it.
-XX:InitiatingHeapOccupancyPercent=n Percentage of the (entire) heap occupancy to start a concurrent GC cycle. It is used by GCs that trigger a concurrent GC cycle based on the occupancy of the entire heap, not just one of the generations (e.g., G1). A value of 0 denotes 'do constant GC cycles'. The default value is 45.
-XX:NewRatio=n Ratio of old/new generation sizes. The default value is 2.
-XX:SurvivorRatio=n Ratio of eden/survivor space size. The default value is 8.
-XX:MaxTenuringThreshold=n Maximum value for tenuring threshold. The default value is 15.
-XX:ParallelGCThreads=n Sets the number of threads used during parallel phases of the garbage collectors. The default value varies with the platform on which the JVM is running.
-XX:ConcGCThreads=n Number of threads concurrent garbage collectors will use. The default value varies with the platform on which the JVM is running.
-XX:G1ReservePercent=n Sets the amount of heap that is reserved as a false ceiling to reduce the possibility of promotion failure. The default value is 10.
-XX:G1HeapRegionSize=n With G1 the Java heap is subdivided into uniformly sized regions. This sets the size of the individual sub-divisions. The default value of this parameter is determined ergonomically based upon heap size. The minimum value is 1Mb and the maximum value is 32Mb.

 

 

 

参考资料:
  • JAVA虚拟机之四:G1垃圾收集器
            
    
    博客分类: java虚拟机 java虚拟机G1G1垃圾收集器 
  • 大小: 26.5 KB
  • JAVA虚拟机之四:G1垃圾收集器
            
    
    博客分类: java虚拟机 java虚拟机G1G1垃圾收集器 
  • 大小: 45.7 KB
  • JAVA虚拟机之四:G1垃圾收集器
            
    
    博客分类: java虚拟机 java虚拟机G1G1垃圾收集器 
  • 大小: 49 KB
  • JAVA虚拟机之四:G1垃圾收集器
            
    
    博客分类: java虚拟机 java虚拟机G1G1垃圾收集器 
  • 大小: 81.9 KB
  • JAVA虚拟机之四:G1垃圾收集器
            
    
    博客分类: java虚拟机 java虚拟机G1G1垃圾收集器 
  • 大小: 46.3 KB