深刻理解G1垃圾收集器

时间 2019-11-12

标签深刻理解 g1 垃圾收集繁體版

原文原文链接

G1 GC是Jdk7的新特性之1、Jdk7+版本均可以自主配置G1做为JVM GC选项；做为JVM GC算法的一次重大升级、DK7u后G1已相对稳定、且将来计划替代CMS、因此有必要深刻了解下：编程

不一样于其余的分代回收算法、G1将堆空间划分红了互相独立的区块。每块区域既有可能属于O区、也有多是Y区，且每类区域空间能够是不连续的（对比CMS的O区和Y区都必须是连续的）。这种将O区划分红多块的理念源于：当并发后台线程寻找可回收的对象时、有些区块包含可回收的对象要比其余区块多不少。虽然在清理这些区块时G1仍然须要暂停应用线程、但能够用相对较少的时间优先回收包含垃圾最多区块。这也是为何G1命名为Garbage First的缘由：第一时间处理垃圾最多的区块。并发

平时工做中大多数系统都使用CMS、即便静默升级到JDK7默认仍然采用CMS、那么G1相对于CMS的区别在：高并发

G1在压缩空间方面有优点
G1经过将内存空间分红区域（Region）的方式避免内存碎片问题
Eden, Survivor, Old区再也不固定、在内存使用效率上来讲更灵活
G1能够经过设置预期停顿时间（Pause Time）来控制垃圾收集时间避免应用雪崩现象
G1在回收内存后会立刻同时作合并空闲内存的工做、而CMS默认是在STW（stop the world）的时候作
G1会在Young GC中使用、而CMS只能在O区使用

就目前而言、CMS仍是默认首选的GC策略、可能在如下场景下G1更适合：spa

服务端多核CPU、JVM内存占用较大的应用（至少大于4G）
应用在运行过程当中会产生大量内存碎片、须要常常压缩空间
想要更可控、可预期的GC停顿周期；防止高并发下应用雪崩现象

一次完整G1GC的详细过程：

G1在运行过程当中主要包含以下4种操做方式：线程

YGC（不一样于CMS）
并发阶段
混合模式
full GC （通常是G1出现问题时发生）

YGC：

下面是一次YGC先后内存区域是示意图：日志

图中每一个小区块都表明G1的一个区域（Region），区块里面的字母表明不一样的分代内存空间类型（如[E]Eden,[O]Old,[S]Survivor）空白的区块不属于任何一个分区；G1能够在须要的时候任意指定这个区域属于Eden或是O区之类的。
G1 YoungGC在Eden充满时触发，在回收以后全部以前属于Eden的区块全变成空白。而后至少有一个区块是属于S区的（如图半满的那个区域），同时可能有一些数据移到了O区。code

目前淘系的应用大都使用PrintGCDetails参数打出GC日志、这个参数对G1一样有效、但日志内容颇为不一样；下面是一个Young GC的例子：对象

23.430: [GC pause (young), 0.23094400 secs]
...
[Eden: 1286M(1286M)->0B(1212M)
Survivors: 78M->152M Heap: 1454M(4096M)->242M(4096M)]
[Times: user=0.85 sys=0.05, real=0.23 secs]内存

上面日志的内容解析：Young GC实际占用230毫秒、其中GC线程占用850毫秒的CPU时间
E：内存占用从1286MB变成0、都被移出
S：从78M增加到了152M、说明从Eden移过来74M
Heap:占用从1454变成242M、说明此次Young GC一共释放了1212M内存空间
不少状况下，S区的对象会有部分晋升到Old区，另外若是S区已满、Eden存活的对象会直接晋升到Old区，这种状况下Old的空间就会涨

并发阶段：

一个并发G1回收周期先后内存占用状况以下图所示：

从上面的图表能够看出如下几点：
一、Young区发生了变化、这意味着在G1并发阶段内至少发生了一次YGC（这点和CMS就有区别），Eden在标记以前已经被彻底清空，由于在并发阶段应用线程同时在工做、因此能够看到Eden又有新的占用
二、一些区域被X标记，这些区域属于O区，此时仍然有数据存放、不一样之处在G1已标记出这些区域包含的垃圾最多、也就是回收收益最高的区域
三、在并发阶段完成以后实际上O区的容量变得更大了（O+X的方块）。这时由于这个过程当中发生了YGC有新的对象进入所致。此外，这个阶段在O区没有回收任何对象：它的做用主要是标记出垃圾最多的区块出来。对象其实是在后面的阶段真正开始被回收

G1并发标记周期能够分红几个阶段、其中有些须要暂停应用线程。第一个阶段是初始标记阶段。这个阶段会暂停全部应用线程-部分缘由是这个过程会执行一次YGC、下面是一个日志示例：

50.541: [GC pause (young) (initial-mark), 0.27767100 secs]
[Eden: 1220M(1220M)->0B(1220M)
Survivors: 144M->144M Heap: 3242M(4096M)->2093M(4096M)]
[Times: user=1.02 sys=0.04, real=0.28 secs]

上面的日志代表发生了YGC、应用线程为此暂停了280毫秒，Eden区被清空（71MB从Young区移到了O区）。
日志里面initial-mark的字样代表后台的并发GC阶段开始了。由于初始标记阶段自己也是要暂停应用线程的，
G1正好在YGC的过程当中把这个事情也一块儿干了。为此带来的额外开销不是很大、增长了20%的CPU，暂停时间相应的略微变长了些。

接下来，G1开始扫描根区域、日志示例：

50.819: [GC concurrent-root-region-scan-start]
51.408: [GC concurrent-root-region-scan-end, 0.5890230]

一共花了580毫秒，这个过程没有暂停应用线程；是后台线程并行处理的。这个阶段不能被YGC所打断、所以后台线程有足够的CPU时间很关键。若是Young区空间刚好在Root扫描的时候
满了、YGC必须等待root扫描以后才能进行。带来的影响是YGC暂停时间会相应的增长。这时的GC日志是这样的：

350.994: [GC pause (young)
351.093: [GC concurrent-root-region-scan-end, 0.6100090]
351.093: [GC concurrent-mark-start],0.37559600 secs]

GC暂停这里能够看出在root扫描结束以前就发生了，代表YGC发生了等待，等待时间大概是100毫秒。
在root扫描完成后，G1进入了一个并发标记阶段。这个阶段也是彻底后台进行的；GC日志里面下面的信息表明这个阶段的开始和结束：

111.382: [GC concurrent-mark-start]
....
120.905: [GC concurrent-mark-end, 9.5225160 sec]

并发标记阶段是能够被打断的，好比这个过程当中发生了YGC就会。这个阶段以后会有一个二次标记阶段和清理阶段：

120.910: [GC remark 120.959:
[GC ref-PRC, 0.0000890 secs], 0.0718990 secs]
[Times: user=0.23 sys=0.01, real=0.08 secs]
120.985: [GC cleanup 3510M->3434M(4096M), 0.0111040 secs]
[Times: user=0.04 sys=0.00, real=0.01 secs]

这两个阶段一样会暂停应用线程，但时间很短。接下来还有额外的一次并发清理阶段：

120.996: [GC concurrent-cleanup-start]
120.996: [GC concurrent-cleanup-end, 0.0004520]

到此为止，正常的一个G1周期已完成–这个周期主要作的是发现哪些区域包含可回收的垃圾最多（标记为X），实际空间释放较少。

混合GC：

接下来G1执行一系列的混合GC。这个时期由于会同时进行YGC和清理上面已标记为X的区域，因此称之为混合阶段，下面是一个混合GC执行的先后示意图：

像普通的YGC那样、G1彻底清空掉Eden同时调整survivor区。另外，两个标记也被回收了，他们有个共同的特色是包含最多可回收的对象，所以这两个区域绝对部分空间都被释放了。这两个区域任何存活的对象都被移到了其余区域（和YGC存活对象晋升到O区相似）。这就是为何G1的堆比CMS内存碎片要少不少的缘由–移动这些对象的同时也就是在压缩对内存。下面是一个混合GC的日志：

79.826: [GC pause (mixed), 0.26161600 secs]
....
[Eden: 1222M(1222M)->0B(1220M)
Survivors: 142M->144M Heap: 3200M(4096M)->1964M(4096M)]
[Times: user=1.01 sys=0.00, real=0.26 secs]

上面的日志能够注意到Eden释放了1222MB、但整个堆的空间释放内存要大于这个数目。数量相差看起来比较少、只有16MB，可是要考虑同时有survivor区的对象晋升到O区；另外，每次混合GC只是清理一部分的O区内存，整个GC会一直持续到几乎全部的标记区域垃圾对象都被回收，这个阶段完了以后G1会从新回到正常的YGC阶段。周期性的，当O区内存占用达到必定数量以后G1又会开启一次新的并行GC阶段.

原创文章，转载请注明： 转载自并发编程网 – ifeve.com本文连接地址: 深刻理解G1垃圾收集器