1、来源
- ZGC收集器是由Oracle公司研发的。2018年建立了JEP 333将ZGC提交给OpenJDK,推进其进入OpenJDK11的发布清单中。
2、ZGC的堆内存布局
- 与Shenandoah和G1同样,ZGC也采用基于Region的堆内存布局。
-
ZGC的Region具备动态性。算法
分类以下:数据结构
- 小型Region(Small Region):容量固定为2MB,用于放置小于256KB的小对象。
- 中型Region(Medium Region):容量固定为32MB,用于放置大于等于256KB但小于4MB的对象。
- 大型Region(Large Region):容量不固定,能够动态变化,但必须为2MB的整数倍,用于放置4MB或以上的大对象。每一个大型Region中只会存放一个大对象,因此实际容量可能小于中型Region,最小容量可低至4MB。大型Region在ZGC的实现中是不会被重分配的,由于复制一个大对象的代价很是高昂。
3、并发整理算法的实现。
3.1 算法的由来
- G1收集器的筛选回收阶段是stop the world的,但收集器线程间是并行的,之因此不和用户线程并发执行,是由于G1只回收一部分Region,停顿时间是用户能够控制的。因此并不着急去实现,交给了ZGC去实现。
- 而且由于G1为了避免影响吞吐量才选择stw的。停顿用户线程能够最大幅度提升垃圾收集效率。
3.2 实现
3.2.1 读屏障
指针的自愈能力架构
3.2.2 染色指针技术
3.2.2.1 HotSpot虚拟机的标记实现方案有以下几种:
- 把标记直接记录在对象头上(如Serial收集器);
- 把标记记录在与对象相互独立的数据结构上(如G一、Shenandoah使用了一种至关于堆内存的1/64大小的,称为BitMap的结构来记录标记信息);
- 直接把标记信息记在引用对象的指针上(如ZGC)
为何会放在指针上呢?app
- 追踪式收集算法的标记阶段就是看有没有引用,因此能够只和指针打交道而无论指针所引用的对象自己。
- 例如对象标记过程就是打个三色标记,这些标记本质上只和对象引用有关,和对象自己无关。某个对象只有它的引用关系才能决定它的存活。
3.2.2.2 染色指针的解释
union _metadata {
以前都是oop,如今直接指向Klass了
Klass* _klass;
narrowKlass _compressed_klass;
} _metadata;
染色指针如图:
布局
3.2.2.3 染色指针的设计
ZGC多重映射下的寻址
操作系统
3.2.2.4 染色指针的做用。
-
一旦某个Region的存活对象被移走以后,这个Region当即就可以被释放和重用掉
,而没必要等待整个堆中全部指向该Region的引用都被修正后才能清理,这使得理论上只要还有一个空闲Region,ZGC就能完成收集。而Shenandoah须要等到更新阶段结束才能释放回收集中的Region,若是Region里面对象都存活的时候,须要1:1的空间才能完成收集。
-
染色指针能够大幅减小在垃圾收集过程当中内存屏障的使用数量
,ZGC只使用了读屏障。由于信息直接维护在指针中。
- 染色指针具有强大的扩展性,
它能够做为一种可扩展的存储结构用来记录更多与对象标记、重定位过程相关的数据
,以便往后进一步提升性能。
4、ZGC的过程
ZGC运做过程:

- 并发标记(Concurrent Mark):与G一、Shenandoah同样,并发标记是遍历对象图作可达性分析的阶段,它的初始标记和最终标记也会出现短暂的停顿,整个标记阶段只会更新染色指针中的Marked 0、Marked 1标志位。
-
并发预备重分配(Concurrent Prepare for Relocate):这个阶段须要根据特定的查询条件统计得出本次收集过程要清理哪些Region,将这些Region组成重分配集(Relocation Set)。ZGC每次回收都会扫描全部的Region,用范围更大的扫描成本换取省去G1中记忆集的维护成本。
- ZGC的重分配集只是决定里面的存活对象会被复制到其余的Region。不是为了效益回收
- JDK12的ZGC中开始支持的类卸载以及弱引用的处理,也是在这个阶段完成的。
-
并发重分配(Concurrent Relocate):重分配是ZGC执行过程当中的核心阶段,这个过程要把重分配集中的存活对象复制到新的Region上,并为重分配集中的每一个Region维护一个转发表(Forward Table),记录从旧对象到新对象的转向关系。
- ZGC收集器能仅从引用上就明确得知一个对象是否处于重分配集之中,若是用户线程此时并发访问了位于重分配集中的对象,此次访问将会被预置的内存屏障所截获,而后当即根据Region上的转发表记录将访问转发到新复制的对象上,并同时修正更新该引用的值,使其直接指向新对象,ZGC将这种行为称为指针的“自愈”(Self-Healing)能力。
- ZGC的染色指针由于“自愈”(Self-Healing)能力,因此只有第一次访问旧对象会变慢,而Shenandoah的Brooks转发指针是每次都会变慢。 一旦重分配集中某个Region的存活对象都复制完毕后,这个Region就能够当即释放用于新对象的分配,可是转发表还得留着不能释放掉,由于可能还有访问在使用这个转发表。
- 并发重映射(Concurrent Remap):重映射所作的就是修正整个堆中指向重分配集中旧对象的全部引用,可是ZGC中对象引用存在“自愈”功能,因此这个重映射操做并非很迫切。ZGC很巧妙地把并发重映射阶段要作的工做,合并到了下一次垃圾收集循环中的并发标记阶段里去完成,反正它们都是要遍历全部对象的,这样合并就节省了一次遍历对象图的开销。
5、ZGC的优势
- 低停顿,高吞吐量,ZGC收集过程当中额外耗费的内存小
- G1经过写屏障维护记忆集,才能处理跨代指针,得以实现增量回收。记忆集占用大量内存,写屏障对正常程序形成额外负担。
- ZGC没有写屏障,卡表之类的。
- 在多核处理器的某种架构下,ZGC优先在线程当前所处的处理器的本地内存上分配对象,以保证内存高效访问。
6、ZGC的缺点
-
承受的对象分配速率不会过高,由于浮动垃圾。
- ZGC的停顿时间是在10ms如下,可是ZGC的执行时间仍是远远大于这个时间的。假如ZGC全过程须要执行10分钟,在这个期间因为对象分配速率很高,将建立大量的新对象,这些对象很难进入当次GC,因此只能在下次GC的时候进行回收,这些只能等到下次GC才能回收的对象就是浮动垃圾。
- 形成回收到的内存空间小于期间并发产生的浮动垃圾所占的空间。
ZGC没有分代概念,每次都须要进行全堆扫描,致使一些“朝生夕死”的对象没能及时的被回收。
6.1 解决办法
- 增长堆容量大小,使得程序获得更多的喘息时间。治标不治本的方案。
- 从根本上解决这个问题,仍是须要引入分代收集。让新生对象在一个专门区域建立,而后专门针对这个区域进行更频繁的,更快的收集。
参考资料
《深刻理解Java虚拟机第三版》