ZGC(The Z Garbage Collector)是JDK 11中推出的一款追求极致低延迟的实验性质的垃圾收集器,它曾经设计目标包括:java
当初,提出这个目标的时候,有不少人都以为设计者在吹牛逼。面试
但今天看来,这些“吹下的牛逼”都在一个个被实现。算法
基于最新的JDK15来看,“停顿时间不超过10ms”和“支持16TB的堆”这两个目标已经实现,而且官方明确指出JDK15中的ZGC再也不是实验性质的垃圾收集器,且建议投入生产了。并发
ZGC已经熟了,面试题还会远吗?app
本文会从ZGC的设计思路出发,讲清楚为什么ZGC能在低延时场景中的应用中有着如此卓越的表现。less
为了能更好的理解ZGC的内存管理,咱们先看一下这个例子:性能
你在你爸爸妈妈眼中是儿子,在你女友眼中是男友。在全世界人面前就是最帅的人。你还有一个名字,但名字也只是你的一个代号,并非你本人。将这个关系画一张映射图表示:测试
假如你的名字是全世界惟一的,经过“你的名字”、“你爸爸的儿子”、“你女友的男友”,“世界上最帅的人”最后定位到的都是你本人。优化
如今咱们再来看看ZGC的内存管理。spa
ZGC为了能高效、灵活地管理内存,实现了两级内存管理:虚拟内存和物理内存,而且实现了物理内存和虚拟内存的映射关系。这和操做系统中虚拟地址和物理地址设计思路基本一致。
当应用程序建立对象时,首先在堆空间申请一个虚拟地址,ZGC同时会为该对象在Marked0、Marked1和Remapped三个视图空间分别申请一个虚拟地址,且这三个虚拟地址对应同一个物理地址。
图中的Marked0、Marked1和Remapped三个视图是什么意思呢?
对照上面的例子,这三个视图分别对应的就是"你爸爸眼中",“你女友的眼中”,“全世界人眼中”。
而三个视图里面的地址,都是虚拟地址,对应的是“你爸爸眼中的儿子”,“你女友眼中的男友”......
最后,这些虚地址都能映射到同一个物理地址,这个物理地址对应上面例子中的“你本人”。
用一段简单的Java代码表示这种关系:
在ZGC中这三个空间在同一时间点有且仅有一个空间有效。
为何这么设计呢?这就是ZGC的高明之处,利用虚拟空间换时间,这三个空间的切换是由垃圾回收的不一样阶段触发的,经过限定三个空间在同一时间点有且仅有一个空间有效高效的完成GC过程的并发操做,具体实现会在后面讲ZGC并发处理算法的部分再详细描述。
在讲ZGC并发处理算法以前,还须要补充一个知识点——染色指针。
咱们都知道,以前的垃圾收集器都是把GC信息(标记信息、GC分代年龄..)存在对象头的Mark Word里。举个例子:
若是某我的是个垃圾人,就在这我的的头上盖一个“垃圾”的章;若是这我的不是垃圾了,就把这我的头上的“垃圾”印章洗掉。
而ZGC是这样作的:
若是某我的是垃圾人。就在这我的的身份证信息里面标注这我的是个垃圾,之后无论这我的在哪刷身份证,别人都知道他是个垃圾人了。也许哪一天,这我的醒悟了再也不是垃圾人了,就把这我的身份证里面的“垃圾”标志去掉。
在这例子中,“这我的”就是一个对象,而“身份证”就是指向这个对象的指针。
ZGC将信息存储在指针中,这种技术有一个高大上的名字——染色指针(Colored Pointer)。
在64位的机器中,对象指针是64位的。
读屏障是JVM向应用代码插入一小段代码的技术。当应用线程从堆中读取对象引用时,就会执行这段代码。千万不要把这个读屏障和Java内存模型里面的读屏障搞混了,二者根本不是同一个东西,ZGC中的读屏障更像是一种AOP技术,在字节码层面或者编译代码层面给读操做增长一个额外的处理。
读屏障实例:
Object o = obj.FieldA // 从堆中读取对象引用,须要加入读屏障 <load barrier needed here> Object p = o // 无需加入读屏障,由于不是从堆中读取引用 o.dosomething() // 无需加入读屏障,由于不是从堆中读取引用 int i = obj.FieldB // 无需加入读屏障,由于不是对象引用
ZGC中读屏障的代码做用:
GC线程和应用线程是并发执行的,因此存在应用线程去A对象内部的引用所指向的对象B的时候,这个对象B正在被GC线程移动或者其余操做,加上读屏障以后,应用线程会去探测对象B是否被GC线程操做,而后等待操做完成再读取对象,确保数据的准确性。具体的探测和操做步骤以下:
这样会影响程序的性能吗?
会。据测试,最多百分之4的性能损耗。但这是ZGC并发转移的基础,为了下降STW,设计者认为这点牺牲是可接受的。
ZGC并发处理算法利用全局空间视图的切换和对象地址视图的切换,结合SATB算法实现了高效的并发。
以上全部的铺垫,都是为了讲清楚ZGC的并发处理算法,在一些博文上,都说染色指针和读屏障是ZGC的核心,但都没有讲清楚二者是如何在算法里面被利用的,我认为,ZGC的并发处理算法才是ZGC的核心,染色指针和读屏障只不过是为算法服务而已。
ZGC的并发处理算法三个阶段的全局视图切换以下:
标记阶段全局视图切换到M0视图。由于应用程序和标记线程并发执行,那么对象的访问可能来自标记线程和应用程序线程。
在标记阶段结束以后,对象的地址视图要么是M0,要么是Remapped。
当标记阶段结束后,ZGC会把全部活跃对象的地址存到对象活跃信息表,活跃对象的地址视图都是M0。
转移阶段切换到Remapped视图。由于应用程序和转移线程也是并发执行,那么对象的访问可能来自转移线程和应用程序线程。
至此,ZGC的一个垃圾回收周期中,并发标记和并发转移就结束了。
咱们提到在标记阶段存在两个地址视图M0和M1,上面的算法过程显示只用到了一个地址视图,为何设计成两个?简单地说是为了区别前一次标记和当前标记。
ZGC是按照页面进行部份内存垃圾回收的,也就是说当对象所在的页面须要回收时,页面里面的对象须要被转移,若是页面不须要转移,页面里面的对象也就不须要转移。
如图,这个对象在第二次GC周期开始的时候,地址视图仍是M0。若是第二次GC的标记阶段还切到M0视图的话,就不能区分出对象是活跃的,仍是上一次垃圾回收标记过的。这个时候,第二次GC周期的标记阶段切到M1视图的话就能够区分了,此时这3个地址视图表明的含义是:
如今,咱们能够回答“使用地址视图和染色指针有什么好处”这个问题了
使用地址视图和染色指针能够加快标记和转移的速度。之前的垃圾回收器经过修改对象头的标记位来标记GC信息,这是有内存存取访问的,而ZGC经过地址视图和染色指针技术,无需任何对象访问,只须要设置地址中对应的标志位便可。这就是ZGC在标记和转移阶段速度更快的缘由。
当GC信息再也不存储在对象头上时而存在引用指针上时,当肯定一个对象已经无用的时候,能够当即重用对应的内存空间,这是把GC信息放到对象头所作不到的。
ZGC采用的是标记-复制算法,标记、转移和重定位阶段几乎都是并发的,ZGC垃圾回收周期以下图所示:
ZGC只有三个STW阶段:初始标记,再标记,初始转移。
其中,初始标记和初始转移分别都只须要扫描全部GC Roots,其处理时间和GC Roots的数量成正比,通常状况耗时很是短;
再标记阶段STW时间很短,最多1ms,超过1ms则再次进入并发标记阶段。即,ZGC几乎全部暂停都只依赖于GC Roots集合大小,停顿时间不会随着堆的大小或者活跃对象的大小而增长。与ZGC对比,G1的转移阶段彻底STW的,且停顿时间随存活对象的大小增长而增长。
ZGC诞生于JDK11,通过不断的完善,JDK15中的ZGC已经再也不是实验性质的了。
从只支持Linux/x64,到如今支持多平台;从不支持指针压缩,到支持压缩类指针.....
在JDK16,ZGC将支持并发线程栈扫描(Concurrent Thread Stack Scanning),根据SPECjbb2015测试结果,实现并发线程栈扫描以后,ZGC的STW时间又能下降一个数量级,停顿时间将进入毫秒时代。
ZGC已然是一款优秀的垃圾收集器了,它借鉴了Pauseless GC,也彷佛在朝着C4 GC的方向发展——引入分代思想。
Oracle的努力,让咱们开发者看到了商用级别的GC“飞入寻常百姓家”的但愿,随着JDK的发展,我相信在将来的某一天,JVM调优这种反人类的操做将不复存在,底层的GC会自适应各类状况自动优化。
ZGC确实是Java的最前沿的技术,但在G1都没有普及的今天,谈论ZGC彷佛为时过早。但也许咱们探讨的不是ZGC,而是ZGC背后的设计思路。
但愿你能有所收获!
为了对每一篇发出去的文章负责,力求准确,我通常是参考官方文档和业界权威的书籍,有些时候,还须要看一些论文,看一部分源代码。而官方文档和论文通常都是英文,对于一个英语四级只考了456分的人来讲,很是艰难,整个过程都是谷歌翻译和有道词典陪伴着个人。由于一些专业术语翻译的不够准确,还须要英文和翻译对照慢慢理解。
但即便这样,也不免会有纰漏,若是你发现了,欢迎提出,我会对其修正。
你的正反馈对我来讲很是重要,点个赞,点个再看,点个关注都是对我最大的支持!
谢谢您的阅读,咱们下期再见!