Java垃圾收集器——Serial，Parallel，CMS，G1收集器概述

时间 2019-11-11

标签 java 垃圾收集 serial parallel cms g1 概述栏目 Java 繁體版

原文原文链接

1.概述

Java应用启动的时候，除了配置Xms以及Xmx参数（Xmx:InitialHeapSize， Xms:MaxHeapSize），还须要选择合适的垃圾收集器。
截止Jdk1.8，共提供了7款垃圾收集器，每一款垃圾收集器都具备不一样的特色。咱们所须要作的就是，根据Java应用的特色已经部署环境，肯定不一样垃圾收集器的组合。这几款垃圾收集器之间联系以下图所示：
程序员

由上图可知，Serial，ParNew，Parallel Scavenge主要负责Young generation区域的垃圾回收，CMS，Serial Odl， Parallel Old主要负责Tenured generation区域的垃圾回收，G1在Young generation以及Tenured generation区域都可以使用(详细缘由在下文会进行阐述)。算法

2.垃圾收集器概述

jdk提供了多重垃圾收集器，下文会提供主流的垃圾收集器搭配组合，各类组合按照特色分为如下三类：微信

串行收集器：Serial + Serial Old;
并行收集器: Parallel Scavenge + Parallel Old，专一于应用吞吐量；
并发收集器：CMS，G1，专一于响应时间。

2.1 Serial收集器

Serial收集器（Serial + Serial Old）的主要特色是单线程回收资源。当须要执行垃圾回收时，程序会暂停一切工做(又称为Stop The World，STW)，使用复制算法完成垃圾清理工做。多线程

优势：并发

简单高效，是Client模式下默认的垃圾收集器；
对于资源受限的环境，好比单核(例如Docker中设置单核)，单线程效率较高；
内存小于一两百兆的桌面程序中，交互有限，则有限的STW是能够接受的。

缺点：post

垃圾回收速度较慢且回收能力有限，频繁的STW会致使较差的使用体验。

ParNew收集器是Serial收集器的多线程版本，除了使用多线程进行垃圾收集工做，其余的控制参数，收集算法，对象分配规则等均与Serial收集器一致。
ParNew收集器在单核/双核环境下，效率未必有Serial收集器工做效率高(多线程切换开销等因素限制)，固然随着核数的增长，其性能也会获得较大的提高。性能

2.2 Parallel收集器

Parallel收集器（Parallel Scavenge + Parallel Old）相比于Serial收集器的主要特色是，其是经过多线程完成垃圾的清理工做。其中Parallel Scavenge使用复制算法完成垃圾收集（Parallel Old使用标记整理算法），若是从这一点看其与ParNew类似，但实际上二者的出发点存在区别，区别以下所示：线程

ParNew出发点在于加速资源回收的速度，以减小应用的STW时间；
Parallel Scavenge出发点在于资源回收的吞吐量(吞吐量:用户线程时间/(用户线程时间 + GC线程时间)).

高吞吐量适合于交互较少的后台应用程序（诸如科学计算应用），可以更加充分的压榨CPU。开发者能够根据应用的实际状况，经过调整如下两个参数追求最优性能：日志

最大停顿时间：垃圾收集器在执行垃圾回收时终端应用执行的最大时间间隔,-XX:MaxGCPauseMills;
吞吐量：执行垃圾收集的时间与执行应用的时间占比，-XX：GCTimeRatio= ，垃圾收集时间占比：1/(1+N)。

2.3 CMS收集器

CMS(Concurrent Mark Sweep)收集器是jdk 1.5推出的第一款真正意义上的并发收集器（针对老年代），实现了让垃圾收集器与用户线程（近似）同时工做，其具备如下特色：对象

基于"标记-清除"算法；
以获取最短回收停顿时间为目标；
并发收集，停顿时间短。

CMS的垃圾收集过程比较复杂，主要步骤以下所示：

(1) CMS Initial Mark：初始标记Root(会STW，单线程执行，不过由于仅仅把GC Roots的直接可达对象标记一下，因此速度较快)；

(2) CMS Concurrent Mark：并发标记；

(3) CMS Concurrent Preclean: 并发预清理；

(4) CMS Remark: 并发标记(会STW，此步骤是由于在并发标记的过程当中可能会产生新的垃圾，须要从新标记新产生的垃圾)；

(5) CMS Concurrent Sweep: 并发清除；

(6) CMS Concurrent Reset: 并发重置。

以上步骤中，最为耗费时间的并发标记与并发清除阶段，不须要应用程序暂停执行，因此垃圾回收的停顿时间较短。

缺点：

对CPU资源敏感：并发收集虽然不会暂停应用程序，可是会占用CPU资源从而下降应用程序的执行效率（CMS默认收集线程数量=(CPU数量 + 3) / 4）;
产生浮动垃圾：在并发清除时，用户线程会产生新的垃圾，称之为浮动垃圾（并发清除时须要预留内存空间，不能像其余收集器在老年代几乎填满以后再进行收集工做）。
产生空间碎片：使用"标记-清除"算法，会产生大量不连续的内存碎片，从而致使在分配大内存对象时，没法找到足够的连续内存，从而须要提早触发一次Full GC操做。

针对以上缺点，能够从以下参数进行改进：

-XX:ConcGCThreads:并发的GC线程数，从而下降CPU敏感度；
-XX:CMSInitiatingOccupancyFraction：合理设置CMS的预留内存空间；
-XX:+UseCMSCompactAtFullGCCollection: FullGC以后执行压缩操做，消减内存碎片；
-XX:CMSFullGCBeforeCompaction: 执行屡次FullGC以后执行压缩操做，消减内存碎片。

2.4 G1收集器

须要注意的是G1垃圾收集器在新生代以及老年代都能进行工做，这是由于相比于前面所介绍的垃圾收集器，它具备不一样的堆内存结构。之前的垃圾收集器分代是划分为新生代、老牛代、持久带等
。

G1将内存划分为多个大小相同的Region(1-32M，上限2048个)，每一个Region均拥有本身的分代属性，这些分代不须要连续。经过划分Region，G1能够根据计算老年代对象的效益率，优先回收具备最高效益率的对象（分代的内存不连续，GC搜索垃圾时须要全盘扫描找出对象引用状况，G1经过在每一个Region中维护一个Remembered Set记录对象引用状况解决此问题）。具体以下图所示：

G1提供了两种GC模式，Young GC以及Mixed GC,两种GC都会STW。

2.4.1 Young GC

选定全部年轻代里的Region。经过控制年轻代的region个数，即年轻代内存大小，来控制young GC的时间开销。

2.4.2 Mixed GC

选定全部年轻代里的Region，外加根据global concurrent marking统计得出收集收益高的若干老年代Region，在用户指定的开销目标范围内尽量选择收益高的老年代Region。

Mixed GC不是Full GC，它只能回收部分老年代的Region，若是mixed GC实在没法跟上程序分配内存的速度，致使老年代填满没法继续进行Mixed GC，就会使用serial old GC（full GC）来收集整个GC heap（此时效率就会很低下）。因此咱们能够知道，G1是不提供Full GC的。

在执行Mixed GC以前须要进行并发标记过程(Global Concurrent Marking)，具体步骤以下图所示：

Initial marking phase: 标记GCRoots(会STW)；
Root region scanning phase：标记存活Region；
Concurrent marking phase：标记存活的对象；
Remark phase：从新标记(会STW)；
Cleanup phase：回收内存。

须要注意，Mixed GC并非一次性执行完，其会分为多个步骤执行(具体可见下一篇关于GC日志的文章)。在每次执行时，G1会计算每一个Region中垃圾占内存分段比例，若是超过了-XX:G1MixedGCLiveThresholdPercent,则进行回收操做。此外，G1中能够设置堆内存中有多少空间容许浪费，即-XX:G1HeapWastePercent，在并发标记结束后，能够知道有多少空间要被回收，在每次Young GC和发生Mixed GC以前，会检查垃圾占比是否到达了此阈值，只有到达了，才会发生Mixed GC。

PS:
资料收集过程当中，感谢如下做者文章的参考：
https://bdqfork.cn/articles/33
http://www.javashuo.com/article/p-gngwroki-km.html

若是您以为个人文章对您有帮助，请关注个人微信公众号，谢谢!