jvm 7种垃圾收集器

若是说收集算法是内存回收的方法论,那么垃圾收集器就是内存回收的具体实现。Java虚拟机规范中对垃圾收集器应该如何实现并无任何规定,所以不一样的厂商、版本的虚拟机所提供的垃圾收集器均可能会有很大差异,而且通常都会提供参数供用户根据本身的应用特色和要求组合出各个年代所使用的收集器。接下来讨论的收集器基于JDK1.7 Update 14 以后的HotSpot虚拟机(在此版本中正式提供了商用的G1收集器,以前G1仍处于实验状态),该虚拟机包含的全部收集器以下图所示:git

上图展现了7种做用于不一样分代的收集器,若是两个收集器之间存在连线,就说明它们能够搭配使用。虚拟机所处的区域,则表示它是属于新生代收集器仍是老年代收集器。Hotspot实现了如此多的收集器,正是由于目前并没有完美的收集器出现,只是选择对具体应用最适合的收集器。github

相关概念[](https://crowhawk.github.io/20...

并行和并发[](https://crowhawk.github.io/20...

  • 并行(Parallel):指多条垃圾收集线程并行工做,但此时用户线程仍然处于等待状态。
  • 并发(Concurrent):指用户线程与垃圾收集线程同时执行(但不必定是并行的,可能会交替执行),用户程序在继续运行。而垃圾收集程序运行在另外一个CPU上。

吞吐量(Throughput)[](https://crowhawk.github.io/20...

吞吐量就是CPU用于运行用户代码的时间CPU总消耗时间的比值,即算法

吞吐量 = 运行用户代码时间 /(运行用户代码时间 + 垃圾收集时间)。多线程

假设虚拟机总共运行了100分钟,其中垃圾收集花掉1分钟,那吞吐量就是99%。并发

Minor GC 和 Full GC[](https://crowhawk.github.io/20...

  • 新生代GC(Minor GC):指发生在新生代的垃圾收集动做,由于Java对象大多都具有朝生夕灭的特性,因此Minor GC很是频繁,通常回收速度也比较快。具体原理见上一篇文章。
  • 老年代GC(Major GC / Full GC):指发生在老年代的GC,出现了Major GC,常常会伴随至少一次的Minor GC(但非绝对的,在Parallel Scavenge收集器的收集策略里就有直接进行Major GC的策略选择过程)。Major GC的速度通常会比Minor GC慢10倍以上。

新生代收集器[](https://crowhawk.github.io/20...

Serial收集器[](https://crowhawk.github.io/20...

Serial(串行)收集器是最基本、发展历史最悠久的收集器,它是采用复制算法新生代收集器,曾经(JDK 1.3.1以前)是虚拟机新生代收集的惟一选择。它是一个单线程收集器,只会使用一个CPU或一条收集线程去完成垃圾收集工做,更重要的是它在进行垃圾收集时,必须暂停其余全部的工做线程,直至Serial收集器收集结束为止(“Stop The World”)。这项工做是由虚拟机在后台自动发起和自动完成的,在用户不可见的状况下把用户正常工做的线程所有停掉,这对不少应用来讲是难以接收的。jvm

下图展现了Serial 收集器(老年代采用Serial Old收集器)的运行过程:布局

为了消除或减小工做线程因内存回收而致使的停顿,HotSpot虚拟机开发团队在JDK 1.3以后的Java发展历程中研发出了各类其余的优秀收集器,这些将在稍后介绍。可是这些收集器的诞生并不意味着Serial收集器已经“老而无用”,实际上到如今为止,它依然是HotSpot虚拟机运行在Client模式下的默认的新生代收集器。它也有着优于其余收集器的地方:简单而高效(与其余收集器的单线程相比),对于限定单个CPU的环境来讲,Serial收集器因为没有线程交互的开销,专心作垃圾收集天然能够得到更高的单线程收集效率。性能

在用户的桌面应用场景中,分配给虚拟机管理的内存通常不会很大,收集几十兆甚至一两百兆的新生代(仅仅是新生代使用的内存,桌面应用基本不会再大了),停顿时间彻底能够控制在几十毫秒最多一百毫秒之内,只要不频繁发生,这点停顿时间能够接收。因此,Serial收集器对于运行在Client模式下的虚拟机来讲是一个很好的选择。网站

ParNew 收集器[](https://crowhawk.github.io/20...

ParNew收集器就是Serial收集器的多线程版本,它也是一个新生代收集器。除了使用多线程进行垃圾收集外,其他行为包括Serial收集器可用的全部控制参数、收集算法(复制算法)、Stop The World、对象分配规则、回收策略等与Serial收集器彻底相同,二者共用了至关多的代码。spa

ParNew收集器的工做过程以下图(老年代采用Serial Old收集器):

ParNew收集器除了使用多线程收集外,其余与Serial收集器相比并没有太多创新之处,但它倒是许多运行在Server模式下的虚拟机中首选的新生代收集器,其中有一个与性能无关的重要缘由是,除了Serial收集器外,目前只有它能和CMS收集器(Concurrent Mark Sweep)配合工做,CMS收集器是JDK 1.5推出的一个具备划时代意义的收集器,具体内容将在稍后进行介绍。

ParNew 收集器在单CPU的环境中绝对不会有比Serial收集器有更好的效果,甚至因为存在线程交互的开销,该收集器在经过超线程技术实现的两个CPU的环境中都不能百分之百地保证能够超越。在多CPU环境下,随着CPU的数量增长,它对于GC时系统资源的有效利用是颇有好处的。它默认开启的收集线程数与CPU的数量相同,在CPU很是多的状况下可以使用-XX:ParallerGCThreads参数设置。

Parallel Scavenge 收集器[](https://crowhawk.github.io/20...

Parallel Scavenge收集器也是一个并行多线程新生代收集器,它也使用复制算法。Parallel Scavenge收集器的特色是它的关注点与其余收集器不一样,CMS等收集器的关注点是尽量缩短垃圾收集时用户线程的停顿时间,而Parallel Scavenge收集器的目标是达到一个可控制的吞吐量(Throughput)

停顿时间越短就越适合须要与用户交互的程序,良好的响应速度能提高用户体验。而高吞吐量则能够高效率地利用CPU时间,尽快完成程序的运算任务,主要适合在后台运算而不须要太多交互的任务

Parallel Scavenge收集器除了会显而易见地提供能够精确控制吞吐量的参数,还提供了一个参数-XX:+UseAdaptiveSizePolicy,这是一个开关参数,打开参数后,就不须要手工指定新生代的大小(-Xmn)、Eden和Survivor区的比例(-XX:SurvivorRatio)、晋升老年代对象年龄(-XX:PretenureSizeThreshold)等细节参数了,虚拟机会根据当前系统的运行状况收集性能监控信息,动态调整这些参数以提供最合适的停顿时间或者最大的吞吐量,这种方式称为GC自适应的调节策略(GC Ergonomics)。自适应调节策略也是Parallel Scavenge收集器与ParNew收集器的一个重要区别。

另外值得注意的一点是,Parallel Scavenge收集器没法与CMS收集器配合使用,因此在JDK 1.6推出Parallel Old以前,若是新生代选择Parallel Scavenge收集器,老年代只有Serial Old收集器能与之配合使用。

老年代收集器[](https://crowhawk.github.io/20...

Serial Old收集器[](https://crowhawk.github.io/20...

Serial Old 是 Serial收集器的老年代版本,它一样是一个单线程收集器,使用“标记-整理”(Mark-Compact)算法。

此收集器的主要意义也是在于给Client模式下的虚拟机使用。若是在Server模式下,它还有两大用途:

  • 在JDK1.5 以及以前版本(Parallel Old诞生之前)中与Parallel Scavenge收集器搭配使用。
  • 做为CMS收集器的后备预案,在并发收集发生Concurrent Mode Failure时使用。

它的工做流程与Serial收集器相同,这里再次给出Serial/Serial Old配合使用的工做流程图:

Parallel Old收集器[](https://crowhawk.github.io/20...

Parallel Old收集器是Parallel Scavenge收集器的老年代版本,使用多线程“标记-整理”算法。前面已经提到过,这个收集器是在JDK 1.6中才开始提供的,在此以前,若是新生代选择了Parallel Scavenge收集器,老年代除了Serial Old之外别无选择,因此在Parallel Old诞生之后,“吞吐量优先”收集器终于有了比较名副其实的应用组合,在注重吞吐量以及CPU资源敏感的场合,均可以优先考虑Parallel Scavenge加Parallel Old收集器。Parallel Old收集器的工做流程与Parallel Scavenge相同,这里给出Parallel Scavenge/Parallel Old收集器配合使用的流程图:

CMS收集器[](https://crowhawk.github.io/20...

CMS(Concurrent Mark Sweep)收集器是一种以获取最短回收停顿时间为目标的收集器,它很是符合那些集中在互联网站或者B/S系统的服务端上的Java应用,这些应用都很是重视服务的响应速度。从名字上(“Mark Sweep”)就能够看出它是基于“标记-清除”算法实现的。

CMS收集器工做的整个流程分为如下4个步骤:

  • 初始标记(CMS initial mark):仅仅只是标记一下GC Roots能直接关联到的对象,速度很快,须要“Stop The World”。
  • 并发标记(CMS concurrent mark):进行GC Roots Tracing的过程,在整个过程当中耗时最长。
  • 从新标记(CMS remark):为了修正并发标记期间因用户程序继续运做而致使标记产生变更的那一部分对象的标记记录,这个阶段的停顿时间通常会比初始标记阶段稍长一些,但远比并发标记的时间短。此阶段也须要“Stop The World”。
  • 并发清除(CMS concurrent sweep)

因为整个过程当中耗时最长的并发标记和并发清除过程收集器线程均可以与用户线程一块儿工做,因此,从整体上来讲,CMS收集器的内存回收过程是与用户线程一块儿并发执行的。经过下图能够比较清楚地看到CMS收集器的运做步骤中并发和须要停顿的时间:

优势

CMS是一款优秀的收集器,它的主要优势在名字上已经体现出来了:并发收集低停顿,所以CMS收集器也被称为并发低停顿收集器(Concurrent Low Pause Collector)

缺点

  • 对CPU资源很是敏感其实,面向并发设计的程序都对CPU资源比较敏感。在并发阶段,它虽然不会致使用户线程停顿,但会由于占用了一部分线程(或者说CPU资源)而致使应用程序变慢,总吞吐量会下降。CMS默认启动的回收线程数是(CPU数量+3)/4,也就是当CPU在4个以上时,并发回收时垃圾收集线程很多于25%的CPU资源,而且随着CPU数量的增长而降低。可是当CPU不足4个时(好比2个),CMS对用户程序的影响就可能变得很大,若是原本CPU负载就比较大,还要分出一半的运算能力去执行收集器线程,就可能致使用户程序的执行速度突然下降了50%,其实也让人没法接受。
  • 没法处理浮动垃圾(Floating Garbage)可能出现“Concurrent Mode Failure”失败而致使另外一次Full GC的产生。因为CMS并发清理阶段用户线程还在运行着,伴随程序运行天然就还会有新的垃圾不断产生。这一部分垃圾出如今标记过程以后,CMS没法再当次收集中处理掉它们,只好留待下一次GC时再清理掉。这一部分垃圾就被称为“浮动垃圾”。也是因为在垃圾收集阶段用户线程还须要运行,那也就还须要预留有足够的内存空间给用户线程使用,所以CMS收集器不能像其余收集器那样等到老年代几乎彻底被填满了再进行收集,须要预留一部分空间提供并发收集时的程序运做使用。
  • 标记-清除算法致使的空间碎片CMS是一款基于“标记-清除”算法实现的收集器,这意味着收集结束时会有大量空间碎片产生。空间碎片过多时,将会给大对象分配带来很大麻烦,每每出现老年代空间剩余,但没法找到足够大连续空间来分配当前对象。

G1收集器[](https://crowhawk.github.io/20...

G1(Garbage-First)收集器是当今收集器技术发展最前沿的成果之一,它是一款面向服务端应用的垃圾收集器,HotSpot开发团队赋予它的使命是(在比较长期的)将来能够替换掉JDK 1.5中发布的CMS收集器。与其余GC收集器相比,G1具有以下特色:

  • 并行与并发G1 能充分利用多CPU、多核环境下的硬件优点,使用多个CPU来缩短“Stop The World”停顿时间,部分其余收集器本来须要停顿Java线程执行的GC动做,G1收集器仍然能够经过并发的方式让Java程序继续执行。
  • 分代收集与其余收集器同样,分代概念在G1中依然得以保留。虽然G1能够不须要其余收集器配合就能独立管理整个GC堆,但它可以采用不一样方式去处理新建立的对象和已存活一段时间、熬过屡次GC的旧对象来获取更好的收集效果。
  • 空间整合G1从总体来看是基于“标记-整理”算法实现的收集器,从局部(两个Region之间)上来看是基于“复制”算法实现的。这意味着G1运行期间不会产生内存空间碎片,收集后能提供规整的可用内存。此特性有利于程序长时间运行,分配大对象时不会由于没法找到连续内存空间而提早触发下一次GC。
  • 可预测的停顿这是G1相对CMS的一大优点,下降停顿时间是G1和CMS共同的关注点,但G1除了下降停顿外,还能创建可预测的停顿时间模型,能让使用者明确指定在一个长度为M毫秒的时间片断内,消耗在GC上的时间不得超过N毫秒,这几乎已是实时Java(RTSJ)的垃圾收集器的特征了。

横跨整个堆内存

在G1以前的其余收集器进行收集的范围都是整个新生代或者老生代,而G1再也不是这样。G1在使用时,Java堆的内存布局与其余收集器有很大区别,它将整个Java堆划分为多个大小相等的独立区域(Region),虽然还保留新生代和老年代的概念,但新生代和老年代再也不是物理隔离的了,而都是一部分Region(不须要连续)的集合

创建可预测的时间模型

G1收集器之因此能创建可预测的停顿时间模型,是由于它能够有计划地避免在整个Java堆中进行全区域的垃圾收集。G1跟踪各个Region里面的垃圾堆积的价值大小(回收所得到的空间大小以及回收所需时间的经验值),在后台维护一个优先列表,每次根据容许的收集时间,优先回收价值最大的Region(这也就是Garbage-First名称的来由)。这种使用Region划份内存空间以及有优先级的区域回收方式,保证了G1收集器在有限的时间内能够获取尽量高的收集效率。

避免全堆扫描——Remembered Set

G1把Java堆分为多个Region,就是“化整为零”。可是Region不多是孤立的,一个对象分配在某个Region中,能够与整个Java堆任意的对象发生引用关系。在作可达性分析肯定对象是否存活的时候,须要扫描整个Java堆才能保证准确性,这显然是对GC效率的极大伤害。

为了不全堆扫描的发生,虚拟机为G1中每一个Region维护了一个与之对应的Remembered Set。虚拟机发现程序在对Reference类型的数据进行写操做时,会产生一个Write Barrier暂时中断写操做,检查Reference引用的对象是否处于不一样的Region之中(在分代的例子中就是检查是否老年代中的对象引用了新生代中的对象),若是是,便经过CardTable把相关引用信息记录到被引用对象所属的Region的Remembered Set之中。当进行内存回收时,在GC根节点的枚举范围中加入Remembered Set便可保证不对全堆扫描也不会有遗漏。


若是不计算维护Remembered Set的操做,G1收集器的运做大体可划分为如下几个步骤:

  • 初始标记(Initial Marking)仅仅只是标记一下GC Roots 能直接关联到的对象,而且修改TAMS(Nest Top Mark Start)的值,让下一阶段用户程序并发运行时,能在正确能够的Region中建立对象,此阶段须要停顿线程,但耗时很短。
  • 并发标记(Concurrent Marking)从GC Root 开始对堆中对象进行可达性分析,找到存活对象,此阶段耗时较长,但可与用户程序并发执行
  • 最终标记(Final Marking)为了修正在并发标记期间因用户程序继续运做而致使标记产生变更的那一部分标记记录,虚拟机将这段时间对象变化记录在线程的Remembered Set Logs里面,最终标记阶段须要把Remembered Set Logs的数据合并到Remembered Set中,这阶段须要停顿线程,可是可并行执行
  • 筛选回收(Live Data Counting and Evacuation)首先对各个Region中的回收价值和成本进行排序,根据用户所指望的GC 停顿是时间来制定回收计划。此阶段其实也能够作到与用户程序一块儿并发执行,可是由于只回收一部分Region,时间是用户可控制的,并且停顿用户线程将大幅度提升收集效率。

经过下图能够比较清楚地看到G1收集器的运做步骤中并发和须要停顿的阶段(Safepoint处):

总结[](https://crowhawk.github.io/20...

image.png

本文经过详细介绍HotSpot虚拟机的7种垃圾收集器回答了上一篇文章开头提出的三个问题中的第三个——“如何回收”,在下一篇文章中,咱们将回答最后一个未被解答的问题——“何时回收”。

参考资料[](https://crowhawk.github.io/20...

相关文章
相关标签/搜索