JVM垃圾回收器

垃圾收集基础

Java 语言的一大特色就是能够进行自动垃圾回收处理,而无需开发人员过于关注系统资源,例如内存资源的释放状况。自动垃圾收集虽然大大减轻了开发人员的工做量,可是也增长了软件系统的负担。 java

拥有垃圾收集器能够说是 Java 语言与 C++语言的一项显著区别。在 C++语言中,程序员必须当心谨慎地处理每一项内存分配,且内存使用完后必须手工释放曾经占用的内存空间。当内存释放不够彻底时,即存在分配但永不释放的内存块,就会引发内存泄漏,严重时甚至致使程序瘫痪。 程序员

如下列举了垃圾回收器经常使用的算法及实验原理: 算法

  • 引用计数法 (Reference Counting) 服务器

引用计数器在微软的 COM 组件技术中、Adobe 的 ActionScript3 种都有使用。 数据结构

引用计数器的实现很简单,对于一个对象 A,只要有任何一个对象引用了 A,则 A 的引用计数器就加 1,当引用失效时,引用计数器就减 1。只要对象 A 的引用计数器的值为 0,则对象 A 就不可能再被使用。 多线程

引用计数器的实现也很是简单,只须要为每一个对象配置一个整形的计数器便可。可是引用计数器有一个严重的问题,即没法处理循环引用的状况。所以,在 Java 的垃圾回收器中没有使用这种算法。 并发

一个简单的循环引用问题描述以下:有对象 A 和对象 B,对象 A 中含有对象 B 的引用,对象 B 中含有对象 A 的引用。此时,对象 A 和对象 B 的引用计数器都不为 0。可是在系统中却不存在任何第 3 个对象引用了 A 或 B。也就是说,A 和 B 是应该被回收的垃圾对象,但因为垃圾对象间相互引用,从而使垃圾回收器没法识别,引发内存泄漏。 jvm

  • 标记-清除算法 (Mark-Sweep) 性能

标记-清除算法将垃圾回收分为两个阶段:标记阶段和清除阶段。一种可行的实现是,在标记阶段首先经过根节点,标记全部从根节点开始的较大对象。所以,未被标记的对象就是未被引用的垃圾对象。而后,在清除阶段,清除全部未被标记的对象。该算法最大的问题是存在大量的空间碎片,由于回收后的空间是不连续的。在对象的堆空间分配过程当中,尤为是大对象的内存分配,不连续的内存空间的工做效率要低于连续的空间。 测试

  • 复制算法 (Copying)

将现有的内存空间分为两快,每次只使用其中一块,在垃圾回收时将正在使用的内存中的存活对象复制到未被使用的内存块中,以后,清除正在使用的内存块中的全部对象,交换两个内存的角色,完成垃圾回收。

若是系统中的垃圾对象不少,复制算法须要复制的存活对象数量并不会太大。所以在真正须要垃圾回收的时刻,复制算法的效率是很高的。又因为对象在垃圾回收过程当中统一被复制到新的内存空间中,所以,可确保回收后的内存空间是没有碎片的。该算法的缺点是将系统内存折半。

Java 的新生代串行垃圾回收器中使用了复制算法的思想。新生代分为 eden 空间、from 空间、to 空间 3 个部分。其中 from 空间和 to 空间能够视为用于复制的两块大小相同、地位相等,且可进行角色互换的空间块。from 和 to 空间也称为 survivor 空间,即幸存者空间,用于存放未被回收的对象。

在垃圾回收时,eden 空间中的存活对象会被复制到未使用的 survivor 空间中 (假设是 to),正在使用的 survivor 空间 (假设是 from) 中的年轻对象也会被复制到 to 空间中 (大对象,或者老年对象会直接进入老年带,若是 to 空间已满,则对象也会直接进入老年代)。此时,eden 空间和 from 空间中的剩余对象就是垃圾对象,能够直接清空,to 空间则存放这次回收后的存活对象。这种改进的复制算法既保证了空间的连续性,又避免了大量的内存空间浪费。

  • 标记-压缩算法 (Mark-Compact)

复制算法的高效性是创建在存活对象少、垃圾对象多的前提下的。这种状况在年轻代常常发生,可是在老年代更常见的状况是大部分对象都是存活对象。若是依然使用复制算法,因为存活的对象较多,复制的成本也将很高。

标记-压缩算法是一种老年代的回收算法,它在标记-清除算法的基础上作了一些优化。也首先须要从根节点开始对全部可达对象作一次标记,但以后,它并不简单地清理未标记的对象,而是将全部的存活对象压缩到内存的一端。以后,清理边界外全部的空间。这种方法既避免了碎片的产生,又不须要两块相同的内存空间,所以,其性价比比较高。

  • 增量算法 (Incremental Collecting)

在垃圾回收过程当中,应用软件将处于一种 CPU 消耗很高的状态。在这种 CPU 消耗很高的状态下,应用程序全部的线程都会挂起,暂停一切正常的工做,等待垃圾回收的完成。若是垃圾回收时间过长,应用程序会被挂起好久,将严重影响用户体验或者系统的稳定性。

增量算法的基本思想是,若是一次性将全部的垃圾进行处理,须要形成系统长时间的停顿,那么就可让垃圾收集线程和应用程序线程交替执行。每次,垃圾收集线程只收集一小片区域的内存空间,接着切换到应用程序线程。依次反复,直到垃圾收集完成。使用这种方式,因为在垃圾回收过程当中,间断性地还执行了应用程序代码,因此能减小系统的停顿时间。可是,由于线程切换和上下文转换的消耗,会使得垃圾回收的整体成本上升,形成系统吞吐量的降低。

  • 分代 (Generational Collecting)

根据垃圾回收对象的特性,不一样阶段最优的方式是使用合适的算法用于本阶段的垃圾回收,分代算法便是基于这种思想,它将内存区间根据对象的特色分红几块,根据每块内存区间的特色,使用不一样的回收算法,以提升垃圾回收的效率。以 Hot Spot 虚拟机为例,它将全部的新建对象都放入称为年轻代的内存区域,年轻代的特色是对象会很快回收,所以,在年轻代就选择效率较高的复制算法。当一个对象通过几回回收后依然存活,对象就会被放入称为老生代的内存空间。在老生代中,几乎全部的对象都是通过几回垃圾回收后依然得以幸存的。所以,能够认为这些对象在一段时期内,甚至在应用程序的整个生命周期中,将是常驻内存的。若是依然使用复制算法回收老生代,将须要复制大量对象。再加上老生代的回收性价比也要低于新生代,所以这种作法也是不可取的。根据分代的思想,能够对老年代的回收使用与新生代不一样的标记-压缩算法,以提升垃圾回收效率。

从不一样角度分析垃圾收集器,能够将其分为不一样的类型。

1. 按线程数分,能够分为串行垃圾回收器和并行垃圾回收器。串行垃圾回收器一次只使用一个线程进行垃圾回收;并行垃圾回收器一次将开启多个线程同时进行垃圾回收。在并行能力较强的 CPU 上,使用并行垃圾回收器能够缩短 GC 的停顿时间。

2. 按照工做模式分,能够分为并发式垃圾回收器和独占式垃圾回收器。并发式垃圾回收器与应用程序线程交替工做,以尽量减小应用程序的停顿时间;独占式垃圾回收器 (Stop the world) 一旦运行,就中止应用程序中的其余全部线程,直到垃圾回收过程彻底结束。

3. 按碎片处理方式可分为压缩式垃圾回收器和非压缩式垃圾回收器。压缩式垃圾回收器会在回收完成后,对存活对象进行压缩整理,消除回收后的碎片;非压缩式的垃圾回收器不进行这步操做。

4. 按工做的内存区间,又可分为新生代垃圾回收器和老年代垃圾回收器。

能够用如下指标评价一个垃圾处理器的好坏。

吞吐量:指在应用程序的生命周期内,应用程序所花费的时间和系统总运行时间的比值。系统总运行时间=应用程序耗时+GC 耗时。若是系统运行了 100min,GC 耗时 1min,那么系统的吞吐量就是 (100-1)/100=99%。

垃圾回收器负载:和吞吐量相反,垃圾回收器负载指来记回收器耗时与系统运行总时间的比值。

停顿时间:指垃圾回收器正在运行时,应用程序的暂停时间。对于独占回收器而言,停顿时间可能会比较长。使用并发的回收器时,因为垃圾回收器和应用程序交替运行,程序的停顿时间会变短,可是,因为其效率极可能不如独占垃圾回收器,故系统的吞吐量可能会较低。

垃圾回收频率:指垃圾回收器多长时间会运行一次。通常来讲,对于固定的应用而言,垃圾回收器的频率应该是越低越好。一般增大堆空间能够有效下降垃圾回收发生的频率,可是可能会增长回收产生的停顿时间。

反应时间:指当一个对象被称为垃圾后多长时间内,它所占据的内存空间会被释放。

堆分配:不一样的垃圾回收器对堆内存的分配方式多是不一样的。一个良好的垃圾收集器应该有一个合理的堆内存区间划分。

回页首

JVM 垃圾回收器分类

  • 新生代串行收集器

串行收集器主要有两个特色:第一,它仅仅使用单线程进行垃圾回收;第二,它独占式的垃圾回收。

在串行收集器进行垃圾回收时,Java 应用程序中的线程都须要暂停,等待垃圾回收的完成,这样给用户体验形成较差效果。虽然如此,串行收集器倒是一个成熟、通过长时间生产环境考验的极为高效的收集器。新生代串行处理器使用复制算法,实现相对简单,逻辑处理特别高效,且没有线程切换的开销。在诸如单 CPU 处理器或者较小的应用内存等硬件平台不是特别优越的场合,它的性能表现能够超过并行回收器和并发回收器。在 HotSpot 虚拟机中,使用-XX:+UseSerialGC 参数能够指定使用新生代串行收集器和老年代串行收集器。当 JVM 在 Client 模式下运行时,它是默认的垃圾收集器。一次新生代串行收集器的工做输出日志相似如清单 1 信息 (使用-XX:+PrintGCDetails 开关) 所示。

清单 1. 一次新生代串行收集器的工做输出日志
[GC [DefNew: 3468K->150K(9216K), 0.0028638 secs][Tenured:
  1562K->1712K(10240K), 0.0084220 secs] 3468K->1712K(19456K),
  [Perm : 377K->377K(12288K)],
  0.0113816 secs] [Times: user=0.02 sys=0.00, real=0.01 secs]

它显示了一次垃圾回收前的新生代的内存占用量和垃圾回收后的新生代内存占用量,以及垃圾回收所消耗的时间。

  • 老年代串行收集器

老年代串行收集器使用的是标记-压缩算法。和新生代串行收集器同样,它也是一个串行的、独占式的垃圾回收器。因为老年代垃圾回收一般会使用比新生代垃圾回收更长的时间,所以,在堆空间较大的应用程序中,一旦老年代串行收集器启动,应用程序极可能会所以停顿几秒甚至更长时间。虽然如此,老年代串行回收器能够和多种新生代回收器配合使用,同时它也能够做为 CMS 回收器的备用回收器。若要启用老年代串行回收器,能够尝试使用如下参数:-XX:+UseSerialGC: 新生代、老年代都使用串行回收器。

清单 2. 一次老年代串行收集器的工做输出日志
Heap
 def new generation total 4928K, used 1373K [0x27010000, 0x27560000, 0x2c560000)
 eden space 4416K, 31% used [0x27010000, 0x27167628, 0x27460000)
 from space 512K, 0% used [0x27460000, 0x27460000, 0x274e0000)
 to space 512K, 0% used [0x274e0000, 0x274e0000, 0x27560000)
 tenured generation total 10944K, used 0K [0x2c560000, 0x2d010000, 0x37010000)
 the space 10944K, 0% used [0x2c560000, 0x2c560000, 0x2c560200, 0x2d010000)
 compacting perm gen total 12288K, used 376K [0x37010000, 0x37c10000, 0x3b010000)
 the space 12288K, 3% used [0x37010000, 0x3706e0b8, 0x3706e200, 0x37c10000)
 ro space 10240K, 51% used [0x3b010000, 0x3b543000, 0x3b543000, 0x3ba10000)
 rw space 12288K, 55% used [0x3ba10000, 0x3c0ae4f8, 0x3c0ae600, 0x3c610000)

若是使用-XX:+UseParNewGC 参数设置,表示新生代使用并行收集器,老年代使用串行收集器,如清单 3 所示。

清单 3. 一次串并行收集器混合使用的工做输出日志
Heap
 par new generation total 4928K, used 1373K [0x0f010000, 0x0f560000, 0x14560000)
 eden space 4416K, 31% used [0x0f010000, 0x0f167620, 0x0f460000)
 from space 512K, 0% used [0x0f460000, 0x0f460000, 0x0f4e0000)
 to space 512K, 0% used [0x0f4e0000, 0x0f4e0000, 0x0f560000)
 tenured generation total 10944K, used 0K [0x14560000, 0x15010000, 0x1f010000)
 the space 10944K, 0% used [0x14560000, 0x14560000, 0x14560200, 0x15010000)
 compacting perm gen total 12288K, used 2056K [0x1f010000, 0x1fc10000, 0x23010000)
 the space 12288K, 16% used [0x1f010000, 0x1f2121d0, 0x1f212200, 0x1fc10000)
No shared spaces configured.

若是使用-XX:+UseParallelGC 参数设置,表示新生代和老年代均使用并行回收收集器。如清单 4 所示。

清单 4. 一次老年代并行回收器的工做输出日志
[Full GC [Tenured: 1712K->1699K(10240K), 0.0071963 secs] 1712K->1699K(19456K),
      [Perm : 377K->372K(12288K)], 0.0072393 secs] [Times: user=0.00 sys=0.00,
      real=0.01 secs]

它显示了垃圾回收前老年代和永久区的内存占用量,以及垃圾回收后老年代和永久区的内存使用量。

  • 并行收集器

并行收集器是工做在新生代的垃圾收集器,它只简单地将串行回收器多线程化。它的回收策略、算法以及参数和串行回收器同样。

并行回收器也是独占式的回收器,在收集过程当中,应用程序会所有暂停。但因为并行回收器使用多线程进行垃圾回收,所以,在并发能力比较强的 CPU 上,它产生的停顿时间要短于串行回收器,而在单 CPU 或者并发能力较弱的系统中,并行回收器的效果不会比串行回收器好,因为多线程的压力,它的实际表现极可能比串行回收器差。

开启并行回收器可使用参数-XX:+UseParNewGC,该参数设置新生代使用并行收集器,老年代使用串行收集器。

清单 5. 设置参数-XX:+UseParNewGC 的输出日志
[GC [ParNew: 825K->161K(4928K), 0.0155258 secs][Tenured: 8704K->661K(10944K), 
  0.0071964 secs] 9017K->661K(15872K), 
  [Perm : 2049K->2049K(12288K)], 0.0228090 secs] [Times: user=0.01 sys=0.00, real=0.01 secs] 
Heap
 par new generation total 4992K, used 179K [0x0f010000, 0x0f570000, 0x14560000)
 eden space 4480K, 4% used [0x0f010000, 0x0f03cda8, 0x0f470000)
 from space 512K, 0% used [0x0f470000, 0x0f470000, 0x0f4f0000)
 to space 512K, 0% used [0x0f4f0000, 0x0f4f0000, 0x0f570000)
 tenured generation total 10944K, used 8853K [0x14560000, 0x15010000, 0x1f010000)
 the space 10944K, 80% used [0x14560000, 0x14e057c0, 0x14e05800, 0x15010000)
 compacting perm gen total 12288K, used 2060K [0x1f010000, 0x1fc10000, 0x23010000)
 the space 12288K, 16% used [0x1f010000, 0x1f213228, 0x1f213400, 0x1fc10000)
No shared spaces configured.

设置参数-XX:+UseConcMarkSweepGC 能够要求新生代使用并行收集器,老年代使用 CMS。

清单 6. 设置参数-XX:+UseConcMarkSweepGC 的输出日志
[GC [ParNew: 8967K->669K(14784K), 0.0040895 secs] 8967K->669K(63936K),
  0.0043255 secs] [Times: user=0.00 sys=0.00, real=0.00 secs] 
Heap
 par new generation total 14784K, used 9389K [0x03f50000, 0x04f50000, 0x04f50000)
 eden space 13184K, 66% used [0x03f50000, 0x047d3e58, 0x04c30000)
 from space 1600K, 41% used [0x04dc0000, 0x04e67738, 0x04f50000)
 to space 1600K, 0% used [0x04c30000, 0x04c30000, 0x04dc0000)
 concurrent mark-sweep generation total 49152K, used 0K [0x04f50000, 0x07f50000, 0x09f50000)
 concurrent-mark-sweep perm gen total 12288K, used 2060K [0x09f50000, 0x0ab50000, 0x0df50000)

并行收集器工做时的线程数量可使用-XX:ParallelGCThreads 参数指定。通常,最好与 CPU 数量至关,避免过多的线程数影响垃圾收集性能。在默认状况下,当 CPU 数量小于 8 个,ParallelGCThreads 的值等于 CPU 数量,大于 8 个,ParallelGCThreads 的值等于 3+[5*CPU_Count]/8]。如下测试显示了笔者笔记本上运行 8 个线程时耗时最短,本人笔记本是 8 核 IntelCPU。

清单 7. 设置为 8 个线程后 GC 输出
[GC [ParNew: 8967K->676K(14784K), 0.0036983 secs] 8967K->676K(63936K),
  0.0037662 secs] [Times: user=0.00 sys=0.00, real=0.00 secs] 
Heap
 par new generation total 14784K, used 9395K [0x040e0000, 0x050e0000, 0x050e0000)
 eden space 13184K, 66% used [0x040e0000, 0x04963e58, 0x04dc0000)
 from space 1600K, 42% used [0x04f50000, 0x04ff9100, 0x050e0000)
 to space 1600K, 0% used [0x04dc0000, 0x04dc0000, 0x04f50000)
 concurrent mark-sweep generation total 49152K, used 0K [0x050e0000, 0x080e0000, 0x0a0e0000)
 concurrent-mark-sweep perm gen total 12288K, used 2060K [0x0a0e0000, 0x0ace0000, 0x0e0e0000)
清单 8. 设置为 128 个线程后 GC 输出
[GC [ParNew: 8967K->664K(14784K), 0.0207327 secs] 8967K->664K(63936K),
  0.0208077 secs] [Times: user=0.03 sys=0.00, real=0.02 secs]
清单 9. 设置为 640 个线程后 GC 输出
[GC [ParNew: 8967K->667K(14784K), 0.2323704 secs] 8967K->667K(63936K),
  0.2324778 secs] [Times: user=0.34 sys=0.02, real=0.23 secs]
清单 10. 设置为 1280 个线程后 GC 输出
Error occurred during initialization of VM
Too small new size specified
  • 新生代并行回收 (Parallel Scavenge) 收集器

新生代并行回收收集器也是使用复制算法的收集器。从表面上看,它和并行收集器同样都是多线程、独占式的收集器。可是,并行回收收集器有一个重要的特色:它很是关注系统的吞吐量。

新生代并行回收收集器可使用如下参数启用:

-XX:+UseParallelGC:新生代使用并行回收收集器,老年代使用串行收集器。

-XX:+UseParallelOldGC:新生代和老年代都是用并行回收收集器。

清单 11. 设置为 24 个线程后 GC 输出
Heap
 PSYoungGen total 4800K, used 893K [0x1dac0000, 0x1e010000, 0x23010000)
 eden space 4160K, 21% used [0x1dac0000,0x1db9f570,0x1ded0000)
 from space 640K, 0% used [0x1df70000,0x1df70000,0x1e010000)
 to space 640K, 0% used [0x1ded0000,0x1ded0000,0x1df70000)
 ParOldGen total 19200K, used 16384K [0x13010000, 0x142d0000, 0x1dac0000)
 object space 19200K, 85% used [0x13010000,0x14010020,0x142d0000)
 PSPermGen total 12288K, used 2054K [0x0f010000, 0x0fc10000, 0x13010000)
 object space 12288K, 16% used [0x0f010000,0x0f2119c0,0x0fc10000)

新生代并行回收收集器可使用如下参数启用:

-XX:+MaxGCPauseMills:设置最大垃圾收集停顿时间,它的值是一个大于 0 的整数。收集器在工做时会调整 Java 堆大小或者其余一些参数,尽量地把停顿时间控制在 MaxGCPauseMills 之内。若是但愿减小停顿时间,而把这个值设置得很小,为了达到预期的停顿时间,JVM 可能会使用一个较小的堆 (一个小堆比一个大堆回收快),而这将致使垃圾回收变得很频繁,从而增长了垃圾回收总时间,下降了吞吐量。

-XX:+GCTimeRatio:设置吞吐量大小,它的值是一个 0-100 之间的整数。假设 GCTimeRatio 的值为 n,那么系统将花费不超过 1/(1+n) 的时间用于垃圾收集。好比 GCTimeRatio 等于 19,则系统用于垃圾收集的时间不超过 1/(1+19)=5%。默认状况下,它的取值是 99,即不超过 1%的时间用于垃圾收集。

除此以外,并行回收收集器与并行收集器另外一个不一样之处在于,它支持一种自适应的 GC 调节策略,使用-XX:+UseAdaptiveSizePolicy 能够打开自适应 GC 策略。在这种模式下,新生代的大小、eden 和 survivor 的比例、晋升老年代的对象年龄等参数会被自动调整,以达到在堆大小、吞吐量和停顿时间之间的平衡点。在手工调优比较困难的场合,能够直接使用这种自适应的方式,仅指定虚拟机的最大堆、目标的吞吐量 (GCTimeRatio) 和停顿时间 (MaxGCPauseMills),让虚拟机本身完成调优工做。

清单 12. 新生代并行回收收集器 GC 输出
Heap
 PSYoungGen total 4800K, used 893K [0x1dac0000, 0x1e010000, 0x23010000)
 eden space 4160K, 21% used [0x1dac0000,0x1db9f570,0x1ded0000)
 from space 640K, 0% used [0x1df70000,0x1df70000,0x1e010000)
 to space 640K, 0% used [0x1ded0000,0x1ded0000,0x1df70000)
 PSOldGen total 19200K, used 16384K [0x13010000, 0x142d0000, 0x1dac0000)
 object space 19200K, 85% used [0x13010000,0x14010020,0x142d0000)
 PSPermGen total 12288K, used 2054K [0x0f010000, 0x0fc10000, 0x13010000)
 object space 12288K, 16% used [0x0f010000,0x0f2119c0,0x0fc10000)

它也显示了收集器的工做成果,也就是回收前的内存大小和回收后的内存大小,以及花费的时间。

  • 老年代并行回收收集器

老年代的并行回收收集器也是一种多线程并发的收集器。和新生代并行回收收集器同样,它也是一种关注吞吐量的收集器。老年代并行回收收集器使用标记-压缩算法,JDK1.6 以后开始启用。

使用-XX:+UseParallelOldGC 能够在新生代和老生代都使用并行回收收集器,这是一对很是关注吞吐量的垃圾收集器组合,在对吞吐量敏感的系统中,能够考虑使用。参数-XX:ParallelGCThreads 也能够用于设置垃圾回收时的线程数量。

清单 13 是设置线程数量为 100 时老年代并行回收收集器输出日志:

清单 13. 老年代并行回收收集器设置 100 线程时 GC 输出
Heap
 PSYoungGen total 4800K, used 893K [0x1dac0000, 0x1e010000, 0x23010000)
 eden space 4160K, 21% used [0x1dac0000,0x1db9f570,0x1ded0000)
 from space 640K, 0% used [0x1df70000,0x1df70000,0x1e010000)
 to space 640K, 0% used [0x1ded0000,0x1ded0000,0x1df70000)
 ParOldGen total 19200K, used 16384K [0x13010000, 0x142d0000, 0x1dac0000)
 object space 19200K, 85% used [0x13010000,0x14010020,0x142d0000)
 PSPermGen total 12288K, used 2054K [0x0f010000, 0x0fc10000, 0x13010000)
 object space 12288K, 16% used [0x0f010000,0x0f2119c0,0x0fc10000)
  • CMS 收集器

与并行回收收集器不一样,CMS 收集器主要关注于系统停顿时间。CMS 是 Concurrent Mark Sweep 的缩写,意为并发标记清除,从名称上能够得知,它使用的是标记-清除算法,同时它又是一个使用多线程并发回收的垃圾收集器。

CMS 工做时,主要步骤有:初始标记、并发标记、从新标记、并发清除和并发重置。其中初始标记和从新标记是独占系统资源的,而并发标记、并发清除和并发重置是能够和用户线程一块儿执行的。所以,从总体上来讲,CMS 收集不是独占式的,它能够在应用程序运行过程当中进行垃圾回收。

根据标记-清除算法,初始标记、并发标记和从新标记都是为了标记出须要回收的对象。并发清理则是在标记完成后,正式回收垃圾对象;并发重置是指在垃圾回收完成后,从新初始化 CMS 数据结构和数据,为下一次垃圾回收作好准备。并发标记、并发清理和并发重置都是能够和应用程序线程一块儿执行的。

CMS 收集器在其主要的工做阶段虽然没有暴力地完全暂停应用程序线程,可是因为它和应用程序线程并发执行,相互抢占 CPU,因此在 CMS 执行期内对应用程序吞吐量形成必定影响。CMS 默认启动的线程数是 (ParallelGCThreads+3)/4),ParallelGCThreads 是新生代并行收集器的线程数,也能够经过-XX:ParallelCMSThreads 参数手工设定 CMS 的线程数量。当 CPU 资源比较紧张时,受到 CMS 收集器线程的影响,应用程序的性能在垃圾回收阶段可能会很是糟糕。

因为 CMS 收集器不是独占式的回收器,在 CMS 回收过程当中,应用程序仍然在不停地工做。在应用程序工做过程当中,又会不断地产生垃圾。这些新生成的垃圾在当前 CMS 回收过程当中是没法清除的。同时,由于应用程序没有中断,因此在 CMS 回收过程当中,还应该确保应用程序有足够的内存可用。所以,CMS 收集器不会等待堆内存饱和时才进行垃圾回收,而是当前堆内存使用率达到某一阈值时,便开始进行回收,以确保应用程序在 CMS 工做过程当中依然有足够的空间支持应用程序运行。

这个回收阈值可使用-XX:CMSInitiatingOccupancyFraction 来指定,默认是 68。即当老年代的空间使用率达到 68%时,会执行一次 CMS 回收。若是应用程序的内存使用率增加很快,在 CMS 的执行过程当中,已经出现了内存不足的状况,此时,CMS 回收将会失败,JVM 将启动老年代串行收集器进行垃圾回收。若是这样,应用程序将彻底中断,直到垃圾收集完成,这时,应用程序的停顿时间可能很长。所以,根据应用程序的特色,能够对-XX:CMSInitiatingOccupancyFraction 进行调优。若是内存增加缓慢,则能够设置一个稍大的值,大的阈值能够有效下降 CMS 的触发频率,减小老年代回收的次数能够较为明显地改善应用程序性能。反之,若是应用程序内存使用率增加很快,则应该下降这个阈值,以免频繁触发老年代串行收集器。

标记-清除算法将会形成大量内存碎片,离散的可用空间没法分配较大的对象。在这种状况下,即便堆内存仍然有较大的剩余空间,也可能会被迫进行一次垃圾回收,以换取一块可用的连续内存,这种现象对系统性能是至关不利的,为了解决这个问题,CMS 收集器还提供了几个用于内存压缩整理的算法。

-XX:+UseCMSCompactAtFullCollection 参数可使 CMS 在垃圾收集完成后,进行一次内存碎片整理。内存碎片的整理并非并发进行的。-XX:CMSFullGCsBeforeCompaction 参数能够用于设定进行多少次 CMS 回收后,进行一次内存压缩。

-XX:CMSInitiatingOccupancyFraction 设置为 100,同时设置-XX:+UseCMSCompactAtFullCollection 和-XX:CMSFullGCsBeforeCompaction,日志输出以下:

清单 14.CMS 垃圾回收器 GC 输出
[GC [DefNew: 825K->149K(4928K), 0.0023384 secs][Tenured: 8704K->661K(10944K),
  0.0587725 secs] 9017K->661K(15872K), 
  [Perm : 374K->374K(12288K)], 0.0612037 secs] [Times: user=0.01 sys=0.02, real=0.06 secs] 
Heap
 def new generation total 4992K, used 179K [0x27010000, 0x27570000, 0x2c560000)
 eden space 4480K, 4% used [0x27010000, 0x2703cda8, 0x27470000)
 from space 512K, 0% used [0x27470000, 0x27470000, 0x274f0000)
 to space 512K, 0% used [0x274f0000, 0x274f0000, 0x27570000)
 tenured generation total 10944K, used 8853K [0x2c560000, 0x2d010000, 0x37010000)
 the space 10944K, 80% used [0x2c560000, 0x2ce057c8, 0x2ce05800, 0x2d010000)
 compacting perm gen total 12288K, used 374K [0x37010000, 0x37c10000, 0x3b010000)
 the space 12288K, 3% used [0x37010000, 0x3706db10, 0x3706dc00, 0x37c10000)
 ro space 10240K, 51% used [0x3b010000, 0x3b543000, 0x3b543000, 0x3ba10000)
 rw space 12288K, 55% used [0x3ba10000, 0x3c0ae4f8, 0x3c0ae600, 0x3c610000)
  • G1 收集器 (Garbage First)

G1 收集器的目标是做为一款服务器的垃圾收集器,所以,它在吞吐量和停顿控制上,预期要优于 CMS 收集器。

与 CMS 收集器相比,G1 收集器是基于标记-压缩算法的。所以,它不会产生空间碎片,也没有必要在收集完成后,进行一次独占式的碎片整理工做。G1 收集器还能够进行很是精确的停顿控制。它可让开发人员指定当停顿时长为 M 时,垃圾回收时间不超过 N。使用参数-XX:+UnlockExperimentalVMOptions –XX:+UseG1GC 来启用 G1 回收器,设置 G1 回收器的目标停顿时间:-XX:MaxGCPauseMills=20,-XX:GCPauseIntervalMills=200。

回页首

收集器对系统性能的影响

经过清单 15 所示代码运行 1 万次循环,每次分配 512*100B 空间,采用不一样的垃圾回收器,输出程序运行所消耗的时间。

清单 15. 性能测试代码
import java.util.HashMap;


public class GCTimeTest {
 static HashMap map = new HashMap();
 
 public static void main(String[] args){
 long begintime = System.currentTimeMillis();
 for(int i=0;i<10000;i++){
 if(map.size()*512/1024/1024>=400){
 map.clear();//保护内存不溢出
 System.out.println("clean map");
 }
 byte[] b1;
 for(int j=0;j<100;j++){
 b1 = new byte[512];
 map.put(System.nanoTime(), b1);//不断消耗内存
 }
 }
 long endtime = System.currentTimeMillis();
 System.out.println(endtime-begintime);
 }
}

使用参数-Xmx512M -Xms512M -XX:+UseParNewGC 运行代码,输出以下:

clean map 8565

cost time=1655

使用参数-Xmx512M -Xms512M -XX:+UseParallelOldGC –XX:ParallelGCThreads=8 运行代码,输出以下:

clean map 8798

cost time=1998

使用参数-Xmx512M -Xms512M -XX:+UseSerialGC 运行代码,输出以下:

clean map 8864

cost time=1717

使用参数-Xmx512M -Xms512M -XX:+UseConcMarkSweepGC 运行代码,输出以下:

clean map 8862

cost time=1530

上面例子的 GC 输出能够看出,采用不一样的垃圾回收机制及设定不一样的线程数,对于代码段的总体执行时间有较大的影响。须要读者有针对性地选用适合本身代码段的垃圾回收机制。

回页首

GC 相关参数总结

1. 与串行回收器相关的参数

-XX:+UseSerialGC:在新生代和老年代使用串行回收器。

-XX:+SuivivorRatio:设置 eden 区大小和 survivor 区大小的比例。

-XX:+PretenureSizeThreshold:设置大对象直接进入老年代的阈值。当对象的大小超过这个值时,将直接在老年代分配。

-XX:MaxTenuringThreshold:设置对象进入老年代的年龄的最大值。每一次 Minor GC 后,对象年龄就加 1。任何大于这个年龄的对象,必定会进入老年代。

2. 与并行 GC 相关的参数

-XX:+UseParNewGC: 在新生代使用并行收集器。

-XX:+UseParallelOldGC: 老年代使用并行回收收集器。

-XX:ParallelGCThreads:设置用于垃圾回收的线程数。一般状况下能够和 CPU 数量相等。但在 CPU 数量比较多的状况下,设置相对较小的数值也是合理的。

-XX:MaxGCPauseMills:设置最大垃圾收集停顿时间。它的值是一个大于 0 的整数。收集器在工做时,会调整 Java 堆大小或者其余一些参数,尽量地把停顿时间控制在 MaxGCPauseMills 之内。

-XX:GCTimeRatio:设置吞吐量大小,它的值是一个 0-100 之间的整数。假设 GCTimeRatio 的值为 n,那么系统将花费不超过 1/(1+n) 的时间用于垃圾收集。

-XX:+UseAdaptiveSizePolicy:打开自适应 GC 策略。在这种模式下,新生代的大小,eden 和 survivor 的比例、晋升老年代的对象年龄等参数会被自动调整,以达到在堆大小、吞吐量和停顿时间之间的平衡点。

3. 与 CMS 回收器相关的参数

-XX:+UseConcMarkSweepGC: 新生代使用并行收集器,老年代使用 CMS+串行收集器。

-XX:+ParallelCMSThreads: 设定 CMS 的线程数量。

-XX:+CMSInitiatingOccupancyFraction:设置 CMS 收集器在老年代空间被使用多少后触发,默认为 68%。

-XX:+UseFullGCsBeforeCompaction:设定进行多少次 CMS 垃圾回收后,进行一次内存压缩。

-XX:+CMSClassUnloadingEnabled:容许对类元数据进行回收。

-XX:+CMSParallelRemarkEndable:启用并行重标记。

-XX:CMSInitatingPermOccupancyFraction:当永久区占用率达到这一百分比后,启动 CMS 回收 (前提是-XX:+CMSClassUnloadingEnabled 激活了)。

-XX:UseCMSInitatingOccupancyOnly:表示只在到达阈值的时候,才进行 CMS 回收。

-XX:+CMSIncrementalMode:使用增量模式,比较适合单 CPU。

4. 与 G1 回收器相关的参数

-XX:+UseG1GC:使用 G1 回收器。

-XX:+UnlockExperimentalVMOptions:容许使用实验性参数。

-XX:+MaxGCPauseMills:设置最大垃圾收集停顿时间。

-XX:+GCPauseIntervalMills:设置停顿间隔时间。

5. 其余参数

-XX:+DisableExplicitGC: 禁用显示 GC。


1.整体介绍:

CMS(Concurrent Mark-Sweep)是以牺牲吞吐量为代价来得到最短回收停顿时间的垃圾回收器。对于要求服务器响应速度的应用上,这种垃圾回收器很是适合。在启动JVM参数加上-XX:+UseConcMarkSweepGC ,这个参数表示对于老年代的回收采用CMS。CMS采用的基础算法是:标记—清除。

2.CMS过程:

  • 初始标记(STW initial mark)
  • 并发标记(Concurrent marking)
  • 并发预清理(Concurrent precleaning)
  • 从新标记(STW remark)
  • 并发清理(Concurrent sweeping)
  • 并发重置(Concurrent reset)

初始标记 :在这个阶段,须要虚拟机停顿正在执行的任务,官方的叫法STW(Stop The Word)。这个过程从垃圾回收的"根对象"开始,只扫描到可以和"根对象"直接关联的对象,并做标记。因此这个过程虽然暂停了整个JVM,可是很快就完成了。

并发标记 :这个阶段紧随初始标记阶段,在初始标记的基础上继续向下追溯标记。并发标记阶段,应用程序的线程和并发标记的线程并发执行,因此用户不会感觉到停顿。

并发预清理 :并发预清理阶段仍然是并发的。在这个阶段,虚拟机查找在执行并发标记阶段新进入老年代的对象(可能会有一些对象重新生代晋升到老年代, 或者有一些对象被分配到老年代)。经过从新扫描,减小下一个阶段"从新标记"的工做,由于下一个阶段会Stop The World。

从新标记 :这个阶段会暂停虚拟机,收集器线程扫描在CMS堆中剩余的对象。扫描从"跟对象"开始向下追溯,并处理对象关联。

并发清理 :清理垃圾对象,这个阶段收集器线程和应用程序线程并发执行。

并发重置 :这个阶段,重置CMS收集器的数据结构,等待下一次垃圾回收。

 

CSM执行过程: 

3.CMS缺点

  • CMS回收器采用的基础算法是Mark-Sweep。全部CMS不会整理、压缩堆空间。这样就会有一个问题:通过CMS收集的堆会产生空间碎片。 CMS不对堆空间整理压缩节约了垃圾回收的停顿时间,但也带来的堆空间的浪费。为了解决堆空间浪费问题,CMS回收器再也不采用简单的指针指向一块可用堆空 间来为下次对象分配使用。而是把一些未分配的空间汇总成一个列表,当JVM分配对象空间的时候,会搜索这个列表找到足够大的空间来hold住这个对象。
  • 须要更多的CPU资源。从上面的图能够看到,为了让应用程序不停顿,CMS线程和应用程序线程并发执行,这样就须要有更多的CPU,单纯靠线程切 换是不靠谱的。而且,从新标记阶段,为空保证STW快速完成,也要用到更多的甚至全部的CPU资源。固然,多核多CPU也是将来的趋势!
  • CMS的另外一个缺点是它须要更大的堆空间。由于CMS标记阶段应用程序的线程仍是在执行的,那么就会有堆空间继续分配的状况,为了保证在CMS回 收完堆以前还有空间分配给正在运行的应用程序,必须预留一部分空间。也就是说,CMS不会在老年代满的时候才开始收集。相反,它会尝试更早的开始收集,已 避免上面提到的状况:在回收完成以前,堆没有足够空间分配!默认当老年代使用68%的时候,CMS就开始行动了。 – XX:CMSInitiatingOccupancyFraction =n 来设置这个阀值。

总得来讲,CMS回收器减小了回收的停顿时间,可是下降了堆空间的利用率。

4.啥时候用CMS

若是你的应用程序对停顿比较敏感,而且在应用程序运行的时候能够提供更大的内存和更多的CPU(也就是硬件牛逼),那么使用CMS来收集会给你带来好处。还有,若是在JVM中,有相对较多存活时间较长的对象(老年代比较大)会更适合使用CMS。

JVM 的垃圾回收器有不少种,先看下面的图例:

jvm-types.png

Serial(串行) 收集器

从名字能够看出来这是一个单线程的垃圾收集器,这个单线程不只仅是使用一个 CPU 或一条收集线程去完成,并且在垃圾收集的时候必须暂停全部其余的工做线程。

jvm-serial.png

主要用在 Client 模式下的默认新生代收集器,优点是简单而高效。

ParNew 收集器

ParNew 其实就是 Serial 的多线程版本,除了使用多线程进行垃圾搜集外,其他的控制参数、收集算法、对象分配规则、回收策略都与 Serial 同样。

ParNew 是许多运行在 Server 模式下的虚拟机首选的新生代收集器。由于只有 Serial 和 ParNew 能够与 CMS 组合使用。

ParNew 也是使用 -XX:+UseConcMarkSweepGC 选项后的默认新生代收集器,也可使用 -XX:+UseParNewGC 来指定。

jvm-parnew.png

Tips

  • 并行(Parallel):指多条垃圾收集线程并行工做,可是用户线程仍是处于等待状态。
  • 并发(Concurrent):指用户线程与垃圾收集线程同时执行。

Parallel Scavenge 收集器

Parallel Scavenge 是一个新生代收集器,也是使用复制算法,也是并行多线程。

Parallel Scavenge 与 ParNew 的不一样点是, Parallel Scavenge 收集器的目标是达到一个可控制的吞吐量,而其余的收集器关注的是尽量缩短垃圾收集时候用户线程的停顿时间。吞吐量是 CPU 用于运行用户代码的时间与 CPU 总消耗时间的比值,虚拟机运行了 100 分钟,垃圾回收消耗了 1 分钟,那么吞吐率就是 99%。

停顿时间短适合须要跟用户交互的程序,高吞吐量则能够高效利用 CPU 时间,主要适合后台运算不须要太多交互的任务。

Parallel Scavenge 收集器提供了两个参数用于精确控制吞吐量,分别是控制最大垃圾收集啊停顿时间的 -XX:MaxGCPauseMilis 参数以及直接设置吞吐量大小的 -XX:GCTimeRatio 参数。

MaxGCPauseMilis 参数容许的值是一个大于 0 的毫秒数,收集器尽可能控制回收垃圾时间不超过设定值。可是这个值不要设置过小,由于 GC 停顿时间缩短是牺牲吞吐量和新生代空间来换取的。系统把新生代调小,收集 300M 确定比 500M 快,也直接致使了垃圾收集更加频繁,原来10秒一次、每次停顿100ms,如今5秒收集一次,每次停顿70ms。停顿时间降低了,可是吞吐量也降低了。

GCTimeRatio 参数是 0-100 的整数,也就是垃圾收集时间占中时间的比率的底数。若是参数设置成 19,那容许的最大 GC 时间就占 1/(1+19) 即 5%。默认是 99 ,容许 1 / (1+99) 的 GC 时间。

-XX:+UseAdaptiveSizePolicy 参数打开后,不须要手动指定 Eden 与 Survivor 的比例、晋升老年代对象年龄等细节,虚拟机会自动调节大小。

Tips

不能与 CMS 组合使用。

Serial Old 收集器

Serial 收集器的老年代版,同样是单线程,使用标记整理算法。

Parallel Old 收集器

Parallel Old 是 Parallel Scavenge 的老年代版本,使用多线程了标记整理算法。

在 JDK 1.6 前,Parallel Scavenge 收集器的位置很尴尬,由于他不能与 CMS 组合,因此当新生代选择了 Parallel Scavenge ,老年代必须选择 Serial Old 收集器。

相关文章
相关标签/搜索