JVM 基础知识

时间 2020-06-15

标签 jvm 基础知识栏目 Java 繁體版

原文原文链接

JVM 基础知识（GC）

2013-12-10 00:16 3190人阅读评论(1) 收藏举报

分类：

Java（49）

目录(?)[+]html

几年前写过一篇关于JVM调优的文章，前段时间拿出来看了看，又添加了一些东西。忽然发现，基础真的很重要。学习的过程是一个由表及里，再由里及表的过程，所谓的“温故而知新”。而真正能走完这个轮回的人，也就能称为大牛或专家了。这个过程可能来来回回，这就是所谓“螺旋上升”，而每一次轮回都有新的发现。java

这回添加的东西主要集中在基础的一些问题上，还有一些这两年思考的问题。这些问题可能平时咱们不会刻意去想，可是真正看清楚了，却发现仍是大有裨益的，但愿对你们都有帮助~算法

1、基础概念数组

数据类型缓存

Java虚拟机中，数据类型能够分为两类：基本类型和引用类型。基本类型的变量保存原始值，即：他表明的值就是数值自己；而引用类型的变量保存引用值。“引用值”表明了某个对象的引用，而不是对象自己，对象自己存放在这个引用值所表示的地址的位置。服务器

基本类型包括：byte、short、int、long、char、float、double、Boolean、returnAddress数据结构

引用类型包括：类类型、接口类型、数组多线程

堆和栈并发

堆和栈是程序运行的关键，颇有必要把他们的关系说清楚。app

1）栈是运行时的单位，而堆是存储的单位。

2）栈解决程序的运行问题，即程序如何执行，或者说如何处理数据；堆解决的是数据存储的问题，即数据怎么放、放在哪儿。

在Java中一个线程就会相应有一个线程栈与之对应，这点很容易理解，由于不一样的线程执行逻辑有所不一样，所以须要一个独立的线程栈。而堆则是全部线程共享的。栈由于是运行单位，所以里面存储的信息都是跟当前线程（或程序）相关信息的。包括局部变量、程序运行状态、方法返回值等等；而堆只负责存储对象信息。

为何要把堆和栈区分出来呢？栈中不是也能够存储数据吗？

1）从软件设计的角度看，栈表明了处理逻辑，而堆表明了数据。这样分开，使得处理逻辑更为清晰。分而治之的思想。这种隔离、模块化的思想在软件设计的方方面面都有体现。

2）堆与栈的分离，使得堆中的内容能够被多个栈共享（也能够理解为多个线程访问同一个对象）。这种共享的收益是不少的。一方面这种共享提供了一种有效的数据交互方式(如：共享内存)，另外一方面，堆中的共享常量和缓存能够被全部栈访问，节省了空间。

3）栈由于运行时的须要，好比保存系统运行的上下文，须要进行地址段的划分。因为栈只能向上增加，所以就会限制住栈存储内容的能力。而堆不一样，堆中的对象是能够根据须要动态增加的，所以栈和堆的拆分，使得动态增加成为可能，相应栈中只需记录堆中的一个地址便可。

4）面向对象就是堆和栈的完美结合。其实，面向对象方式的程序与之前结构化的程序在执行上没有任何区别。可是，面向对象的引入，使得对待问题的思考方式发生了改变，而更接近于天然方式的思考。当咱们把对象拆开，你会发现，对象的属性其实就是数据，存放在堆中；而对象的行为（方法），就是运行逻辑，放在栈中。咱们在编写对象的时候，其实即编写了数据结构，也编写的处理数据的逻辑。不得不认可，面向对象的设计，确实很美。

在Java中，Main函数就是栈的起始点，也是程序的起始点。

程序要运行老是有一个起点的。同C语言同样，java中的Main就是那个起点。不管什么java程序，找到main就找到了程序执行的入口

堆中存什么？栈中存什么？

堆中存的是对象。栈中存的是基本数据类型和堆中对象的引用。一个对象的大小是不可估计的，或者说是能够动态变化的，可是在栈中，一个对象只对应了一个4byte的引用（堆栈分离的好处）

为何不把基本类型放堆中呢？由于其占用的空间通常是1~8个字节，须要空间比较少，并且由于是基本类型，因此不会出现动态增加的状况——长度固定，所以栈中存储就够了，若是把他存在堆中是没有什么意义的（还会浪费空间，后面说明）。能够这么说，基本类型和对象的引用都是存放在栈中，并且都是几个字节的一个数，所以在程序运行时，他们的处理方式是统一的。可是基本类型、对象引用和对象自己就有所区别了，由于一个是栈中的数据一个是堆中的数据。最多见的一个问题就是，Java中参数传递时的问题。

Java中的参数传递时传值呢？仍是传引用？

1）不要试图与C进行类比，Java中没有指针的概念

2）程序运行永远都是在栈中进行的，于是参数传递时，只存在传递基本类型和对象引用的问题，不会直接传对象自己。

明确以上两点后。Java在方法调用传递参数时，由于没有指针，因此它都是进行传值调用（这点能够参考C的传值调用）。所以，不少书里面都说Java是进行传值调用，这点没有问题，并且也简化的C中复杂性。

可是传引用的错觉是如何形成的呢？在运行栈中，基本类型和引用的处理是同样的，都是传值，因此，若是是传引用的方法调用，也同时能够理解为“传引用值”的传值调用，即引用的处理跟基本类型是彻底同样的。可是当进入被调用方法时，被传递的这个引用的值，被程序解释（或者查找）到堆中的对象，这个时候才对应到真正的对象。若是此时进行修改，修改的是引用对应的对象，而不是引用自己，即：修改的是堆中的数据。因此这个修改是能够保持的了。

对象，从某种意义上说，是由基本类型组成的。能够把一个对象看做为一棵树，对象的属性若是仍是对象，则仍是一颗树（即非叶子节点），基本类型则为树的叶子节点。程序参数传递时，被传递的值自己都是不能进行修改的，可是，若是这个值是一个非叶子节点（即一个对象引用），则能够修改这个节点下面的全部内容。

堆和栈中，栈是程序运行最根本的东西。程序运行能够没有堆，可是不能没有栈。而堆是为栈进行数据存储服务，说白了堆就是一块共享的内存。不过，正是由于堆和栈的分离的思想，才使得Java的垃圾回收成为可能。

Java中，栈的大小经过-Xss来设置，当栈中存储数据比较多时，须要适当调大这个值，不然会出现java.lang.StackOverflowError异常。常见的出现这个异常的是没法返回的递归，由于此时栈中保存的信息都是方法返回的记录点。

Java对象的大小

基本数据的类型的大小是固定的，对于非基本类型的Java对象，其大小就值得商榷。

在Java中，一个空Object对象的大小是8byte，这个大小只是保存堆中一个没有任何属性的对象的大小。看下面语句：

Object ob = new Object();

这样在程序中完成了一个Java对象的生命，可是它所占的空间为：4byte + 8byte

4byte，是上面部分所说的Java栈中保存引用的所须要的空间。

8byte，是Java堆中对象的信息。由于全部的Java非基本类型的对象都须要默认继承Object对象，所以不论什么样的Java对象，其大小都必须是大于8byte。

有了Object对象的大小，咱们就能够计算其余对象的大小了。

Class NewObject {

int count;

boolean flag;

Object obj;

}

这里须要注意一下：基本类型的包装类型的大小，由于这种包装类型已经成为对象了，所以须要把他们做为对象来看待。包装类型的大小至少是12byte（声明一个空Object至少须要的空间），并且12byte没有包含任何有效信息，同时，由于Java对象大小是8的整数倍，所以一个基本类型包装类的大小至少是16byte。这个内存占用是很恐怖的，它是使用基本类型的N倍（N>2），有些类型的内存占用更是夸张（随便想下就知道了）。所以，可能的话应尽可能少使用包装类。在JDK5.0之后，由于加入了自动类型装换，所以，Java虚拟机会在存储方面进行相应的优化。

引用类型

对象引用类型分为：强引用、软引用、弱引用、虚引用

强引用：就是咱们通常声明对象是时虚拟机生成的引用，强引用环境下，垃圾回收时须要严格判断当前对象是否被强引用，若是被强引用，则不会被垃圾回收

软引用：软引用通常被作为缓存来使用。与强引用的区别是，软引用在垃圾回收时，虚拟机会根据当前系统的剩余内存来决定是否对软引用进行回收。若是剩余内存比较紧张，则虚拟机会回收软引用所引用的空间；若是剩余内存相对富裕，则不会进行回收。换句话说，虚拟机在发生OutOfMemory时，确定是没有软引用存在的。

弱引用：弱引用与软引用相似，都是做为缓存来使用。但与软引用不一样，弱引用在进行垃圾回收时，是必定会被回收掉的，所以其生命周期只存在于一个垃圾回收周期内。

强引用不用说，咱们系统通常在使用时都是用的强引用。而“软引用”和“弱引用”比较少见。他们通常被做为缓存使用，并且通常是在内存大小比较受限的状况下作为缓存。由于若是内存足够大的话，能够直接使用强引用做为缓存便可，同时可控性更高。于是，他们常见的是被使用在桌面应用系统的缓存。

2、垃圾回收算法

1）按照基本回收策略分

（1）引用计数（Reference Counting）：

比较古老的回收算法。原理是此对象有一个引用，即增长一个计数，删除一个引用则减小一个计数。垃圾回收时，引用收集计数为0的对象。此算法最致命的是没法处理循环引用的问题。

（2）标记-清除（Mark-Sweep）：

此算法执行分两阶段。第一阶段从引用根节点开始标记全部被引用的对象，第二阶段遍历整个堆，把未标记的对象清除。此算法须要暂停整个应用，同时，会产生内存碎片。

（3）复制（Copying）:

此算法把内存空间划为两个相等的区域，每次只使用其中一个区域。垃圾回收时，遍历当前使用区域，把正在使用中的对象复制到另一个区域中。次算法每次只处理正在使用中的对象，所以复制成本比较小，同时复制过去之后还能进行相应的内存整理，不会出现“碎片”问题。固然，此算法的缺点也是很明显的，就是须要两倍内存空间。

（4）标记-整理（Mark-Compact）:

此算法结合了“标记-清除”和“复制”两个算法的优势。也是分两阶段，第一阶段从根节点开始标记全部被引用对象，第二阶段遍历整个堆，把清除未标记对象并且把存活对象“压缩”到堆的其中一块，按顺序排放。此算法避免了“标记-清除”的碎片问题，同时也避免了“复制”算法的空间问题。

2）按分区对待的方式分

增量收集（Incremental Collecting）：实时垃圾回收算法，即：在应用进行的同时进行垃圾回收。不知道什么缘由JDK5.0中的收集器没有使用这种算法的。

分代收集（Generational Collecting）：基于对对象生命周期分析后得出的垃圾回收算法。把对象分为年青代、年老代、持久代，对不一样生命周期的对象使用不一样的算法（上述方式中的一个）进行回收。如今的垃圾回收器（从J2SE1.2开始）都是使用此算法的。

3）按系统线程分

（1）串行收集：串行收集使用单线程处理全部垃圾回收工做，由于无需多线程交互，实现容易，并且效率比较高。可是，其局限性也比较明显，即没法使用多处理器的优点，因此此收集适合单处理器机器。固然，此收集器也能够用在小数据量（100M左右）状况下的多处理器机器上。

（2）并行收集：并行收集使用多线程处理垃圾回收工做，于是速度快，效率高。并且理论上CPU数目越多，越能体现出并行收集器的优点。

（3）并发收集：相对于串行收集和并行收集而言，前面两个在进行垃圾回收工做时，须要暂停整个运行环境，而只有垃圾回收程序在运行，所以，系统在垃圾回收时会有明显的暂停，并且暂停时间会由于堆越大而越长。

如何区分垃圾

上面说到的“引用计数”法，经过统计控制生成对象和删除对象时的引用数来判断。垃圾回收程序收集计数为0的对象便可。可是这种方法没法解决循环引用。所以，后来实现的垃圾判断算法中，都是从程序运行的根节点出发，遍历整个对象引用，查找存活的对象。那么在这种方式的实现中，垃圾回收从哪儿开始的呢？即，从哪儿开始查找哪些对象是正在被当前系统使用的。上面分析的堆和栈的区别，其中栈是真正进行程序执行地方，因此要获取哪些对象正在被使用，则须要从 Java栈开始。同时，一个栈是与一个线程对应的，所以，若是有多个线程的话，则必须对这些线程对应的全部的栈进行检查。

同时，除了栈外，还有系统运行时的寄存器等，也是存储程序运行数据的。这样，以栈或寄存器中的引用为起点，咱们能够找到堆中的对象，又从这些对象找到对堆中其余对象的引用，这种引用逐步扩展，最终以null引用或者基本类型结束，这样就造成了一颗以Java栈中引用所对应的对象为根节点的一颗对象树，若是栈中有多个引用，则最终会造成多颗对象树。在这些对象树上的对象，都是当前系统运行所须要的对象，不能被垃圾回收。而其余剩余对象，则能够视为没法被引用到的对象，能够被当作垃圾进行回收。

所以，垃圾回收的起点是一些根对象（java栈, 静态变量, 寄存器...）。而最简单的Java栈就是Java程序执行的main函数。这种回收方式，也是上面提到的“标记-清除”的回收方式

如何处理碎片

因为不一样Java对象存活时间是不必定的，所以，在程序运行一段时间之后，若是不进行内存整理，就会出现零散的内存碎片。碎片最直接的问题就是会致使没法分配大块的内存空间，以及程序运行效率下降。因此，在上面提到的基本垃圾回收算法中，“复制”方式和“标记-整理”方式，均可以解决碎片的问题。

如何解决同时存在的对象建立和对象回收问题

垃圾回收线程是回收内存的，而程序运行线程则是消耗（或分配）内存的，一个回收内存，一个分配内存，从这点看，二者是矛盾的。所以，在现有的垃圾回收方式中，要进行垃圾回收前，通常都须要暂停整个应用（即：暂停内存的分配），而后进行垃圾回收，回收完成后再继续应用。这种实现方式是最直接，并且最有效的解决两者矛盾的方式。

可是这种方式有一个很明显的弊端，就是当堆空间持续增大时，垃圾回收的时间也将会相应的持续增大，对应应用暂停的时间也会相应的增大。一些对相应时间要求很高的应用，好比最大暂停时间要求是几百毫秒，那么当堆空间大于几个G时，就颇有可能超过这个限制，在这种状况下，垃圾回收将会成为系统运行的一个瓶颈。为解决这种矛盾，有了并发垃圾回收算法，使用这种算法，垃圾回收线程与程序运行线程同时运行。在这种方式下，解决了暂停的问题，可是由于须要在新生成对象的同时又要回收对象，算法复杂性会大大增长，系统的处理能力也会相应下降，同时，“碎片”问题将会比较难解决。

为何要分代

分代的垃圾回收策略，是基于这样一个事实：不一样的对象的生命周期是不同的。所以，不一样生命周期的对象能够采起不一样的收集方式，以便提升回收效率。

在Java程序运行的过程当中，会产生大量的对象，其中有些对象是与业务信息相关，好比Http请求中的Session对象、线程、Socket链接，这类对象跟业务直接挂钩，所以生命周期比较长。可是还有一些对象，主要是程序运行过程当中生成的临时变量，这些对象生命周期会比较短，好比：String对象，因为其不变类的特性，系统会产生大量的这些对象，有些对象甚至只用一次便可回收。

试想，在不进行对象存活时间区分的状况下，每次垃圾回收都是对整个堆空间进行回收，花费时间相对会长，同时，由于每次回收都须要遍历全部存活对象，但实际上，对于生命周期长的对象而言，这种遍历是没有效果的，由于可能进行了不少次遍历，可是他们依旧存在。所以，分代垃圾回收采用分治的思想，进行代的划分，把不一样生命周期的对象放在不一样代上，不一样代上采用最适合它的垃圾回收方式进行回收。

如何分代

如上图，虚拟机中的共划分为三个代：年轻代（Young Generation）、年老点（Old Generation）、持久代（Permanent Generation）

其中持久代主要存放的是Java类的类信息，与垃圾收集要收集的Java对象关系不大。年轻代和年老代的划分是对垃圾收集影响比较大的。

（1）年轻代:

全部新生成的对象首先都是放在年轻代的。年轻代的目标就是尽量快速的收集掉那些生命周期短的对象。年轻代分三个区。一个Eden区，两个 Survivor区(通常而言)。大部分对象在Eden区中生成。当Eden区满时，还存活的对象将被复制到Survivor区（两个中的一个），当这个 Survivor区满时，此区的存活对象将被复制到另一个Survivor区，当这个Survivor区也满了的时候，从第一个Survivor区复制过来的而且此时还存活的对象，将被复制“年老区(Tenured)”。须要注意，Survivor的两个区是对称的，没前后关系，因此同一个区中可能同时存在从Eden复制过来对象，和从前一个Survivor复制过来的对象，而复制到年老区的只有从第一个Survivor去过来的对象。并且，Survivor区总有一个是空的。同时，根据程序须要，Survivor区是能够配置为多个的（多于两个），这样能够增长对象在年轻代中的存在时间，减小被放到年老代的可能。

（2）年老代:

在年轻代中经历了N次垃圾回收后仍然存活的对象，就会被放到年老代中。所以，能够认为年老代中存放的都是一些生命周期较长的对象。

（3）持久代:

用于存放静态文件，现在Java类、方法等。持久代对垃圾回收没有显著影响，可是有些应用可能动态生成或者调用一些class，例如Hibernate 等，在这种时候须要设置一个比较大的持久代空间来存放这些运行过程当中新增的类。持久代大小经过-XX:MaxPermSize=<N>进行设置。

什么状况下触发垃圾回收

因为对象进行了分代处理，所以垃圾回收区域、时间也不同。GC有两种类型：Scavenge GC和Full GC

（1）Scavenge GC

通常状况下，当新对象生成，而且在Eden申请空间失败时，就会触发Scavenge GC，对Eden区域进行GC，清除非存活对象，而且把尚且存活的对象移动到Survivor区。而后整理Survivor的两个区。这种方式的GC是对年轻代的Eden区进行，不会影响到年老代。由于大部分对象都是从Eden区开始的，同时Eden区不会分配的很大，因此Eden区的GC会频繁进行。因而，通常在这里须要使用速度快、效率高的算法，使Eden去能尽快空闲出来。

（2）Full GC

对整个堆进行整理，包括Young、Tenured和Perm。Full GC由于须要对整个对进行回收，因此比Scavenge GC要慢，所以应该尽量减小Full GC的次数。在对JVM调优的过程当中，很大一部分工做就是对于FullGC的调节。有以下缘由可能致使Full GC：

· 年老代（Tenured）被写满

· 持久代（Perm）被写满

· System.gc()被显示调用

·上一次GC以后Heap的各域分配策略动态变化

分代垃圾回收流程示意

选择合适的垃圾收集算法

（1）串行收集器

用单线程处理全部垃圾回收工做，由于无需多线程交互，因此效率比较高。可是，也没法使用多处理器的优点，因此此收集器适合单处理器机器。固然，此收集器也能够用在小数据量（100M左右）状况下的多处理器机器上。可使用-XX:+UseSerialGC打开。

（2）并行收集器

对年轻代进行并行垃圾回收，所以能够减小垃圾回收时间。通常在多线程多处理器机器上使用。使用-XX:+UseParallelGC.打开。并行收集器在 J2SE5.0第六6更新上引入，在Java SE6.0中进行了加强--能够对年老代进行并行收集。若是年老代不使用并发收集的话，默认是使用单线程进行垃圾回收，所以会制约扩展能力。使用 -XX:+UseParallelOldGC打开。

使用-XX:ParallelGCThreads=<N>设置并行垃圾回收的线程数。此值能够设置与机器处理器数量相等。

此收集器能够进行以下配置：

最大垃圾回收暂停：指定垃圾回收时的最长暂停时间，经过-XX:MaxGCPauseMillis=<N>指定。<N>为毫秒.若是指定了此值的话，堆大小和垃圾回收相关参数会进行调整以达到指定值。设定此值可能会减小应用的吞吐量。

吞吐量：吞吐量为垃圾回收时间与非垃圾回收时间的比值，经过-XX:GCTimeRatio=<N>来设定，公式为1/（1+N）。例如，-XX:GCTimeRatio=19时，表示5%的时间用于垃圾回收。默认状况为99，即1%的时间用于垃圾回收。

（3）并发收集器

能够保证大部分工做都并发进行（应用不中止），垃圾回收只暂停不多的时间，此收集器适合对响应时间要求比较高的中、大规模应用。使用-XX:+UseConcMarkSweepGC打开。

并发收集器主要减小年老代的暂停时间，他在应用不中止的状况下使用独立的垃圾回收线程，跟踪可达对象。在每一个年老代垃圾回收周期中，在收集初期并发收集器会对整个应用进行简短的暂停，在收集中还会再暂停一次。第二次暂停会比第一次稍长，在此过程当中多个线程同时进行垃圾回收工做。并发收集器使用处理器换来短暂的停顿时间。在一个N个处理器的系统上，并发收集部分使用K/N个可用处理器进行回收，通常状况下1<=K<=N/4。在只有一个处理器的主机上使用并发收集器，设置为incremental mode模式也可得到较短的停顿时间。

浮动垃圾：因为在应用运行的同时进行垃圾回收，因此有些垃圾可能在垃圾回收进行完成时产生，这样就形成了“Floating Garbage”，这些垃圾须要在下次垃圾回收周期时才能回收掉。因此，并发收集器通常须要20%的预留空间用于这些浮动垃圾。

Concurrent Mode Failure：并发收集器在应用运行时进行收集，因此须要保证堆在垃圾回收的这段时间有足够的空间供程序使用，不然，垃圾回收还未完成，堆空间先满了。这种状况下将会发生“并发模式失败”，此时整个应用将会暂停，进行垃圾回收。

启动并发收集器：由于并发收集在应用运行时进行收集，因此必须保证收集完成以前有足够的内存空间供程序使用，不然会出现“Concurrent Mode Failure”。经过设置-XX:CMSInitiatingOccupancyFraction=<N>指定还有多少剩余堆时开始执行并发收集

适用场景

（1）串行处理器：

--适用状况：数据量比较小（100M左右）；单处理器下而且对响应时间无要求的应用。
--缺点：只能用于小型应用

（2）并行处理器：

--适用状况：“对吞吐量有高要求”，多CPU、对应用响应时间无要求的中、大型应用。举例：后台处理、科学计算。
--缺点：垃圾收集过程当中应用响应时间可能加长

（3）并发处理器：

--适用状况：“对响应时间有高要求”，多CPU、对应用响应时间有较高要求的中、大型应用。举例：Web服务器/应用服务器、电信交换、集成开发环境。

小结

并行收集器 )

concurrent collector (并发收集器)
介绍	使用单线程去完成全部的gc工做，没有线程间的通讯，这种方式会相对高效	使用多线程的方式，利用多CUP来提升GC的效率，主要以到达必定的吞吐量为目标	使用多线程的方式，利用多CUP来提升GC的效率，并发完成大部分工做，使得gc pause短
适用场景	单处理器机器且没有pause time的要求	适用于科学技术和后台处理有中规模/大规模数据集大小的应用且运行在多处理器上，关注吞吐量(throughput)	适合中大规模数据集的应用，应用服务器，电信领域，关注response time，而不是throughput
使用参数	Client模式下默认：可以使用强制使用参数： -XX:+UseSerialGC 优势：对server应用没什么优势缺点：慢,不能充分发挥硬件资源	Server模式下默认 --YGC:PS FGC:Parallel MSC 强制使用参数： -XX:+UseParallelGC或-XX:+UseParallelOldGC --ParallelGC表明FGC为Parallel MSC --ParallelOldGC表明FGC为Parallel Compacting 优势：高效缺点：heap变大后形成暂停时间会变长	可用-XX:+UseConcMarkSweepGC强制指定优势: 对old进行回收时,对应用形成的暂停时间很是短,适合对latency要求比较高的应用缺点: 1.内存碎片和浮动垃圾 2.old去的内存分配效率低 3.回收的整个耗时比较长 4.和应用争抢CPU
内存回收触发条件	YGC eden空间不足 FGC old空间不足 perm空间不足显示调用System.gc()，包括RMI等的定时触发	YGC eden空间不足 FGC old空间不足 perm空间不足显示调用System.gc()，包括RMI等的定时触发	YGC eden空间不足 CMS GC 1.old Gen使用率大的比率，默认为92% 2.配置了CMSClassUnloadingEnabled,且Perm Gen的使用达到必定的比率默认为92% 3.Hotspot本身根据估计决定是否要触法 4.在配置了ExplictGCInvokesConcurrent的状况下显示调用了System.gc()
内存回收触发工做	YGC 清空eden+from中全部no ref的对象占用的内存将eden+from中的全部存活的对象copy到to中在这个过程当中一些对象将晋升到old中: --to放不下的 --存活次数超过tenuring threshold的从新计算Tenuring Threshold; 单线程作以上动做，GC全程暂停应用 FGC 若是配置了CollectGen0First,则先触发YGC 清空heap中no ref的对象,permgen中已经被卸载的classloader中加载的class的信息单线程作以上动做全程暂停应用	YGC 同serial动做基本相同,不一样点: 1.多线程处理 2.YGC的最后不只从新计算Tenuring Threshold,还会从新调整Eden和From的大小 FGC 1.如配置了ScavengeBeforeFullGC(默认),则先触发YGC(??) 2.MSC:清空heap中的no ref对象,permgen中已经被卸载的classloader中加载的class信息,并进行压缩 3.Compacting:清空heap中部分no ref的对象,permgen中已经被卸载的classloader中加载的class信息,并进行部分压缩多线程作以上动做.	YGC 同serial动做基本相同,不一样点: 1.多线程处理 CMSGC: 1.old gen到达比率时只清除old gen中no ref的对象所占用的空间 2.perm gen到达比率时只清除已被清除的classloader加载的class信息 FGC 同serial
细节参数	可用-XX:+UseSerialGC强制使用 -XX:SurvivorRatio=x,控制eden/s0/s1的大小 -XX:MaxTenuringThreshold,用于控制对象在新生代存活的最大次数 -XX:PretenureSizeThreshold=x,控制超过多大的字节的对象就在old分配.	-XX:SurvivorRatio=x,控制eden/s0/s1的大小 -XX:MaxTenuringThreshold,用于控制对象在新生代存活的最大次数 -XX:UseAdaptiveSizePolicy 去掉YGC后动态调整eden from已经tenuringthreshold的动做 -XX:ParallelGCThreads=4设置并行的线程数	-XX:CMSInitiatingOccupancyFraction 设置old gen使用到达多少比率时触发 -XX:CMSInitiatingPermOccupancyFraction,设置Perm Gen使用到达多少比率时触发 -XX:+UseCMSInitiatingOccupancyOnly禁止hostspot自行触发CMS GC

3、典型配置举例

如下配置主要针对分代垃圾回收算法而言。

堆大小设置

年轻代的设置很关键

JVM中最大堆大小有三方面限制：相关操做系统的数据模型（32-bt仍是64-bit）限制；系统的可用虚拟内存限制；系统的可用物理内存限制。32位系统下，通常限制在1.5G~2G；64为操做系统对内存无限制。在Windows Server 2003 系统，3.5G物理内存，JDK5.0下测试，最大可设置为1478m。

典型设置：

java -Xmx3550m -Xms3550m -Xmn2g –Xss128k

-Xmx3550m：设置JVM最大可用内存为3550M。

-Xms3550m：设置JVM促使内存为3550m。此值能够设置与-Xmx相同，以免每次垃圾回收完成后JVM从新分配内存。

-Xmn2g：设置年轻代大小为2G。整个堆大小=年轻代大小 + 年老代大小 + 持久代大小。持久代通常固定大小为64m，因此增大年轻代后，将会减少年老代大小。此值对系统性能影响较大，Sun官方推荐配置为整个堆的3/8。

-Xss128k：设置每一个线程的堆栈大小。JDK5.0之后每一个线程堆栈大小为1M，之前每一个线程堆栈大小为 256K。更具应用的线程所需内存大小进行调整。在相同物理内存下，减少这个值能生成更多的线程。可是操做系统对一个进程内的线程数仍是有限制的，不能无限生成，经验值在3000~5000左右。

java -Xmx3550m -Xms3550m -Xss128k -XX:NewRatio=4 -XX:SurvivorRatio=4 -XX:MaxPermSize=16m -XX:MaxTenuringThreshold=0

-XX:NewRatio=4:设置年轻代（包括Eden和两个Survivor区）与年老代的比值（除去持久代）。设置为4，则年轻代与年老代所占比值为1：4，年轻代占整个堆栈的1/5

-XX:SurvivorRatio=4：设置年轻代中Eden区与Survivor区的大小比值。设置为4，则两个Survivor区与一个Eden区的比值为2:4，一个Survivor区占整个年轻代的1/6

-XX:MaxPermSize=16m:设置持久代大小为16m。

-XX:MaxTenuringThreshold=0：设置垃圾最大年龄。若是设置为0的话，则年轻代对象不通过 Survivor区，直接进入年老代。对于年老代比较多的应用，能够提升效率。若是将此值设置为一个较大值，则年轻代对象会在Survivor区进行屡次复制，这样能够增长对象再年轻代的存活时间，增长在年轻代即被回收的概论。

回收器选择

JVM给了三种选择：串行收集器、并行收集器、并发收集器

（1）串行收集器

适用于小数据量的状况，因此这里的选择主要针对并行收集器和并发收集器。默认状况下，JDK5.0之前都是使用串行收集器，若是想使用其余收集器须要在启动时加入相应参数。JDK5.0之后，JVM会根据当前系统配置进行判断。

（2）并行收集器——吞吐量优先

如上文所述，并行收集器主要以到达必定的吞吐量为目标，适用于科学技术和后台处理等。

典型配置：

java -Xmx3800m -Xms3800m -Xmn2g -Xss128k -XX:+UseParallelGC -XX:ParallelGCThreads=20

-XX:+UseParallelGC：选择垃圾收集器为并行收集器。此配置仅对年轻代有效。即上述配置下，年轻代使用并发收集，而年老代仍旧使用串行收集。

-XX:ParallelGCThreads=20：配置并行收集器的线程数，即：同时多少个线程一块儿进行垃圾回收。此值最好配置与处理器数目相等。

java -Xmx3550m -Xms3550m -Xmn2g -Xss128k -XX:+UseParallelGC -XX:ParallelGCThreads=20 -XX:+UseParallelOldGC

-XX:+UseParallelOldGC：配置年老代垃圾收集方式为并行收集。JDK6.0支持对年老代并行收集。

java -Xmx3550m -Xms3550m -Xmn2g -Xss128k -XX:+UseParallelGC -XX:MaxGCPauseMillis=100

-XX:MaxGCPauseMillis=100:设置每次年轻代垃圾回收的最长时间，若是没法知足此时间，JVM会自动调全年轻代大小，以知足此值。

java -Xmx3550m -Xms3550m -Xmn2g -Xss128k -XX:+UseParallelGC -XX:MaxGCPauseMillis=100 -XX:+UseAdaptiveSizePolicy

-XX:+UseAdaptiveSizePolicy：设置此选项后，并行收集器会自动选择年轻代区大小和相应的Survivor区比例，以达到目标系统规定的最低相应时间或者收集频率等，此值建议使用并行收集器时，一直打开。

（3）并发收集器——响应时间优先

如上文所述，并发收集器主要是保证系统的响应时间，减小垃圾收集时的停顿时间。适用于应用服务器、电信领域等。

典型配置：

java -Xmx3550m -Xms3550m -Xmn2g -Xss128k -XX:ParallelGCThreads=20 -XX:+UseConcMarkSweepGC -XX:+UseParNewGC

-XX:+UseConcMarkSweepGC：设置年老代为并发收集。测试中配置这个之后，-XX:NewRatio=4的配置失效了，缘由不明。因此，此时年轻代大小最好用-Xmn设置。

-XX:+UseParNewGC: 设置年轻代为并行收集。可与CMS收集同时使用。JDK5.0以上，JVM会根据系统配置自行设置，因此无需再设置此值。

java -Xmx3550m -Xms3550m -Xmn2g -Xss128k -XX:+UseConcMarkSweepGC -XX:CMSFullGCsBeforeCompaction=5 -XX:+UseCMSCompactAtFullCollection

-XX:CMSFullGCsBeforeCompaction：因为并发收集器不对内存空间进行压缩、整理，因此运行一段时间之后会产生“碎片”，使得运行效率下降。此值设置运行多少次GC之后对内存空间进行压缩、整理。

-XX:+UseCMSCompactAtFullCollection：打开对年老代的压缩。可能会影响性能，可是能够消除碎片

辅助信息

JVM提供了大量命令行参数，打印信息，供调试使用。主要有如下一些：

-XX:+PrintGC：输出形式：[GC 118250K->113543K(130112K), 0.0094143 secs] [Full GC 121376K->10414K(130112K), 0.0650971 secs]

-XX:+PrintGCDetails：输出形式：[GC [DefNew: 8614K->781K(9088K), 0.0123035 secs] 118250K->113543K(130112K), 0.0124633 secs] [GC [DefNew: 8614K->8614K(9088K), 0.0000665 secs][Tenured: 112761K->10414K(121024K), 0.0433488 secs] 121376K->10414K(130112K), 0.0436268 secs]

-XX:+PrintGCTimeStamps -XX:+PrintGC：PrintGCTimeStamps可与上面两个混合使用
输出形式：11.851: [GC 98328K->93620K(130112K), 0.0082960 secs]

-XX:+PrintGCApplicationConcurrentTime：打印每次垃圾回收前，程序未中断的执行时间。可与上面混合使用。输出形式：Application time: 0.5291524 seconds

-XX:+PrintGCApplicationStoppedTime：打印垃圾回收期间程序暂停的时间。可与上面混合使用。输出形式：Total time for which application threads were stopped: 0.0468229 seconds

-XX:PrintHeapAtGC: 打印GC先后的详细堆栈信息。输出形式：

34.702: [GC {Heap before gc invocations=7:

def new generation total 55296K, used 52568K [0x1ebd0000, 0x227d0000, 0x227d0000)

eden space 49152K, 99% used [0x1ebd0000, 0x21bce430, 0x21bd0000)

from space 6144K, 55% used [0x221d0000, 0x22527e10, 0x227d0000)

to space 6144K, 0% used [0x21bd0000, 0x21bd0000, 0x221d0000)

tenured generation total 69632K, used 2696K [0x227d0000, 0x26bd0000, 0x26bd0000)

the space 69632K, 3% used [0x227d0000, 0x22a720f8, 0x22a72200, 0x26bd0000)

compacting perm gen total 8192K, used 2898K [0x26bd0000, 0x273d0000, 0x2abd0000)

the space 8192K, 35% used [0x26bd0000, 0x26ea4ba8, 0x26ea4c00, 0x273d0000)

ro space 8192K, 66% used [0x2abd0000, 0x2b12bcc0, 0x2b12be00, 0x2b3d0000)

rw space 12288K, 46% used [0x2b3d0000, 0x2b972060, 0x2b972200, 0x2bfd0000)

34.735: [DefNew: 52568K->3433K(55296K), 0.0072126 secs] 55264K->6615K(124928K)Heap after gc invocations=8:

def new generation total 55296K, used 3433K [0x1ebd0000, 0x227d0000, 0x227d0000)

eden space 49152K, 0% used [0x1ebd0000, 0x1ebd0000, 0x21bd0000)

from space 6144K, 55% used [0x21bd0000, 0x21f2a5e8, 0x221d0000)

to space 6144K, 0% used [0x221d0000, 0x221d0000, 0x227d0000)

tenured generation total 69632K, used 3182K [0x227d0000, 0x26bd0000, 0x26bd0000)

the space 69632K, 4% used [0x227d0000, 0x22aeb958, 0x22aeba00, 0x26bd0000)

compacting perm gen total 8192K, used 2898K [0x26bd0000, 0x273d0000, 0x2abd0000)

the space 8192K, 35% used [0x26bd0000, 0x26ea4ba8, 0x26ea4c00, 0x273d0000)

ro space 8192K, 66% used [0x2abd0000, 0x2b12bcc0, 0x2b12be00, 0x2b3d0000)

rw space 12288K, 46% used [0x2b3d0000, 0x2b972060, 0x2b972200, 0x2bfd0000)

}

, 0.0757599 secs]

-Xloggc:filename:与上面几个配合使用，把相关日志信息记录到文件以便分析。

4、常见配置汇总

堆设置

-Xms:初始堆大小

-Xmx:最大堆大小

-XX:NewSize=n:设置年轻代大小

-XX:NewRatio=n:设置年轻代和年老代的比值。如:为3，表示年轻代与年老代比值为1：3，年轻代占整个年轻代年老代和的1/4

-XX:SurvivorRatio=n:年轻代中Eden区与两个Survivor区的比值。注意Survivor区有两个。如：3，表示Eden：Survivor=3：2，一个Survivor区占整个年轻代的1/5

-XX:MaxPermSize=n:设置持久代大小

收集器设置

-XX:+UseSerialGC:设置串行收集器

-XX:+UseParallelGC:设置并行收集器

-XX:+UseParalledlOldGC:设置并行年老代收集器

-XX:+UseConcMarkSweepGC:设置并发收集器

垃圾回收统计信息

-XX:+PrintGC

-XX:+PrintGCDetails

-XX:+PrintGCTimeStamps

-Xloggc:filename

并行收集器设置

-XX:ParallelGCThreads=n:设置并行收集器收集时使用的CPU数。并行收集线程数。

-XX:MaxGCPauseMillis=n:设置并行收集最大暂停时间

-XX:GCTimeRatio=n:设置垃圾回收时间占程序运行时间的百分比。公式为1/(1+n)

并发收集器设置

-XX:+CMSIncrementalMode:设置为增量模式。适用于单CPU状况。

-XX:ParallelGCThreads=n:设置并发收集器年轻代收集方式为并行收集时，使用的CPU数。并行收集线程数。

调优总结

年轻代大小选择

响应时间优先的应用：尽量设大，直到接近系统的最低响应时间限制（根据实际状况选择）。在此种状况下，年轻代收集发生的频率也是最小的。同时，减小到达年老代的对象。

吞吐量优先的应用：尽量的设置大，可能到达Gbit的程度。由于对响应时间没有要求，垃圾收集能够并行进行，通常适合8CPU以上的应用。

年老代大小选择

响应时间优先的应用：年老代使用并发收集器，因此其大小须要当心设置，通常要考虑并发会话率和会话持续时间等一些参数。若是堆设置小了，能够会形成内存碎片、高回收频率以及应用暂停而使用传统的标记清除方式；若是堆大了，则须要较长的收集时间。最优化的方案，通常须要参考如下数据得到：

1. 并发垃圾收集信息

2. 持久代并发收集次数

3. 传统GC信息

4. 花在年轻代和年老代回收上的时间比例

减小年轻代和年老代花费的时间，通常会提升应用的效率

吞吐量优先的应用：通常吞吐量优先的应用都有一个很大的年轻代和一个较小的年老代。缘由是，这样能够尽量回收掉大部分短时间对象，减小中期的对象，而年老代尽存放长期存活对象。

较小堆引发的碎片问题

由于年老代的并发收集器使用标记、清除算法，因此不会对堆进行压缩。当收集器回收时，他会把相邻的空间进行合并，这样能够分配给较大的对象。可是，当堆空间较小时，运行一段时间之后，就会出现“碎片”，若是并发收集器找不到足够的空间，那么并发收集器将会中止，而后使用传统的标记、清除方式进行回收。若是出现“碎片”，可能须要进行以下配置：

1. -XX:+UseCMSCompactAtFullCollection：使用并发收集器时，开启对年老代的压缩。

2. -XX:CMSFullGCsBeforeCompaction=0：上面配置开启的状况下，这里设置多少次Full GC后，对年老代进行压缩

垃圾回收的瓶颈

传统分代垃圾回收方式，已经在必定程度上把垃圾回收给应用带来的负担降到了最小，把应用的吞吐量推到了一个极限。可是他没法解决的一个问题，就是Full GC所带来的应用暂停。在一些对实时性要求很高的应用场景下，GC暂停所带来的请求堆积和请求失败是没法接受的。这类应用可能要求请求的返回时间在几百甚至几十毫秒之内，若是分代垃圾回收方式要达到这个指标，只能把最大堆的设置限制在一个相对较小范围内，可是这样有限制了应用自己的处理能力，一样也是不可接收的。

分代垃圾回收方式确实也考虑了实时性要求而提供了并发回收器，支持最大暂停时间的设置，可是受限于分代垃圾回收的内存划分模型，其效果也不是很理想。

为了达到实时性的要求（其实Java语言最初的设计也是在嵌入式系统上的），一种新垃圾回收方式呼之欲出，它既支持短的暂停时间，又支持大的内存空间分配。能够很好的解决传统分代方式带来的问题。

增量收集的演进

增量收集的方式在理论上能够解决传统分代方式带来的问题。增量收集把对堆空间划分红一系列内存块，使用时，先使用其中一部分（不会所有用完），垃圾收集时把以前用掉的部分中的存活对象再放到后面没有用的空间中，这样能够实现一直边使用边收集的效果，避免了传统分代方式整个使用完了再暂停的回收的状况。

固然，传统分代收集方式也提供了并发收集，可是他有一个很致命的地方，就是把整个堆作为一个内存块，这样一方面会形成碎片（没法压缩），另外一方面他的每次收集都是对整个堆的收集，没法进行选择，在暂停时间的控制上仍是很弱。而增量方式，经过内存空间的分块，偏偏能够解决上面问题。

Garbage Firest（G1）

这部分的内容主要参考这里，这篇文章算是对G1算法论文的解读。我也没加什么东西了。

目标：从设计目标看G1彻底是为了大型应用而准备的。

支持很大的堆

高吞吐量

--支持多CPU和垃圾回收线程

--在主线程暂停的状况下，使用并行收集

--在主线程运行的状况下，使用并发收集

实时目标：可配置在N毫秒内最多只占用M毫秒的时间进行垃圾回收

固然G1要达到实时性的要求，相对传统的分代回收算法，在性能上会有一些损失。

G1 算法详解

G1可谓博采众家之长，力求到达一种完美。他吸收了增量收集优势，把整个堆划分为一个一个等大小的区域（region）。内存的回收和划分都以 region为单位；同时，他也吸收了CMS的特色，把这个垃圾回收过程分为几个阶段，分散一个垃圾回收过程；并且，G1也认同分代垃圾回收的思想，认为不一样对象的生命周期不一样，能够采起不一样收集方式，所以，它也支持分代的垃圾回收。为了达到对回收时间的可预计性，G1在扫描了region之后，对其中的活跃对象的大小进行排序，首先会收集那些活跃对象小的region，以便快速回收空间（要复制的活跃对象少了），由于活跃对象小，里面能够认为多数都是垃圾，因此这种方式被称为Garbage First（G1）的垃圾回收算法，即：垃圾优先的回收。

回收步骤：

（1）初始标记（Initial Marking）

G1对于每一个region都保存了两个标识用的bitmap，一个为previous marking bitmap，一个为next marking bitmap，bitmap中包含了一个bit的地址信息来指向对象的起始点。开始Initial Marking以前，首先并发的清空next marking bitmap，而后中止全部应用线程，并扫描标识出每一个region中root可直接访问到的对象，将region中top的值放入next top at mark start（TAMS）中，以后恢复全部应用线程。触发这个步骤执行的条件为：

G1定义了一个JVM Heap大小的百分比的阀值，称为h，另外还有一个H，H的值为(1-h)*Heap Size，目前这个h的值是固定的，后续G1也许会将其改成动态的，根据jvm的运行状况来动态的调整，在分代方式下，G1还定义了一个u以及soft limit，soft limit的值为H-u*Heap Size，当Heap中使用的内存超过了soft limit值时，就会在一次clean up执行完毕后在应用容许的GC暂停时间范围内尽快的执行此步骤；

在pure方式下，G1将marking与clean up组成一个环，以便clean up能充分的使用marking的信息，当clean up开始回收时，首先回收可以带来最多内存空间的regions，当通过屡次的clean up，回收到没多少空间的regions时，G1从新初始化一个新的marking与clean up构成的环。

（2）并发标记（Concurrent Marking）

按照以前Initial Marking扫描到的对象进行遍历，以识别这些对象的下层对象的活跃状态，对于在此期间应用线程并发修改的对象的以来关系则记录到remembered set logs中，新建立的对象则放入比top值更高的地址区间中，这些新建立的对象默认状态即为活跃的，同时修改top值。

（3）最终标记暂停（Final Marking Pause）

当应用线程的remembered set logs未满时，是不会放入filled RS buffers中的，在这样的状况下，这些remebered set logs中记录的card的修改就会被更新了，所以须要这一步，这一步要作的就是把应用线程中存在的remembered set logs的内容进行处理，并相应的修改remembered sets，这一步须要暂停应用，并行的运行。

（4）存活对象计算及清除（Live Data Counting and Cleanup）

值得注意的是，在G1中，并非说Final Marking Pause执行完了，就确定执行Cleanup这步的，因为这步须要暂停应用，G1为了可以达到准实时的要求，须要根据用户指定的最大的GC形成的暂停时间来合理的规划何时执行Cleanup，另外还有几种状况也是会触发这个步骤的执行的：

G1采用的是复制方法来进行收集，必须保证每次的”to space”的空间都是够的，所以G1采起的策略是当已经使用的内存空间达到了H时，就执行Cleanup这个步骤；

对于full-young和partially-young的分代模式的G1而言，则还有状况会触发Cleanup的执行，full-young模式下，G1根据应用可接受的暂停时间、回收young regions须要消耗的时间来估算出一个yound regions的数量值，当JVM中分配对象的young regions的数量达到此值时，Cleanup就会执行；partially-young模式下，则会尽可能频繁的在应用可接受的暂停时间范围内执行 Cleanup，并最大限度的去执行non-young regions的Cleanup。

之后JVM的调优或许跟多须要针对G1算法进行调优了。

参考资料

能整理出上面一些东西，也是由于站在巨人的肩上。下面是一些参考资料，供你们学习，你们有更好的，能够继续完善：）

· Java 理论与实践: 垃圾收集简史

· Java HotSpot VM Options

· 《深刻Java虚拟机》。虽然过去了不少年，但这本书依旧是经典。

这里是本系列的最后一篇了，很高兴你们可以喜欢这系列的文章。期间也提了不少问题，其中有些是我以前没有想到的或者考虑欠妥的，感谢提出这些问题的朋友，我也学到的很多东西。

参考推荐：

JVM调优总结（推荐）