深刻理解JVM（③）各类垃圾收集算法

时间 2020-06-12

标签深刻理解 jvm 各类垃圾收集算法栏目 Java 繁體版

原文原文链接

前言

从如何断定对象消亡的角度出发，垃圾收集算法能够划分为“引用计数式垃圾收集”（Reference Counting GC）和“追踪式垃圾收集”（Tracing GC）两大类，这两类也常被称做“直接垃圾收集”和“间接垃圾收集”。因为束流Java虚拟机中使用的都是“追踪式垃圾收集”，因此后续介绍的垃圾收集算法都是属于追踪式的垃圾收集。算法

分代式收集理论

当前商业虚拟机的垃圾收集器，大多数都遵循了“分代收集”的理论进行设计。
主要简历在两个分代假说之上：
一、弱分代假说：绝大多数对象都是“朝生夕灭”的。
二、强分代假说：熬过越多此垃圾收集过程的对象就越难以消亡。
这两个分代假说奠基了多款经常使用的垃圾收集器的一致设计原则：收集器应该将Java堆划分出不一样的区域，而后将回收对象依据其年龄（对象熬过垃圾收集过程的次数）分配到不一样的区域之中存储。
把分代收集理论具体放到如今商用的Java虚拟机里，设计者通常至少会把Java堆划分为新生代（Young Generation）和老年代（Old Generation两个区域。在新生代中，每次垃圾收集时都有大批对象死去，而每次回收后存活的少许对象，将会逐步晋升到老年代中存放。优化

标记-清除算法

标记-清除算法，分为“标记”和“清除”两个阶段：首先标记全部须要回收的对象，标记完成后，统一回收掉全部被标记的对象，也能够反过来，标记存活的对象，统一回收全部未被标记的对象。
这个算法有两个主要的缺点：
第一个是执行效率不稳定，若是Java堆中有大部分是须要回收的对象，这个会进行大量标记和清除动做，致使标记和清除两个过程的执行效率随着对象数量增加而下降。
第二个是内存碎片化问题，标记、清除以后会产生大量不连续的内存碎片，空间碎片太多会致使当须要大对象时找不到足够的连续内存，而提早触发另外一次垃圾收集动做。
由于这两个缺点的缘由，才会产生后续一些针对于修复这两个缺点的算法。
标记清除算法示意图：
设计

标记复制算法

标记复制算法也被简称Wie复制算法，为了解决标记清除算法面对大量可回收对象时执行效率低的问题，而产生的一种称为“半区复制”的垃圾收集算法。
原理是：将可用内存按容量划分为大小相等的两块，每次只使用其中的一块当这一块内存用完了，就将还存活着的对象复制到另一块上面，而后再把已使用过的内存空间一次清理掉。
这种算法不用考虑空间碎片化，只须要移动堆指针，按顺序分配便可，实现简单，运行高效，但缺点也是显而易见的，就是将可用内存缩小了原来的一半。
标记复制算法示意图：

因为新生代里的对象“朝生夕灭”，针对这个特色，又产生了一种更优化的半区复制分代策略，称为“Appel式回收”。具体作法是把新生代分为一块较大的Eden空间和两块较小的Survivor空间，每次分配内存只是用Eden和其中一块Survivor。当发生垃圾收集时，将Eden和Survivor中任然存活的对象一次性复制到另一块Survivor空间上，而后直接清理掉Eden和Survivor空间。
HotSpot虚拟机默认Eden和Survivor的大小比例是8：1，也就是说每次可利用的空间为新生代的90%，只有10%的空间会暂时“浪费”。
若是另一块儿Survivor没有足够的空间存放存活的对象了，这些对象将经过分配担保机制直接进入到老年代。指针

标记整理算法

标记复制算法在对象存活率较高时就要进行较多的复制操做，效率将会下降。更关键的是，若是不浪费50%的空间，就须要有额外的空间进行分配担保，以应对被使用的内存中全部对象都100%存活的极端状况，因此在老年代通常不能直接选用这种算法。
针对老年代对象的存亡特征，产生了另一种有针对性的“标记整理”算法。标记的过程和“标记-清除”算法同样，也是判断对象是否属于垃圾的过程。但后续步骤是让全部存活的对象都向内存空间一端移动，而后直接清理掉边界之外的内存。
标记整理算法示意图：

在这种算法中，在移动存活对象，尤为是在老年代这种每次回收都有大量对象存活区域，移动存活对象并更新全部引用这些对象的地方将会是一种极为负重的操做，并且这种移动操做必须在暂停用户应用程序才能进行（也就是“Stop The World”）。可是不移动又会形成内存空间碎片化。因此各有利弊，从垃圾收集的停顿时间来看，不移动对象停顿时间更短，但从整个程序的吞吐量来看，移动对象会更划算。因此要依状况而定。
还有一种“和稀泥”的解决方案，就是平时采用标记清除算法，直到内存空间碎片化程度已经大到影响对象分配时，再采用标记整理算法收集一次，以得到规整的内存空间。对象