Java GC:基础原理

Java 使用了垃圾收集器来代替手动管理内存,对于垃圾收集器来讲,不管哪一种,其核心思想都是作两件事:算法

  1. 找到哪些对象是存活的(还在使用)
  2. 清除死掉的(再也不使用)的对象

标记存活对象:

引用计数法

最直接,最容易想到的标记方法是引用计数法,顾明思议,记录每一个对象被引用的个数,若是为0,则为死亡对象。该方法实现简单,判断效率高,但很难解决对象之间相互循环引用的问题。 post

可达性分析计算

在JVM中使用了可达性分析计算的方式来标记存活对象,GC 定义了一些特殊的对象做为 GC Roots:优化

  • 栈帧中的本地变量和参数
  • 活跃线程
  • 已加载的静态变量
  • JNI 引用

以 GC Roots 做为起始点,沿着引用路径不断搜索,同时标记搜索到的对象为存活。 线程

注意,在标记阶段,须要中止应用线程(Stop the World),由于没有办法在应用程序不断改变引用关系的同时一边标记。暂停的时间取决于存活对象的多少,存活的对象越多,须要标记的时间越长。3d

清除死亡对象

Sweep and Compact

在学术上,标记清除算法是最具表明性的算法:cdn

Marking: 经过 GC Roots 开始搜索标记可达的对象对象

Sweeping: 使得被未标记的对象占用的内存空间能够被以后分配使用blog

可是这样直接 Sweep 会存在两个问题:图片

  • 写操做时须要寻找可用块,会更加费时
  • 空间碎片太多会致使分配较大对象时没法获得足够连续内存

为了不这个问题,还须要作一次碎片整理 内存

Copy

还有一种更简单的方法,将内存分为两块,每次只使用其中的一块区域,发生 GC 时,将存活的对象复制到另外一个区域中,这样也不会出现碎片的问题,此外,复制能够在标记的同时进行,更加高效。缺点也很明显,须要更多的内存。这种算法被称为标记-复制算法。

分代假说

研究人员观察到,应用程序内的大多数分配分为两类:

  • 大部分对象建立后很快就再也不使用
  • 有一些对象会存活很长一段时间

基于这个假设,虚拟机将内存分为了两个代,分别为 新生代(Young Generation), 和老年代(Old Generation or Tenured)。

那么针对不一样代的特色,能够有针对性的进行算法优化,通常来讲将算法分为 Mionr GC(只回收新生代对象)和 Full GC(全局回收)。 这个假设也存在两个问题:

  • 两个代之间的对象可能存在引用,即便只进行 Mionr gc,也须要扫描一遍老年代对象检查是否存在老年代对象引用新生代对象,违背了分代的初衷
  • 分代假设可能不适用于某些应用。因为GC对算法是专门针对快速死亡的对象和存活长时间的对象进行了优化,所以对有“中等”寿命的对象的处理,JVM 表现的不太好

内存划分

一般状况下 Eden 是对象建立时被分配的区域。因为涉及到多个线程同时建立对象,Eden 被划分红了一个或多个 Thread Local Allocation Buffer (TLAB) ,简单来讲,每一个线程都被分配了一块区域用于本线程的对象分配(避免的线程同步代价),若是分配的内存不够使用了,则使用共有的部分(申请新的TLAB),若是再不够,则触发一次新生代 GC(Minor GC) ,若是清理后的内存仍然不够,则将对象分配在老年代。

在 Mionr GC 时,首先经过 GC Roots 扫描标记全部存活的对象,须要注意以前提到过,老年代的对象也有可能引用新生代对象。对于这个问题,JVM 使用了 card-marking 来避免老年代的扫描。HotSpot 使用了卡表(Card Table)的技术,将整个堆划分为一个个大小为512字节的卡,若是卡中的对象可能指向新生代对象引用,那么这张卡是脏的,同时 JVM 维护了一个卡表,每张卡都有一个对应的标识位来表示是不是脏卡。那么在进行 Minor GC 时,只需将脏卡中的对象将入到 GC Roots 里,而不用扫描整个老年代。

完成标记后,将全部存活的对象复制到其中一个 Survivor 区中,此后整个 Eden 区的内存均可以从新被使用了。这个算法也叫作“标记-复制“算法(Mark and Copy)。 Survivor 分为 from 和 to 两个区域(每次GC后身份互换),其中 to 区域永远是空的,当GC完成标记后,Eden 和 from 区域的存活对象都复制到 to 区域中,from区域清空,两个区域身份互换。

对象可能在两个 Survivor 中不断的来回复制,当复制达到必定次数时(默认15次),将被认为足够老,晋升到老年代中。此外,若是 Survivor 区域大小不够存放全部存活对象,则会将较老的对象提早晋升到老年代中。

老年代内存要大的多,而且大多数对象都不会是垃圾,而且发生GC的频率要相对小的多,因此复制算法不适用。通常来讲,使用“标记-清除-整理“的算法对老年代进行回收。

至于 JVM 是如如何使用这些算法实现具体的回收器的,请看这篇 通俗易懂 JVM 中的 GC 实现

图片来源及参考资料:《Plumbr Handbook Java Garbage Collection》

相关文章
相关标签/搜索