Java 使用了垃圾收集器来代替手动管理内存,对于垃圾收集器来讲,不管哪一种,其核心思想都是作两件事:算法
最直接,最容易想到的标记方法是引用计数法,顾明思议,记录每一个对象被引用的个数,若是为0,则为死亡对象。该方法实现简单,判断效率高,但很难解决对象之间相互循环引用的问题。 post
在JVM中使用了可达性分析计算的方式来标记存活对象,GC 定义了一些特殊的对象做为 GC Roots:优化
以 GC Roots 做为起始点,沿着引用路径不断搜索,同时标记搜索到的对象为存活。 线程
注意,在标记阶段,须要中止应用线程(Stop the World),由于没有办法在应用程序不断改变引用关系的同时一边标记。暂停的时间取决于存活对象的多少,存活的对象越多,须要标记的时间越长。3d
在学术上,标记清除算法是最具表明性的算法:cdn
Marking: 经过 GC Roots 开始搜索标记可达的对象对象
Sweeping: 使得被未标记的对象占用的内存空间能够被以后分配使用blog
可是这样直接 Sweep 会存在两个问题:图片
为了不这个问题,还须要作一次碎片整理 内存
还有一种更简单的方法,将内存分为两块,每次只使用其中的一块区域,发生 GC 时,将存活的对象复制到另外一个区域中,这样也不会出现碎片的问题,此外,复制能够在标记的同时进行,更加高效。缺点也很明显,须要更多的内存。这种算法被称为标记-复制算法。
研究人员观察到,应用程序内的大多数分配分为两类:
基于这个假设,虚拟机将内存分为了两个代,分别为 新生代(Young Generation), 和老年代(Old Generation or Tenured)。
那么针对不一样代的特色,能够有针对性的进行算法优化,通常来讲将算法分为 Mionr GC(只回收新生代对象)和 Full GC(全局回收)。 这个假设也存在两个问题:
一般状况下 Eden 是对象建立时被分配的区域。因为涉及到多个线程同时建立对象,Eden 被划分红了一个或多个 Thread Local Allocation Buffer (TLAB) ,简单来讲,每一个线程都被分配了一块区域用于本线程的对象分配(避免的线程同步代价),若是分配的内存不够使用了,则使用共有的部分(申请新的TLAB),若是再不够,则触发一次新生代 GC(Minor GC) ,若是清理后的内存仍然不够,则将对象分配在老年代。
在 Mionr GC 时,首先经过 GC Roots 扫描标记全部存活的对象,须要注意以前提到过,老年代的对象也有可能引用新生代对象。对于这个问题,JVM 使用了 card-marking 来避免老年代的扫描。HotSpot 使用了卡表(Card Table)的技术,将整个堆划分为一个个大小为512字节的卡,若是卡中的对象可能指向新生代对象引用,那么这张卡是脏的,同时 JVM 维护了一个卡表,每张卡都有一个对应的标识位来表示是不是脏卡。那么在进行 Minor GC 时,只需将脏卡中的对象将入到 GC Roots 里,而不用扫描整个老年代。
完成标记后,将全部存活的对象复制到其中一个 Survivor 区中,此后整个 Eden 区的内存均可以从新被使用了。这个算法也叫作“标记-复制“算法(Mark and Copy)。 Survivor 分为 from 和 to 两个区域(每次GC后身份互换),其中 to 区域永远是空的,当GC完成标记后,Eden 和 from 区域的存活对象都复制到 to 区域中,from区域清空,两个区域身份互换。
对象可能在两个 Survivor 中不断的来回复制,当复制达到必定次数时(默认15次),将被认为足够老,晋升到老年代中。此外,若是 Survivor 区域大小不够存放全部存活对象,则会将较老的对象提早晋升到老年代中。
老年代内存要大的多,而且大多数对象都不会是垃圾,而且发生GC的频率要相对小的多,因此复制算法不适用。通常来讲,使用“标记-清除-整理“的算法对老年代进行回收。
至于 JVM 是如如何使用这些算法实现具体的回收器的,请看这篇 通俗易懂 JVM 中的 GC 实现
图片来源及参考资料:《Plumbr Handbook Java Garbage Collection》