阿里面试官都爱问的内存管理和GC算法及回收策略

JVM内存组成结构

JVM栈由堆、栈、本地方法栈、方法区等部分组成,结构图以下所示:java

JVM内存回收

Sun的JVMGenerationalCollecting(垃圾回收)原理是这样的:把对象分为年青代(Young)年老代(Tenured)持久代(Perm),对不一样生命周期的对象使用不一样的算法。(基于对对象生命周期分析)面试

1.Young(年轻代)

年轻代分三个区。一个Eden区,两个Survivor区。大部分对象在Eden区中生成。当Eden区满时,还存活的对象将被复制到Survivor区(两个中的一个),当这个Survivor区满时,此区的存活对象将被复制到另一个Survivor区,当这个Survivor去也满了的时候,从第一个Survivor区复制过来的而且此时还存活的对象,将被复制年老区(Tenured。须要注意,Survivor的两个区是对称的,没前后关系,因此同一个区中可能同时存在从Eden复制过来对象,和从前一个Survivor复制过来的对象,而复制到年老区的只有从第一个Survivor去过来的对象。并且,Survivor区总有一个是空的。算法

2.Tenured(年老代)

年老代存放从年轻代存活的对象。通常来讲年老代存放的都是生命期较长的对象。数组

3.Perm(持久代)

用于存放静态文件,现在Java类、方法等。持久代对垃圾回收没有显著影响,可是有些应用可能动态生成或者调用一些class,例如Hibernate等,在这种时候须要设置一个比较大的持久代空间来存放这些运行过程当中新增的类。持久代大小经过-XX:MaxPermSize=进行设置。架构

举个例子:当在程序中生成对象时,正常对象会在年轻代中分配空间,若是是过大的对象也可能会直接在年老代生成(据观测在运行某程序时候每次会生成一个十兆的空间用收发消息,这部份内存就会直接在年老代分配)。年轻代在空间被分配完的时候就会发起内存回收,大部份内存会被回收,一部分幸存的内存会被拷贝至Survivor的from区,通过屡次回收之后若是from区内存也分配完毕,就会也发生内存回收而后将剩余的对象拷贝至to区。等到to区也满的时候,就会再次发生内存回收而后把幸存的对象拷贝至年老区。测试

一般咱们说的JVM内存回收老是在指堆内存回收,确实只有堆中的内容是动态申请分配的,因此以上对象的年轻代和年老代都是指的JVM的Heap空间,而持久代则是以前提到的MethodArea,不属于Heap。线程

关于JVM内存管理的一些建议

  1. 手动将生成的无用对象,中间对象置为null,加快内存回收。3d

  2. 对象池技术若是生成的对象是可重用的对象,只是其中的属性不一样时,能够考虑采用对象池来较少对象的生成。若是有空闲的对象就从对象池中取出使用,没有再生成新的对象,大大提升了对象的复用率。指针

  3. JVM调优经过配置JVM的参数来提升垃圾回收的速度,若是在没有出现内存泄露且上面两种办法都不能保证JVM内存回收时,能够考虑采用JVM调优的方式来解决,不过必定要通过实体机的长期测试,由于不一样的参数可能引发不一样的效果。如-Xnoclassgc参数等。cdn

垃圾对象的断定

Java堆中存放着几乎全部的对象实例,垃圾收集器对堆中的对象进行回收前,要先肯定这些对象是否还有用,断定对象是否为垃圾对象有以下算法:

引用计数算法

给对象添加一个引用计数器,每当有一个地方引用它时,计数器值就加1,当引用失效时,计数器值就减1,任什么时候刻计数器都为0的对象就是不可能再被使用的。

引用计数算法的实现简单,断定效率也很高,在大部分状况下它都是一个不错的选择,当Java语言并无选择这种算法来进行垃圾回收,主要缘由是它很难解决对象之间的相互循环引用问题。

根搜索算法

**Java和C#**中都是采用根搜索算法来断定对象是否存活的。这种算法的基本思路是经过一系列名为“GC Roots”的对象做为起始点,从这些节点开始向下搜索,搜索所走过的路径称为引用链,当一个对象到GC Roots没有任何引用链相连时,就证实此对象是不可用的。在Java语言里,可做为GC Roots的兑现包括下面几种:

  • 虚拟机栈(栈帧中的本地变量表)中引用的对象。
  • 方法区中的类静态属性引用的对象。
  • 方法区中的常量引用的对象。
  • 本地方法栈中JNI(Native方法)的引用对象。

实际上,在根搜索算法中,要真正宣告一个对象死亡,至少要经历两次标记过程:若是对象在进行根搜索后发现没有与GC Roots相链接的引用链,那它会被第一次标记而且进行一次筛选,筛选的条件是此对象是否有必要执行finalize()方法。当对象没有覆盖finalize()方法,或finalize()方法已经被虚拟机调用过,虚拟机将这两种状况都视为没有必要执行。若是该对象被断定为有必要执行finalize()方法,那么这个对象将会被放置在一个名为F-Queue队列中,并在稍后由一条由虚拟机自动创建的、低优先级的Finalizer线程去执行finalize()方法。finalize()方法是对象逃脱死亡命运的最后一次机会(由于一个对象的finalize()方法最多只会被系统自动调用一次),稍后GC将对F-Queue中的对象进行第二次小规模的标记,若是要在finalize()方法中成功拯救本身,只要在finalize()方法中让该对象从新引用链上的任何一个对象创建关联便可。而若是对象这时尚未关联到任何链上的引用,那它就会被回收掉。

垃圾收集算法

断定除了垃圾对象以后,即可以进行垃圾回收了。下面介绍一些垃圾收集算法,因为垃圾收集算法的实现涉及大量的程序细节,所以这里主要是阐明各算法的实现思想,而不去细论算法的具体实现。

标记—清除算法

标记—清除算法是最基础的收集算法,它分为“标记”和“清除”两个阶段:首先标记出所需回收的对象,在标记完成后统一回收掉全部被标记的对象,它的标记过程其实就是前面的根搜索算法中断定垃圾对象的标记过程。标记—清除算法的执行状况以下图所示:

该算法有以下缺点:

  • 标记和清除过程的效率都不高。
  • 标记清除后会产生大量不连续的内存碎片,空间碎片太多可能会致使,当程序在之后的运行过程当中须要分配较大对象时没法找到足够的连续内存而不得不触发另外一次垃圾收集动做。
复制算法

复制算法比较适合于新生代,复制算法是针对标记—清除算法的缺点,在其基础上进行改进而获得的,它讲课用内存按容量分为大小相等的两块,每次只使用其中的一块,当这一块的内存用完了,就将还存活着的对象复制到另一块内存上面,而后再把已使用过的内存空间一次清理掉。复制算法有以下优势:

  • 每次只对一块内存进行回收,运行高效。
  • 只需移动栈顶指针,按顺序分配内存便可,实现简单。
  • 内存回收时不用考虑内存碎片的出现。

它的缺点是:可一次性分配的最大内存缩小了一半。 复制算法的执行状况以下图所示:

但通常不用按1:1划份内存空间,能够分红一个大的eden和两块小的survivor。

标记—整理算法

老年代中,对象存活率比较高,若是执行较多的复制操做,效率将会变低,因此老年代通常会选用其余算法,如标记—整理算法。该算法标记的过程与标记—清除算法中的标记过程同样,但对标记后出的垃圾对象的处理状况有所不一样,它不是直接对可回收对象进行清理,而是让全部的对象都向一端移动,而后直接清理掉端边界之外的内存。标记—整理算法的回收状况以下所示:

分代收集

当前商业虚拟机的垃圾收集都采用分代收集来管理内存,它根据对象的存活周期的不一样将内存划分为几块,通常是把Java堆分为新生代和老年代。在新生代中,每次垃圾收集时都会发现有大量对象死去,只有少许存活,所以可选用复制算法来完成收集,而老年代中由于对象存活率高、没有额外空间对它进行分配担保,就必须使用标记—清除算法或标记—整理算法来进行回收。

每一个对象都有一个年龄(Age)计数器,若是对象在Eden出声并讲过一次Minor GC还存活,将被移动到Survivor区并将Age设置为1,以后每在Survivor区中熬过一次Minor GC,Age就加1,当增长到必定程度(默认为15),就能够放到老年代中。

垃圾收集器

垃圾收集器是内存回收算法的具体实现,Java虚拟机规范中对垃圾收集器应该如何实现并无任何规定,所以不一样厂商、不一样版本的虚拟机所提供的垃圾收集器均可能会有很大的差异。Sun HotSpot虚拟机1.6版包含了以下收集器:Serial、ParNew、Parallel Scavenge、CMS、Serial Old、Parallel Old。这些收集器以不一样的组合形式配合工做来完成不一样分代区的垃圾收集工做。

垃圾回收分析

在用代码分析以前,咱们对内存的分配策略明确如下三点:

  • 对象优先在Eden分配。当Eden没有足够空间分配时,将发起一次Minor GC
  • 大对象(须要大量连续空间的java对象,如长的字符串和数组)直接进入老年代。因为新生代使用复制算法回收内存,这样能够避免在Eden和两个Survivor区之间发生大量的内存复制。
  • 长期存活的对象将进入老年代。

对垃圾回收策略说明如下两点:

  • 新生代GC(Minor GC):发生在新生代的垃圾收集动做,由于Java对象大多都具备朝生夕灭的特性,所以Minor GC很是频繁,通常回收速度也比较快。
  • 老年代GC(Major GC/Full GC):发生在老年代的GC,出现了Major GC,常常会伴随至少一次Minor GC。因为老年代中的对象生命周期比较长,所以Major GC并不频繁,通常都是等待老年代满了后才进行Full GC,并且其速度通常会比Minor GC慢10倍以上。另外,若是分配了Direct Memory,在老年代中进行Full GC时,会顺便清理掉Direct Memory中的废弃对象。

Dalvik虚拟机使用Mark-Sweep算法来进行垃圾收集。顾名思义,Mark-Sweep算法就是为Mark和Sweep两个阶段进行垃圾回收。其中,Mark阶段从根集(Root Set)开始,递归地标记出当前全部被引用的对象,而Sweep阶段负责回收那些没有被引用的对象。在分析Dalvik虚拟机使用的Mark-Sweep算法以前,咱们先来了解一下什么状况下会触发GC。

读者福利、完整面试题【含答案】Java核心笔记,Java架构面试专题整合千道(pdf文档)

相关文章
相关标签/搜索