Java虚拟机详解(三)------垃圾回收

  若是对C++这门语言熟悉的人,再来看Java,就会发现这二者对垃圾(内存)回收的策略有很大的不一样。html

  C++:垃圾回收很重要,咱们必需要本身来回收!!!程序员

  Java:垃圾回收很重要,咱们必须交给系统来帮咱们完成!!!算法

  我想这也能看出这两门语言设计者的心态吧,总之,Java和C++之间有一堵由内存动态分布和垃圾回收技术所围成的高墙,墙外面的人想进去,墙里面的人想出来。服务器

  本篇博客咱们就来详细介绍Java的垃圾回收策略。编辑器

一、为何要进行垃圾回收

  咱们知道Java是一门面向对象的语言,在一个系统运行中,会伴随着不少对象的建立,而这些对象一旦建立了就占据了必定的内存,在上一篇博客Java运行时内存结构中,咱们介绍过建立的对象是保存在堆中的,当对象使用完毕以后,不对其进行清理,那么会一直占据内存空间,很明显内存空间是有限的,若是不回收这些无用的对象占据的内存,那么新建立的对象申请不了内存空间,系统就会抛出异常而没法运行,因此必需要常常进行内存的回收,也就是垃圾收集。ide

二、为何要了解垃圾回收

  文章开头,咱们就说Java的垃圾回收是系统自动进行的,不须要咱们程序员手动处理,那么咱们为何还要了解垃圾回收呢,?函数

  其实这也是一个程序员进阶的过程,生产项目在运行过程当中,极可能会存在内存溢出、内存泄露等问题,出现了这些问题,咱们应该怎么排查?以及在生产服务器有限的资源上如何更好的分配Java运行时内存区域,提升系统运行效率等,咱们必须知其然知其因此然。this

  PS:本篇博客只是介绍Java垃圾回收机制,关于排查内存泄漏、溢出,运行时内存区域参数调优等会在后面进行介绍。spa

三、回收哪部分区域内存

  仍是结合上一篇博客Java运行时内存结构,咱们介绍了Java运行时的内存结构,其中程序计数器、虚拟机栈、本地方法栈这三个区域是线程私有的,随线程而生,随线程而灭,栈中的栈帧随着方法的进入和退出而有条不紊的执行着入栈和出栈操做,这几个区域的内存分配和回收都具有肯定性,在方法结束或线程结束时,内存也就跟着回收了,因此不须要咱们考虑。线程

  那么如今就剩下Java堆方法区了,这两块区域在编译期间咱们并不能彻底肯定建立多少个对象,有些是在运行时期建立的对象,因此Java内存回收机制主要是做用在这两块区域。

四、如何判断对象为垃圾对象

  经过上面介绍了,咱们了解了为何要进行垃圾回收以及回收哪部分的垃圾,那么接下来咱们怎么去区分哪些对象为垃圾呢?

  换句话来讲,咱们如何判断哪些对象还“活着”,哪些对象已经“死了”,那些“死了”的对象占据的内存就是咱们要进行回收的。

①、引用计数算法

  这种算法是这样的:给每个建立的对象增长一个引用计数器,每当有一个地方引用它时,这个计数器就加1;而当引用失效时,这个计数器就减1。当这个引用计数器值为0时,也就是说这个对象没有任何地方在使用它了,那么这就是一个无效的对象,即可以进行垃圾回收了。

  这种算法实现简单,并且效率也很高。可是Java没有采用该算法来进行垃圾回收,由于这种算法没法解决对象之间的循环引用问题。

  下面咱们就来构造一个循环引用的例子:

  首先,有一个 Person 类,这个类有两个自引用属性,分别表示其父亲,儿子。

 1 package com.ys.algorithmproject.leetcode.demo.JVM;
 2 
 3 /**
 4  * Create by YSOcean
 5  */
 6 public class Person {
 7 
 8     private Byte[] _1MB = null;
 9 
10     public Person() {
11         /**
12          * 这个成员属性的做用纯粹就是占据必定内存,以便在日志中查看是否被回收
13          */
14         _1MB = new Byte[1*1024*1024];
15     }
16 
17 
18 
19     private Person father;
20     private Person son;
21 
22     public Person getFather() {
23         return father;
24     }
25 
26     public void setFather(Person father) {
27         this.father = father;
28     }
29 
30     public Person getSon() {
31         return son;
32     }
33 
34     public void setSon(Person son) {
35         this.son = son;
36     }
37 }
View Code

  接着,咱们经过Person类构造两个对象,分别是父亲,儿子,以下:

 1 public static void main(String[] args) {
 2 
 3     Person father = new Person();
 4     Person son = new Person();
 5     father.setSon(son);
 6     son.setFather(father);
 7 
 8     father = null;
 9     son = null;
10     
11     /**
12      * 调用此方法表示但愿进行一次垃圾回收。可是它不能保证垃圾回收必定会进行,
13      * 并且具体何时进行是取决于具体的虚拟机的,不一样的虚拟机有不一样的对策。
14      */
15     System.gc();
16 }

  首先,从第3-6行代码,其运行时内存结构图以下:

   

  father对象和son对象,其引用计数第一个是栈内存指向,第二个就是其属性互相引用对方,全部引用计数器都是2。

  接着咱们看第8,9行代码,分别将这两个对象置为null,也就是去掉了栈内存指向。

  

  这时候其实这两个对象只是本身互相引用了,没有别的地方在引用它们,引用计数器为1,那么这两个对象按照引用计数算法实现的虚拟机就不会回收,可想而知,这是咱们不能接受的。

  因此Java虚拟机都没有使用该算法来判断对象是否存活,咱们能够经过增长打印虚拟机参数来验证。

  咱们将上面的man函数,增长以下Java虚拟机参数,用来打印gc信息。

-verbose:gc

  在IDEA编辑器中,添加方式以下:

  

   运行结果以下:

  

  咱们看到12201K->1088K(125952K)的输出,表示垃圾收集GC前有12201K,回收后剩下1088K,堆的总量为125952K,回收的内存为12201K-1088K = 11113K。

  换句话说,上面的例子Java虚拟机是有进行垃圾回收的,因此,这也间接佐证了Java虚拟机并非采用的引用计数法来判断对象是不是垃圾。

  PS:这些参数信息详解也会在后面博客进行详细介绍。

②、根搜索算法

  咱们这里直接给出结论:在主流的商用程序中(Java,C#),都是使用根搜索算法(GC Roots Tracing)来断定对象是否存活。 

  该算法思路:经过一系列名为“GC Roots” 的对象做为终点,当一个对象到GC Roots 之间没法经过引用到达时,那么该对象即可以进行回收了。

  

  上图Object1,Object2,Object3,Object4到GC Roots是可达的,因此不会被做为垃圾回收。

  

  上图Object1,Object2,Object3这三个对象互相引用,可是到 GC Roots不可达,因此都会被垃圾回收掉。

  那么有哪些对象能够做为 GC Roots 呢?

  在Java语言中,有以下4中对象能够做为 GC Roots:

1 1、虚拟机栈(栈帧中的本地变量表)中引用的对象
2 2、方法区中的静态变量属性引用的对象
3 3、方法区中常量引用的对象
4 四、本地方法栈中(JNI)(即通常说的Native方法)的引用的对象

五、如何进行垃圾回收

  垃圾回收涉及到大量的程序细节,并且各个平台的虚拟机操做内存的方式也不同,可是他们进行垃圾回收的算法是通用的,因此这里咱们也只介绍几种通用算法。

①、标记-清除算法

  算法实现:分为标记-清除两个阶段,首先根据上面的根搜索算法标记出全部须要回收的对象,在标记完成后,而后在统一回收掉全部被标记的对象。

  缺点

  一、效率低:标记和清除这两个过程的效率都不高。

  二、容易产生内存碎片:由于内存的申请一般不是连续的,那么清除一些对象后,那么就会产生大量不连续的内存碎片,而碎片太多时,当有个大对象须要分配内存时,便会形成没有足够的连续内存分配而提早触发垃圾回收,甚至直接抛出OutOfMemoryExecption。

  

②、复制算法

  为了解决标记-清除算法的两个缺点,复制算法诞生了。

  算法实现:将可用内存按容量划分为大小相等的两块区域,每次只使用其中一块,当这一块的内存用完了,就将还活着的对象复制到另外一块区域上,而后再把已使用过的内存空间一次性清理掉。

  优势:每次都是只对其中一块内存进行回收,不用考虑内存碎片的问题,并且分配内存时,只须要移动堆顶指针,按顺序进行分配便可,简单高效。

  缺点:将内存分为两块,可是每次只能使用一块,也就是说,机器的一半内存是闲置的,这资源浪费有点严重。而且若是对象存活率较高,每次都须要复制大量的对象,效率也会变得很低。

  

③、标记-整理算法

  上面咱们说过复制算法会浪费一半的内存,而且对象存活率较高时,会有过多的复制操做,效率低下。

  若是对象存活率很高,基本上不会进行垃圾回收时,标记-整理算法诞生了。

  算法实现:首先标记出全部存活的对象,而后让全部存活对象向一端进行移动,最后直接清理到端边界之外的内存。

  局限性:只有对象存活率很高的状况下,使用该算法才会效率较高。

  

④、分代收集算法

   当前商业虚拟机都是采用此算法,可是其实这不是什么新的算法,而是上面几种算法的合集。

  算法实现:根据对象的存活周期不一样将内存分为几块,而后不一样的区域采用不一样的回收算法。

    一、对于存活周期较短,每次都有大批对象死亡,只有少许存活的区域,采用复制算法,由于只须要付出少许存活对象的复制成本便可完成收集;

    二、对于存活周期较长,没有额外空间进行分配担保的区域,采用标记-整理算法,或者标记-清除算法。

  好比,对于 HotSpot 虚拟机,它将堆空间分为以下两块区域:

  

  堆有新生代和老年代两块区域组成,而新生代区域又分为三个部分,分别是 Eden,From Surivor,To Survivor ,比例是8:1:1。

  新生代采用复制算法,每次使用一块Eden区和一块Survivor区,当进行垃圾回收时,将Eden和一块Survivor区域的全部存活对象复制到另外一块Survivor区域,而后清理到刚存放对象的区域,依次循环。

  老年代采用标记-清除或者标记-整理算法,根据使用的垃圾回收器来进行判断。

  至于为何要这样,这是因为内存分配的机制致使的,新生代存的基本上都是朝生夕死的对象,而老年代存放的都是存活率很高的对象。关于内存分配下篇博客咱们会详细进行介绍。

六、什么时候进行垃圾回收

  理清了什么是垃圾,怎么回收垃圾,最后一点就是Java虚拟机什么时候进行垃圾回收呢?

  程序员能够调用 System.gc()方法,手动回收,可是调用此方法表示但愿进行一次垃圾回收。可是它不能保证垃圾回收必定会进行,并且具体何时进行是取决于具体的虚拟机的,不一样的虚拟机有不一样的对策。

  其次虚拟机会自行根据当前内存大小,判断什么时候进行垃圾回收,好比前面所说的,新生代满了,新产生的对象没法分配内存时,便会触发垃圾回收机制。

  这里须要说明的是宣告一个对象死亡,至少要经历两次标记,前面咱们说过,若是对象与GC Roots 不可达,那么此对象会被第一次标记并进行一次筛选,筛选的条件是此对象是否有必要执行 finalize() 方法,当对象没有覆盖 finalize()方法,或者该方法已经执行了一次,那么虚拟机都将视为没有必要执行finalize()方法。

  若是这个对象有必要执行 finalize() 方法,那么该对象将会被放置在一个有虚拟机自动创建、低优先级,名为 F-Queue 队列中,GC会对F-Queue进行第二次标记,若是对象在finalize() 方法中成功拯救了本身(好比从新与GC Roots创建链接),那么第二次标记时,就会将该对象移除即将回收的集合,不然就会被回收。

相关文章
相关标签/搜索