GC垃圾回收机制: 浅析与理解

GC垃圾回收机制: 浅析与理解

对垃圾回收进行分析前,咱们先来了解一些基本概念java

基本概念

  • 内存管理:内存管理对于编程语言相当重要。汇编容许你操做全部东西,或者说要求你必须全权处理全部细节更合适。C 语言中虽然标准库函数提供一些内存管理支持,可是对于以前调用 malloc 申请的内存,仍是依赖于你亲自 free 掉。从C++、Python、Swift 和 Java 开始,才在不一样程度上支持内存管理。
  • 内存压缩:对内存碎片进行压缩。(和win10的那个“内存压缩”不太同样啦)
  • win10内存压缩:物理内存已经见底,将一部分不常使用的内存数据打包压缩起来,等到有程序须要访问那些数据的时候,再解压缩出来。
  • 引用与指针:git

    1. 引用被建立的同时必须被初始化(指针则能够在任什么时候候被初始化)。
    2. 不能有NULL 引用,引用必须与合法的存储单元关联(指针则能够是NULL)。
    3. 一旦引用被初始化,就不能改变引用的关系(指针则能够随时改变所指的对象)。
    4. 引用只是某块内存的别名。
    5. 实际上“引用”能够作的任何事情“指针”也都可以作,为何还要“引用” 这东西?
答案是“用适当的工具作恰如其分的工做”。好比说,某人须要一份证实,原本在文件上盖                上公章的印子就好了,若是把取公章的钥匙交给他,那么他就得到了不应有的权利。(什么状况下,就用什么对策)
6. 为何还要说“只有指针,没有引用是一个重要改变?”?
 答案是虽然引用在某些状况下好用,但他也会致使致命错误。以下:
```
 char *pc = 0; // 设置指针为空值 
 char& rc = *pc; // 让引用指向空值 
```
 这是很是有害的,毫无疑问。结果将是不肯定的(编译器能产生一些输出,致使任何事情都有可能发生),应该躲开写出这样代码的人除非他们赞成改正错误。若是你担忧这样的代码会出如今你的软件里,那么你最好彻底避免使用引用,要否则就去让更优秀的程序员去作。   
7. 最后上附图,帮助理解

clipboard.png

  • 堆(heap)和栈(stack)程序员

    1. 日常说的“堆栈”实际上是栈。
    2. 栈,就是那些由编译器在须要的时候分配,在不须要的时候自动清除的变量的存储区。里面的变量一般是局部变量、函数参数等。
    3. 堆,就是那些由new分配的内存块,他们的释放编译器不去管,由咱们的应用程序去控 制,通常一个new就要对应一个delete。若是程序员没有释放掉,那么在程序结束后,操做系统会自动回收。
  • 程序的栈结构github

    1. 程序的地址空间布局: 程序运行靠四个东西:代码、栈、堆、数据段。代码段主要存放的就是可执行文件(一般可执行文件内,含有以二进制编码的微处理器指令,也所以可执行文件有时称为二进制文件)中的代码;数据段存放的就是程序中全局变量和静态变量;堆中是程序的动态内存区域,当程序使用malloc或new获得的内存是来自堆的;栈中维护的是函数调用的上下文,离开了栈就不可能实现函数的调用。
    2. 栈帧: 也叫活动记录,保存的是一个函数调用所须要维护的全部信息。以下:
      1.函数的返回地址和参数
      2.临时变量:包括函数的非静态局部变量以及编译器自动生成的其它临时变量
      3.保存的上下文:包括在函数调用先后须要保存不变的寄存器值
    3. 就是它,先上图

clipboard.png]算法

1.返回地址:一个main函数中断执行的执行点.
 2.ebp:指向函数活动记录的一个固定位置,ebp又被称为帧指针.固定位置是,这样在函数返回的时候,ebp就能够经过这个恢复到调用前的值。
 3.esp始终指向栈顶,所以随着函数的执行,它老是变化的。
 4.入栈顺序:先压这次调用函数参数入栈,接着是main函数返回地址,而后是ebp等寄存器。
  1. Link:C程序的函数栈做用机理(这个讲得好,有实例,因此再也不熬述)

这里咱们对比了解不一样的 “找到须要标记的对象”的方法编程

可回收对象的断定

  • 引用计数法

给对象中添加一个引用计数器,每当有一个地方引用它时,计数器值就加1;当引用失效时, 计数器值就减1;任什么时候刻计数器为0的对象就是不可能再被使用的。以下图所示:
clipboard.png并发

优势:引用计数收集器能够很快地执行,交织在程序的运行之中。这个特性对于程序不能被长时间打断的实时环境颇有利。
缺点:很难处理循环引用,好比图中相互引用的两个对象则没法释放。
应用:Python 和 Swift 采用引用计数方案。
  • 可达性分析算法(根搜索算法)

从GC Roots(每种具体实现对GC Roots有不一样的定义)做为起点,向下搜索它们引用的对象,能够生成一棵引用树,树的节点视为可达对象,反之视为不可达。以下图所示:
clipboard.png编程语言

  • 接下来补充几个概念帮助理解(以java为例):
  1. GC Roots对象:
    虚拟机栈(帧栈中的本地变量表)中引用的对象。
    方法区中静态属性引用的对象。
    方法区中常量引用的对象。
    本地方法栈中JNI引用的对象。

    本地方法栈则为虚拟机所使用的Native方法服务。
    Native方法是指本地方法,当在方法中调用一些不是由java语言写的代码或者在方法中用java语言直接操纵计算机硬件。
    JNI:Java Native Interface缩写,容许Java代码和其余语言写的代码进行交互。
    上述如图,关于root区域的详细解释参考这里
    clipboard.png函数


这里咱们介绍几种不一样的 “标记对象”的方法工具

可回收对象的标记

  • 保守法

将全部堆上对齐的字都认为是指针,那么有些数据就会被误认为是指针。因而某些实际是数字的假指针,会背误认为指向活跃对象,致使内存泄露(假指针指向的对象多是死对象,但依旧有指针指向——这个假指针指向它)同时咱们不能移动任何内存区域。

  • 编译器提示法

若是是静态语言,编译器可以告诉咱们每一个类当中指针的具体位置,而一旦咱们知道对象时哪一个类实例化获得的,就能知道对象中全部指针。这是JVM实现垃圾回收的方式,但这种方式并不适合JS这样的动态语言

  • 标记指针法

标记指针法:这种方法须要在每一个字末位预留一位来标记这个字段是指针仍是数据。这种方法须要编译器支持,但实现简单,并且性能不错。V8采用的是这种方式。

  • 位图标记(Go语言为例)
  1. 非侵入式标记位定义
    既然垃圾回收算法要求给对象加上垃圾回收的标记,显然是须要有标记位的。通常的作法
    会将对象结构体中加上一个标记域,一些优化的作法会利用对象指针的低位进行标记,这
    都只是些奇技淫巧罢了。Go没有这么作,它的对象和C的结构体对象彻底一致,使用的是
    非侵入式的标记位。
  2. 具体实现
    堆区域对应了一个标记位图区域,堆中每一个字(不是byte,而是word)都会在标记位区域
    中有对应的标记位。每一个机器字(32位或64位)会对应4位的标记位。所以,64位系统中
    至关于每一个标记位图的字节对应16个堆中的字节。

    虽然是一个堆字节对应4位标记位,但标记位图区域的内存布局并非按4位一组,而是
    16个堆字节为一组,将它们的标记位信息打包存储的。每组64位的标记位图从上到下依
    次包括:

    16位的 特殊位 标记位
    16位的 垃圾回收 标记位
    16位的 无指针/块边界 的标记位
    16位的 已分配 标记位

    这样设计使得对一个类型的相应的位进行遍历很容易。

    前面提到堆区域和堆地址的标记位图区域是分开存储的,其实它们是以
    mheap.arena_start地址为边界,向上是实际使用的堆地址空间,向下则是标记位图区
    域。以64位系统为例,计算堆中某个地址的标记位的公式以下:

    偏移 = 地址 - mheap.arena_start
    标记位地址 = mheap.arena_start - 偏移/16 - 1
    移位 = 偏移 % 16
    标记位 = *标记位地址 >> 移位

    而后就能够经过 (标记位 & 垃圾回收标记位),(标记位 & 分配位),等来测试相应的位。

    (也就是说,原本64位是一个字,须要4位标记位。可是,为了与字长相对,16个标记位
    放一块儿(恰好一个字长)一块儿表示16个字。而且每类标记位都放在一块儿
    AA..AABB...BB)

  • 接下来补充几个概念帮助理解:
  1. 为何要判断哪些是数据,哪些是指针?
    假设堆中有一个long的变量,它的值是8860225560。可是咱们不知道它的类型是
    long,因此在进行垃圾回收时会把个看成指针处理,这个指针引用到了0x2101c5018位
    置。假设0x2101c5018碰巧有某个对象,那么这个对象就没法被释放了,即便实际上已
    经没任何地方使用它。

    因为没有类型信息,咱们并不知道这个结构体成员不包含指针,所以咱们只能对结构体
    的每一个字节递归地标记下去,这显然会浪费不少时间。
    (能不能清除 变成了几率事件)。

  2. 垃圾收集器(CMS收集器为例)
    几个阶段:

    初始标记
    并发标记
    最终标记
    筛选回收

    初始标记仅仅是标记一下GC Roots能直接关联到的对象,速度很快,并发标记就是进行
    GC Roots Trancing的过程,而从新标记阶段则是为了修正并发标记期间因用户程序继
    续运行而致使标记产生变更那一部分对象的标记记录,这个阶段的停顿时间比初始标记稍
    长一些,但远比并发标记时间短。

  3. stop the world
    由于垃圾回收的时候,须要整个的引用状态保持不变,不然断定是垃圾,等我稍后回
    收的时候它又被引用了,这就全乱套了。因此,GC的时候,其余全部的程序执行处于暂停
    状态,卡住了。
    这个概念提早引入,在这里进行对比,效果会更好些。与标记阶段对比,stop the world发生在回收阶段。

这里咱们介绍几种不一样的垃圾回收算法

垃圾回收算法

  • 标记清除算法 (Mark-Sweep)

标记-清除算法分为两个阶段:标记阶段和清除阶段。标记阶段的任务是标记出全部须要被回收的对象,清除阶段就是回收被标记的对象所占用的空间。

优势是简单,容易实现。
缺点是容易产生内存碎片,碎片太多可能会致使后续过程当中须要为大对象分配空间时没法找到足够的空间而提早触发新的一次垃圾收集动做。(由于没有对不一样生命周期的对象采用不一样算法,因此碎片多,内存容易满,gc频率高,耗时,看了后面的方法就明白了)

clipboard.png  =10x10

  • 分代回收算法

根据对象存活的生命周期将内存划分为若干个不一样的区域。不一样区域采用不一样算法(复制算法,标记整理算法),这就是分代回收算法。

通常状况下将堆区划分为老年代(Old Generation)和新生代(Young Generation),老年代的特色是每次垃圾收集时只有少许对象须要被回收,而新生代的特色是每次垃圾回收时都有大量的对象须要被回收,那么就能够根据不一样代的特色采起最适合的收集算法。

1.新生代回收

新生代使用Scavenge算法进行回收。在Scavenge算法的实现中,主要采用了Cheney算法。

Cheney算法是一种采用复制的方式实现的垃圾回收算法。
它将内存一分为二,每一部分空间称为semispace。在这两个semispace中,一个处于使用状态,另外一个处于闲置状态。
简而言之,就是经过将存活对象在两个semispace空间之间进行复制。

复制过程采用的是BFS(广度优先遍历)的思想,从根对象出发,广度优先遍历全部能到达的对象

优势:时间效率上表现优异(牺牲空间换取时间)
缺点:只能使用堆内存的一半

新生代的空间划分比例为何是比例为8:1:1(不是按照上面算法中说的1:1)?

新建立的对象都是放在Eden空间,这是很频繁的,尤为是大量的局部变量产生的临时对
象,这些对象绝大部分都应该立刻被回收,能存活下来被转移到survivor空间的每每不
多。因此,设置较大的Eden空间和较小的Survivor空间是合理的,大大提升了内存的使
用率,缓解了Copying算法的缺点。

8:1:1就挺好的,固然这个比例是能够调整的,包括上面的新生代和老年代的1:2的
比例也是能够调整的。

Eden空间和两块Survivor空间的工做流程是怎样的?
clipboard.png

具体的执行过程是怎样的?

假设有相似以下的引用状况:
+----- A对象
          |
根对象----+----- B对象 ------ E对象
          |
          +----- C对象 ----+---- F对象 
                           |
                           +---- G对象 ----- H对象

    D对象
在执行Scavenge以前,From区长这幅模样:
```
+---+---+---+---+---+---+---+---+--------+
| A | B | C | D | E | F | G | H |        |
+---+---+---+---+---+---+---+---+--------+
```
那么首先将根对象能到达的ABC对象复制到To区,因而乎To区就变成了这个样子:
```
     allocationPtr
             ↓ 
+---+---+---+----------------------------+
| A | B | C |                            |
+---+---+---+----------------------------+
 ↑
scanPtr  

```
接下来进入循环,扫描scanPtr所指的A对象,发现其没有指针,因而乎scanPtr移动,变成以下这样

```
          allocationPtr
             ↓ 
+---+---+---+----------------------------+
| A | B | C |                            |
+---+---+---+----------------------------+
     ↑
  scanPtr  
```
接下来扫描B对象,发现其有指向E对象的指针,且E对象在From区,那么咱们须要将E对象复制到allocationPtr所指的地方并移动allocationPtr指针:

```
                allocationPtr
                 ↓ 
+---+---+---+---+------------------------+
| A | B | C | E |                        |
+---+---+---+---+------------------------+
     ↑
  scanPtr  
```
中间过程省略,具体参考[新生代的垃圾回收具体的执行过程][3]

From区和To区在复制完成后的结果:
```
//From区
+---+---+---+---+---+---+---+---+--------+
| A | B | C | D | E | F | G | H |        |
+---+---+---+---+---+---+---+---+--------+
//To区
+---+---+---+---+---+---+---+------------+
| A | B | C | E | F | G | H |            |
+---+---+---+---+---+---+---+------------+
```

最终当scanPtr和allocationPtr重合,说明复制结束。
注意:若是指向老生代咱们就没必要考虑它了。(经过写屏障)

对象什么时候晋升?

1.当一个对象通过屡次新生代的清理依旧幸存。
2.若是To空间已经被使用了超过25%(后面还要进来许多新对象,不敢占用太多)
3.大对象
(其实这部分,包括次数,比例等,是视状况设置的。)

2.老生代回收

Mark-Sweep(标记清除)

标记清除分为标记和清除两个阶段。
主要是标记清除只清除死亡对象,而死亡对象在老生代中占用的比例很小,因此效率较高。

Mark-Compact(标记整理)

标记整理正是为了解决标记清除所带来的内存碎片的问题。

大致过程就是 双端队列标记黑(邻接对象已经所有处理),白(待释放垃圾),灰(邻
接对象还没有所有处理)三种对象.
 
标记算法的核心就是深度优先搜索.
  • 补充概念方便理解

1.触发GC(什么时候发生垃圾回收?)

通常都是内存满了就回收,下面列举几个常见缘由:
GC_FOR_MALLOC: 表示是在堆上分配对象时内存不足触发的GC。
GC_CONCURRENT: 当咱们应用程序的堆内存达到必定量,或者能够理解为快要满的时候,系统会自动触发GC操做来释放内存。
GC_EXPLICIT: 表示是应用程序调用System.gc、VMRuntime.gc接口或者收到SIGUSR1信号时触发的GC。
GC_BEFORE_OOM: 表示是在准备抛OOM异常以前进行的最后努力而触发的GC。

2.写屏障(一个老年代的对象须要引用年轻代的对象,该怎么办?)

若是新生代中的一个对象只有一个指向它的指针,而这个指针在老生代中,咱们如何判断
这个新生代的对象是否存活?为了解决这个问题,须要创建一个列表用来记录全部老生代
对象指向新生代对象的状况。每当有老生代对象指向新生代对象的时候,咱们就记录下
来。
当垃圾回收发生在年轻代时,只需对这张表进行搜索以肯定是否须要进行垃圾回收,而不
是检查老年代中的全部对象引用。

3.深度、广度优先搜索(为何新生代用广度搜索,老生代用深度搜索)

深度优先DFS通常采用递归方式实现,处理tracing的时候,可能会致使栈空间溢出,因此通常采用广度优先来实现tracing(递归状况下容易爆栈)。
广度优先的拷贝顺序使得GC后对象的空间局部性(memory locality)变差(相关变量散开了)。
广度优先搜索法通常无回溯操做,即入栈和出栈的操做,因此运行速度比深度优先搜索算法法要快些。
深度优先搜索法占内存少但速度较慢,广度优先搜索算法占内存多但速度较快。

结合深搜和广搜的实现,以及新生代移动数量小,老生代数量大的状况,咱们能够获得了解答。
相关文章
相关标签/搜索