php7 垃圾回收机制详解

本文出错,没有参考价值php

本文出错,没有参考价值html

本文出错,没有参考价值git

本文出错,没有参考价值github

本文出错,没有参考价值算法

笔者前几天对这个话题感兴趣,因而到网上一搜,几乎都是 php 5的垃圾回收机制,虽然 php5 到 php7 GC部分作出的改动较小,但我以为仍是有必要单独作一遍博文出来。 不特地说明的话 php 版本为 7.2

在php中的变量占用的空间,是不须要咱们手动回收的。内核帮咱们处理了这一部分的工做。相比C,这大大方便了咱们的操做。segmentfault

本篇主要讲解 变量的 GC机制数组

在了解咱们 php GC 时,我以为我有必要介绍一下们的 php 的变量在底层的实现。缓存

zval 的结构

// php 变量对于的c结构体
struct _zval_struct {
    zend_value value;
    union {
       ……
    } u1;
    union {
        ……
    } u2;
};

因为主要讲垃圾回收,因此在这里简单介绍下 u1 u2 联合体的功能
u1 结构比较复杂,我认为主要是用于识别变量类型
u2 这里面大多都是辅助字段,变量内部功能的实现、提高缓存友好性等等
接下来是咱们的主角 php7

zend_value 它也是结构体中内嵌的一个联合体ui

typedef union _zend_value {
    zend_long         lval;//整形
    double            dval;//浮点型
    zend_refcounted  *counted;//获取不一样类型的gc头部
    zend_string      *str;//string字符串
    zend_array       *arr;//数组
    zend_object      *obj;//对象
    zend_resource    *res;//资源
    zend_reference   *ref;//是不是引用类型
  
    // 忽略下面的结构,与咱们讨论无关
    zend_ast_ref     *ast;
    zval             *zv;
    void             *ptr;
    zend_class_entry *ce;
    zend_function    *func;
    struct {
        ZEND_ENDIAN_LOHI(
            uint32_t w1,
            uint32_t w2)
    } ww;
} zend_value;

zval的 value中就记录了引用计数zend_refcounted *counted这个类型,咱们的垃圾回收机制也是基于此的。

typedef struct _zend_refcounted_h {
    uint32_t         refcount;          /* reference counter 32-bit */
    union {
        struct {
            ZEND_ENDIAN_LOHI_3(
                zend_uchar    type,
                zend_uchar    flags,    /* used for strings & objects */
                uint16_t      gc_info)  /* keeps GC root number (or 0) and color */
        } v;
        uint32_t type_info;
    } u;
} zend_refcounted_h;

全部的复杂类型的定义, 开始的时候都是zend_refcounted_h结构, 这个结构里除了引用计数之外, 还有GC相关的结构. 从而在作GC回收的时候, GC不须要关心具体类型是什么, 全部的它均可以当作zend_refcounted*结构来处理.

变量的自动回收

在php中 除了 arrayobject类型的变量,其他大部分是自动回收
php 普通变量的回收和 该变量的引用次数有关。

官方的例子

$a = 1;
$b = $a;
xdebug_debug_zval('a');
$a =10;
xdebug_debug_zval('a');
unset($a);
xdebug_debug_zval('a');

结果

a:
(refcount=2, is_ref=0),int 1
a:
(refcount=1, is_ref=0),int 10
a: no such symbol

能够看到 当$a =10 的时候 涉及到 php的COW(copy-on-write)机制,$b 会复制一份原先的 $a ,解除了他们之间的引用关系,因此a的引用次数(refcount)减小为1。

而后咱们uset($a)以后 a的引用次数变为0。这就会被认为是垃圾变量,释放空间。

在举一个例子

$a = [1];
$a[1] = &$a;
unset($a);

在 unset($a) 以前 $a 的类型为引用类型

a:
(refcount=2, is_ref=1),
array (size=2)
  0 => (refcount=1, is_ref=0),int 1
  1 => (refcount=2, is_ref=1),
    &array<

unset($a) 以后,就变成这样

这时候,咱们unset操做时refcount 由2变为1,由于有内部引用指向 $a,因此在外部 其所占用的空间并不会被销毁。

而后咱们的外部引用已经被中断了,咱们也不能使用它。它就成了一个“孤儿”,在c语言中叫作野指针。在php中叫作循环引用。内存泄漏。想要销毁变量的话,只能等 php脚本结束。

循环引用形成的内存泄漏

为了清理这些垃圾,引入了两个准则

  • 若是引用计数减小到零,所在变量容器将被清除(free),不属于垃圾
  • 若是一个zval 的引用计数减小后还大于0,那么它会进入垃圾周期。其次,在一个垃圾周期中,经过检查引用计数是否减1,而且检查哪些变量容器的引用次数是零,来发现哪部分是垃圾。

循环引用基本上只会出如今 数组和对象中,对象是由于它的自己就是引用

object和array的回收过程

php7的垃圾回收包含两个部分,一个是垃圾收集器,一个是垃圾回收算法。

垃圾收集器,把刚刚提到的,多是垃圾的元素收集到回收池中 也就是把变量的 zend_refcount的信息 放在回收池中。 当回收池的值达到必定额度了,会进行统一处理。

处理的过程呢,就比较简单。

遍历回收池中的每个变量,根据每个变量,再遍历每个成员,若是成员还有嵌套的话继续遍历。而后把全部成员的 作模拟的 refcount -1。若是此时外部的变量的 引用次数为 0 。那么能够视为垃圾,清楚。若是大于0,那么恢复引用次数,并从垃圾回收池中取出。

垃圾回收的原理

若是你这个变量不是垃圾,那么它的全部成员变量的引用减一以后,必然不会是总变量的引用为0。

例子

说的比较死,不如举个例子。刚刷 sf.gg 的时候看到一道关于 GC 的题,我回答了一波。关于GC垃圾回收机制

题目以下
题目

//个人回答
一、只要zval.value的refcount减一,而后缺其refcount的值不为0那么它就多是垃圾,进入垃圾周期。
二、进入垃圾池遍历全部成员,包括其嵌套的成员,都对其作 refcount-1的操做,看外部的引用是否为0。

那么对于 题主的问题来讲,
首先,你要想$a为垃圾,必定要先对 unset($a)操做,那么此时 $a的 refcount = 2
对于$a[0] refcount-1 不影响外部的$a,
$a[1] refcount-1 ,此时 $a的 refount=1
$a[2] refcount-1 ,此时 $a 的 refount=0 
模拟减结束,那么此变量被当成垃圾回收。

参考连接:
官方文档
盘古大叔内核剖析之GC
鸟哥的 zval 解析

相关文章
相关标签/搜索