最近在查阅 PHP7 垃圾回收的资料的时候,网上的一些代码示例在本地环境下运行时出现了不一样的结果,使我一度很是迷惑。 仔细一想不难发现问题所在:这些文章大可能是 PHP5.x 时代的,而 PHP7 发布后,采用了新的 zval 结构,相关的资料也比较贫瘠,因此我结合一些资料作了一个总结,主要侧重于解释新 zval 容器中的引用计数机制,若有谬误,还望不吝指教。php
明人不说暗话,先看代码!node
struct _zval_struct {
union {
zend_long lval; /* long value */
double dval; /* double value */
zend_refcounted *counted;
zend_string *str;
zend_array *arr;
zend_object *obj;
zend_resource *res;
zend_reference *ref;
zend_ast_ref *ast;
zval *zv;
void *ptr;
zend_class_entry *ce;
zend_function *func;
struct {
uint32_t w1;
uint32_t w2;
} ww;
} value;
union {
struct {
ZEND_ENDIAN_LOHI_4(
zend_uchar type, /* active type */
zend_uchar type_flags,
zend_uchar const_flags,
zend_uchar reserved) /* call info for EX(This) */
} v;
uint32_t type_info;
} u1;
union {
uint32_t var_flags;
uint32_t next; /* hash collision chain */
uint32_t cache_slot; /* literal cache slot */
uint32_t lineno; /* line number (for ast nodes) */
uint32_t num_args; /* arguments number for EX(This) */
uint32_t fe_pos; /* foreach position */
uint32_t fe_iter_idx; /* foreach iterator index */
} u2;
};
复制代码
对于该结构的详细描述能够参考文末鸟哥的文章,写的很是详细,我就不关公面前耍大刀了,这里我只提出几个比较关键的点:git
zval_struct
和在其中声明的 value
zval_struct.value
中的 zend_long
、double
都是简单数据类型,可以直接储存具体的值,而其余复杂数据类型储存一个指向其余数据结构的指针value
中而不是 zval_struct
IS_FALSE
和 IS_TRUE
两个常量来标记),天然也就没有引用计数struct _zend_reference {
zend_refcounted_h gc;
zval val;
}
复制代码
zend_reference
做为 zval_struct
中包含的一种 value
类型,也拥有本身的 val
值,这个值是指向一个 zval_struct.value
的。他们都拥有本身的引用计数器。引用计数器用来记录当前有多少
zval
指向同一个zend_value
。github
针对第六点,请看以下代码:数组
$a = 'foo';
$b = &$a;
$c = $a;
复制代码
此时的数据结构是这样的:php7
$a 与 $b 各拥有一个 zval_struct
容器,而且其中的 value
都指向同一个 zend_reference
结构,zend_reference
内嵌一个 val
结构, 指向同一个 zend_string
,字符串的内容就储存在其中。数据结构
而 $c 也拥有一个 zval_struct
,而它的 value 在初始化的时候能够直接指向上面提到的 zend_string
,这样在拷贝时就不会产生复制。函数
下面咱们就聊一聊在这种全新的 zval
结构中,会出现的种种现象,和这些现象背后的缘由。优化
$var_int = 233;
$var_float = 233.3;
$var_str = '233';
xdebug_debug_zval('var_int');
xdebug_debug_zval('var_float');
xdebug_debug_zval('var_str');
/** 输出 ** var_int: (refcount=0, is_ref=0)int 233 var_float: (refcount=0, is_ref=0)float 233.3 var_str: (refcount=0, is_ref=0)string '233' (length=3) **********/
复制代码
在 PHP7 中,为一个变量赋值的时候,包含了两部分操做:ui
zval_struct
结构zval_struct.value
中 对于 zval
在 value
字段中能保存下的值,就不会在对他们进行引用计数,而是在拷贝的时候直接赋值,这部分类型有:即咱们在 PHP 中的整形与浮点型。
那么 var_str 的 refcount 为何也是 0 呢?
这就牵扯到 PHP 中字符串的两种类型:
interned string
内部字符串(函数名、类名、变量名、静态字符串):$str = '233'; // 静态字符串
复制代码
$str = '233' . time();
复制代码
对于内部字符串而言,字符串的内容是惟一不变的,至关于 C 语言中定义在静态变量区的字符串,他们的生存周期存在于整个请求期间,request 完成后会统一销毁释放,天然也就无需经过引用计数进行内存管理。
$var_int_1 = 233;
$var_int_2 = &var_int;
xdebug_debug_zval('var_int_1');
/** 输出 ** var_int: (refcount=2, is_ref=1)int 233 **********/
复制代码
回忆一下咱们开头讲的 zval_struct
中 value
的数据结构,当为一个变量赋整形、浮点型或静态字符串类型的值时,value 的数据类型为 zend_long
、 double
或 zend_string
,这时值是能够直接储存在 value 中的。而按值拷贝时,会开辟一个新的 zval_struct
以一样的方式将值储存到相同数据类型的 value 中,因此 refcount 的值一直都会为 0。
可是当使用 &
操做符进行引用拷贝时,状况就不同了:
&
操做符操做的变量申请一个 zend_reference
结构zend_reference.value
指向原来的 zval_struct.value
zval_struct.value
的数据类型会被修改成 zend_refrence
zval_struct.value
指向刚刚申请并初始化后的 zend_reference
zval_struct
结构,将他的 value
指向刚刚建立的 zend_reference
此时:$var_int_1 和 $var_int_2 都拥有一个 zval_struct
结构体,而且他们的 zval_struct.value
都指向了同一个 zend_reference
结构,因此该结构的引用计数器的值为 2。
题外话:zend_reference 又指向了一个整形或浮点型的 value,若是指向的 value 类型是 zend_string,那么该 value 引用计数器的值为 1。而 xdebug 出来的 refcount 显示的是 zend_reference 的计数器值(即 2)
$var_empty_arr = [1, 2, '3'];
xdebug_debug_zval('var_empty_arr');
/** 输出 ** var_arr: (refcount=2, is_ref=0) array (size=3) 0 => (refcount=0, is_ref=0)int 1 1 => (refcount=0, is_ref=0)int 2 2 => (refcount=1, is_ref=0)string '3' (length=1) **********/
复制代码
这牵扯到 PHP7 中的另外一个概念,叫作 immutable array
(不可变数组)。
For arrays the not-refcounted variant is called an "immutable array". If you use opcache, then constant array literals in your code will be converted into immutable arrays. Once again, these live in shared memory and as such must not use refcounting. Immutable arrays have a dummy refcount of 2, as it allows us to optimize certain separation paths.
不可变数组是 opcache
扩展优化出的一种数组类型,简单的说,全部屡次编译结果恒定不变的数组,都会被优化为不可变数组,下面是一个反例:
$array = [1, 2, time()];
复制代码
PHP 在编译阶段没法得知 time()
函数的返回值,因此此处的 $array 是可变数组。
不可变数组和咱们上面讲到的内部字符串同样,都是不使用引用计数的,可是不一样点是,内部字符串的计数值恒为 0,而不可变数组会使用一个伪计数值 2。