引用计数基本知识 & PHP 的内存泄露

每一个php变量存在一个叫"zval"的变量容器中。一个zval变量容器,除了包含变量的类型和值,还包括两个字节的额外信息。第一个 是"is_ref",是个bool值,用来标识这个变量是不是属于引用集合(reference set)。经过这个字节,php引擎才能把普通变量和引用变量区分开来,因为php容许用户经过使用&来使用自定义引用,zval变量容器中还有 一个内部引用计数机制,来优化内存使用。第二个额外字节是"refcount",用以表示指向这个zval变量容器的变量(也称符号即symbol)个 数。全部的符号存在一个符号表中,其中每一个符号都有做用域(scope),那些主脚本(好比:经过浏览器请求的的脚本)和每一个函数或者方法也都有做用域。 php

当一个变量被赋常量值时,就会生成一个zval变量容器,以下例这样: 算法

Example #1 Creating a new zval container 数组

<?php
$a 
"new string";
?>

在上例中,新的变量a,是在当前做用域中生成的。而且生成了类型为 string 和值为new string的变量容器。在额外的两个字节信息中,"is_ref"被默认设置为 FALSE,由于没有任何自定义的引用生成。"refcount" 被设定为 1,由于这里只有一个变量使用这个变量容器. 注意到当"refcount"的值是1时,"is_ref"的值老是FALSE. 若是你已经安装了» Xdebug,你能经过调用函数 xdebug_debug_zval()显示"refcount"和"is_ref"的值。 浏览器


Example #2 Displaying zval information 服务器

<?php
xdebug_debug_zval
('a');
?>

以上例程会输出: 数据结构

a: (refcount=1, is_ref=0)='new string'

把一个变量赋值给另外一变量将增长引用次数(refcount). 函数


Example #3 Increasing refcount of a zval 单元测试

<?php
$a 
"new string";
$b $a;
xdebug_debug_zval'a' );
?>

以上例程会输出: 测试

a: (refcount=2, is_ref=0)='new string'

这时,引用次数是2,由于同一个变量容器被变量a和变量b关联.当不必时,php不会去复制已生成的变量容器。变量容器在”refcount“变成0时就被销毁. 当任何关联到某个变量容器的变量离开它的做用域(好比:函数执行结束),或者对变量调用了函数 unset()时,”refcount“就会减1,下面的例子就能说明: 优化


Example #4 Decreasing zval refcount

<?php
$a 
"new string";
$c $b $a;
xdebug_debug_zval'a' );
unset( 
$b$c );
xdebug_debug_zval'a' );
?>

以上例程会输出:

a: (refcount=3, is_ref=0)='new string'
a: (refcount=1, is_ref=0)='new string'

若是咱们如今执行 unset($a);,包含类型和值的这个变量容器就会从内存中删除。

复合类型(Compound Types)

当考虑像 arrayobject这样的复合类型时,事情就稍微有点复杂. 与 标量(scalar)类型的值不一样,arrayobject类型的变量把它们的成员或属性存在本身的符号表中。这意味着下面的例子将生成三个zval变量容器。


Example #5 Creating a array zval

<?php
$a 
= array( 'meaning' => 'life''number' => 42 );
xdebug_debug_zval'a' );
?>

以上例程的输出相似于:

a: (refcount=1, is_ref=0)=array (
   'meaning' => (refcount=1, is_ref=0)='life',
   'number' => (refcount=1, is_ref=0)=42
)

Or graphically

Zvals for a simple array

这三个zval变量容器是:a,meaning和number。增长和减小”refcount”的规则和上面提到的同样. 下面, 咱们在数组中再添加一个元素,而且把它的值设为数组中已存在元素的值:


Example #6 Adding already existing element to an array

<?php
$a 
= array( 'meaning' => 'life''number' => 42 );
$a['life'] = $a['meaning'];
xdebug_debug_zval'a' );
?>

以上例程的输出相似于:

a: (refcount=1, is_ref=0)=array (
   'meaning' => (refcount=2, is_ref=0)='life',
   'number' => (refcount=1, is_ref=0)=42,
   'life' => (refcount=2, is_ref=0)='life'
)

Or graphically

Zvals for a simple array with a reference

从以上的xdebug输出信息,咱们看到原有的数组元素和新添加的数组元素关联到同一个"refcount"2的zval变量容器. 尽管 Xdebug的输出显示两个值为'life'的 zval 变量容器,实际上是同一个。 函数xdebug_debug_zval()不显示这个信息,可是你能经过显示内存指针信息来看到。

删除数组中的一个元素,就是相似于从做用域中删除一个变量. 删除后,数组中的这个元素所在的容器的“refcount”值减小,一样,当“refcount”为0时,这个变量容器就从内存中被删除,下面又一个例子能够说明:


Example #7 Removing an element from an array

<?php
$a 
= array( 'meaning' => 'life''number' => 42 );
$a['life'] = $a['meaning'];
unset( 
$a['meaning'], $a['number'] );
xdebug_debug_zval'a' );
?>

以上例程的输出相似于:

a: (refcount=1, is_ref=0)=array (
   'life' => (refcount=1, is_ref=0)='life'
)

如今,当咱们添加一个数组自己做为这个数组的元素时,事情就变得有趣,下个例子将说明这个。例中咱们加入了引用操做符,不然php将生成一个复制。


Example #8 Adding the array itself as an element of it self

<?php
$a 
= array( 'one' );
$a[] =& $a;
xdebug_debug_zval'a' );
?>

以上例程的输出相似于:

a: (refcount=2, is_ref=1)=array (
   0 => (refcount=1, is_ref=0)='one',
   1 => (refcount=2, is_ref=1)=...
)

Or graphically

Zvals for an array with a circular reference

能看到数组变量 (a) 同时也是这个数组的第二个元素(1) 指向的变量容器中“refcount”为 2。上面的输出结果中的"..."说明发生了递归操做, 显然在这种状况下意味着"..."指向原始数组。

跟刚刚同样,对一个变量调用unset,将删除这个符号,且它指向的变量容器中的引用次数也减1。因此,若是咱们在执行完上面的代码后,对变量$a调用unset, 那么变量$a和数组元素 "1" 所指向的变量容器的引用次数减1, 从"2"变成"1". 下例能够说明:


Example #9 Unsetting$a

(refcount=1, is_ref=1)=array (
   0 => (refcount=1, is_ref=0)='one',
   1 => (refcount=1, is_ref=1)=...
)

Or graphically

Zvals after removal of array with a circular reference demonstrating the memory leak

清理变量容器的问题(Cleanup Problems)

尽管再也不有某个做用域中的任何符号指向这个结构(就是变量容器),因为数组元素“1”仍然指向数组自己,因此这个容器不能被清除 。由于没有另外的符号指向它,用户没有办法清除这个结构,结果就会致使内存泄漏。庆幸的是,php将在请求结束时清除这个数据结构,可是在php清除之 前,将耗费很多空间的内存。若是你要实现分析算法,或者要作其余像一个子元素指向它的父元素这样的事情,这种状况就会常常发生。固然,一样的状况也会发生 在对象上,实际上对象更有可能出现这种状况,由于对象老是隐式的被引用。

若是上面的状况发生仅仅一两次倒没什么,可是若是出现几千次,甚至几十万次的内存泄漏,这显然是个大问题。在长时间运行的脚本,好比请求基本上不会结束的 守护进程(deamons)或者单元测试中的大的套件(sets)中,在给 eZ 组件库的模板组件作单元测试时,后者(指单元测试中的大的套件)就会出现问题.它将须要耗用2GB的内存,而通常的测试服务器没有这么大的内存空间。

相关文章
相关标签/搜索