本文大部份内容参照 AST 的 RFC 文档而成:https://wiki.php.net/rfc/abstract_syntax_tree,为了易于理解从源文档中节选部分进行介绍。php
本文并不会告诉你抽象语法树是什么,这须要你本身去了解,这里只是描述 AST 给 PHP 带来的一些变化。git
PHP7 的内核中有一个重要的变化是加入了 AST。在 PHP5中,从 php 脚本到 opcodes 的执行的过程是:github
Lexing:词法扫描分析,将源文件转换成 token 流;数组
Parsing:语法分析,在此阶段生成 op arrays。函数
PHP7 中在语法分析阶段再也不直接生成 op arrays,而是先生成 AST,因此过程多了一步:测试
Lexing:词法扫描分析,将源文件转换成 token 流;优化
Parsing:语法分析,从 token 流生成抽象语法树;.net
Compilation:从抽象语法树生成 op arrays。code
从以上的步骤来看,这比以前的过程还多了一步,因此按常理来讲这反而会增长程序的执行时间和内存的使用。但事实上内存的使用确实增长了,可是执行时间上却有所下降。orm
如下结果是使用小(代码大约 100 行)、中(大约 700 行)、大(大约 2800 行)三个脚本分别进行测试获得的,测试脚本: https://gist.github.com/nikic/289b0c7538b46c2220bc
每一个文件编译 100 次的执行时间(注意文章的测试结果时间是 14 年,PHP7 还叫 PHP-NG 的时候):
php-ng | php-ast | diff | |
---|---|---|---|
SMALL | 0.180s | 0.160s | -12.5% |
MEDIUM | 1.492s | 1.268s | -17.7% |
LARGE | 6.703s | 5.736s | -16.9% |
单次编译中的内存峰值:
php-ng | php-ast | diff | |
---|---|---|---|
SMALL | 378kB | 414kB | +9.5% |
MEDIUM | 507kB | 643kB | +26.8% |
LARGE | 1084kB | 1857kB | +71.3% |
单次编译的测试结果可能并不能表明实际使用的状况,如下是使用 PhpParser 进行完整项目测试获得的结果:
php-ng | php-ast | diff | |
---|---|---|---|
TIME | 25.5ms | 22.8ms | -11.8% |
MEMORY | 2360kB | 2482kB | +5.1% |
测试代表,使用 AST 以后程序的执行时间总体上大概有 10% 到 15% 的提高,可是内存消耗也有增长,在大文件单次编译中增长明显,可是在整个项目执行过程当中并非很严重的问题。
还有注意的是以上的结果都是在没有 Opcache 的状况下,生产环境中打开 Opcache 的状况下,内存的消耗增长也不是很大的问题。
若是仅仅是时间上的优化,彷佛也不是使用 AST 的充足理由。其实实现 AST 并非基于时间优化上的考虑,而是为了解决语法上的问题。下面来看一下语义上的一些变化。
在 PHP5 的实现中,若是在一个表达式上下文(例如在一个赋值表达式的右侧)中使用 yield,你必须在 yield 申明两边使用括号:
<?php $result = yield fn(); // 不合法的 $result = (yield fn()); // 合法的
这种行为仅仅是由于 PHP5 的实现方式的限制,在 PHP7 中,括号再也不是必须的了。因此下面这些写法也都是合法的:
<?php $result = yield; $result = yield $v; $result = yield $k => $v;
固然了,还得遵循 yield 的应用场景才行。
在 PHP5 中,($foo)['bar'] = 'baz'
和 $foo['bar'] = 'baz'
两个语句的含义不同。事实上前一种写法是不合法的,你会获得下面这样的错误:
<?php ($foo)['bar'] = 'baz'; # PHP Parse error: Syntax error, unexpected '[' on line 1
可是在 PHP7 中,两种写法表示一样的意思。
一样,若是函数的参数被括号包裹,类型检查存在问题,在 PHP7 中这个问题也获得了解决:
<?php function func() { return []; } function byRef(array &$a) { } byRef((func()));
以上代码在 PHP5 中不会告警,除非使用 byRef(func())
的方式调用,可是在 PHP7 中,无论 func()
两边有没有括号都会产生如下错误:
PHP Strict standards: Only variables should be passed by reference ...
list 关键字的行为改变了不少。list 给变量赋值的顺序(等号左右同时的顺序)之前是从右至左,如今是从左到右:
<?php list($array[], $array[], $array[]) = [1, 2, 3]; var_dump($array); // PHP5: $array = [3, 2, 1] // PHP7: $array = [1, 2, 3] # 注意这里的左右的顺序指的是等号左右同时的顺序, # list($a, $b) = [1, 2] 这种使用中 $a == 1, $b == 2 是没有疑问的。
产生上面变化的缘由正是由于在 PHP5 的赋值过程当中,3
会最早被填入数组,1
最后,可是如今顺序改变了。
一样的变化还有:
<?php $a = [1, 2]; list($a, $b) = $a; // PHP5: $a = 1, $b = 2 // PHP7: $a = 1, $b = null + "Undefined index 1"
这是由于在之前的赋值过程当中 $b
先获得 2
,而后 $a
的值才变成 1
,可是如今 $a
先变成了 1
,再也不是数组,因此 $b
就成了 null
。
list 如今只会访问每一个偏移量一次:
<?php list(list($a, $b)) = $array; // PHP5: $b = $array[0][1]; $a = $array[0][0]; // PHP7: // 会产生一个中间变量,获得 $array[0] 的值 $_tmp = $array[0]; $a = $_tmp[0]; $b = $_tmp[1];
空的 list 成员如今是所有禁止的,之前只是在某些状况下:
<?php list() = $a; // 不合法 list($b, list()) = $a; // 不合法 foreach ($a as list()) // 不合法 (PHP5 中也不合法)
引用赋值的顺序在 PHP5 中是从右到左的,如今时从左到右:
<?php $obj = new stdClass; $obj->a = &$obj->b; $obj->b = 1; var_dump($obj); // PHP5: object(stdClass)#1 (2) { ["b"] => &int(1) ["a"] => &int(1) } // PHP7: object(stdClass)#1 (2) { ["a"] => &int(1) ["b"] => &int(1) }
如今能够直接使用 $obj->__clone()
的写法去调用 __clone
方法。__clone
是以前惟一一个被禁止直接调用的魔术方法,以前你会获得一个这样的错误:
Fatal error: Cannot call __clone() method on objects - use 'clone $obj' instead in ...
AST 也解决了一些语法一致性的问题,这些问题是在另一个 RFC 中被提出的:https://wiki.php.net/rfc/uniform_variable_syntax.
在新的实现上,之前的一些语法表达的含义和如今有些不一样,具体的能够参照下面的表格:
Expression | PHP5 | PHP7 |
---|---|---|
$$foo['bar']['baz'] |
${$foo['bar']['baz']} |
($$foo)['bar']['baz'] |
$foo->$bar['baz'] |
$foo->{$bar['baz']} |
($foo->$bar)['baz'] |
$foo->$bar['baz']() |
$foo->{$bar['baz']}() |
($foo->$bar)['baz']() |
Foo::$bar['baz']() |
Foo::{$bar['baz']}() |
(Foo::$bar)['baz']() |
总体上仍是之前的顺序是从右到左,如今从左到右,同时也遵循括号不影响行为的原则。这些复杂的变量写法是在实际开发中须要注意的。
私博地址:http://0x1.im