PHP7革新与性能优化

有幸参与2015年的PHP技术峰会(PHPCON),听了鸟哥(惠新宸)的关于PHP7的新特性和性能优化的分享,一切都使人感到激动。鸟哥是国内最权威的PHP专家,他的分享有不少很是有价值的东西,我经过整理分享的PPT和收集相关资料,整理为这篇解读性质的技术文章,但愿能给作PHP开发的同窗一些帮助。php

 

PHP已经走过了20年的历史,直到今天,PHP7都发布了RC版,听说,PHP7正式版应该会在2015年11月份左右发布。PHP7对于上一个系列的PHP5.*,能够说是一个大规模的革新,尤为是在性能方面实现跨越式的大幅提高。程序员

PHP是一种在全球范围内被普遍使用的Web开发语言,PHP7的革新也固然会给这些Web服务带来更深入的变化。这里引用鸟哥PPT中的一个图表(82%的Web站点有使用PHP做为开发语言):web

 PHP7革新与性能优化 - 徐汉彬Hansion - 技术行者

(注:一个web站点能够会使用多种语言做为它的开发语言)数组

(注:本文含有很多从鸟哥PPT里的截图,图片版权归鸟哥全部)缓存

 

咱们先看看两张激动人心的性能测试结果图:安全

Benchmark对比(图片来自于PPT):性能优化

 PHP7革新与性能优化 - 徐汉彬Hansion - 技术行者

PHP7的性能测试结果,性能压测结果,耗时从2.991降低到1.186,大幅度降低60%。服务器

WordPress的QPS压测(图片来自于PPT):多线程

 PHP7革新与性能优化 - 徐汉彬Hansion - 技术行者

而在WordPress项目中,PHP7对比PHP5.6,QPS提高2.77倍。函数

看完使人激动的性能测试结果对比,咱们就进入正题哈。PHP7的新增特性不少,不过,咱们会更聚焦于那些主要的变化。

 

1、新增特性和改变

1. 标量类型和返回类型声明(Scalar Type Declarations & Scalar Type Declarations)

PHP语言一个很是重要的特色就是“弱类型”,它让PHP的程序变得很是容易编写,新手接触PHP可以快速上手,不过,它也伴随着一些争议。支持变量类型的定义,能够说是革新性质的变化,PHP开始以可选的方式支持类型定义。除此以外,还引入了一个开关指令declare(strict_type=1);,当这个指令一旦开启,将会强制当前文件下的程序遵循严格的函数传参类型和返回类型。

例如一个add函数加上类型定义,能够写成这样:

 PHP7革新与性能优化 - 徐汉彬Hansion - 技术行者

若是配合强制类型开关指令,则能够变为这样:

 PHP7革新与性能优化 - 徐汉彬Hansion - 技术行者

若是不开启strict_type,PHP将会尝试帮你转换成要求的类型,而开启以后,会改变PHP就再也不作类型转换,类型不匹配就会抛出错误。对于喜欢“强类型”语言的同窗来讲,这是一大福音。

更为详细的介绍:

PHP7标量类型声明RFC[翻译]  

 

2. 更多的Error变为可捕获的Exception

PHP7实现了一个全局的throwable接口,原来的Exception和部分Error都实现了这个接口(interface), 以接口的方式定义了异常的继承结构。因而,PHP7中更多的Error变为可捕获的Exception返回给开发者,若是不进行捕获则为Error,若是捕获就变为一个可在程序内处理的Exception。这些可被捕获的Error一般都是不会对程序形成致命伤害的Error,例如函数不存。PHP7进一步方便开发者处理,让开发者对程序的掌控能力更强。由于在默认状况下,Error会直接致使程序中断,而PHP7则提供捕获而且处理的能力,让程序继续执行下去,为程序员提供更灵活的选择。

例如,执行一个咱们不肯定是否存在的函数,PHP5兼容的作法是在函数被调用以前追加的判断function_exist,而PHP7则支持捕获Exception的处理方式。

以下图中的例子(截图来源于PPT内):

 PHP7革新与性能优化 - 徐汉彬Hansion - 技术行者

 

3. AST(Abstract Syntax Tree,抽象语法树)

AST在PHP编译过程做为一个中间件的角色,替换原来直接从解释器吐出opcode的方式,让解释器(parser)和编译器(compliler)解耦,能够减小一些Hack代码,同时,让实现更容易理解和可维护。

PHP5:

 PHP7革新与性能优化 - 徐汉彬Hansion - 技术行者 

PHP7:

 PHP7革新与性能优化 - 徐汉彬Hansion - 技术行者

更多AST信息:

https://wiki.php.net/rfc/abstract_syntax_tree

 

4. Native TLS(Native Thread local storage,原生线程本地存储)

PHP在多线程模式下(例如,Web服务器Apache的woker和event模式,就是多线程),须要解决“线程安全”(TS,Thread Safe)的问题,由于线程是共享进程的内存空间的,因此每一个线程自己须要经过某种方式,构建私有的空间来保存本身的私有数据,避免和其余线程相互污染。而PHP5采用的方式,就是维护一个全局大数组,为每个线程分配一份独立的存储空间,线程经过各自拥有的key值来访问这个全局数据组。

而这个独有的key值在PHP5中须要传递给每个须要用到全局变量的函数,PHP7认为这种传递的方式并不友好,而且存在一些问题。于是,尝试采用一个全局的线程特定变量来保存这个key值。

相关的Native TLS问题:

https://wiki.php.net/rfc/native-tls

 

5. 其余新特性

PHP7新特性和变化很多,咱们这里并不所有展开来细说哈。

(1) Int64支持,统一不一样平台下的整型长度,字符串和文件上传都支持大于2GB。

(2) 统一变量语法(Uniform variable syntax)。

(3) foreach表现行为一致(Consistently foreach behaviors)

(4) 新的操做符 <=>, ??

(5) Unicode字符格式支持(\u{xxxxx})

(6) 匿名类支持(Anonymous Class)

… …

 

2、跨越式的性能突破:全速前进

1. JIT与性能

Just In Time(即时编译)是一种软件优化技术,指在运行时才会去编译字节码为机器码。从直觉出发,咱们都很容易认为,机器码是计算机可以直接识别和执行的,比起Zend读取opcode逐条执行效率会更高。其中,HHVM(HipHop Virtual Machine,HHVM是一个Facebook开源的PHP虚拟机)就采用JIT,让他们的PHP性能测试提高了一个数量级,放出一个使人震惊的测试结果,也让咱们直观地认为JIT是一项点石成金的强大技术。

而实际上,在2013年的时候,鸟哥和Dmitry(PHP语言内核开发者之一)就曾经在PHP5.5的版本上作过一个JIT的尝试(并无发布)。PHP5.5的原来的执行流程,是将PHP代码经过词法和语法分析,编译成opcode字节码(格式和汇编有点像),而后,Zend引擎读取这些opcode指令,逐条解析执行。

 

PHP7革新与性能优化 - 徐汉彬Hansion - 技术行者

  

而他们在opcode环节后引入了类型推断(TypeInf),而后经过JIT生成ByteCodes,而后再执行。

 PHP7革新与性能优化 - 徐汉彬Hansion - 技术行者

因而,在benchmark(测试程序)中获得使人兴奋的结果,实现JIT后性能比PHP5.5提高了8倍。然而,当他们把这个优化放入到实际的项目WordPress(一个开源博客项目)中,却几乎看不见性能的提高,获得了一个使人费解的测试结果。

因而,他们使用Linux下的profile类型工具,对程序执行进行CPU耗时占用分析。

执行100次WordPress的CPU消耗的分布(截图来自PPT):

 PHP7革新与性能优化 - 徐汉彬Hansion - 技术行者

注解:

21%CPU时间花费在内存管理。

12%CPU时间花费在hash table操做,主要是PHP数组的增删改查。

30%CPU时间花费在内置函数,例如strlen。

25%CPU时间花费在VM(Zend引擎)。

 

通过分析以后,获得了两个结论:

(1)JIT生成的ByteCodes若是太大,会引发CPU缓存命中率降低(CPU Cache Miss)

在PHP5.5的代码里,由于并无明显类型定义,只能靠类型推断。尽量将能够推断出来的变量类型,定义出来,而后,结合类型推断,将非该类型的分支代码去掉,生成直接可执行的机器码。然而,类型推断不能推断出所有类型,在WordPress中,可以推断出来的类型信息只有不到30%,可以减小的分支代码有限。致使JIT之后,直接生成机器码,生成的ByteCodes太大,最终引发CPU缓存命中大幅度降低(CPU Cache Miss)。

CPU缓存命中是指,CPU在读取并执行指令的过程当中,若是须要的数据在CPU一级缓存(L1)中读取不到,就不得不往下继续寻找,一直到二级缓存(L2)和三级缓存(L3),最终会尝试到内存区域里寻找所须要的指令数据,而内存和CPU缓存之间的读取耗时差距能够达到100倍级别。因此,ByteCodes若是过大,执行指令数量过多,致使多级缓存没法容纳如此之多的数据,部分指令将不得不被存放到内存区域。

 PHP7革新与性能优化 - 徐汉彬Hansion - 技术行者 

CPU的各级缓存的大小也是有限的,下图是Intel i7 920的配置信息:

 PHP7革新与性能优化 - 徐汉彬Hansion - 技术行者

所以,CPU缓存命中率降低会带来严重的耗时增长,另外一方面,JIT带来的性能提高,也被它所抵消掉了。

 

经过JIT,能够下降VM的开销,同时,经过指令优化,能够间接下降内存管理的开发,由于能够减小内存分配的次数。然而,对于真实的WordPress项目来讲,CPU耗时只有25%在VM上,主要的问题和瓶颈实际上并不在VM上。所以,JIT的优化计划,最后没有被列入该版本的PHP7特性中。不过,它极可能会在更后面的版本中实现,这点也很是值得咱们期待哈。

 

(2)JIT性能的提高效果取决于项目的实际瓶颈

JIT在benchmark中有大幅度的提高,是由于代码量比较少,最终生成的ByteCodes也比较小,同时主要的开销是在VM中。而应用在WordPress实际项目中并无明显的性能提高,缘由WordPress的代码量要比benchmark大得多,虽然JIT下降了VM的开销,可是由于ByteCodes太大而又引发CPU缓存命中降低和额外的内存开销,最终变成没有提高。

不一样类型的项目会有不一样的CPU开销比例,也会获得不一样的结果,脱离实际项目的性能测试,并不具备很好的表明性。

 

2. Zval的改变

PHP的各类类型的变量,其实,真正存储的载体就是Zval,它特色是海纳百川,有容乃大。从本质上看,它是C语言实现的一个结构体(struct)。对于写PHP的同窗,能够将它粗略理解为是一个相似array数组的东西。

PHP5的Zval,内存占据24个字节(截图来自PPT):

 PHP7革新与性能优化 - 徐汉彬Hansion - 技术行者

PHP7的Zval,内存占据16个字节(截图来自PPT):

 PHP7革新与性能优化 - 徐汉彬Hansion - 技术行者

Zval从24个字节降低到16个字节,为何会降低呢,这里须要补一点点的C语言基础,辅助不熟悉C的同窗理解。struct和union(联合体)有点不一样,Struct的每个成员变量要各自占据一块独立的内存空间,而union里的成员变量是共用一块内存空间(也就是说修改其中一个成员变量,公有空间就被修改了,其余成员变量的记录也就没有了)。所以,虽然成员变量看起来多了很多,可是实际占据的内存空间却降低了。

 

除此以外,还有被明显改变的特性,部分简单类型再也不使用引用。

Zval结构图(来源于PPT中):

 PHP7革新与性能优化 - 徐汉彬Hansion - 技术行者

图中Zval的由2个64bits(1字节=8bit,bit是“位”)组成,若是变量类型是long、bealoon这些长度不超过64bit的,则直接存储到value中,就没有下面的引用了。当变量类型是array、objec、string等超过64bit的,value存储的就是一个指针,指向真实的存储结构地址。

对于简单的变量类型来讲,Zval的存储变得很是简单和高效。

不须要引用的类型:NULL、Boolean、Long、Double

须要引用的类型:String、Array、Object、Resource、Reference

 

3. 内部类型zend_string

Zend_string是实际存储字符串的结构体,实际的内容会存储在val(char,字符型)中,而val是一个char数组,长度为1(方便成员变量占位)。

 PHP7革新与性能优化 - 徐汉彬Hansion - 技术行者

结构体最后一个成员变量采用char数组,而不是使用char*,这里有一个小优化技巧,能够下降CPU的cache miss。

若是使用char数组,当malloc申请上述结构体内存,是申请在同一片区域的,一般是长度是sizeof(_zend_string) + 实际char存储空间。可是,若是使用char*,那个这个位置存储的只是一个指针,真实的存储又在另一片独立的内存区域内。

使用char[1]和char*的内存分配对比:

 PHP7革新与性能优化 - 徐汉彬Hansion - 技术行者

从逻辑实现的角度来看,二者其实也没有多大区别,效果很相似。而实际上,当这些内存块被载入到CPU的中,就显得很是不同。前者由于是连续分配在一块儿的同一块内存,在CPU读取时,一般均可以一同得到(由于会在同一级缓存中)。然后者,由于是两块内存的数据,CPU读取第一块内存的时候,极可能第二块内存数据不在同一级缓存中,使CPU不得不往L2(二级缓存)如下寻找,甚至到内存区域查到想要的第二块内存数据。这里就会引发CPU Cache Miss,而二者的耗时最高能够相差100倍。

另外,在字符串复制的时候,采用引用赋值,zend_string能够避免的内存拷贝。

 

6. PHP数组的变化(HashTable和Zend Array)

在编写PHP程序过程当中,使用最频繁的类型莫过于数组,PHP5的数组采用HashTable实现。若是用比较粗略的归纳方式来讲,它算是一个支持双向链表的HashTable,不只支持经过数组的key来作hash映射访问元素,也能经过foreach以访问双向链表的方式遍历数组元素。

PHP5的HashTable(截图来自于PPT):

 PHP7革新与性能优化 - 徐汉彬Hansion - 技术行者

这个图看起来很复杂,各类指针跳来跳去,当咱们经过key值访问一个元素内容的时候,有时须要3次的指针跳跃才能找对须要的内容。而最重要的一点,就在于这些数组元素存储,都是分散在各个不一样的内存区域的。同理可得,在CPU读取的时候,由于它们就极可能不在同一级缓存中,会致使CPU不得不到下级缓存甚至内存区域查找,也就是引发CPU缓存命中降低,进而增长更多的耗时。

PHP7的Zend Array(截图来源于PPT):

 PHP7革新与性能优化 - 徐汉彬Hansion - 技术行者

新版本的数组结构,很是简洁,让人眼前一亮。最大的特色是,整块的数组元素和hash映射表所有链接在一块儿,被分配在同一块内存内。若是是遍历一个整型的简单类型数组,效率会很是快,由于,数组元素(Bucket)自己是连续分配在同一块内存里,而且,数组元素的zval会把整型元素存储在内部,也再也不有指针外链,所有数据都存储在当前内存区域内。固然,最重要的是,它可以避免CPU Cache Miss(CPU缓存命中率降低)。

Zend Array的变化:

(1) 数组的value默认为zval。

(2) HashTable的大小从72降低到56字节,减小22%。

(3) Buckets的大小从72降低到32字节,减小50%。

(4) 数组元素的Buckets的内存空间是一同分配的。

(5) 数组元素的key(Bucket.key)指向zend_string。

(6) 数组元素的value被嵌入到Bucket中。

(7) 下降CPU Cache Miss。

 

7. 函数调用机制(Function Calling Convention)

PHP7改进了函数的调用机制,经过优化参数传递的环节,减小了一些指令,提升执行效率。

PHP5的函数调用机制(截图来自于PPT):

PHP7革新与性能优化 - 徐汉彬Hansion - 技术行者

图中,在vm栈中的指令send_val和recv参数的指令是相同,PHP7经过减小这两条重复,来达到对函数调用机制的底层优化。

PHP7的函数调用机制(截图来自于PPT):

 PHP7革新与性能优化 - 徐汉彬Hansion - 技术行者

 

8. 经过宏定义和内联函数(inline),让编译器提早完成部分工做

C语言的宏定义会被在预处理阶段(编译阶段)执行,提早将部分工做完成,无需在程序运行时分配内存,可以实现相似函数的功能,却没有函数调用的压栈、弹栈开销,效率会比较高。内联函数也相似,在预处理阶段,将程序中的函数替换为函数体,真实运行的程序执行到这里,就不会产生函数调用的开销。

PHP7在这方面作了很多的优化,将很多须要在运行阶段要执行的工做,放到了编译阶段。例如参数类型的判断(Parameters Parsing),由于这里涉及的都是固定的字符常量,所以,能够放到到编译阶段来完成,进而提高后续的执行效率。

例以下图中处理传递参数类型的方式,从左边的写法,优化为右边宏的写法。

 PHP7革新与性能优化 - 徐汉彬Hansion - 技术行者

 

3、小结

鸟哥的PPT里放出过一组对比数据,就是WordPress在PHP5.6执行100次会产生70亿次的CPU指令执行数目,而在PHP7中只须要25亿次,减小64.2%,这是一个使人震撼的数据。

在鸟哥的整个分享中,给我最深入的一个观点是:要注意细节,不少个细小的优化,一点点持续地积累,聚沙成塔,最终汇聚为惊艳的成果。为山九仞,岂一日之功,我想大概也是这个道理。

毫无疑问,PHP7在性能方面实现跨越式的提高,若是可以将这些成果应用在PHP的Web系统中,也许咱们只须要更少的机器,就能够支撑起更高请求量的服务。PHP7正式版的发布,使人充满无限憧憬。

 

参考&引用资料:

鸟哥(惠新宸)的分享PPT,http://www.laruence.com/

PHP官方社区,http://php.net/

 

致谢:

感谢鸟哥(惠新宸)提供的帮助与支持。

 

原文:http://hansionxu.blog.163.com/blog/static/24169810920158704014772

相关文章
相关标签/搜索