转载 深度探讨 PHP 之性能

1.缘起php

关于PHP,不少人的直观感受是PHP是一种灵活的脚本语言,库类丰富,使用简单,安全,很是适合WEB开发,但性能低下。PHP的性能是否真的就 如同你们的感受同样的差呢?本文就是围绕这么一个话题来进行探讨的。从源码、应用场景、基准性能、对比分析等几个方面深刻分析PHP之性能问题,并经过真 实的数据来讲话。nginx

2.从原理分析PHP性能git

从原理分析PHP的性能,主要从如下几个方面:内存管理、变量、函数、运行机制来进行分析。github

2.1内存管理数组

相似Nginx的内存管理方式,PHP在内部也是基于内存池,而且引入内存池的生命周期概念。在内存池方面,PHP对PHP脚本和扩展的全部内存相 关操做都进行了托管。对大内存和小内存的管理采用了不一样的实现方式和优化,具体能够参考如下文档:https://wiki.php.net /internals/zend_mm。在内存分配和回收的生命周期内,PHP采用一次初始化申请+动态扩容+内存标识回收机制,而且在每次请求结束后直 接对内存池进行从新mask。安全

2.2变量框架

总所周知,PHP是一种弱变量类型的语言,因此在PHP内部,全部的PHP变量都对应成一种类型Zval。函数

在变量方面,PHP作了大量的优化工做,好比说Reference counting和copy on writer机制。这样可以保证内存使用上的优化,而且减小内存拷贝次数(请参考http://blog.xiuwz.com/2011/11/09 /php-using-internal-zval/)。在数组方面,PHP内部采用高效的hashtable来实现。

2.3函数php-fpm

在PHP内部,全部的PHP函数都回转化成内部的一个函数指针。好比说扩展中函数工具

ZEND_FUNCTION ( my_function );//相似function my_function(){}

在内部展开后就会是一个函数

void zif_my_function ( INTERNAL_FUNCTION_PARAMETERS );  
    void zif_my_function(  
    int ht,  
    zval * return_value,  
    zval * this_ptr,  
    int return_value_used,  
    zend_executor_globals * executor_globals  
    );

从这个角度来看,PHP函数在内部也是对应一个函数指针。

2.4运行机制

在话说PHP性能的时候,不少人都会说“C/C++是编译型,JAVA是半编译型,PHP是解释型”。也就是说PHP是先动态解析再代码运行的,因此从这个角度来看,PHP性能必然不好。

的确,从PHP脚本运行来输出,的确是一个动态解析再代码运行的过程。具体来讲,PHP的运行阶段也分红三个阶段:

Parse 语法分析阶段。
Compile 编译产出opcode中间码。
Execute 运行,动态运行进行输出。

因此说,在PHP内部,自己也是存在编译的过程。而且据此产生了大量的opcode cache工具,好比说apc、eacc、xcache等等。这些opcode cache在生产环境基本上在标配。基于opcode cache,能到作到“PHP脚本编译一次,屡次运行”的效果。从这点上,PHP就和JAVA的半编译机制很是相似。

因此,从运行机制上来看,PHP的运行模式和JAVA是很是相似的,都是先产生中间码,而后运行在不一样虚拟机上。

2.5动态运行

从上面的几个分析来看,PHP在内存管理、变量、函数、运行机制等几个方面都作了大量的工做,因此从原理来看,PHP不该该存在性能问题,性能至少也应该和Java比较接近。

这个时候就不得不谈PHP动态语言的特性所带来的性能问题了,因为PHP是动态运行时,因此全部的变量、函数、对象调用、做用域实现等等都是在执行 阶段中才肯定的。这个从根本上决定了PHP性能中很难改变的一些东西:在C/C++等可以在静态编译阶段肯定的变量、函数,在PHP中须要在动态运行中确 定,也就决定了PHP中间码不能直接运行而须要运行在Zend Engine上。

说到PHP变量的具体实现,又不得不说一个东西了:Hashtable。Hashtable能够说在PHP灵魂之一,在PHP内部普遍用到,包含变量符号栈、函数符号栈等等都是基于hashtable的。

以PHP变量为例来讲明下PHP的动态运行特色,好比说代码:

$var = “hello, blog.xiuwz.com”;

该代码的执行结果就是在变量符号栈(是一个hashtable)中新增一个项

'var'->zval(value:"hello, blog.xiuwz.com", refcount=1, is_ref=0)

大话PHP之性能

当要使用到该变量时候,就去变量符合栈中去查找(也就是变量调用对出了一个hash查找的过程)。

一样对于函数调用也基本上相似有一个函数符号栈(hashtable)。

其实关于动态运行的变量查找特色,在PHP的运行机制中也能看出一些。PHP代码经过解释、编译后的流程下图:

大话PHP之性能
图3 PHP运行实例

从上图能够看出,PHP代码在compile以后,产出的了类符号表、函数符号表、和OPCODE。在真正执行的时候,zend Engine会根据op code去对应的符号表中进行查找,处理。

从某种程度上,在这种问题的上,很难找到解决方案。由于这是因为PHP语言的动态特性所决定的。可是在国内外也有很多的人在寻找解决方案。由于经过 这样,可以从根本上彻底的优化PHP。典型的列子有facebook的hiphop(https://github.com/facebook /hiphop-php)。

2.6结论

从上面分析来看,在基础的内存管理、变量、函数、运行机制方面,PHP自己并不会存在明显的性能差别,但因为PHP的动态运行特性,决定了PHP和 其余的编译型语言相比,全部的变量查找、函数运行等等都会多一些hash查找的CPU开销和额外的内存开销,至于这种开销具体有多大,能够经过后续的基准 性能和对比分析得出。

所以,也能够大致看出PHP不太适合的一些场景:大量计算性任务、大数据量的运算、内存要求很严格的应用场景。若是要实现这些功能,也建议经过扩展的方式实现,而后再提供钩子函数给PHP调用。这样能够减低内部计算的变量、函数等系列开销。

3.基准性能

对于PHP基准性能,目前缺乏标准的数据。大多数同窗都存在感性的认识,有人认为800QPS就是PHP的极限了。此外,对于框架的性能和框架对性能的影响很没有响应的权威数字。

本章节的目的是给出一个基准的参考性能指标,经过数据给你们一个直观的了解。

具体的基准性能有如下几个方面:

1.裸PHP性能。完成基本的功能。

2.裸框架的性能。只作最简单的路由分发,只走通核心功能。

3.标准模块的基准性能。所谓标准模块的基准性能,是指一个具备完整服务模块功能的基准性能。

3.1环境说明

测试环境:

Uname -a

Linux db-forum-test17.db01.baidu.com 2.6.9_5-7-0-0 #1 SMP Wed Aug 12 17:35:51 CST 2009 x86_64 x86_64 x86_64 GNU/Linux

Red Hat Enterprise Linux AS release 4 (Nahant Update 3)

8  Intel(R) Xeon(R) CPU           E5520  @ 2.27GHz

软件相关:

 

Nginx:

nginx version: nginx/0.8.54  built by gcc 3.4.5 20051201 (Red Hat 3.4.5-2)

Php5:(采用php-fpm)

PHP 5.2.8 (cli) (built: Mar  6 2011 17:16:18)

Copyright (c) 1997-2008 The PHP Group

Zend Engine v2.2.0, Copyright (c) 1998-2008 Zend Technologies

with eAccelerator v0.9.5.3, Copyright (c) 2004-2006 eAccelerator, by eAccelerator

bingo2:

PHP框架。

其余说明:

目标机器的部署方式:nginx -> php-fpm -> php 脚本。

测试压力机器和目标机器独立部署。

3.2裸PHP性能

最简单的PHP脚本。

require_once ‘./actions/indexAction.php’;  
    $objAction = new indexAction();  
    $objAction->init();  
    $objAction->execute();  

    Acitons/indexAction.php里面的代码以下  

    class indexAction  
    {  
    public function execute()  
    {  
    echo ‘hello, world!’;  
    }  
    }

经过压力工具测试结果以下:

大话PHP之性能

3.3裸PHP框架性能

为了和3.2的对比,基于bingo2框架实现了相似的功能。代码以下

require_once ‘Bingo/Controller/Front.php’;  
    $objFrontController = Bingo_Controller_Front::getInstance(array(  
    ‘actionDir’ => ‘./actions’,  
    ));  
    $objFrontController->dispatch();

压力测试结果以下:

大话PHP之性能

从该测试结果能够看出:框架虽然有必定的消耗,但对总体的性能来讲影响是很是小的。

3.4标准PHP模块的基准性能

所谓标准PHP模块,是指一个PHP模块所必需要具体的基本功能:

路由分发。

自动加载。

LOG初始化&Notice日志打印。因此的UI请求都一条标准的日志。

错误处理。
时间校订。
自动计算每一个阶段耗时开销。
编码识别&编码转化。
标准配置文件的解析和调用

采用bingo2的代码自动生成工具产生标准的测试PHP模块:test。

测试结果以下:

大话PHP之性能

3.5结论

从测试数据的结论来看,PHP自己的性能仍是能够的。基准性能彻底可以达到几千甚至上W的QPS。至于为何在大多数的PHP模块中表现不佳,其实 这个时候更应该去找出系统的瓶颈点,而是简单的说OK,PHP不行,那咱们换C来搞吧。(下一个章节,会经过一些例子来对比,采用C来处理不见得有特别的 优点)

经过基准数据,能够得出如下几个具体的结论:

1.PHP自己性能也很不错。简单功能下可以达到5000QPS,极限也能过W。

2.PHP框架自己对性能影响很是有限。尤为是在有必定业务逻辑和数据交互的状况下,几乎能够忽略。

3.一个标准的PHP模块,基准性能可以达到2000QPS(80 cpu idle)。

4.对比分析

不少时候,你们发现PHP模块性能不行的时候,就来一句“ok,咱们采用C重写吧”。在公司内,采用C/C++来写业务逻辑模块的现象处处都有,在前几年甚至几乎所有都是采用C来写。那时候你们写的真是一个痛苦:调试难、敏捷不要谈。