php性能调优

第一章  针对系统调用过多的优化php

我此次的优化针对syscall调用过多的问题,因此使用strace跟踪apache进行分析。前端

1.  apache2ctl -X &nginx

使用-X(debug)参数启动httpd进程,这个时候只启动1httpd进程c++

2. ps -ef | grep httpd正则表达式

找到须要stracepid数据库

3. strace -p $PID -o /tmp/strace.logapache

发送一个http请求到httpd,就能看到strace信息了。数组

 

1、include_path问题浏览器

通常能够看到不少这类信息:缓存

stat64("/error/dir/test.php", 0xbfab4b9c) = -1 ENOENT (No such file or directory)

解决方法:

1. 在应用php里面设置include_path,去掉'.'等相对路径,将其中包含使用文件比较多的目录放到前面。保证遍历include_path的时候可以很快找到。

2. 使用绝对路径进行includerequireinclude_oncerequire_once

3. 使用php自动加载机制

 

2、apacherewrite配置

    RewriteEngine On

    RewriteCond %{DOCUMENT_ROOT}%{REQUEST_FILENAME} !-f
    RewriteCond %{DOCUMENT_ROOT}%{REQUEST_FILENAME} !-d
    RewriteRule .* %{DOCUMENT_ROOT}%/index.php

   #RewriteRule .* /index.php 

这里最后一个注释掉的rewrite配置很差,由于它每次请求都会多一次syscall

stat64("/index.php", 0xbfab4b9c) = -1 ENOENT (No such file or directory)

 

3、apache日志问题

咱们在测试一个问题的时候,发现若是自定义日志里面记录了访问时间等信息,会多出不少

stat64("/etc/localtime", {st_mode=S_IFREG|0644, st_size=165, ...}) = 0

若是记录的日志比较多,性能降低很是严重,对于简单应用,记录复杂日志,性能会降低30倍。

解决方法:

在多个apache前端架http层的proxy,如haproxynginx。在这些地方记录日志。接入层负载通常不高,因此proxy能够作一些记录日志的工做。在这种配置下,能够关闭apache的日志

 

4、realpath()问题

你们能够看一下这篇文章:http://bugs.php.net/bug.php?id=43864

lstat64调用多了以后,主机CPUIO都会比较高。

究其缘由,由于php5.2.xrealpath()的实现不够好,致使会针对目录层次,逐级调用lstat64()

为了解决这个问题,它使用了realpath_cache,针对某个文件,存储其realpath。这里只存储了叶子节点的realpath,而对 路径上的内容没有存储,因此在作"/a/b/c/d/e/f/g/a.php"realpath检查的时候逐级调用lstat64,而在作"/a/b/c /d/e/f/g/b.php"检查的时候,还要对""/a/b/c/d/e/f/g/"作逐级检查。因此有些优化建议就是减小目录层次,甚至放到"/"根目录下。固然我不推荐这么干。5.3.0开始,phprealpath()作了高效的实现,路realpath的中间路径也作了缓存,以上面的状况为例,检查"/a/b/c/d/e/f/g/b.php"的时候就只会作“b.php”的检查了。因此,升级到php5.3.0以上版本可以很好地解决这个问题。

解决方法:

1. 尽可能少用include_oncerequire_once

由于这两个函数会作realpath检查,防止有符号连接的状况致使重复加载。不用它们就能减小realpath的调用。

2. 合理设定php.ini中的realpath_cache_sizerealpath_cache_ttl参数

既然使用了realpath_cache,那确定有大小限制。对于使用了不少文件,好比用了Zend Framework的项目,可能默认realpath_cache_size=16k就过小了,须要增大这个设置,推荐设置为256K以上。另外默认realpath_cache_ttl=1202分钟就过期了,怎么也要设定为36001小时)。

这里须要注意的是,这个realpath_cache是每隔apache进程独占的,因此很吃内存的,不能设置的太大。

3. 升级到php5.3.x

没什么好说的,若是应用通过详细测试没有问题,那么推荐升级到高版本。

 

5、APC的使用

apc可以缓存phpopcode码,能广泛提高30%的性能。可是默认apc.stat=1,这样每次请求都会访问须要使用的php文件,看看这个文件是否更新了,已决定是否从新编译php文件。这个是很耗性能的,推荐关掉。

解决方法:

1. 设定apc.stat=0,没必要每次请求都访问须要用到的php文件。

须要注意的是:每次发版本改动了php文件的时候,必须调用apc_clear()清除apc缓存,不然你的代码永远也不会生效。

6、smarty调优

对于模块化比较好,并且应用比较多的网站,若是使用了smarty模板系统,这个时候就须要对smarty进行调优了,不然smarty部分的开销就很可观。以前根据一个经验来看,smarty能够占到10%左右的开销。

默认配置下,smarty对检测每一个模板文件是否有更新,决定是否从新编译模板文件。若是模板文件比较多,则会多出不少stat系统调用,加上context switch,开销会不小。

解决方法

1. $smarty->compile_check = false;
去掉每次的检测,可是这样以后,每次发版本都要把compile_dir目录的已编译模板删除,不然你的模板文件永远也不会生效了。
2.
 若是可能,可使用cache功能。

 

结论

通过上面的调优,结论以下:

1.          升级到php5.3.1开启上面的优化,比5.2.3性能高10%以上

2.          在优化配置下,使用Zend Framework开发的一个搜索应用,每秒请求可达210/rps

3.          在优化配置下,使用doophp framework开发的一个搜索应用,每秒请求可达450/rps


 

第二章  使用APC缓存

php程序的执行流程
》客户端(浏览器)请求Get hello.php
—-
cgi服务器接(譬如apache)收到请求,根据配置寻找php的处理程序(譬如mod_php
—-
apache加载php的处理程序,php的处理程序读取php.ini初始化php的解释环境
—-
mod_php定位寻找hell.php,将其载入到内存中来
—-
mod_php编译源代码成为opcode
—-mod_php执行opcode
—-
》生成结果给浏览器

在这个过程当中,有几点是须要注意的:

一、  对许多代码文件说,特别是含有不少包含文件(include or require)。它们须要花费更多的时间和解析并产生中间代码。

二、  即便PHP代码文件没有发生改变,这个执行过程还会严格的按照流程执行。也就是说,不管你的应该程序是否发生改变,每次调用的时候,都须要从新编译生成opcode码。(其实这就是编译缓存存在的理由)

三、  这个流程不只仅发生在主要的代码文件,对于每一次的includerequire来讲,都会执行这个流程。(这是能够继续优化的)

那些地方能够优化呢?

一、mod_php fast-cgi化,避免每次都要加载这个模块,这个模块还要每次都去初始化php的解释环境。

二、缓存php文件的opcode码,这样话,避免每次都去编译。

APC可用用来实现第2点。编译缓存去掉了执行PHP过程当中的解析过程,因此它对含有大量PHP代码的应用程序是很是有效的。一般状况下能够提高2-3倍以上的速度。对于包含大量include文件的项目,编译缓存更现实出它的优越性。

注:include并不会被编译缓存进行缓存。好比如今有两个文件:main.php tobeInclude.php,其中main.php中有这样的语句include tobeInclude.php’。假设中间码的后缀为.op(实际上不是这样)那么加上缓存cache main.php=>main.op tobeInclude.php=>tobeInclude.op可是PHP在执行main.php的时候,她仍是须要去解析main.op中的include命令,去调用tobeInclude.op的内容。具体流程是这样的。
    …=>
执行main.op=>执行tobeInclude.op=>…
    而不是之间简单的执行main.op

因此说过多的include文件会下降程序性能的

 

APC的具体配置

Alternative PHP CacheAPC)是 PHP 的一个免费公开的优化代码缓存。它用来提供免费,公开而且强健的架构来缓存和优化 PHP 的中间代码。

APC 官方网站为 http://pecl.php.net/package/apc

1安装

PHP extension 形式安装

phpize

./configure --enable-apc --enable-apc-mmap

make

make install

生成.so,将.so拷贝到php引用modules的目录下,修改权限755

2配置

apc.enabled        boolean

apc.optimization   optimization

选项在脚本中能够改变

APC PHP.ini配置选项详解

[APC]

; Alternative PHP Cache 用于缓存和优化PHP中间代码

apc.cache_by_default = On

;SYS

; 是否默认对全部文件启用缓冲。

; 若设为Off并与以加号开头的apc.filters指令一块儿用,则文件仅在匹配过滤器时才被缓存。

apc.enable_cli = Off

;SYS

; 是否为CLI版本启用APC功能,仅用于测试和调试目的才打开此指令。

apc.enabled = On

; 是否启用APC,若是APC被静态编译进PHP又想禁用它,这是惟一的办法。

apc.file_update_protection = 2

;SYS

; 当你在一个运行中的服务器上修改文件时,你应当执行原子操做。

; 也就是先写进一个临时文件,而后将该文件重命名(mv)到最终的名字。

; 文本编辑器以及 cp, tar 等程序却并非这样操做的,从而致使有可能缓冲了残缺的文件。

; 默认值 2 表示在访问文件时若是发现修改时间距离访问时间小于 2 秒则不作缓冲。

; 那个不幸的访问者可能获得残缺的内容,可是这种坏影响却不会经过缓存扩大化。

; 若是你能确保全部的更新操做都是原子操做,那么能够用 0 关闭此特性。

; 若是你的系统因为大量的IO操做致使更新缓慢,你就须要增大此值。

apc.filters =

;SYS

; 一个以逗号分隔的POSIX扩展正则表达式列表。

; 若是源文件名与任意一个模式匹配,则该文件不被缓存。

; 注意,用来匹配的文件名是传递给include/require的文件名,而不是绝对路径。

; 若是正则表达式的第一个字符是"+"则意味着任何匹配表达式的文件会被缓存,

; 若是第一个字符是"-"则任何匹配项都不会被缓存。"-"是默认值,能够省略掉。

apc.ttl = 0

;SYS

; 缓存条目在缓冲区中容许逗留的秒数。0 表示永不超时。建议值为7200~36000

; 设为 0 意味着缓冲区有可能被旧的缓存条目填满,从而致使没法缓存新条目。

apc.user_ttl = 0

;SYS

; 相似于apc.ttl,只是针对每一个用户而言,建议值为7200~36000

; 设为 0 意味着缓冲区有可能被旧的缓存条目填满,从而致使没法缓存新条目。

apc.gc_ttl = 3600

;SYS

; 缓存条目在垃圾回收表中可以存在的秒数。

; 此值提供了一个安全措施,即便一个服务器进程在执行缓存的源文件时崩溃,

; 并且该源文件已经被修改,为旧版本分配的内存也不会被回收,直到达到此TTL值为止。

; 设为零将禁用此特性。

apc.include_once_override = Off

;SYS

; 请保持为Off,不然可能致使意想不到的结果。

apc.max_file_size = 1M

;SYS

; 禁止大于此尺寸的文件被缓存。

apc.mmap_file_mask =

;SYS

; 若是使用–enable-mmap(默认启用)APC编译了MMAP支持,

; 这里的值就是传递给mmap模块的mktemp风格的文件掩码(建议值为"/tmp/apc.XXXXXX")

; 该掩码用于决定内存映射区域是否要被file-backed或者shared memory backed

; 对于直接的file-backed内存映射,要设置成"/tmp/apc.XXXXXX"的样子(刚好6X)

; 要使用POSIX风格的shm_open/mmap就须要设置成"/apc.shm.XXXXXX"的样子。

; 你还能够设为"/dev/zero"来为匿名映射的内存使用内核的"/dev/zero"接口。

; 不定义此指令则表示强制使用匿名映射。

apc.num_files_hint = 1000

;SYS

; Web服务器上可能被包含或被请求的不一样源文件的大体数量(建议值为1024~4096)

; 若是你不能肯定,则设为 0 ;此设定主要用于拥有数千个源文件的站点。

apc.optimization = 0

; 优化级别(建议值为 0 ) 。

; 正整数值表示启用优化器,值越高则使用越激进的优化。

; 更高的值可能有很是有限的速度提高,但目前尚在试验中。

apc.report_autofilter = Off

;SYS

; 是否记录全部因为early/late binding缘由而自动未被缓存的脚本。

apc.shm_segments = 1

;SYS

; 为编译器缓冲区分配的共享内存块数量(建议值为1)

; 若是APC耗尽了共享内存,而且已将apc.shm_size指令设为系统容许的最大值,

; 你能够尝试增大此值。

apc.shm_size = 30

;SYS

; 每一个共享内存块的大小(MB为单位,建议值为128~256)

; 有些系统(包括大多数BSD变种)默认的共享内存块大小很是少。

apc.slam_defense = 0

;SYS(反对使用该指令,建议该用apc.write_lock指令)

; 在很是繁忙的服务器上,不管是启动服务仍是修改文件,

; 均可能因为多个进程企图同时缓存一个文件而致使竞争条件。

; 这个指令用于设置进程在处理未被缓存的文件时跳过缓存步骤的百分率。

; 好比设为75表示在遇到未被缓存的文件时有75%的几率不进行缓存,从而减小碰撞概率。

; 鼓励设为 0 来禁用这个特性。

apc.stat = On

;SYS

; 是否启用脚本更新检查。

; 改变这个指令值要很是当心。

; 默认值 On 表示APC在每次请求脚本时都检查脚本是否被更新,

; 若是被更新则自动从新编译和缓存编译后的内容。但这样作对性能有不利影响

; 若是设为Off 则表示不进行检查,从而使性能获得大幅提升。

; 可是为了使更新的内容生效,你必须重启Web服务器

; 这个指令对于include/require的文件一样有效。可是须要注意的是

; 若是你使用的是相对路径,APC就必须在每一次include/require时都进行检查以定位文件

; 而使用绝对路径则能够跳过检查,因此鼓励你使用绝对路径进行include/require操做。

apc.user_entries_hint = 100

;SYS

; 相似于num_files_hint指令,只是针对每一个不一样用户而言。

; 若是你不能肯定,则设为 0 。

apc.write_lock = On

;SYS

; 是否启用写入锁。

; 在很是繁忙的服务器上,不管是启动服务仍是修改文件,

; 均可能因为多个进程企图同时缓存一个文件而致使竞争条件。

; 启用该指令能够避免竞争条件的出现。

apc.rfc1867 = Off

;SYS

; 打开该指令后,对于每一个刚好在file字段以前含有APC_UPLOAD_PROGRESS字段的上传文件,APC都将自动建立一个upload_的用户缓存条目(就是APC_UPLOAD_PROGRESS字段值)

3php函数

apc_cache_info        - Retrieves cached information (and meta-data) from APC's data store
apc_clear_cache       - Clears the APC cache
apc_define_constants - Defines a set of constants for later retrieval and mass-definition
apc_delete            - Removes a stored variable from the cache
apc_fetch             - Fetch a stored variable from the cache
apc_load_constants    - Loads a set of constants from the cache
apc_sma_info          - Retrieves APC's Shared Memory Allocation information
apc_store             - Cache a variable in the data store

4注意:

Apcapache的进程共享内存,因此只有在执行apache进程时,才能够往apc中存值,普通的php进程不能访问apc共享内存。


 

第三章  提升PHP性能的编码技巧

0、用单引号代替双引号来包含字符串,这样作会更快一些。由于PHP会在双引号包围的字符串中搜寻变量,单引号则不会,注意:只有echo能这么作,它是一种能够把多个字符串看成参数的函数(译注:PHP手册中说echo是语言结构,不是真正的函数,故把函数加上了双引号)。
1
、若是能将类的方法定义成static,就尽可能定义成static,它的速度会提高将近4倍。
2
$row[’id’] 的速度是$row[id]7倍。
3
echo print 快,而且使用echo的多重参数(译注:指用逗号而不是句点)代替字符串链接,好比echo $str1,$str2
4
、在执行for循环以前肯定最大循环数,不要每循环一次都计算最大值,最好运用foreach代替。
5
、注销那些不用的变量尤为是大数组,以便释放内存。
6
、尽可能避免使用__get__set__autoload
7
require_once()代价昂贵。
8
include文件时尽可能使用绝对路径,由于它避免了PHPinclude_path里查找文件的速度,解析操做系统路径所需的时间会更少。
9
、若是你想知道脚本开始执行(译注:即服务器端收到客户端请求)的时刻,使用$_SERVER[‘REQUEST_TIME’]要好于time()
10
、函数代替正则表达式完成相同功能。
11
str_replace函数比preg_replace函数快,但strtr函数的效率是str_replace函数的四倍。
12
、若是一个字符串替换函数,可接受数组或字符做为参数,而且参数长度不太长,那么能够考虑额外写一段替换代码,使得每次传递参数是一个字符,而不是只写一行代码接受数组做为查询和替换的参数。
13
、使用选择分支语句(译注:即switch case)好于使用多个ifelse if语句。
14
、用@屏蔽错误消息的作法很是低效,极其低效。
15
、打开apachemod_deflate模块,能够提升网页的浏览速度。
16
、数据库链接当使用完毕时应关掉,不要用长链接。
17
、错误消息代价昂贵。
18
、在方法中递增局部变量,速度是最快的。几乎与在函数中调用局部变量的速度至关。
19
、递增一个全局变量要比递增一个局部变量慢2倍。
20
、递增一个对象属性(如:$this->prop++)要比递增一个局部变量慢3倍。
21
、递增一个未预约义的局部变量要比递增一个预约义的局部变量慢910倍。
22
、仅定义一个局部变量而没在函数中调用它,一样会减慢速度(其程度至关于递增一个局部变量)。PHP大概会检查看是否存在全局变量。
23
、方法调用看来与类中定义的方法的数量无关,由于我(在测试方法以前和以后都)添加了10个方法,但性能上没有变化。
24
、派生类中的方法运行起来要快于在基类中定义的一样的方法。
25
、调用带有一个参数的空函数,其花费的时间至关于执行78次的局部变量递增操做。相似的方法调用所花费的时间接近于15次的局部变量递增操做。
26
Apache解析一个PHP脚本的时间要比解析一个静态HTML页面慢210倍。尽可能多用静态HTML页面,少用脚本。
27
、除非脚本能够缓存,不然每次调用时都会从新编译一次。引入一套PHP缓存机制一般能够提高25%100%的性能,以避免除编译开销。
28
、尽可能作缓存,可以使用memcachedmemcached是一款高性能的内存对象缓存系统,可用来加速动态Web应用程序,减轻数据库负载。对运算码(OP code)的缓存颇有用,使得脚本没必要为每一个请求作从新编译。
29
、当操做字符串并须要检验其长度是否知足某种要求时,你想固然地会使用strlen()函数。此函数执行起来至关快,由于它不作任何计算,只返回在zval 结构(C的内置数据结构,用于存储PHP变量)中存储的已知字符串长度。可是,因为strlen()是函数,多多少少会有些慢,由于函数调用会通过诸多步骤,如字母小写化(译注:指函数名小写化,PHP不区分函数名大小写)、哈希查找,会跟随被调用的函数一块儿执行。在某些状况下,你可使用isset() 技巧加速执行你的代码。
(举例以下)
if (strlen($foo) < 5) { echo “Foo is too short”$$ }
(与下面的技巧作比较)
if (!isset($foo{5})) { echo “Foo is too short”$$ }
调用isset()恰巧比strlen()快,由于与后者不一样的是,isset()做为一种语言结构,意味着它的执行不须要函数查找和字母小写化。也就是说,实际上在检验字符串长度的顶层代码中你没有花太多开销。
34
、当执行变量$i的递增或递减时,$i++会比++$i慢一些。这种差别是PHP特有的,并不适用于其余语言,因此请不要修改你的CJava代码并期望它们能当即变快,没用的。++$i更快是由于它只须要3条指令(opcodes)$i++ 则须要4条指令。后置递增实际上会产生一个临时变量,这个临时变量随后被递增。而前置递增直接在原值上递增。这是最优化处理的一种,正如ZendPHP 优化器所做的那样。牢记这个优化处理不失为一个好主意,由于并非全部的指令优化器都会作一样的优化处理,而且存在大量没有装配指令优化器的互联网服务提供商(ISPs)和服务器。
35
、并非事必面向对象(OOP),面向对象每每开销很大,每一个方法和对象调用都会消耗不少内存。
36
、并不是要用类实现全部的数据结构,数组也颇有用。
37
、不要把方法细分得过多,仔细想一想你真正打算重用的是哪些代码?
38
、当你须要时,你总能把代码分解成方法。
39
、尽可能采用大量的PHP 内置函数。
40
、若是在代码中存在大量耗时的函数,你能够考虑用C扩展的方式实现它们。
41
、评估检验(profile)你的代码。检验器会告诉你,代码的哪些部分消耗了多少时间。Xdebug调试器包含了检验程序,评估检验整体上能够显示出代码的瓶颈。
42
mod_zip可做为Apache模块,用来即时压缩你的数据,并可以让数据传输量下降80%
43
、在能够用file_get_contents替代filefopenfeoffgets等系列方法的状况下,尽可能用file_get_contents,由于他的效率高得多!可是要注意file_get_contents在打开一个URL文件时候的PHP版本问题;
44
、尽可能的少进行文件操做,虽然PHP的文件操做效率也不低的;
45
、优化Select SQL语句,在可能的状况下尽可能少的进行InsertUpdate操做
46
、尽量的使用PHP内部函数(可是我却为了找个PHP里面不存在的函数,浪费了本能够写出一个自定义函数的时间,经验问题啊!);
47
、循环内部不要**变量,尤为是大变量:对象(这好像不仅是PHP里面要注意的问题吧?)
48
、多维数组尽可能不要循环嵌套赋值;
49
、在能够用PHP内部字符串操做函数的状况下,不要用正则表达式;
50
foreach效率更高,尽可能用foreach代替whilefor循环;
51
、用单引号替代双引号引用字符串;
52
i+=1代替i=i+1。符合c/c++的习惯,效率还高
53
、对global变量,应该用完就unset()掉;

相关文章
相关标签/搜索