前些天帮同事查一个问题,第一次接触到了 PHP 的多线程,原觉得 PHP 广泛都是单线程模型,并不适合多线程领域,花些时间翻了几个多线程的项目源码以后,发现 PHP 的多线程也很有可取之处,活用起来,用来解决某些问题居然很是适合。php
因而找了几篇文章看了下 PHP 多线程 TSRM
机制的实现,也有所收获,详情能够查看下面的参考文章。本文对比多进程介绍了下多线程的优点和适用场景,提出了一种巧用方案,并使用 PHP 代码实现了多线程的常见用法。css
文章欢迎转载,但请注明来源:http://www.cnblogs.com/zhenbianshu/p/7978835.html, 谢谢。html
首先说下线程:程序员
线程(thread) 是操做系统可以进行运算调度的最小单位。它被包含在进程之中,是进程中的实际运做单位。一条线程指的是进程中一个单一顺序的控制流,一个进程中能够并发多个线程,每条线程并行执行不一样的任务.web
使用多线程主要是由于它在执行效率上有很大优点。因为线程是操做系统可以进行调度的最小单位
:数据库
同时对比多进程程序,多线程有如下特色:编程
多线程的优化是不少,但是无脑使用多线程并不能提高程序的执行效率,由于线程的建立和销毁、上下文切换、线程同步等也是有性能损耗的,耗费时间可能比顺序执行的代码还多。如:数组
sumSmall
是一个从1累加到50000的函数。安全
上图是在主线程内执行了三次 sumSmall 和三个线程分别执行 sumSmall ,再将结果同步到一个线程的时间对比,咱们会发现只在主线程执行的时间反而更短,三个线程建立、切换、同步的时间远远大过了线程异步执行节省的时间。网络
而函数 sumLarge 从1累加到5000000,下图同一线程执行三次和三个线程执行的耗时:
此次,多线程终于有效率优点了。
是否使用多线程还须要根据具体需求而定,通常考虑如下两种状况:
PHP 默认并不支持多线程,要使用多线程须要安装 pthread 扩展,而要安装 pthread 扩展,必须使用 --enable-maintainer-zts
参数从新编译 PHP,这个参数是指定编译 PHP 时使用线程安全方式。
多线程是让程序变得不安分的一个因素,在使用多线程以前,首先要考虑线程安全问题:
线程安全:线程安全是编程中的术语,指某个函数、函数库在多线程环境中被调用时,可以正确地处理多个线程之间的共享变量,使程序功能正确完成。
在传统多线程中,因为多个线程共享变量,因此可能会致使出现以下问题:
$arr = array('a');
;$a = array_pop($arr); $a = 'a';
;$b = array_pop($arr); $a = null;
;PHP 实现的线程安全主要是使用 TSRM
机制对 全局变量和静态变量进行了隔离
,将全局变量和静态变量 给每一个线程都复制了一份,各线程使用的都是主线程的一个备份,从而避免了变量冲突,也就不会出现线程安全问题。
PHP 对多线程的封装保证了线程安全,程序员不用考虑对全局变量加各类锁来避免读写冲突了,同时也减小了出错的机会,写出的代码更加安全。
但由此致使的是,子线程一旦开始运行,主线程便没法再对子线程运行细节进行调整了,线程必定程度上失去了线程之间经过全局变量进行消息传递的能力。
同时 PHP 开启线程安全选项后,使用 TSRM
机制分配和使用变量时也会有额外的损耗,因此在不须要多线程的 PHP 环境中,使用 PHP 的 ZTS (非线程安全) 版本就好。
PHP 将线程 封装成了 Thread
类,线程的建立经过实例化一个线程对象来实现,因为类的封装性,变量的使用只能经过构造函数传入,而线程运算结果也须要经过类变量传出。
下面介绍几个经常使用的 Thread 类方法:
run()
:此方法是一个抽象方法,每一个线程都要实现此方法,线程开始运行后,此方法中的代码会自动执行;start()
:在主线程内调用此方法以开始运行一个线程;join()
:各个线程相对于主线程都是异步执行,调用此方法会等待线程执行结束;kill()
:强制线程结束;isRunning()
:返回线程的运行状态,线程正在执行run()
方法的代码时会返回 true;由于线程安全的实现,PHP 的多线程开始运行后,没法再经过共享内存空间通讯,线程也没法经过线程间通讯复用,因此我认为 PHP 的“线程池”并无什么意义。扩展内自带的Pool
类是一个对多线程分配管理的类,这里也再也不多介绍了。
下面是一个线程类,用来请求某一接口。接下来根据它写两个多线程的应用实例:
class Request extends Thread { public $url; public $response; public function __construct($url) { $this->url = $url; } public function run() { $this->response = file_get_contents($this->url); } }
将同步的请求拆分为多个线程异步调用,以提高程序的运行效率。
$chG = new Request("www.google.com"); $chB = new Request("www.baidu.com"); $chG ->start(); $chB ->start(); $chG->join(); $chB->join(); $gl = $chG->response; $bd = $chB->response;
偶然间发现公司网站某一网页上的一块内容时有时无,不知道具体实现,但这给了我使用多线程的灵感:利用线程异步实现快速失败和超时控制。
咱们在使用 curl 请求某个地址时,能够经过 CURLOPT_CONNECTTIMEOUT / CURLOPT_TIMEOUT
参数分别设置 curl 的链接超时时间和读取数据超时时间,但总的超时时间很差控制。并且在进行数据库查询时的超时时间没法设置(鸟哥博客:为MySQL设置查询超时)。
这时咱们即可以借用多线程来实现此功能:在执行线程类的 start()
方法后,不调用 join()
方法,使线程一直处于异步状态,不阻塞主线程的执行。
此时主线程至关于旗舰,而各子线程至关于巡航舰,旗舰到达某地后没必要要一直等待巡航舰也归来,等待一段时间后离开便可,从而避免巡航舰意外时旗舰白白空等。
代码:
$chG = new Request("www.google.com"); $chB = new Request("www.baidu.com"); $chG->start(); $chB->start(); $chB->join(); // 此处不对chG执行join方法 sleep(1); // sleep一个能接受的超时时间 $gl = $chG->response; $bd = $chB->response; $bd->kill(); if (!$gl) { $gl = ""; // 处理异常,或在线程类内给$gl一个默认值 }
PHP 对多线程进行的封(yan)装(ge),让人用线程用得很是不尽兴。虽然安全,也保持 PHP 简单易用的一向风格,却没法彻底发挥多线程的能力。不过各个语言各有特点和侧重点,也没必要强求,爱她就要包容她 =_=。
最近在重学操做系统和 Linux 内核方面的知识,对程序的认知有了很大提高,感受很是有必要总结一下,敬请期待。
关于本文有什么问题能够在下面留言交流,若是您以为本文对您有帮助,能够点击下面的 推荐
支持一下我,博客一直在更新,欢迎 关注
。
参考: