PHP并发IO编程
并发 IO 问题一直是服务器端编程中的技术难题,从最先的同步阻塞直接 Fork 进程,到 Worker 进程池/线程池,到如今的异步IO、协程。PHP 程序员由于有强大的 LAMP 框架,对这类底层方面的知识知之甚少,本文目的就是详细介绍 PHP 进行并发 IO 编程的各类尝试,最后再介绍 Swoole 的使用,深刻浅出全面解析并发 IO 问题。php
多进程/多线程同步阻塞
最先的服务器端程序都是经过多进程、多线程来解决并发IO的问题。进程模型出现的最先,从 Unix 系统诞生就开始有了进程的概念。最先的服务器端程序通常都是 Accept 一个客户端链接就建立一个进程,而后子进程进入循环同步阻塞地与客户端链接进行交互,收发处理数据。
react
多线程模式出现要晚一些,线程与进程相比更轻量,并且线程之间是共享内存堆栈的,因此不一样的线程之间交互很是容易实现。好比聊天室这样的程序,客户端链接之间能够交互,比聊天室中的玩家能够任意的其余人发消息。用多线程模式实现很是简单,线程中能够直接向某一个客户端链接发送数据。而多进程模式就要用到管道、消息队列、共享内存,统称进程间通讯(IPC)复杂的技术才能实现。程序员
代码实例:
面试
多进程/线程模型的流程是算法
- 建立一个 socket,绑定服务器端口(bind),监听端口(listen),在PHP中用stream_socket_server一个函数就能完成上面3个步骤,固然也可使用更底层的sockets扩展分别实现。
- 进入while循环,阻塞在accept操做上,等待客户端链接进入。此时程序会进入睡眠状态,直到有新的客户端发起connect到服务器,操做系统会唤醒此进程。accept函数返回客户端链接的socket
- 主进程在多进程模型下经过fork(php: pcntl_fork)建立子进程,多线程模型下使用pthread_create(php: new Thread)建立子线程。下文如无特殊声明将使用进程同时表示进程/线程。
- 子进程建立成功后进入while循环,阻塞在recv(php: fread)调用上,等待客户端向服务器发送数据。收到数据后服务器程序进行处理而后使用send(php: fwrite)向客户端发送响应。长链接的服务会持续与客户端交互,而短链接服务通常收到响应就会close。
- 当客户端链接关闭时,子进程退出并销毁全部资源。主进程会回收掉此子进程。
这种模式最大的问题是,进程/线程建立和销毁的开销很大。因此上面的模式没办法应用于很是繁忙的服务器程序。对应的改进版解决了此问题,这就是经典的 Leader-Follower 模型。编程
代码实例:
数组
它的特色是程序启动后就会建立N个进程。每一个子进程进入 Accept,等待新的链接进入。当客户端链接到服务器时,其中一个子进程会被唤醒,开始处理客户端请求,而且再也不接受新的TCP链接。当此链接关闭时,子进程会释放,从新进入 Accept ,参与处理新的链接。缓存
这个模型的优点是彻底能够复用进程,没有额外消耗,性能很是好。不少常见的服务器程序都是基于此模型的,好比 Apache 、PHP-FPM。服务器
- 这种模型严重依赖进程的数量解决并发问题,一个客户端链接就须要占用一个进程,工做进程的数量有多少,并发处理能力就有多少。操做系统能够建立的进程数量是有限的。
- 启动大量进程会带来额外的进程调度消耗。数百个进程时可能进程上下文切换调度消耗占CPU不到1%能够忽略不计,若是启动数千甚至数万个进程,消耗就会直线上升。调度消耗可能占到 CPU 的百分之几十甚至 100%。
另外有一些场景多进程模型没法解决,好比即时聊天程序(IM),一台服务器要同时维持上万甚至几十万上百万的链接(经典的C10K问题),多进程模型就力不从心了。
还有一种场景也是多进程模型的软肋。一般Web服务器启动100个进程,若是一个请求消耗100ms,100个进程能够提供1000qps,这样的处理能力仍是不错的。可是若是请求内要调用外网Http接口,像QQ、微博登陆,耗时会很长,一个请求须要10s。那一个进程1秒只能处理0.1个请求,100个进程只能达到10qps,这样的处理能力就太差了。
有没有一种技术能够在一个进程内处理全部并发IO呢?答案是有,这就是IO复用技术。
IO复用/事件循环/异步非阻塞
其实IO复用的历史和多进程同样长,Linux很早就提供了 select 系统调用,能够在一个进程内维持1024个链接。后来又加入了poll系统调用,poll作了一些改进,解决了 1024 限制的问题,能够维持任意数量的链接。但select/poll还有一个问题就是,它须要循环检测链接是否有事件。这样问题就来了,若是服务器有100万个链接,在某一时间只有一个链接向服务器发送了数据,select/poll须要作循环100万次,其中只有1次是命中的,剩下的99万9999次都是无效的,白白浪费了CPU资源。
直到Linux 2.6内核提供了新的epoll系统调用,能够维持无限数量的链接,并且无需轮询,这才真正解决了 C10K 问题。如今各类高并发异步IO的服务器程序都是基于epoll实现的,好比Nginx、Node.js、Erlang、Golang。像 Node.js 这样单进程单线程的程序,均可以维持超过1百万TCP链接,所有归功于epoll技术。
IO复用异步非阻塞程序使用经典的Reactor模型,Reactor顾名思义就是反应堆的意思,它自己不处理任何数据收发。只是能够监视一个socket句柄的事件变化。

Reactor有4个核心的操做:
- add添加socket监听到reactor,能够是listen socket也可使客户端socket,也能够是管道、eventfd、信号等
- set修改事件监听,能够设置监听的类型,如可读、可写。可读很好理解,对于listen socket就是有新客户端链接到来了须要accept。对于客户端链接就是收到数据,须要recv。可写事件比较难理解一些。一个SOCKET是有缓存区的,若是要向客户端链接发送2M的数据,一次性是发不出去的,操做系统默认TCP缓存区只有256K。一次性只能发256K,缓存区满了以后send就会返回EAGAIN错误。这时候就要监听可写事件,在纯异步的编程中,必须去监听可写才能保证send操做是彻底非阻塞的。
- del从reactor中移除,再也不监听事件
- callback就是事件发生后对应的处理逻辑,通常在add/set时制定。C语言用函数指针实现,JS能够用匿名函数,PHP能够用匿名函数、对象方法数组、字符串函数名。
Reactor只是一个事件发生器,实际对socket句柄的操做,如connect/accept、send/recv、close是在callback中完成的。具体编码可参考下面的伪代码:

Reactor模型还能够与多进程、多线程结合起来用,既实现异步非阻塞IO,又利用到多核。目前流行的异步服务器程序都是这样的方式:如
- Nginx:多进程Reactor
- Nginx+Lua:多进程Reactor+协程
- Golang:单线程Reactor+多线程协程
- Swoole:多线程Reactor+多进程Worker
协程是什么
协程从底层技术角度看实际上仍是异步IO Reactor模型,应用层自行实现了任务调度,借助Reactor切换各个当前执行的用户态线程,但用户代码中彻底感知不到Reactor的存在。
PHP并发IO编程实践
PHP相关扩展
- Stream:PHP内核提供的socket封装
- Sockets:对底层Socket API的封装
- Libevent:对libevent库的封装
- Event:基于Libevent更高级的封装,提供了面向对象接口、定时器、信号处理的支持
- Pcntl/Posix:多进程、信号、进程管理的支持
- Pthread:多线程、线程管理、锁的支持
- PHP还有共享内存、信号量、消息队列的相关扩展
- PECL:PHP的扩展库,包括系统底层、数据分析、算法、驱动、科学计算、图形等都有。若是PHP标准库中没有找到,能够在PECL寻找想要的功能。
PHP语言的优劣势
PHP的优势:
- 第一个是简单,PHP比其余任何的语言都要简单,入门的话PHP真的是能够一周就入门。C++有一本书叫作《21天深刻学习C++》,其实21天根本不可能学会,甚至能够说C++没有3-5年不可能深刻掌握。可是PHP绝对能够7天入门。因此PHP程序员的数量很是多,招聘比其余语言更容易。
- PHP的功能很是强大,由于PHP官方的标准库和扩展库里提供了作服务器编程能用到的99%的东西。PHP的PECL扩展库里你想要的任何的功能。
- 另外PHP有超过20年的历史,生态圈是很是大的,在Github能够找到不少代码。
PHP的缺点:
- 性能比较差,由于毕竟是动态脚本,不适合作密集运算,若是一样的 PHP 程序使用 C/C++ 来写,PHP 版本要比它差一百倍。
- 函数命名规范差,这一点你们都是了解的,PHP更讲究实用性,没有一些规范。一些函数的命名是很混乱的,因此每次你必须去翻PHP的手册。
- 提供的数据结构和函数的接口粒度比较粗。PHP只有一个Array数据结构,底层基于HashTable。PHP的Array集合了Map,Set,Vector,Queue,Stack,Heap等数据结构的功能。另外PHP有一个SPL提供了其余数据结构的类封装。
- PHP更适合偏实际应用层面的程序,业务开发、快速实现的利器
- PHP不适合开发底层软件
- 使用C/C++、JAVA、Golang等静态编译语言做为PHP的补充,动静结合
- 借助IDE工具实现自动补全、语法提示