转载：PHP 协程实现

时间 2019-11-08

标签转载 php 实现栏目 PHP 繁體版

原文原文链接

转自：https://newt0n.github.io/2017/02/10/PHP-%E5%8D%8F%E7%A8%8B%E5%8E%9F%E7%90%86/php

实现 PHP 协程须要了解的基本内容。
html

多进程/线程

最先的服务器端程序都是经过多进程、多线程来解决并发IO的问题。进程模型出现的最先，从Unix 系统诞生就开始有了进程的概念。最先的服务器端程序通常都是 Accept 一个客户端链接就建立一个进程，而后子进程进入循环同步阻塞地与客户端链接进行交互，收发处理数据。python

多线程模式出现要晚一些，线程与进程相比更轻量，并且线程之间共享内存堆栈，因此不一样的线程之间交互很是容易实现。好比实现一个聊天室，客户端链接之间能够交互，聊天室中的玩家能够任意的其余人发消息。用多线程模式实现很是简单，线程中能够直接向某一个客户端链接发送数据。而多进程模式就要用到管道、消息队列、共享内存等等统称进程间通讯（IPC）复杂的技术才能实现。git

最简单的多进程服务端模型github

$serv = stream_socket_server("tcp://0.0.0.0:8000", $errno, $errstr)

or die("Create server failed");

while(1) {

$conn = stream_socket_accept($serv);

if (pcntl_fork() == 0) {

$request = fread($conn);

// do something

// $response = "hello world";

fwrite($response);

fclose($conn);

exit(0);

}

多进程/线程模型的流程是：golang

建立一个 socket，绑定服务器端口（bind），监听端口（listen），在 PHP 中用 stream_socket_server 一个函数就能完成上面 3 个步骤，固然也可使用更底层的sockets 扩展分别实现。数据库

进入 while 循环，阻塞在 accept 操做上，等待客户端链接进入。此时程序会进入睡眠状态，直到有新的客户端发起 connect 到服务器，操做系统会唤醒此进程。accept 函数返回客户端链接的 socket 主进程在多进程模型下经过 fork（php: pcntl_fork）建立子进程，多线程模型下使用 pthread_create（php: new Thread）建立子线程。编程

下文如无特殊声明将使用进程同时表示进程/线程。windows

子进程建立成功后进入 while 循环，阻塞在 recv（php:fread）调用上，等待客户端向服务器发送数据。收到数据后服务器程序进行处理而后使用 send（php: fwrite）向客户端发送响应。长链接的服务会持续与客户端交互，而短链接服务通常收到响应就会 close。数组

当客户端链接关闭时，子进程退出并销毁全部资源，主进程会回收掉此子进程。

这种模式最大的问题是，进程建立和销毁的开销很大。因此上面的模式没办法应用于很是繁忙的服务器程序。对应的改进版解决了此问题，这就是经典的 Leader-Follower 模型。

$serv = stream_socket_server("tcp://0.0.0.0:8000", $errno, $errstr)

or die("Create server failed");

for($i = 0; $i < 32; $i++) {

if (pcntl_fork() == 0) {

while(1) {

$conn = stream_socket_accept($serv);

if ($conn == false) continue;

// do something

$request = fread($conn);

// $response = "hello world";

fwrite($response);

fclose($conn);

}

exit(0);

}

它的特色是程序启动后就会建立 N 个进程。每一个子进程进入 Accept，等待新的链接进入。当客户端链接到服务器时，其中一个子进程会被唤醒，开始处理客户端请求，而且再也不接受新的 TCP 链接。当此链接关闭时，子进程会释放，从新进入 Accept，参与处理新的链接。

这个模型的优点是彻底能够复用进程，没有额外消耗，性能很是好。不少常见的服务器程序都是基于此模型的，好比 Apache、PHP-FPM。

多进程模型也有一些缺点。

这种模型严重依赖进程的数量解决并发问题，一个客户端链接就须要占用一个进程，工做进程的数量有多少，并发处理能力就有多少。操做系统能够建立的进程数量是有限的。

启动大量进程会带来额外的进程调度消耗。数百个进程时可能进程上下文切换调度消耗占 CPU 不到 1% 能够忽略不计，若是启动数千甚至数万个进程，消耗就会直线上升。调度消耗可能占到 CPU 的百分之几十甚至 100%。

并行和并发

谈到多进程以及相似同时执行多个任务的模型，就不得不先谈谈并行和并发。

并发（Concurrency）

是指能处理多个同时活动的能力，并发事件之间不必定要同一时刻发生。

并行（Parallesim）

是指同时刻发生的两个并发事件，具备并发的含义，但并发不必定并行。

区别

『并发』指的是程序的结构，『并行』指的是程序运行时的状态
『并行』必定是并发的，『并行』是『并发』设计的一种
单线程永远没法达到『并行』状态

正确的并发设计的标准是：

使多个操做能够在重叠的时间段内进行。
two tasks can start, run, and complete in overlapping time periods

参考：

迭代器 & 生成器

在了解 PHP 协程前，还有迭代器和生成器这两个概念须要先认识一下。

迭代器

PHP5 开始内置了 Iterator 即迭代器接口，因此若是你定义了一个类，并实现了Iterator 接口，那么你的这个类对象就是 ZEND_ITER_OBJECT 便可迭代的，不然就是 ZEND_ITER_PLAIN_OBJECT。

对于 ZEND_ITER_PLAIN_OBJECT 的类，foreach 会获取该对象的默认属性数组，而后对该数组进行迭代。

而对于 ZEND_ITER_OBJECT 的类对象，则会经过调用对象实现的 Iterator 接口相关函数来进行迭代。

任何实现了 Iterator 接口的类都是可迭代的，即均可以用 foreach 语句来遍历。

Iterator 接口

interface Iterator extends Traversable

{

// 获取当前内部标量指向的元素的数据

public mixed current()

// 获取当前标量

public scalar key()

// 移动到下一个标量

public void next()

// 重置标量

public void rewind()

// 检查当前标量是否有效

public boolean valid()

}

常规实现 range 函数

PHP 自带的 range 函数原型：

range — 根据范围建立数组，包含指定的元素

array range (mixed $start , mixed $end [, number $step = 1 ])

创建一个包含指定范围单元的数组。

在不使用迭代器的状况要实现一个和 PHP 自带的 range 函数相似的功能，可能会这么写：

function range ($start, $end, $step = 1)

{

$ret = [];

for ($i = $start; $i <= $end; $i += $step) {

$ret[] = $i;

}

return $ret;

}

须要将生成的全部元素放在内存数组中，若是须要生成一个很是大的集合，则会占用巨大的内存。

迭代器实现 xrange 函数

来看看迭代实现的 range，咱们叫作 xrange，他实现了 Iterator 接口必须的 5 个方法：

class Xrange implements Iterator

{

protected $start;

protected $limit;

protected $step;

protected $current;

public function __construct($start, $limit, $step = 1)

{

$this->start = $start;

$this->limit = $limit;

$this->step = $step;

}

public function rewind()

{

$this->current = $this->start;

}

public function next()

{

$this->current += $this->step;

}

public function current()

{

return $this->current;

}

public function key()

{

return $this->current + 1;

}

public function valid()

{

return $this->current <= $this->limit;

}

使用时代码以下：

foreach (new Xrange(0, 9) as $key => $val) {

echo $key, ' ', $val, "\n";

}

输出：

0 0

1 1

2 2

3 3

4 4

5 5

6 6

7 7

8 8

9 9

看上去功能和 range() 函数所作的一致，不一样点在于迭代的是一个 对象(Object) 而不是数组：

var_dump(new Xrange(0, 9));

输出：

object(Xrange)#1 (4) {

["start":protected]=>

int(0)

["limit":protected]=>

int(9)

["step":protected]=>

int(1)

["current":protected]=>

NULL

}

另外，内存的占用状况也彻底不一样：

// range

$startMemory = memory_get_usage();

$arr = range(0, 500000);

echo 'range(): ', memory_get_usage() - $startMemory, " bytes\n";

unset($arr);

// xrange

$startMemory = memory_get_usage();

$arr = new Xrange(0, 500000);

echo 'xrange(): ', memory_get_usage() - $startMemory, " bytes\n";

输出：

xrange(): 624 bytes

range(): 72194784 bytes

range() 函数在执行后占用了 50W 个元素内存空间，而 xrange 对象在整个迭代过程当中只占用一个对象的内存。

Yii2 Query

在喜闻乐见的各类 PHP 框架里有很多生成器的实例，好比 Yii2 中用来构建 SQL 语句的 \yii\db\Query类：

$query = (new \yii\db\Query)->from('user');

// yii\db\BatchQueryResult

foreach ($query->batch() as $users) {

// 每次循环获得多条 user 记录

}

来看一下 batch() 作了什么：

/**

* Starts a batch query.

* A batch query supports fetching data in batches, which can keep the memory usage under a limit.

* This method will return a [[BatchQueryResult]] object which implements the [[\Iterator]] interface

* and can be traversed to retrieve the data in batches.

* For example,

* $query = (new Query)->from('user');

* foreach ($query->batch() as $rows) {

* // $rows is an array of 10 or fewer rows from user table

* }

* @param integer $batchSize the number of records to be fetched in each batch.

* @param Connection $db the database connection. If not set, the "db" application component will be used.

* @return BatchQueryResult the batch query result. It implements the [[\Iterator]] interface

* and can be traversed to retrieve the data in batches.

public function batch($batchSize = 100, $db = null)

{

return Yii::createObject([

'class' => BatchQueryResult::className(),

'query' => $this,

'batchSize' => $batchSize,

'db' => $db,

'each' => false,

]);

}

实际上返回了一个 BatchQueryResult 类，类的源码实现了 Iterator 接口 5 个关键方法：

class BatchQueryResult extends Object implements \Iterator

{

public $db;

public $query;

public $batchSize = 100;

public $each = false;

private $_dataReader;

private $_batch;

private $_value;

private $_key;

/**

* Destructor.

public function __destruct()

{

// make sure cursor is closed

$this->reset();

}

/**

* Resets the batch query.

* This method will clean up the existing batch query so that a new batch query can be performed.

public function reset()

{

if ($this->_dataReader !== null) {

$this->_dataReader->close();

}

$this->_dataReader = null;

$this->_batch = null;

$this->_value = null;

$this->_key = null;

}

/**

* Resets the iterator to the initial state.

* This method is required by the interface [[\Iterator]].

public function rewind()

{

$this->reset();

$this->next();

}

/**

* Moves the internal pointer to the next dataset.

* This method is required by the interface [[\Iterator]].

public function next()

{

if ($this->_batch === null || !$this->each || $this->each && next($this->_batch) === false) {

$this->_batch = $this->fetchData();

reset($this->_batch);

}

if ($this->each) {

$this->_value = current($this->_batch);

if ($this->query->indexBy !== null) {

$this->_key = key($this->_batch);

} elseif (key($this->_batch) !== null) {

$this->_key++;

} else {

$this->_key = null;

}

} else {

$this->_value = $this->_batch;

$this->_key = $this->_key === null ? 0 : $this->_key + 1;

}

/**

* Fetches the next batch of data.

* @return array the data fetched

protected function fetchData()

{

// ...

}

/**

* Returns the index of the current dataset.

* This method is required by the interface [[\Iterator]].

* @return integer the index of the current row.

public function key()

{

return $this->_key;

}

/**

* Returns the current dataset.

* This method is required by the interface [[\Iterator]].

* @return mixed the current dataset.

public function current()

{

return $this->_value;

}

/**

* Returns whether there is a valid dataset at the current position.

* This method is required by the interface [[\Iterator]].

* @return boolean whether there is a valid dataset at the current position.

public function valid()

{

return !empty($this->_batch);

}

以迭代器的方式实现了相似分页取的效果，同时避免了一次性取出全部数据占用太多的内存空间。

迭代器使用场景

使用返回迭代器的包或库时（如 PHP5 中的 SPL 迭代器）
没法在一次调用获取所需的全部元素时
要处理数量巨大的元素时（数据库中要处理的结果集内容超过内存）
…

生成器

须要 PHP 5 >= 5.5.0 或 PHP 7

虽然迭代器仅需继承接口便可实现，但毕竟须要定义一整个类而后实现接口的全部方法，实在是不怎么方便。

生成器则提供了一种更简单的方式来实现简单的对象迭代，相比定义类来实现 Iterator 接口的方式，性能开销和复杂度大大下降。
PHP Manual

生成器容许在 foreach 代码块中迭代一组数据而不须要建立任何数组。一个生成器函数，就像一个普通的有返回值的自定义函数相似，但普通函数只返回一次, 而生成器能够根据须要经过 yield 关键字返回屡次，以便连续生成须要迭代返回的值。

一个最简单的例子就是使用生成器来从新实现 xrange() 函数。效果和上面咱们用迭代器实现的差很少，但实现起来要简单的多。

生成器实现 `xrange` 函数

function xrange($start, $limit, $step = 1) {

for ($i = 0; $i < $limit; $i += $step) {

yield $i + 1 => $i;

}

foreach (xrange(0, 9) as $key => $val) {

printf("%d %d \n", $key, $val);

}

// 输出

// 1 0

// 2 1

// 3 2

// 4 3

// 5 4

// 6 5

// 7 6

// 8 7

// 9 8

实际上生成器生成的正是一个迭代器对象实例，该迭代器对象继承了 Iterator 接口，同时也包含了生成器对象自有的接口，具体能够参考 Generator 类的定义以及语法参考。

同时须要注意的是：

一个生成器不能够返回值，这样作会产生一个编译错误。然而 return 空是一个有效的语法而且它将会终止生成器继续执行。

yield 关键字

须要注意的是 yield 关键字，这是生成器的关键。经过上面的例子能够看出，yield 会将当前产生的值传递给 foreach，换句话说，foreach 每一次迭代过程都会从 yield 处取一个值，直到整个遍历过程再也不能执行到 yield 时遍历结束，此时生成器函数简单的退出，而调用生成器的上层代码还能够继续执行，就像一个数组已经被遍历完了。

yield 最简单的调用形式看起来像一个 return 申明，不一样的是 yield 暂停当前过程的执行并返回值，而 return 是中断当前过程并返回值。暂停当前过程，意味着将处理权转交由上一级继续进行，直到上一级再次调用被暂停的过程，该过程又会从上一次暂停的位置继续执行。这像是什么呢？若是以前已经在鸟哥的文章中粗略看过，应该知道这很像操做系统的进程调度，多个进程在一个 CPU 核心上执行，在系统调度下每个进程执行一段指令就被暂停，切换到下一个进程，这样外部用户看起来就像是同时在执行多个任务。

但仅仅如此还不够，yield 除了能够返回值之外，还能接收值，也就是能够在两个层级间实现双向通讯。

来看看如何传递一个值给 yield：

function printer()

{

while (true) {

printf("receive: %s\n", yield);

}

$printer = printer();

$printer->send('hello');

$printer->send('world');

// 输出

receive: hello

receive: world

根据 PHP 官方文档的描述能够知道 Generator 对象除了实现 Iterator 接口中的必要方法之外，还有一个 send 方法，这个方法就是向 yield 语句处传递一个值，同时从 yield 语句处继续执行，直至再次遇到 yield 后控制权回到外部。

既然 yield 能够在其位置中断并返回或者接收一个值，那能不能同时进行接收和返回呢？固然，这也是实现协程的根本。对上述代码作出修改：

function printer()

{

$i = 0;

while (true) {

printf("receive: %s\n", (yield ++$i));

}

$printer = printer();

printf("%d\n", $printer->current());

$printer->send('hello');

printf("%d\n", $printer->current());

$printer->send('world');

printf("%d\n", $printer->current());

// 输出

receive: hello

receive: world

这是另外一个例子：

function gen() {

$ret = (yield 'yield1');

var_dump($ret);

$ret = (yield 'yield2');

var_dump($ret);

}

$gen = gen();

var_dump($gen->current()); // string(6) "yield1"

var_dump($gen->send('ret1')); // string(4) "ret1" (第一个 var_dump)

// string(6) "yield2" (继续执行到第二个 yield，吐出了返回值)

var_dump($gen->send('ret2')); // string(4) "ret2" (第二个 var_dump)

// NULL (var_dump 以后没有其余语句，因此此次 ->send() 的返回值为 null)

current 方法是迭代器 Iterator 接口必要的方法，foreach 语句每一次迭代都会经过其获取当前值，然后调用迭代器的 next 方法。在上述例子里则是手动调用了 current 方法获取值。

上述例子已经足以表示 yield 可以做为实现双向通讯的工具，也就是具有了后续实现协程的基本条件。

上面的例子若是第一次接触并稍加思考，难免会疑惑为何一个 yield 既是语句又是表达式，并且这两种状况还同时存在：

对于全部在生成器函数中出现的 yield，首先它都是语句，而跟在 yield 后面的任何表达式的值将做为调用生成器函数的返回值，若是 yield 后面没有任何表达式（变量、常量都是表达式），那么它会返回 NULL，这一点和 return 语句一致。
yield 也是表达式，它的值就是 send 函数传过来的值（至关于一个特殊变量，只不过赋值是经过 send 函数进行的）。只要调用send方法，而且生成器对象的迭代并未终结，那么当前位置的 yield 就会获得 send 方法传递过来的值，这和生成器函数有没有把这个值赋值给某个变量没有任何关系。

这个地方可能须要仔细品味上面两个 send() 方法的例子才能理解。但能够简单的记住：

任什么时候候 yield 关键词便是语句：能够为生成器函数返回值；也是表达式：能够接收生成器对象发过来的值。

除了 send() 方法，还有一种控制生成器执行的方法是 next() 函数：

Next()，恢复生成器函数的执行直到下一个 yield
Send()，向生成器传入一个值，恢复执行直到下一个 yield

协程

对于单核处理器，多进程实现多任务的原理是让操做系统给一个任务每次分配必定的 CPU 时间片，而后中断、让下一个任务执行必定的时间片接着再中断并继续执行下一个，如此反复。因为切换执行任务的速度很是快，给外部用户的感觉就是多个任务的执行是同时进行的。

多进程的调度是由操做系统来实现的，进程自身不能控制本身什么时候被调度，也就是说：

进程的调度是由外层调度器抢占式实现的

而协程要求当前正在运行的任务自动把控制权回传给调度器，这样就能够继续运行其余任务。这与『抢占式』的多任务正好相反, 抢占多任务的调度器能够强制中断正在运行的任务, 无论它本身有没有意愿。『协做式多任务』在 Windows 的早期版本 (windows95) 和 Mac OS 中有使用, 不过它们后来都切换到『抢占式多任务』了。理由至关明确：若是仅依靠程序自动交出控制的话，那么一些恶意程序将会很容易占用所有 CPU 时间而不与其余任务共享。

协程的调度是由协程自身主动让出控制权到外层调度器实现的

回到刚才生成器实现 xrange 函数的例子，整个执行过程的交替能够用下图来表示：

协程能够理解为纯用户态的线程，经过协做而不是抢占来进行任务切换。相对于进程或者线程，协程全部的操做均可以在用户态而非操做系统内核态完成，建立和切换的消耗很是低。

简单的说 Coroutine（协程）就是提供一种方法来中断当前任务的执行，保存当前的局部变量，下次再过来又能够恢复当前局部变量继续执行。

咱们能够把大任务拆分红多个小任务轮流执行，若是有某个小任务在等待系统 IO，就跳过它，执行下一个小任务，这样往复调度，实现了 IO 操做和 CPU 计算的并行执行，整体上就提高了任务的执行效率，这也即是协程的意义。

PHP 协程和 yield

PHP 从 5.5 开始支持生成器及 yield 关键字，而 PHP 协程则由 yield 来实现。

要理解协程，首先要理解：代码是代码，函数是函数。函数包裹的代码赋予了这段代码附加的意义：无论是否显式的指明返回值，当函数内的代码块执行完后都会返回到调用层。而当调用层调用某个函数的时候，必须等这个函数返回，当前函数才能继续执行，这就构成了后进先出，也就是 Stack。

而协程包裹的代码，不是函数，不彻底遵照函数的附加意义，协程执行到某个点，协会协程会 yield返回一个值而后挂起，而不是 return 一个值而后结束，当再次调用协程的时候，会在上次 yield 的点继续执行。

因此协程违背了一般操做系统和 x86 的 CPU 认定的代码执行方式，也就是 Stack 的这种执行方式，须要运行环境（好比 php，python 的 yield 和 golang 的 goroutine）本身调度，来实现任务的中断和恢复，具体到 PHP，就是靠 yield 来实现。

堆栈式调用和协程调用的对比：

结合以前的例子，能够总结一下 yield 能作的就是：

实现不一样任务间的主动让位、让行，把控制权交回给任务调度器。
经过 send() 实现不一样任务间的双向通讯，也就能够实现任务和调度器之间的通讯。

yield 就是 PHP 实现协程的方式。

协程多任务调度

下面是雄文 Cooperative multitasking using coroutines (in PHP!) 里一个简单但完整的例子，来展现如何具体的在 PHP 里实现协程任务的调度。

首先是一个任务类：

Task

class Task

{

// 任务 ID

protected $taskId;

// 协程对象

protected $coroutine;

// send() 值

protected $sendVal = null;

// 是否首次 yield

protected $beforeFirstYield = true;

public function __construct($taskId, Generator $coroutine) {

$this->taskId = $taskId;

$this->coroutine = $coroutine;

}

public function getTaskId() {

return $this->taskId;

}

public function setSendValue($sendVal) {

$this->sendVal = $sendVal;

}

public function run() {

// 如以前提到的在send以前, 当迭代器被建立后第一次 yield 以前，一个 renwind() 方法会被隐式调用

// 因此实际上发生的应该相似:

// $this->coroutine->rewind();

// $this->coroutine->send();

// 这样 renwind 的执行将会致使第一个 yield 被执行, 而且忽略了他的返回值.

// 真正当咱们调用 yield 的时候, 咱们获得的是第二个yield的值，致使第一个yield的值被忽略。

// 因此这个加上一个是否第一次 yield 的判断来避免这个问题

if ($this->beforeFirstYield) {

$this->beforeFirstYield = false;

return $this->coroutine->current();

} else {

$retval = $this->coroutine->send($this->sendVal);

$this->sendVal = null;

return $retval;

}

public function isFinished() {

return !$this->coroutine->valid();

}

接下来是调度器，比 foreach 是要复杂一点，但好歹也能算个正儿八经的 Scheduler :)

Scheduler

class Scheduler

{

protected $maxTaskId = 0;

protected $taskMap = []; // taskId => task

protected $taskQueue;

public function __construct() {

$this->taskQueue = new SplQueue();

}

// （使用下一个空闲的任务id）建立一个新任务,而后把这个任务放入任务map数组里. 接着它经过把任务放入任务队列里来实现对任务的调度. 接着run()方法扫描任务队列, 运行任务.若是一个任务结束了, 那么它将从队列里删除, 不然它将在队列的末尾再次被调度。

public function newTask(Generator $coroutine) {

$tid = ++$this->maxTaskId;

$task = new Task($tid, $coroutine);

$this->taskMap[$tid] = $task;

$this->schedule($task);

return $tid;

}

public function schedule(Task $task) {

// 任务入队

$this->queue->enqueue($task);

}

public function run() {

while (!$this->queue->isEmpty()) {

// 任务出队

$task = $this->queue->dequeue();

$task->run();

if ($task->isFinished()) {

unset($this->taskMap[$task->getTaskId()]);

} else {

$this->schedule($task);

}

队列可使每一个任务得到同等的 CPU 使用时间，

Demo

function task1() {

for ($i = 1; $i <= 10; ++$i) {

echo "This is task 1 iteration $i.\n";

yield;

}

function task2() {

for ($i = 1; $i <= 5; ++$i) {

echo "This is task 2 iteration $i.\n";

yield;

}

$scheduler = new Scheduler;

$scheduler->newTask(task1());

$scheduler->newTask(task2());

$scheduler->run();

输出：

This is task 1 iteration 1.

This is task 2 iteration 1.

This is task 1 iteration 2.

This is task 2 iteration 2.

This is task 1 iteration 3.

This is task 2 iteration 3.

This is task 1 iteration 4.

This is task 2 iteration 4.

This is task 1 iteration 5.

This is task 2 iteration 5.

This is task 1 iteration 6.

This is task 1 iteration 7.

This is task 1 iteration 8.

This is task 1 iteration 9.

This is task 1 iteration 10.

结果正是咱们期待的，最初的 5 次迭代，两个任务是交替进行的，而在第二个任务结束后，只有第一个任务继续执行到结束。

协程非阻塞 IO

若想真正的发挥出协程的做用，那必定是在一些涉及到阻塞 IO 的场景，咱们都知道 Web 服务器最耗时的部分一般都是 socket 读取数据等操做上，若是进程对每一个请求都挂起的等待 IO 操做，那处理效率就过低了，接下来咱们看个支持非阻塞 IO 的 Scheduler：

<?php

class Scheduler

{

protected $maxTaskId = 0;

protected $tasks = []; // taskId => task

protected $queue;

// resourceID => [socket, tasks]

protected $waitingForRead = [];

protected $waitingForWrite = [];

public function __construct() {

// SPL 队列

$this->queue = new SplQueue();

}

public function newTask(Generator $coroutine) {

$tid = ++$this->maxTaskId;

$task = new Task($tid, $coroutine);

$this->tasks[$tid] = $task;

$this->schedule($task);

return $tid;

}

public function schedule(Task $task) {

// 任务入队

$this->queue->enqueue($task);

}

public function run() {

while (!$this->queue->isEmpty()) {

// 任务出队

$task = $this->queue->dequeue();

$task->run();

if ($task->isFinished()) {

unset($this->tasks[$task->getTaskId()]);

} else {

$this->schedule($task);

}

public function waitForRead($socket, Task $task)

{

if (isset($this->waitingForRead[(int)$socket])) {

$this->waitingForRead[(int)$socket][1][] = $task;

} else {

$this->waitingForRead[(int)$socket] = [$socket, [$task]];

}

public function waitForWrite($socket, Task $task)

{

if (isset($this->waitingForWrite[(int)$socket])) {

$this->waitingForWrite[(int)$socket][1][] = $task;

} else {

$this->waitingForWrite[(int)$socket] = [$socket, [$task]];

}

/**

* @param $timeout 0 represent

protected function ioPoll($timeout)

{

$rSocks = [];

foreach ($this->waitingForRead as list($socket)) {

$rSocks[] = $socket;

}

$wSocks = [];

foreach ($this->waitingForWrite as list($socket)) {

$wSocks[] = $socket;

}

$eSocks = [];

// $timeout 为 0 时, stream_select 为当即返回，为 null 时则会阻塞的等，见 http://php.net/manual/zh/function.stream-select.php

if (!@stream_select($rSocks, $wSocks, $eSocks, $timeout)) {

return;

}

foreach ($rSocks as $socket) {

list(, $tasks) = $this->waitingForRead[(int)$socket];

unset($this->waitingForRead[(int)$socket]);

foreach ($tasks as $task) {

$this->schedule($task);

}

foreach ($wSocks as $socket) {

list(, $tasks) = $this->waitingForWrite[(int)$socket];

unset($this->waitingForWrite[(int)$socket]);

foreach ($tasks as $task) {

$this->schedule($task);

}

/**

* 检查队列是否为空，若为空则挂起的执行 stream_select，不然检查完 IO 状态当即返回，详见 ioPoll()

* 做为任务加入队列后，因为 while true，会被一直重复的加入任务队列，实现每次任务前检查 IO 状态

* @return Generator object for newTask

protected function ioPollTask()

{

while (true) {

if ($this->taskQueue->isEmpty()) {

$this->ioPoll(null);

} else {

$this->ioPoll(0);

}

yield;

}

/**

* $scheduler = new Scheduler;

* $scheduler->newTask(Web Server Generator);

* $scheduler->withIoPoll()->run();

* 新建 Web Server 任务后先执行 withIoPoll() 将 ioPollTask() 做为任务入队

* @return $this

public function withIoPoll()

{

$this->newTask($this->ioPollTask());

return $this;

}

这个版本的 Scheduler 里加入一个永不退出的任务，而且经过 stream_select 支持的特性来实现快速的来回检查各个任务的 IO 状态，只有 IO 完成的任务才会继续执行，而 IO 还未完成的任务则会跳过，完整的代码和例子能够戳这里。

也就是说任务交替执行的过程当中，一旦遇到须要 IO 的部分，调度器就会把 CPU 时间分配给不须要 IO 的任务，等到当前任务遇到 IO 或者以前的任务 IO 结束才再次调度 CPU 时间，以此实现 CPU 和 IO 并行来提高执行效率，相似下图：

单任务改造

若是想将一个单进程任务改形成并发执行，咱们能够选择改形成多进程或者协程：

多进程，不改变任务执行的总体过程，在一个时间段内同时执行多个相同的代码段，调度权在 CPU，若是一个任务能独占一个 CPU 则能够实现并行。
协程，把原有任务拆分红多个小任务，原有任务的执行流程被改变，调度权在进程本身，若是有 IO 而且能够实现异步，则能够实现并行。

多进程改造

协程改造

协程（Coroutines）和 Go 协程（Goroutines）

PHP 的协程或者其余语言中，好比 Python、Lua 等都有协程的概念，和 Go 协程有些类似，不过有两点不一样：

Go 协程意味着并行（或者能够以并行的方式部署，能够用 runtime.GOMAXPROCS() 指定可同时使用的 CPU 个数），协程通常来讲只是并发。
Go 协程经过通道 channel 来通讯；协程经过 yield 让出和恢复操做来通讯。

Go 协程比普通协程更强大，也很容易从协程的逻辑复用到 Go 协程，并且在 Go 的开发中也使用的极为广泛，有兴趣的话能够了解一下做为对比。

结束

我的感受 PHP 的协程在实际使用中想要徒手实现和应用并不方便并且场景有限，但了解其概念及实现原理对更好的理解并发不无裨益。

若是想更多的了解协程的实际应用场景不妨试试已经大名鼎鼎的 Swoole，其对多种协议的 client 作了底层的协程封装，几乎能够作到以同步编程的写法实现协程异步 IO 的效果。

转载：PHP 协程实现

多进程/线程

并行和并发

并发（Concurrency）

并行（Parallesim）

区别

迭代器 & 生成器

迭代器

Iterator 接口

常规实现 range 函数

迭代器实现 xrange 函数

Yii2 Query

迭代器使用场景

生成器

生成器实现 xrange 函数

yield 关键字

协程

PHP 协程和 yield

协程多任务调度

协程非阻塞 IO

单任务改造

协程（Coroutines）和 Go 协程（Goroutines）

结束

参考

生成器实现 `xrange` 函数