Reactor和Proactor模型

时间 2019-11-30

原文原文链接

背景

前面介绍了I/O多路复用模型，那有了I/O复用，有了epoll已经可使服务器并发几十万链接的同时，还能维持比较高的TPS，难道还不够吗？好比如今在使用epoll的时候通常都是起个任务，不断的去巡检事件，而后通知处理，而比较理想的方式是最好能以一种回调的机制，提供一个编程框架，让程序更有结构些，另外一方面，若是但愿每一个事件通知以后，作的事情能有机会被代理到某个线程里面去单独运行，而线程完成的状态又能通知回主任务，那么"异步"的进制就必须被引入。因此这个章节主要介绍下"编程框架"。html

Reactor模型

Reactor模式是处理并发I/O比较常见的一种模式，用于同步I/O，中心思想是将全部要处理的I/O事件注册到一个中心I/O多路复用器上，同时主线程/进程阻塞在多路复用器上；一旦有I/O事件到来或是准备就绪(文件描述符或socket可读、写)，多路复用器返回并将事先注册的相应I/O事件分发到对应的处理器中。react

Reactor是一种事件驱动机制，和普通函数调用的不一样之处在于：应用程序不是主动的调用某个API完成处理，而是偏偏相反，Reactor逆置了事件处理流程，应用程序须要提供相应的接口并注册到Reactor上，若是相应的事件发生，Reactor将主动调用应用程序注册的接口，这些接口又称为“回调函数”。用“好莱坞原则”来形容Reactor再合适不过了：不要打电话给咱们，咱们会打电话通知你。linux

Reactor模式与Observer模式在某些方面极为类似：当一个主体发生改变时，全部依属体都获得通知。不过，观察者模式与单个事件源关联，而反应器模式则与多个事件源关联。nginx

在Reactor模式中，有5个关键的参与者：程序员

描述符（handle）：由操做系统提供的资源，用于识别每个事件，如Socket描述符、文件描述符、信号的值等。在Linux中，它用一个整数来表示。事件能够来自外部，如来自客户端的链接请求、数据等。事件也能够来自内部，如信号、定时器事件。
同步事件多路分离器（event demultiplexer）：事件的到来是随机的、异步的，没法预知程序什么时候收到一个客户链接请求或收到一个信号。因此程序要循环等待并处理事件，这就是事件循环。在事件循环中，等待事件通常使用I/O复用技术实现。在linux系统上通常是select、poll、epoll等系统调用，用来等待一个或多个事件的发生。I/O框架库通常将各类I/O复用系统调用封装成统一的接口，称为事件多路分离器。调用者会被阻塞，直到分离器分离的描述符集上有事件发生。这点能够参考前面的 I/O多路复用模型。
事件处理器（event handler）：I/O框架库提供的事件处理器一般是由一个或多个模板函数组成的接口。这些模板函数描述了和应用程序相关的对某个事件的操做，用户须要继承它来实现本身的事件处理器，即具体事件处理器。所以，事件处理器中的回调函数通常声明为虚函数，以支持用户拓展。
具体的事件处理器（concrete event handler）：是事件处理器接口的实现。它实现了应用程序提供的某个服务。每一个具体的事件处理器总和一个描述符相关。它使用描述符来识别事件、识别应用程序提供的服务。
Reactor 管理器（reactor）：定义了一些接口，用于应用程序控制事件调度，以及应用程序注册、删除事件处理器和相关的描述符。它是事件处理器的调度核心。 Reactor管理器使用同步事件分离器来等待事件的发生。一旦事件发生，Reactor管理器先是分离每一个事件，而后调度事件处理器，最后调用相关的模板函数来处理这个事件。

应用场景

场景：长途客车在路途上，有人上车有人下车，可是乘客老是但愿可以在客车上获得休息。
传统作法：每隔一段时间（或每个站），司机或售票员对每个乘客询问是否下车。
Reactor作法：汽车是乘客访问的主体（Reactor），乘客上车后，到售票员（acceptor）处登记，以后乘客即可以休息睡觉去了，当到达乘客所要到达的目的地时（指定的事件发生，乘客到了下车地点），售票员将其唤醒便可。

更加形象例子

这部份内容主要来自：https://blog.csdn.net/russell_tao/article/details/17452997
传统编程方法
就好像是到了银行营业厅里，每一个窗口前排了长队，业务员们在窗口后一个个的解决客户们的请求。一个业务员能够尽情思考着客户A依次提出的问题，例如：
“我要买2万XX理财产品。“
“看清楚了，5万起售。”
“等等，查下我活期余额。”
“余额5万。”
“那就买 5万吧。”
业务员开始录入信息。
”对了，XX理财产品年利率8%？”
“是预期8%，最低无利息保本。“
”早不说，拜拜，我去买余额宝。“
业务员无表情的删着已经录入的信息进行事务回滚。
“下一个！”web

IO复用方法
用了IO复用则是大师业务员开始挑战极限，在超大营业厅里给客户们人手一个牌子，黑压压的客户们都在大厅中，有问题时举牌申请提问，大师目光敏锐点名指定某人提问，该客户迅速获得大师的答复后，要通过一段时间思考，查查本身的银袋子，咨询下LD，才能再次进行下一个提问，直到获得完整的满意答复退出大厅。例如：大师刚指导A填写转账单的某一项，B又来申请兑换泰铢，给了B兑换单后，C又来办理定转活，而后D与F在争抢有限的圆珠笔时出现了不和谐现象，被大师叫停业务，暂时等待。redis

这就是基于事件驱动的IO复用编程比起传统1线程1请求的方式来，有难度的设计点了，客户们都是上帝，既不能出错，还不能厚此薄彼。编程

当没有Reactor时，咱们可能的设计方法是这样的：大师把每一个客户的提问都记录下来，当客户A提问时，首先查阅A以前问过什么作过什么，这叫联系上下文，而后再根据上下文和当前提问查阅有关的银行规章制度，有针对性的回答A，并把回答也记录下来。当圆满回答了A的全部问题后，删除A的全部记录。windows

在程序中

某一瞬间，服务器共有10万个并发链接，此时，一次IO复用接口的调用返回了100个活跃的链接等待处理。先根据这100个链接找出其对应的对象，这并不难，epoll的返回链接数据结构里就有这样的指针能够用。接着，循环的处理每个链接，找出这个对象此刻的上下文状态，再使用read、write这样的网络IO获取这次的操做内容，结合上下文状态查询此时应当选择哪一个业务方法处理，调用相应方法完成操做后，若请求结束，则删除对象及其上下文。后端

这样，咱们就陷入了面向过程编程方法之中了，在面向应用、快速响应为王的移动互联网时代，这样作迟早得把本身玩死。咱们的主程序须要关注各类不一样类型的请求，在不一样状态下，对于不一样的请求命令选择不一样的业务处理方法。这会致使随着请求类型的增长，请求状态的增长，请求命令的增长，主程序复杂度快速膨胀，致使维护愈来愈困难，苦逼的程序员不再敢轻易接新需求、重构。

Reactor是解决上述软件工程问题的一种途径，它也许并不优雅，开发效率上也不是最高的，但其执行效率与面向过程的使用IO复用却几乎是等价的，因此，不管是nginx、memcached、redis等等这些高性能组件的代名词，都义无反顾的一头扎进了反应堆的怀抱中。

Reactor模式能够在软件工程层面，将事件驱动框架分离出具体业务，将不一样类型请求之间用OO的思想分离。一般，Reactor不只使用IO复用处理网络事件驱动，还会实现定时器来处理时间事件的驱动（请求的超时处理或者定时任务的处理），就像下面的示意图：

这幅图有5点意思：

处理应用时基于OO思想，不一样的类型的请求处理间是分离的。例如，A类型请求是用户注册请求，B类型请求是查询用户头像，那么当咱们把用户头像新增多种分辨率图片时，更改B类型请求的代码处理逻辑时，彻底不涉及A类型请求代码的修改。
应用处理请求的逻辑，与事件分发框架彻底分离。什么意思呢？即写应用处理时，不用去管什么时候调用IO复用，不用去管什么调用epoll_wait，去处理它返回的多个socket链接。应用代码中，只关心如何读取、发送socket上的数据，如何处理业务逻辑。事件分发框架有一个抽象的事件接口，全部的应用必须实现抽象的事件接口，经过这种抽象才把应用与框架进行分离。
Reactor上提供注册、移除事件方法，供应用代码使用，而分发事件方法，一般是循环的调用而已，是否提供给应用代码调用，仍是由框架简单粗暴的直接循环使用，这是框架的自由。
IO多路复用也是一个抽象，它能够是具体的select，也能够是epoll，它们只必须提供采集到某一瞬间全部待监控链接中活跃的链接。
定时器也是由Reactor对象使用，它必须至少提供4个方法，包括添加、删除定时器事件，这该由应用代码调用。最近超时时间是须要的，这会被反应堆对象使用，用于确认select或者epoll_wait执行时的阻塞超时时间，防止IO的等待影响了定时事件的处理。遍历也是由反应堆框架使用，用于处理定时事件。

Reactor的几种模式

参考资料：http://gee.cs.oswego.edu/dl/cpjslides/nio.pdf
在web服务中，不少都涉及基本的操做：read request、decode request、process service、encod reply、send reply等。

1 单线程模式

这是最简单的Reactor单线程模型。Reactor线程是个多面手，负责多路分离套接字，Accept新链接，并分派请求处处理器链中。该模型适用于处理器链中业务处理组件能快速完成的场景。不过这种单线程模型不能充分利用多核资源，因此实际使用的很少。

2 多线程模式（单Reactor）

该模型在事件处理器（Handler）链部分采用了多线程（线程池），也是后端程序经常使用的模型。

3 多线程模式（多个Reactor）

比起第二种模型，它是将Reactor分红两部分，mainReactor负责监听并accept新链接，而后将创建的socket经过多路复用器（Acceptor）分派给subReactor。subReactor负责多路分离已链接的socket，读写网络数据；业务处理功能，其交给worker线程池完成。一般，subReactor个数上可与CPU个数等同。

Proacotr模型

Proactor是和异步I/O相关的。
在Reactor模式中，事件分离者等待某个事件或者可应用多个操做的状态发生（好比文件描述符可读写，或者是socket可读写），事件分离器就把这个事件传给事先注册的处理器（事件处理函数或者回调函数），由后者来作实际的读写操做。

在Proactor模式中，事件处理者(或者代由事件分离者发起)直接发起一个异步读写操做(至关于请求)，而实际的工做是由操做系统来完成的。发起时，须要提供的参数包括用于存放读到数据的缓存区，读的数据大小，或者用于存放外发数据的缓存区，以及这个请求完后的回调函数等信息。事件分离者得知了这个请求，它默默等待这个请求的完成，而后转发完成事件给相应的事件处理者或者回调。

能够看出二者的区别：Reactor是在事件发生时就通知事先注册的事件（读写由处理函数完成）；Proactor是在事件发生时进行异步I/O（读写由OS完成），待IO完成事件分离器才调度处理器来处理。

举个例子，将有助于理解Reactor与Proactor两者的差别，以读操做为例（类操做相似）。
在Reactor（同步）中实现读：

注册读就绪事件和相应的事件处理器
事件分离器等待事件
事件到来，激活分离器，分离器调用事件对应的处理器。
事件处理器完成实际的读操做，处理读到的数据，注册新的事件，而后返还控制权。

Proactor（异步）中的读：

处理器发起异步读操做（注意：操做系统必须支持异步IO）。在这种状况下，处理器无视IO就绪事件，它关注的是完成事件。
事件分离器等待操做完成事件
在分离器等待过程当中，操做系统利用并行的内核线程执行实际的读操做，并将结果数据存入用户自定义缓冲区，最后通知事件分离器读操做完成。
事件分离器呼唤处理器。
事件处理器处理用户自定义缓冲区中的数据，而后启动一个新的异步操做，并将控制权返回事件分离器。

常见的I/O编程框架

对比几个常见的I/O编程框架：libevent，libev，libuv，aio，boost.Asio。

1 libevent

libevent是一个C语言写的网络库，官方主要支持的是类linux操做系统，最新的版本添加了对windows的IOCP的支持。在跨平台方面主要经过select模型来进行支持。
设计模式：libevent为Reactor模式；
层次架构：livevent在不一样的操做系统下，作了多路复用模型的抽象，能够选择使用不一样的模型，经过事件函数提供服务；
可移植性：libevent主要支持linux平台，freebsd平台，其余平台下经过select模型进行支持，效率不是过高；
事件分派处理：libevent基于注册的事件回调函数来实现事件分发；
涉及范围：libevent只提供了简单的网络API的封装，线程池，内存池，递归锁等均须要本身实现；
线程调度：libevent的线程调度须要本身来注册不一样的事件句柄；
发布方式：libevent为开源免费的，通常编译为静态库进行使用；
开发难度：基于libevent开发应用，相对容易，具体能够参考memcached这个开源的应用，里面使用了 libevent这个库。

2 libev

libevent/libev是两个名字至关相近的I/O Library。既然是库，第一反应就是对api的包装。epoll在linux上已经存在了好久，可是linux是SysV的后代，BSD及其衍生的MAC就没有，只有kqueue。

libev v.s libevent。既然已经有了libevent，为何还要发明一个轮子叫作libev？

http://www.cnblogs.com/Lifehacker/p/whats_the_difference_between_libevent_and_libev_chinese.html
http://stackoverflow.com/questions/9433864/whats-the-difference-between-libev-and-libevent

上面是libev的做者对于这个问题的回答，下面是网摘的中文翻译：

就设计哲学来讲，libev的诞生，是为了修复libevent设计上的一些错误决策。例如，全局变量的使用，让libevent很难在多线程环境中使用。watcher结构体很大，由于它们包含了I/O，定时器和信号处理器。额外的组件如HTTP和DNS服务器，由于拙劣的实现品质和安全问题而备受折磨。定时器不精确，并且没法很好地处理时间跳变。

总而言之，libev试图作好一件事而已（目标是成为POSIX的事件库），这是最高效的方法。libevent则尝试给你全套解决方案（事件库，非阻塞IO库，http库，DNS客户端）libev 彻底是单线程的，没有DNS解析。

libev解决了epoll, kqueuq等API不一样的问题。保证使用livev的程序能够在大多数 *nix 平台上运行(对windows不太友好)。可是 libev 的缺点也是显而易见，因为基本只是封装了 Event Library，用起来有诸多不便。好比 accept(3) 链接之后须要手动 setnonblocking 。从 socket 读写时须要检测 EAGAIN 、EWOULDBLOCK 和 EINTER 。这也是大多数人认为异步程序难写的根本缘由。

3 libuv

libuv是Joyent给Node作的I/O Library。libuv 须要多线程库支持，其在内部维护了一个线程池来处理诸如getaddrinfo(3) 这样的没法异步的调用。同时，对windows用户友好，Windows下用IOCP实现，官网http://docs.libuv.org/en/v1.x/

4 boost.Asio

Boost.Asio类库，其就是以Proactor这种设计模式来实现。
参见：Proactor（The Boost.Asio library is based on the Proactor pattern. This design note outlines the advantages and disadvantages of this approach.），
其设计文档连接：http://asio.sourceforge.net/boost_asio_0_3_7/libs/asio/doc/design/index.html
http://stackoverflow.com/questions/11423426/how-does-libuv-compare-to-boost-asio

5 linux aio

linux有两种aio(异步机制)，一是glibc提供的(bug不少，几乎不可用)，一是内核提供的(BSD/mac也提供)。固然，机制不等于编程框架。