大白话五种IO模型

1、I/O模型介绍

为了更好地了解I/O模型,咱们须要事先回顾下:同步、异步、阻塞、非阻塞python

同步(synchronous) I/O和异步(asynchronous) I/O,阻塞(blocking) I/O和非阻塞(non-blocking)I/O分别是什么,到底有什么区别?这个问题其实不一样的人给出的答案均可能不一样,好比wiki,就认为asynchronous I/O和non-blocking I/O是一个东西。这实际上是由于不一样的人的知识背景不一样,而且在讨论这个问题的时候上下文(context)也不相同。因此,为了更好的回答这个问题,我先限定一下本文的上下文。linux

本文讨论的背景是Linux环境下的network I/O。本文最重要的参考文献是Richard Stevens的“UNIX® Network Programming Volume 1, Third EditI/On: The Sockets Networking ”,6.2节“I/O Models ”,Stevens在这节中详细说明了各类I/O的特色和区别,若是英文够好的话,推荐直接阅读。Stevens的文风是有名的深刻浅出,因此不用担忧看不懂。本文中的流程图也是截取自参考文献。程序员

Stevens在文章中一共比较了五种I/O Modelweb

英文 中文
blocking I/O 阻塞I/O
nonblocking I/O 非阻塞I/O
I/O multiplexing I/O多路复用
signal driven I/O 信号驱动I/O
asynchronous I/O 异步I/O

再说一下I/O发生时涉及的对象和步骤。对于一个network I/O (这里咱们以read举例),它会涉及到两个系统对象,一个是调用这个I/O的process (or thread),另外一个就是系统内核(kernel)。当一个read操做发生时,该操做会经历两个阶段:数据库

  1. 等待数据准备 (Waiting for the data to be ready)
  2. 将数据从内核拷贝到进程中(Copying the data from the kernel to the process)

记住这两点很重要,由于这些I/O模型的区别就是在两个阶段上各有不一样的状况。编程

在网络环境下,再通俗的讲,将I/O分为两步:数组

  1. 等;
  2. 数据搬迁。

若是要想提升I/O效率,须要将等的时间下降。缓存

五种I/O模型包括:阻塞I/O、非阻塞I/O、信号驱动I/O、I/O多路转接、异步I/O。其中,前四个被称为同步I/O。tomcat

在介绍五种I/O模型时,我会举生活中老王买车票的例子,加深理解。

2、阻塞I/O模型

以买票的例子举例,该模型小结为:

# 老王去火车站买票,排队三天买到一张退票。

# 耗费:在车站吃喝拉撒睡 3天,其余事一件没干。

在linux中,默认状况下全部的socket都是blocking,一个典型的读操做流程大概是这样:

188-大白话五种IO模型-01.png?x-oss-process=style/watermark

当用户进程调用了recvfrom这个系统调用,kernel就开始了I/O的第一个阶段:准备数据。对于network I/O来讲,不少时候数据在一开始尚未到达(好比,尚未收到一个完整的UDP包),这个时候kernel就要等待足够的数据到来。

而在用户进程这边,整个进程会被阻塞。当kernel一直等到数据准备好了,它就会将数据从kernel中拷贝到用户内存,而后kernel返回结果,用户进程才解除block的状态,从新运行起来。因此,blocking I/O的特色就是在I/O执行的两个阶段(等待数据和拷贝数据两个阶段)都被block了。

几乎全部的程序员第一次接触到的网络编程都是从listen()、send()、recv() 等接口开始的,使用这些接口能够很方便的构建服务器/客户机的模型。然而大部分的socket接口都是阻塞型的。以下图

ps:所谓阻塞型接口是指系统调用(通常是I/O接口)不返回调用结果并让当前线程一直阻塞,只有当该系统调用得到结果或者超时出错时才返回。

188-大白话五种IO模型-02.png?x-oss-process=style/watermark

实际上,除非特别指定,几乎全部的I/O接口 ( 包括socket接口 ) 都是阻塞型的。这给网络编程带来了一个很大的问题,如在调用recv(1024)的同时,线程将被阻塞,在此期间,线程将没法执行任何运算或响应任何的网络请求。

2.1 一个简单的解决方案

在服务器端使用多线程(或多进程)。多线程(或多进程)的目的是让每一个链接都拥有独立的线程(或进程),这样任何一个链接的阻塞都不会影响其余的链接。

2.2 该方案的问题

开启多进程或都线程的方式,在遇到要同时响应成百上千路的链接请求,则不管多线程仍是多进程都会严重占据系统资源,下降系统对外界响应效率,并且线程与进程自己也更容易进入假死状态。

2.3 改进方案

不少程序员可能会考虑使用“线程池”或“链接池”。“线程池”旨在减小建立和销毁线程的频率,其维持必定合理数量的线程,并让空闲的线程从新承担新的执行任务。“链接池”维持链接的缓存池,尽可能重用已有的链接、减小建立和关闭链接的频率。这两种技术均可以很好的下降系统开销,都被普遍应用不少大型系统,如websphere、tomcat和各类数据库等。

2.4 改进后方案的问题

“线程池”和“链接池”技术也只是在必定程度上缓解了频繁调用I/O接口带来的资源占用。并且,所谓“池”始终有其上限,当请求大大超过上限时,“池”构成的系统对外界的响应并不比没有池的时候效果好多少。因此使用“池”必须考虑其面临的响应规模,并根据响应规模调整“池”的大小。

对应上例中的所面临的可能同时出现的上千甚至上万次的客户端请求,“线程池”或“链接池”或许能够缓解部分压力,可是不能解决全部问题。总之,多线程模型能够方便高效的解决小规模的服务请求,但面对大规模的服务请求,多线程模型也会遇到瓶颈,能够用非阻塞接口来尝试解决这个问题。

3、非阻塞I/O模型

以买票的例子举例,该模型小结为

# 老王去火车站买票,隔12小时去火车站问有没有退票,三天后买到一张票。

# 耗费:往返车站6次,路上6小时,其余时间作了好多事。

Linux下,能够经过设置socket使其变为non-blocking。当对一个non-blocking socket执行读操做时,流程是这个样子:

188-大白话五种IO模型-03.png?x-oss-process=style/watermark

从图中能够看出,当用户进程发出read操做时,若是kernel中的数据尚未准备好,那么它并不会block用户进程,而是马上返回一个error。从用户进程角度讲 ,它发起一个read操做后,并不须要等待,而是立刻就获得了一个结果。用户进程判断结果是一个error时,它就知道数据尚未准备好,因而用户就能够在本次到下次再发起read询问的时间间隔内作其余事情,或者直接再次发送read操做。一旦kernel中的数据准备好了,而且又再次收到了用户进程的system call,那么它立刻就将数据拷贝到了用户内存(这一阶段仍然是阻塞的),而后返回。

也就是说非阻塞的recvform系统调用调用以后,进程并无被阻塞,内核立刻返回给进程,若是数据还没准备好,此时会返回一个error。进程在返回以后,能够干点别的事情,而后再发起recvform系统调用。重复上面的过程,循环往复的进行recvform系统调用。这个过程一般被称之为轮询。轮询检查内核数据,直到数据准备好,再拷贝数据到进程,进行数据处理。须要注意,拷贝数据整个过程,进程仍然是属于阻塞的状态。因此,在非阻塞式I/O中,用户进程实际上是须要不断的主动询问kernel数据准备好了没有。

3.1 非阻塞I/O实例

#服务端
from socket import *
import time
s=socket(AF_INET,SOCK_STREAM)
s.bind(('127.0.0.1',8080))
s.listen(5)
s.setblocking(False) #设置socket的接口为非阻塞
conn_l=[]
del_l=[]
while True:
    try:
        conn,addr=s.accept()
        conn_l.append(conn)
    except BlockingI/OError:
        print(conn_l)
        for conn in conn_l:
            try:
                data=conn.recv(1024)
                if not data:
                    del_l.append(conn)
                    continue
                conn.send(data.upper())
            except BlockingI/OError:
                pass
            except ConnectI/OnResetError:
                del_l.append(conn)

        for conn in del_l:
            conn_l.remove(conn)
            conn.close()
        del_l=[]

#客户端
from socket import *
c=socket(AF_INET,SOCK_STREAM)
c.connect(('127.0.0.1',8080))

while True:
    msg=input('>>: ')
    if not msg:continue
    c.send(msg.encode('utf-8'))
    data=c.recv(1024)
    print(data.decode('utf-8'))

可是非阻塞I/O模型毫不被推荐。

咱们不可否则其优势:可以在等待任务完成的时间里干其余活了(包括提交其余任务,也就是 “后台” 能够有多个任务在“”同时“”执行)。

可是也难掩其缺点:

  1. 循环调用recv()将大幅度推高CPU占用率;这也是咱们在代码中留一句time.sleep(2)的缘由,不然在低配主机下极容易出现卡机状况
  2. 任务完成的响应延迟增大了,由于每过一段时间才去轮询一次read操做,而任务可能在两次轮询之间的任意时间完成。这会致使总体数据吞吐量的下降。

此外,在这个方案中recv()更多的是起到检测“操做是否完成”的做用,实际操做系统提供了更为高效的检测“操做是否完成“做用的接口,例如select()多路复用模式,能够一次检测多个链接是否活跃。

4、多路复用I/O模型

4.1 select/poll模型

以买票的例子举例,select/poll模型小结为:

1.
# 老王去火车站买票,委托黄牛,而后每隔6小时电话黄牛询问,黄牛三天内买到票,而后老王去火车站交钱领票。

# 耗费:往返车站2次,路上2小时,黄牛手续费100元,打电话17次

I/O multiplexing这个词可能有点陌生,可是若是我说select/poll,大概就都能明白了。有些地方也称这种I/O方式为事件驱动I/O(event driven I/O)。咱们都知道,select/poll的好处就在于单个process就能够同时处理多个网络链接的I/O。它的基本原理就是select/poll这个functI/On会不断的轮询所负责的全部socket,当某个socket有数据到达了,就通知用户进程。它的流程如图:

188-大白话五种IO模型-04.png?x-oss-process=style/watermark

当用户进程调用了select,那么整个进程会被block,而同时,kernel会“监视”全部select负责的socket,当任何一个socket中的数据准备好了,select就会返回。这个时候用户进程再调用read操做,将数据从kernel拷贝到用户进程。

这个图和blocking I/O的图其实并无太大的不一样,事实上还更差一些。由于这里须要使用两个系统调用(select和recvfrom),而blocking I/O只调用了一个系统调用(recvfrom)。可是,用select的优点在于它能够同时处理多个connectI/On。

强调:

  1. 若是处理的链接数不是很高的话,使用select/poll的web server不必定比使用multi-threading + blocking I/O的web server性能更好,可能延迟还更大。select/poll的优点并非对于单个链接能处理得更快,而是在于能处理更多的链接。
  2. 在多路复用模型中,对于每个socket,通常都设置成为non-blocking,可是,如上图所示,整个用户的process实际上是一直被block的。只不过process是被select这个函数block,而不是被socket I/O给block。

    结论: select的优点在于能够处理多个链接,不适用于单个链接

4.1.1 select网络I/O模型

#服务端
from socket import *
import select

s=socket(AF_INET,SOCK_STREAM)
s.setsockopt(SOL_SOCKET,SO_REUSEADDR,1)
s.bind(('127.0.0.1',8081))
s.listen(5)
s.setblocking(False) #设置socket的接口为非阻塞
read_l=[s,]
while True:
    r_l,w_l,x_l=select.select(read_l,[],[])
    print(r_l)
    for ready_obj in r_l:
        if ready_obj == s:
            conn,addr=ready_obj.accept() #此时的ready_obj等于s
            read_l.append(conn)
        else:
            try:
                data=ready_obj.recv(1024) #此时的ready_obj等于conn
                if not data:
                    ready_obj.close()
                    read_l.remove(ready_obj)
                    continue
                ready_obj.send(data.upper())
            except ConnectI/OnResetError:
                ready_obj.close()
                read_l.remove(ready_obj)

#客户端
from socket import *
c=socket(AF_INET,SOCK_STREAM)
c.connect(('127.0.0.1',8081))

while True:
    msg=input('>>: ')
    if not msg:continue
    c.send(msg.encode('utf-8'))
    data=c.recv(1024)
    print(data.decode('utf-8'))

4.1.2 select监听fd变化的过程分析

  1. 用户进程建立socket对象,拷贝监听的fd到内核空间,每个fd会对应一张系统文件表,内核空间的fd响应到数据后,就会发送信号给用户进程数据已到;

  2. 用户进程再发送系统调用,好比(accept)将内核空间的数据copy到用户空间,同时做为接受数据端内核空间的数据清除,这样从新监听时fd再有新的数据又能够响应到了(发送端由于基于TCP协议因此须要收到应答后才会清除)。

4.1.3 该模型的优势

相比其余模型,使用select() 的事件驱动模型只用单线程(进程)执行,占用资源少,不消耗太多 CPU,同时可以为多客户端提供服务。若是试图创建一个简单的事件驱动的服务器程序,这个模型有必定的参考价值。

4.1.4 该模型的缺点

  1. 首先select()接口并非实现“事件驱动”的最好选择。由于当须要探测的句柄值较大时,select()接口自己须要消耗大量时间去轮询各个句柄。
  2. 不少操做系统提供了更为高效的接口,如linux提供了epoll,BSD提供了kqueue,Solaris提供了/dev/poll,…。
  3. 若是须要实现更高效的服务器程序,相似epoll这样的接口更被推荐。遗憾的是不一样的操做系统特供的epoll接口有很大差别,
  4. 因此使用相似于epoll的接口实现具备较好跨平台能力的服务器会比较困难。
  5. 其次,该模型将事件探测和事件响应夹杂在一块儿,一旦事件响应的执行体庞大,则对整个模型是灾难性的。

4.2 epoll模型(了解)

以买票的例子举例,epoll模型小结为:

# 老王去火车站买票,委托黄牛,黄牛买到后即通知老王去领,而后老王去火车站交钱领票。

# 耗费:往返车站2次,路上2小时,黄牛手续费100元,无需打电话

I/O多路复用这个概念被提出来之后, select是第一个实现 (1983 左右在BSD里面实现)。可是,select模型有着一个很大的问题,那就是它所支持的fd的数量是有限制的,从linux源码中所看:

188-大白话五种IO模型-08.png?x-oss-process=style/watermark

它所须要的fd_set类型实际上是一个__FD_SETSIZE长度bit的数组。也就是说经过FD_SET宏来对它进行操做的时候,须要注意socket不能过大,不然可能出现数组写越界的错误。

而linux在2.6 内核中引入的epoll模型,就完全解决了这个问题,因为目前epoll模型只能在linux中使用,所以咱们开发仅作了解便可。

epoll模型提供了三个接口:

188-大白话五种IO模型-09.png?x-oss-process=style/watermark

其使用流程基本与select一致,大体以下:

188-大白话五种IO模型-10.png?x-oss-process=style/watermark

epoll_create函数会为要监听的fd分配内存。

epoll_ctl函数将要监听的fd拷贝到内核空间,从而避免每次等待事件都要进行内存拷贝。同时,注册一个回调函数到 fd的设备等待队列中,这样,当设备就绪的时候,驱动程序能够直接调用回调函数进行处理,从而避免了对全部监听fd的轮循。

epoll_wait函数会检查是否已经有fd就绪了,若是有则直接返回,若是没有,则进入休眠状态,直到被上述的回调函数唤醒或者超时时间到达。

5、信号驱动I/O模型(了解)

以买票的例子举例,该模型小结为:

# 老王去火车站买票,给售票员留下电话,有票后,售票员电话通知老王,而后老王去火车站交钱领票。

# 耗费:往返车站2次,路上2小时,免黄牛费100元,无需打电话

188-大白话五种IO模型-07.png?x-oss-process=style/watermark

因为信号驱动I/O在实际中并不经常使用,因此咱们只作简单了解。

信号驱动I/O模型,应用进程告诉内核:当数据报准备好的时候,给我发送一个信号,对SIGI/O信号进行捕捉,而且调用个人信号处理函数来获取数据报。

6、异步I/O模型

以买票的例子举例,该模型小结为:

# 老王去火车站买票,给售票员留下电话,有票后,售票员电话通知老王并快递送票上门。

# 耗费:往返车站1次,路上1小时,免黄牛费100元,无需打电话

Linux下的asynchronous I/O其实用得很少,从内核2.6版本才开始引入。先看一下它的流程:

188-大白话五种IO模型-05.png?x-oss-process=style/watermark

用户进程发起read操做以后,马上就能够开始去作其它的事。而另外一方面,从kernel的角度,当它受到一个asynchronous read以后,首先它会马上返回,因此不会对用户进程产生任何block。而后,kernel会等待数据准备完成,而后将数据拷贝到用户内存,当这一切都完成以后,kernel会给用户进程发送一个signal,告诉它read操做完成了。

7、I/O模型比较分析

到目前为止,已经将四个 I/O Model都介绍完了。如今回过头来回答最初的那几个问题:阻塞和非阻塞的区别在哪,同步I/O 和 异步I/O 的区别在哪。

先回答最简单的这个:阻塞 vs 非阻塞。前面的介绍中其实已经很明确的说明了这二者的区别。调用 阻塞I/O 会一直block住对应的进程直到操做完成,而 非阻塞I/O 在kernel还准备数据的状况下会马上返回。

再说明同步I/O 和 异步I/O 的区别以前,须要先给出二者的定义。Stevens给出的定义(实际上是POSIX的定义)是这样子的:

A synchronous I/O operatI/O n causes the requesting process to be blocked until that I/O operatI/O ncompletes;

An asynchronous I/O operatI/O n does not cause the requesting process to be blocked;

二者的区别就在于 同步I/O 作”I/O operatI/O n”的时候会将process阻塞。按照这个定义,四个I/O模型能够分为两大类,以前所述的 阻塞I/O , 非阻塞I/O ,I/O多路复用 都属于 同步I/O 这一类,而 异步I/O 属于后一类。

有人可能会说, 非阻塞I/O 并无被block啊。这里有个很是“狡猾”的地方,定义中所指的”I/O operatI/O n”是指真实的I/O操做,就是例子中的recvfrom这个system call。 非阻塞I/O 在执行recvfrom这个system call的时候,若是kernel的数据没有准备好,这时候不会block进程。可是,当kernel中数据准备好的时候,recvfrom会将数据从kernel拷贝到用户内存中,这个时候进程是被block了,在这段时间内,进程是被block的。而 异步I/O 则不同,当进程发起I/O操做以后,就直接返回不再理睬了,直到kernel发送一个信号,告诉进程说I/O完成。在这整个过程当中,进程彻底没有被block。

各个I/O Model的比较如图所示:

188-大白话五种IO模型-06.png?x-oss-process=style/watermark

通过上面的介绍,会发现 非阻塞I/O 和 异步I/O 的区别仍是很明显的。在非阻塞I/O 中,虽然进程大部分时间都不会被block,可是它仍然要求进程去主动的check,而且当数据准备完成之后,也须要进程主动的再次调用recvfrom来将数据拷贝到用户内存。而 异步I/O 则彻底不一样。它就像是用户进程将整个I/O操做交给了他人(kernel)完成,而后他人作完后发信号通知。在此期间,用户进程不须要去检查I/O操做的状态,也不须要主动的去拷贝数据。

能够看出,以上五个模型的阻塞程度由低到高为:阻塞I/O>非阻塞I/O>多路转接I/O>信号驱动I/O>异步I/O,所以他们的效率是由低到高的。

相关文章
相关标签/搜索