文章首发于51CTO技术栈公众号
做者 陈彩华
文章转载交流请联系 caison@aliyun.com
复制代码
随着互联网的发展,面对海量用户高并发业务,传统的阻塞式的服务端架构模式已经无能为力,由此,本文旨在为你们提供有用的概览以及网络服务模型的比较,以揭开设计和实现高性能网络架构的神秘面纱编程
首先看看服务端处理网络请求的典型过程:缓存
能够看到,主要处理步骤包括:bash
设计服务端并发模型时,主要有以下两个关键点:服务器
以上两个关键点最终都与操做系统的I/O模型以及线程(进程)模型相关,下面详细介绍这两个模型网络
介绍操做系统的I/O模型以前,先了解一下几个概念:多线程
二者的最大区别在于被调用方在收到请求到返回结果以前的这段时间内,调用方是否一直在等待。阻塞是指调用方一直在等待并且别的事情什么都不作。非阻塞是指调用方先去忙别的事情架构
同步处理与异步处理并发
阻塞、非阻塞和同步、异步的区别 阻塞、非阻塞和同步、异步其实针对的对象是不同的: 阻塞、非阻塞的讨论对象是调用者 同步、异步的讨论对象是被调用者异步
recvfrom函数 recvfrom函数(经socket接收数据),这里把它视为系统调用socket
一个输入操做一般包括两个不一样的阶段
对于一个套接字上的输入操做,第一步一般涉及等待数据从网络中到达。当所等待分组到达时,它被复制到内核中的某个缓冲区。第二步就是把数据从内核缓冲区复制到应用进程缓冲区
实际应用程序在系统调用完成上面2步操做时,调用方式的阻塞、非阻塞,操做系统在处理应用程序请求时处理方式的同步、异步处理的不一样,参考**《UNIX网络编程卷1》**,能够分为5种I/O模型
简介 在阻塞式I/O模型中,应用程序在从调用recvfrom开始到它返回有数据报准备好这段时间是阻塞的,recvfrom返回成功后,应用进程开始处理数据报
比喻 一我的在钓鱼,当没鱼上钩时,就坐在岸边一直等
优势 程序简单,在阻塞等待数据期间进程/线程挂起,基本不会占用CPU资源
缺点 每一个链接须要独立的进程/线程单独处理,当并发请求量大时为了维护程序,内存、线程切换开销较大,这种模型在实际生产中不多使用
简介 在非阻塞式I/O模型中,应用程序把一个套接口设置为非阻塞就是告诉内核,当所请求的I/O操做没法完成时,不要将进程睡眠,而是返回一个错误,应用程序基于I/O操做函数将不断的轮询数据是否已经准备好,若是没有准备好,继续轮询,直到数据准备好为止
比喻 边钓鱼边玩手机,隔会再看看有没有鱼上钩,有的话就迅速拉杆
优势 不会阻塞在内核的等待数据过程,每次发起的I/O请求能够当即返回,不用阻塞等待,实时性较好
缺点轮询将会不断地询问内核,这将占用大量的CPU时间,系统资源利用率较低,因此通常Web服务器不使用这种I/O模型
简介 在I/O复用模型中,会用到select或poll函数或epoll函数(Linux2.6之后的内核开始支持),这两个函数也会使进程阻塞,可是和阻塞I/O所不一样的的,这两个函数能够同时阻塞多个I/O操做,并且能够同时对多个读操做,多个写操做的I/O函数进行检测,直到有数据可读或可写时,才真正调用I/O操做函数
比喻 放了一堆鱼竿,在岸边一直守着这堆鱼竿,有鱼上钩就玩手机
优势 能够基于一个阻塞对象,同时在多个描述符上等待就绪,而不是使用多个线程(每一个文件描述符一个线程),这样能够大大节省系统资源
缺点 当链接数较少时效率相比多线程+阻塞I/O模型效率较低,可能延迟更大,由于单个链接处理须要2次系统调用,占用时间会有增长
简介 在信号驱动式I/O模型中,应用程序使用套接口进行信号驱动I/O,并安装一个信号处理函数,进程继续运行并不阻塞。当数据准备好时,进程会收到一个SIGIO信号,能够在信号处理函数中调用I/O操做函数处理数据
比喻 鱼竿上系了个铃铛,当铃铛响,就知道鱼上钩,而后能够专心玩手机
优势 线程并无在等待数据时被阻塞,能够提升资源的利用率
缺点
简介 由POSIX规范定义,应用程序告知内核启动某个操做,并让内核在整个操做(包括将数据从内核拷贝到应用程序的缓冲区)完成后通知应用程序。这种模型与信号驱动模型的主要区别在于:信号驱动I/O是由内核通知应用程序什么时候启动一个I/O操做,而异步I/O模型是由内核通知应用程序I/O操做什么时候完成
优势 异步 I/O 可以充分利用 DMA 特性,让 I/O 操做与计算重叠
缺点 要实现真正的异步 I/O,操做系统须要作大量的工做。目前 Windows 下经过 IOCP 实现了真正的异步 I/O,而在 Linux 系统下,Linux2.6才引入,目前 AIO 并不完善,所以在 Linux 下实现高并发网络编程时都是以 IO复用模型模式为主
从上图中咱们能够看出,能够看出,越日后,阻塞越少,理论上效率也是最优。其五种I/O模型中,前四种属于同步I/O,由于其中真正的I/O操做(recvfrom)将阻塞进程/线程,只有异步I/O模型才于POSIX定义的异步I/O相匹配
介绍完服务器如何基于I/O模型管理链接,获取输入数据,下面介绍基于进程/线程模型,服务器如何处理请求
值得说明的是,具体选择线程仍是进程,更可能是与平台及编程语言相关,例如C语言使用线程和进程均可以(例如Nginx使用进程,Memcached使用线程),Java语言通常使用线程(例如Netty),为了描述方便,下面都使用线程来进程描述
特色
存在问题
针对传统传统阻塞I/O服务模型的2个缺点,比较常见的有以下解决方案:
I/O复用结合线程池,这就是Reactor模式基本设计思想
Reactor模式,是指经过一个或多个输入同时传递给服务处理器的服务请求的事件驱动处理模式。 服务端程序处理传入多路请求,并将它们同步分派给请求对应的处理线程,Reactor模式也叫Dispatcher模式,即I/O多了复用统一监听事件,收到事件后分发(Dispatch给某进程),是编写高性能网络服务器的必备技术之一
Reactor模式中有2个关键组成:
Reactor Reactor在一个单独的线程中运行,负责监听和分发事件,分发给适当的处理程序来对IO事件作出反应。 它就像公司的电话接线员,它接听来自客户的电话并将线路转移到适当的联系人
Handlers 处理程序执行I/O事件要完成的实际事件,相似于客户想要与之交谈的公司中的实际官员。Reactor经过调度适当的处理程序来响应I/O事件,处理程序执行非阻塞操做
根据Reactor的数量和处理资源池线程的数量不一样,有3种典型的实现:
下面详细介绍这3种实现
其中,select是前面I/O复用模型介绍的标准网络编程API,能够实现应用程序经过一个阻塞对象监听多路链接请求,其余方案示意图相似
方案说明
优势 模型简单,没有多线程、进程通讯、竞争的问题,所有都在一个线程中完成
缺点
使用场景 客户端的数量有限,业务处理很是快速,好比Redis,业务处理的时间复杂度O(1)
方案说明
优势 能够充分利用多核CPU的处理能力
缺点
针对单Reactor多线程模型中,Reactor在单线程中运行,高并发场景下容易成为性能瓶颈,可让Reactor在多线程中运行
方案说明
优势
这种模型在许多项目中普遍使用,包括Nginx主从Reactor多进程模型,Memcached主从多线程,Netty主从多线程模型的支持
3种模式能够用个比喻来理解: 餐厅经常雇佣接待员负责迎接顾客,当顾客入坐后,侍应生专门为这张桌子服务
Reactor模式具备以下的优势:
在Reactor模式中,Reactor等待某个事件或者可应用或个操做的状态发生(好比文件描述符可读写,或者是socket可读写),而后把这个事件传给事先注册的Handler(事件处理函数或者回调函数),由后者来作实际的读写操做,其中的读写操做都须要应用程序同步操做,因此Reactor是非阻塞同步网络模型。若是把I/O操做改成异步,即交给操做系统来完成就能进一步提高性能,这就是异步网络模型Proactor
Proactor是和异步I/O相关的,详细方案以下:
能够看出Proactor和Reactor的区别:Reactor是在事件发生时就通知事先注册的事件(读写在应用程序线程中处理完成);Proactor是在事件发生时基于异步I/O完成读写操做(由内核完成),待I/O操做完成后才回调应用程序的处理器来处理进行业务处理
理论上Proactor比Reactor效率更高,异步I/O更加充分发挥DMA(Direct Memory Access,直接内存存取)的优点,可是有以下缺点:
所以在Linux下实现高并发网络编程都是以Reactor模型为主
UNIX网络编程卷1:套接字联网API(第3版)