由select引起的思考

时间 2019-11-13

标签 select 引起思考栏目兴趣爱好繁體版

原文原文链接

1、前言html

　　网络编程里一个经典的问题，select,poll和epoll的区别？这个问题刚学习编程时就接触了，当时看了材料很不明白，许多概念和思想没有体会，如今在这个阶段，再从新回头看这个问题，有一种豁然开朗的感受，编程

把目前我所能理解到的记录下来。缓存

　　参考资料：https://www.cnblogs.com/zingp/p/6863170.html安全

　　　　　　　http://blog.csdn.net/a837199685/article/details/45954349服务器

　　　　　　　https://www.zhihu.com/question/32163005网络

　　　　　　　http://shmilyaw-hotmail-com.iteye.com/blog/1896683多线程

　　　　　　　http://www.cnblogs.com/my_life/articles/3968782.html并发

　　　　　　　https://www.cnblogs.com/Anker/p/3265058.html异步

2、从操做系统开始谈起socket

　　有几个之后一直谈到的概念，有必要先了解，之前就是这个步骤没作，学习的时候一脸懵逼。

　　1. 用户空间和内核空间

　　　　目前操做系统寻址模式为虚拟寻址，即处理器产生虚拟地址，以后翻译成物理地址，总线到物理地址处理，处理器拿处处理后的数据

　　　　操做系统的核心为内核，能够访问受保护的内存空间，能够访问底层硬件设施，能够作任何事情。因此为了系统的稳定，讲道理内核应该被保护起来。

　　　　因此虚拟空间被分为内核空间和用户空间。内核空间在最高的1G中，用户空间在剩下的内存中。

　　　　多数咱们所用的进程在用户空间处理，把请求发给内核，在内核空间中操做硬件。

　　2. 进程上下文切换（进程切换）

　　　　挂起当前进程，恢复某个进程，你们都知道这是个开销大的过程，那具体有哪些步骤呢？

　　　　首先，保存当前进程一些必要信息用以往后恢复，如描绘地址空间的页表，进程表，文件表等等。

　　　　而后切换页全局目录，安装一个新的地址空间

　　　　最后回复目标进程的上下文

　　3. 文件描述符（fd）

　　　　计算机的一个术语，指向文件对象的一个抽象表示。形式上是一个非负整数的索引值，指向文件表中的文件

　　　　当程序打开或建立一个文件时，内核向进程返回一个文件描述符，表明该文件。

　　　　经过操做文件描述符，咱们实现真实操做文件的目的

　　4. 进程阻塞（process block）

　　　　当某个进程等待一个执行结果时，自身阻塞（不干事），直到获得结果，再继续往下，

　　　　重点是：这个是进程自身行为，且阻塞时不占用cpu资源（cpu也不干事），

　　　　因此I/O请求最拉低性能，俗话说占着茅坑不拉屎，在计算机里也是存在的，因此人们设计了多线程，多进程等方案来解决这个问题。

　　5. I/O过程

　　　　通常有两种模式，直接 I/O，缓存 I/O（默认），

　　　　缓存 I/O：

　　　　　　进程发起系统调用（通知系统我要读写了！）

　　　　　　写：进程（数据） -------》进程缓冲池 ------------》内核缓冲池 ----------》存储设备

　　　　　　读：存储设备（数据）---------》内核缓冲池 ----------》进程缓冲池 ---------》进程

　　　　直接 I/O（进程缓存池消失了！）：　　　　　　

　　　　　　进程发起系统调用（通知系统我要读写了！）

　　　　　　写：进程（数据） ------------》内核缓冲池 ----------》存储设备

　　　　　　读：存储设备（数据）---------》内核缓冲池 ---------》进程

　　　　以上每一个步骤之间都是有可能进程会有阻塞（block）发生，根据不一样位置的阻塞，就产生了多种网络模式，以适应于不一样场景。

3、 I/O模式（以读为例）

　　　1. block I/O

　　　　过程：

　　　　　　进程发起系统调用（通知系统我要读写了！）

　　　　　　读：存储设备（数据）---------》内核缓冲池 ---------》进程------------》内核通知进程ok，进程解除阻塞

　　　　　　　　　　　　　　　　进程阻塞进程阻塞

　　　　解释：

　　　　　　进程一直等文件准备好，再继续下一步。

　　　　应用场景：

　　　　　　以上原理是一个用户链接的状况，很容易理解。

　　　　　　当一个服务器对接多个客户端的时候：

　　　　　　初级方案：开多进程（大数据或长时间任务、开销大，更安全）或多线程（不少链接，开销低，数据放一块儿不太安全）为每个客户端创建一个链接来处理。

　　　　　　不足：高并发的状况就体现出开销大，性能低。一个是多线程切换，上下文切换的性能开销，另外一个是多线程数量大，会占据大量系统资源

　　　　　　优化方案：采用线程池（减小建立和销毁线程的频率）或链接池（维持链接的缓存池，尽可能重用已有的链接），下降系统开销

　　　　　　不足：下降开销仍是有限度的，在这个时代，高并发大，很容易到达瓶颈。

　　　2. non-block I/O 　　

　　　　过程：

　　　　　　发起系统调用（通知系统我要读写了！）

　　　　　　读：存储设备（数据）-------------》内核缓冲池 -----------》进程-------------》内核通知进程ok，进程解除阻塞

　　　　　　　　　　　　　　　　非阻塞阻塞

　　　　解释：

　　　　　　在内核准备数据阶段，当即返回一个error给进程，

　　　　　　所以进程知道内核还没准备好，

　　　　　　因此进程再问内核，内核再回error，直到内核准备好，被询问时返回准备好的信号，进程再接触阻塞，

　　　　应用场景：

　　　　　　链接量小，没差异，

　　　　　　当链接数大的时候，这个模式理论上能够用一个线程实现多个链接：

　　　　　　因为非阻塞，这个线程能够循环去询问全部链接目标有没有准备好，内核都是立马回复，error往下，准备好就交给进程，因此不会浪费时间，

　　　　　　可是，（凡事都有可是），这个简单的实现方案，效率仍是很低的，毕竟从内核空间到用户空间仍是block的，并且会极大推高cpu占用率。

　　　　　　特别是当响应事件（读取或者其余）庞大的时候，执行速度就会很缓慢。

　　　　　　下面的select等就是基于此想法的发展。

　　　3. I/O multiplexing

　　　　目标：低开销，高效率得处理高并发请求

　　　　方案：select 、poll、epoll 三种实现方案

　　　　本质：用 select、poll、epoll 去监听全部 socket对象，当socket对象发生变化时，通知用户进程处理。

　　　　特征：

　　　　　　　select（最先出现）：多平台支持

　　　　　　　　　　　　　　　　经过轮询，效率较低

　　　　　　　　　　　　　　　　处理链接数量有限制，默认1024个，

　　　　　　　　　　　　　　　　大量用户态和内核态fd的拷贝，性能低，

　　　　　　　　　　　　　　　　返回的是全部句柄列表，没有告诉是哪个发生变化，用户进程还得再次遍历。

　　　　　　　poll（略微改进）：改进了数量链接限制，作到了数量无限制

　　　　　　　epoll（改进全部缺点）：当socket变化时，通知进程哪个完成了，

　　　　　　　　　　　　　　　　　　数量无限制（为系统最大打开文件数量）

　　　　　　　　　　　　　　　　　　fd句柄只拷贝一次，性能高

　　　　性能对比：

　　　　　　横坐标是链接数，Dead Connections 是软件命名的，纵坐标是此时处理链接数

　　　　　　能够看出 epoll 性能比较稳定，并且性能较优。

　　　　仔细过程讨论：

　　　　　　　　这里只讨论大体原理，具体实现不一样语言有不一样的差异。（不是由于我没作过，不是的）

　　　　　　　　首先。在多路复用模型中，对于每个 socket，通常都设置成为 non-blocking，可是，整个用户的 process 实际上是一直被 block 的

　　　　　　　　即用户进程被select、poll阻塞，可是select、poll是非阻塞的，他们不断轮询、挂起来完成工做。

　　　　　　　　select：

　　　　　　　　　　1. 从用户态拷贝 fd_set 至内核空间（告诉内核要监听的socket）

　　　　　　　　　　2..注册回调函数pollwait（将进程挂到等待队列中，当socket准备好后（执行mask状态码判断），再唤醒进程）

　　　　　　　　　　3. 内核遍历fd，调用每个的poll方法（本质上是pollwait回调函数，返回值socket的mask状态掩码，即如今准备好了没，给fd_set赋值）

　　　　　　　　　　4. 当无可读写mask码（没有任何准备好的），select睡眠，等睡眠时间到，再次醒来轮询fd-set

　　　　　　　　　　5. 有值时返回fd_set（已经赋值完，例如能够读的value为1）、将其拷贝至用户空间

　　　　　　　　　　6. 用户进程循环fd_set,

　　　　　　　　分析：

　　　　　　　　　　每次循环都要执行上面流程，

　　　　　　　　　　一次循环两次拷贝fi_set，即每次监听都从新告诉内核要监听的事件，在用户量很大的时候是一个很大的开销

　　　　　　　　　　返回全部的fd_set，却没有告诉进程哪个是完成的，进程还得循环判断，用户量很大（十万，百万）的时候，性能过低

　　　　　　　　　　所以，select只支持1024个链接。

　　　　　　　　　　这也解释了上图中为何链接量越大，性能越低的现象，许多时间用来处理无活跃的链接、循环判断中，在高并发低活跃的场景中尤其如此。

　　　　　　　　poll：

　　　　　　　　　　将fd_set结构改成pollfd结构，能够不限数量，可是其余问题咩有解决。

　　　　　　　　epoll：

　　　　　　　　　　改进：

　　　　　　　　　　　　fd只拷贝一次（开始就告诉内核全部注册事件，监听对象）。

　　　　　　　　　　　　只返回包含全部变化的fd的链表。

　　　　　　　　　　　　链接无限制

　　　　　　　　　　epoll提供三个函数

　　　　　　　　　　epoll_create（句柄），开始是有size参数，说明fd数量，如今内核动态分配，

　　　　　　　　　　epoll_ctl（注册事件类型），注册监听事件

　　　　　　　　　　epoll_wait（等待事件发生），捕捉fd信号，

　　　　三者区别小结：

　　　　　　select、poll 孪生兄弟，有许多缺点，优势很少，应用场景也很少。是时代的产物

　　　　　　epoll 是进阶版，可是只有Linux有，

　　　　　　具体状况具体分析。

　　4. 异步io

　　　　解释：进程彻底不阻塞，请求发完就去作其余事，等数据所有准备好，内核发消息给进程，进程接着处理，

　　　　实现：据说很复杂，没研究。

4、总结和挖坑

　　研究了一些操做系统的概念，研究了I/O模式，着重研究了select、poll、epoll 的区别，

　　有时间具体实现和操做，实践出真知，许多细节可能还有谬误，待之后水平上升，再来修改。