细说select、poll和epoll之间的区别与优缺点

时间 2021-08-12

标签数组异步 socket tcp ide 函数性能 spa 3d orm 栏目系统网络繁體版

原文原文链接

I/O多路复用就经过一种机制，能够监视多个描述符，一旦某个描述符就绪（通常是读就绪或者写就绪），可以通知程序进行相应的读写操做。select，poll，epoll都是IO多路复用的机制。但select，poll，epoll本质上都是同步I/O，由于他们都须要在读写事件就绪后本身负责进行读写，也就是说这个读写过程是阻塞的，而异步I/O则无需本身负责进行读写，异步I/O的实现会负责把数据从内核拷贝到用户空间。下来，分别谈谈。数组

select——>
异步

原理概述：socket

select 的核心功能是调用tcp文件系统的poll函数，不停的查询，若是没有想要的数据，主动执行一次调度（防止一直占用cpu），直到有一个链接有想要的消息为止。从这里能够看出select的执行方式基本就是不一样的调用poll,直到有须要的消息为止。

缺点：tcp

一、每次调用select，都须要把fd集合从用户态拷贝到内核态，这个开销在fd不少时会很大；ide

二、同时每次调用select都须要在内核遍历传递进来的全部fd，这个开销在fd不少时也很大；函数

三、select支持的文件描述符数量过小了，默认是1024。性能

优势：spa

一、select的可移植性更好，在某些Unix系统上不支持poll()。3d

二、select对于超时值提供了更好的精度：微秒，而poll是毫秒。orm

poll——>

原理概述：

poll本质上和select没有区别，它将用户传入的数组拷贝到内核空间，而后查询每一个fd对应的设备状态，若是设备就绪则在设备等待队列中加入一项并继续遍历，若是遍历完全部fd后没有发现就绪设备，则挂起当前进程，直到设备就绪或者主动超时，被唤醒后它又要再次遍历fd。这个过程经历了屡次无谓的遍历。poll还有一个特色是“水平触发”，若是报告了fd后，没有被处理，那么下次poll时会再次报告该fd。

缺点：

一、大量的fd的数组被总体复制于用户态和内核地址空间之间，而无论这样的复制是否是有意义；

二、与select同样，poll返回后，须要轮询pollfd来获取就绪的描述符。

优势：

一、poll() 不要求开发者计算最大文件描述符加一的大小。

二、poll() 在应付大数目的文件描述符的时候速度更快，相比于select。

三、它没有最大链接数的限制，缘由是它是基于链表来存储的。

epoll——>

原理概述：

epoll一样只告知那些就绪的文件描述符，并且当咱们调用epoll_wait()得到就绪文件描述符时，返回的不是实际的描述符，而是一个表明就绪描述符数量的值，你只须要去epoll指定的一个数组中依次取得相应数量的文件描述符便可，这里也使用了内存映射技术，这样便完全省掉了这些文件描述符在系统调用时复制的开销。

epoll的优势就是改进了前面所说缺点：

一、支持一个进程打开大数目的socket描述符：相比select，epoll则没有对FD的限制，它所支持的FD上限是最大能够打开文件的数目，这个数字通常远大于2048,举个例子,在1GB内存的机器上大约是10万左右，具体数目能够cat /proc/sys/fs/file-max察看,通常来讲这个数目和系统内存关系很大。

二、IO效率不随FD数目增长而线性降低：epoll不存在这个问题，它只会对"活跃"的socket进行操做--- 这是由于在内核实现中epoll是根据每一个fd上面的callback函数实现的。那么，只有"活跃"的socket才会主动的去调用 callback函数，其余idle状态socket则不会，在这点上，epoll实现了一个"伪"AIO，由于这时候推进力在os内核。在一些 benchmark中，若是全部的socket基本上都是活跃的---好比一个高速LAN环境，epoll并不比select/poll有什么效率，相反，若是过多使用epoll_ctl,效率相比还有稍微的降低。可是一旦使用idle connections模拟WAN环境,epoll的效率就远在select/poll之上了。

三、使用mmap加速内核与用户空间的消息传递：这点实际上涉及到epoll的具体实现了。不管是select,poll仍是epoll都须要内核把FD消息通知给用户空间，如何避免没必要要的内存拷贝就很重要，在这点上，epoll是经过内核于用户空间mmap同一块内存实现的。

三者对比与区别：

一、select，poll实现须要本身不断轮询全部fd集合，直到设备就绪，期间可能要睡眠和唤醒屡次交替。而epoll其实也须要调用epoll_wait不断轮询就绪链表，期间也可能屡次睡眠和唤醒交替，可是它是设备就绪时，调用回调函数，把就绪fd放入就绪链表中，并唤醒在epoll_wait中进入睡眠的进程。虽然都要睡眠和交替，可是select和poll在“醒着”的时候要遍历整个fd集合，而epoll在“醒着”的时候只要判断一下就绪链表是否为空就好了，这节省了大量的CPU时间。这就是回调机制带来的性能提高。

二、select，poll每次调用都要把fd集合从用户态往内核态拷贝一次，而且要把current往设备等待队列中挂一次，而epoll只要一次拷贝，并且把current往等待队列上挂也只挂一次（在epoll_wait的开始，注意这里的等待队列并非设备等待队列，只是一个epoll内部定义的等待队列）。这也能节省很多的开销。