服务端经典的C10k问题(译)

时间 2019-11-06

标签服务经典 c10k 问题栏目 C&C++ 繁體版

原文原文链接

服务端经典的C10K问题

最近看了一下Unix网络编程相关的内容，而后发现了一篇很是经典的文章, 内容可能不是很新，不过真的很经典,C10K问题,简单翻译了一下(markdown转换过来格式可能存在少许问题)对掌握linux io和 linux 线程会有更深的理解.(文内存在大量的连接.) 原文连接 The C10K problemphp

如今 web 服务器须要同时处理上万请求,难道不是吗?毕竟现在的网络将会有很大的发展空间. 计算机也一样强大.你能够花1200美圆买一台 1000MHz,2G 内存和1000Mbits/sec的网卡的机器.让咱们来看看-- 20000 客户端,每一个客户端 50KHz, 1000Kb 和每秒 50Kb,那没有什么比这两万个客户端每一个每秒从磁盘中取出4千字节并将它们每秒发送到网络上去更消耗资源了.(顺便说一下,每一个客户端0.0.8美圆,一些操做系统收费的单个客户端美圆的许可费看起来有点贵)因此硬件再也不是一种瓶颈.css

在1999年,最繁忙的 ftp 网站之一, cdrom.com, 实际上经过一个千兆以太网网卡同时处理 10000个客户端.如今相同的速度也被ISP 提供,他们但愿它变得愈来愈受大型企业客户的欢迎.html

轻量级的客户端计算模型彷佛又开始变得流行起来了 - 服务器在互联网上运行,为数千个客户提供服务.前端

基于以上的一些考虑,这有一些关于如何配置操做系统或者编写支持数千客户端的代码问题提出了一些注意点. 讨论的中心的主要是围绕着类Unix操做系统,由于这是我我的感兴趣的领域,可是Windows也会涉及一点.java

内容

C10K问题

内容]
相关网站
预读书籍
I/O 框架
I/O 策略

1. 一个线程服务多个客户端,使用非阻塞 IO 和水平触发的就绪通知
2. 一个线程服务多个客户端,使用非阻塞 IO 和就绪改变通知
3. 一个线程服务多个客户端,使用异步 I/O
4. 一个线程服务一个客户端
Linux线程

NGPT: Linux的下一代 Posix 线程
NPTL: Linux原生的 Posix 线程库
FreeBSD 线程支持
NetBSD 线程支持
Solaris 线程支持
JDK 1.3.x及更早版本中的Java线程支持
注意：1:1 线程与 M:N线程

5. 将服务端代码构建到内核中

将 TCP 协议栈带入用户空间
评论
打开文件句柄的限制
线程限制
Java问题]
其余建议
其余限制
内核问题
测试服务性能
例子
有趣的基于 select() 的服务器
有趣的基于 /dev/poll 的服务器
有趣的基于 epoll 的服务器
有趣的基于 kqueue() 的服务器
有趣的基于实时信号的服务器
有趣的基于线程的服务器
有趣的内核服务器
其余有趣的连接

预读书籍

若是你没有阅读过the late W. Richard Stevens的Unix网络编程: 网络Apis:套接字和Xti（第1卷)的拷贝,请尽快获取一份,它描述了不少的于 I/O 策略和编写高性能服务器的陷阱.它甚至谈到了 'thundering herd'问题.当你在阅读它时,请阅读 Jeff Darcy写的关于高性能服务器设计.nginx

(另一本书构建可扩展的网站可能会对使用而不是编写一个web服务器的人会有帮助)git

I/O 框架

如下提供了几个预打包的库,它们抽象了下面介绍的一些技术,使代码与操做系统隔离,并使其更具可移植性.github

ACE,一个轻量级的 C++ I/O 框架,包含一些用面对对象的思想实现的 I/O 策略和许多其余有用的事情.特别的,他的 Reactor 以面对对象的方式执行非阻塞 I/O,Proactor 是一种面对对象处理异步 I/O 的的方式.
ASIO 是一个 C++ I/O 框架,它正在成为Boost的一部分.这就像是为 STL 时代更新的ACE.
libevent 是 Niels Provos 写的一个轻量级的 C I/O 框架.它支持 kqueue 和 select,即将支持 poll 和 epoll.我想它应该只采用了水平触发,这具备两面性.Niels给了一个图来讲明时间和链接数目在处理一个事件上的功能,图中能够看出kqueue 和 sys_epoll 是明显的赢家.
我本身在轻量级框架的尝试(惋惜的是没有保持更新)

Poller 是一个轻量级的 C++ I/O 框架,它使用任何一种准备就绪API(poll, select, /dev/poll, kqueue, sigio)实现水平触发准备就绪API. 以其余多种 API 为基础测试,Poll的性能好的多.文档链到下面的Poller 子类,该连接文档的下面一部分说明了如何使用这些准备就绪API.
rn 是一个轻量级的C I/O 框架,这是我在Poller以后的第二次尝试. 他使用lgpl(所以它更容易在商业应用程序中使用) 和 C(所以更容易在非 C++ 的产品中使用).现在它被应用在一些商业产品中.

Matt Welsh 在2000年4月写了一篇关于如何在构建可扩展性服务时去平衡工做线程和事件驱动使用的论文,该论文描述了他的 Sandstorm I/O 框架.
Cory Nelson 的Scale!库 - 一个Windows下的异步套接字, 文件, 和管道 I/O 库.

I/O 策略

网络软件的设计者有多种选择.这有一些:

是否以及如何在单个线程发出多个 I/O 调用

不处理;使用阻塞和同步调用,尽量的使用多个线程和进程实现并发.
使用非阻塞调用(如,在一个socket write()上设置 O_NONBLOCK) 去启动 I/O,就绪通知(如,poll() 或则 /dev/poll)知道何时通道是 OK 的而后开启下一个 I/O.一般这只能用于网络 I/O,而不能用于磁盘 I/O.
使用异步调用(如,aio_write())去启动 I/O,完成通知(如,信号或完成端口)去通知 I/O 完成.这同时适用于网络和磁盘 I/O.

如何控制每一个客户的服务

一个进程服务一个客户(经典的 Unix 方法,从1980年左右就开始使用)
一个系统级别线程服务多个客户;每一个客户经过如下控制:

一个用户级别线程(如. GNU 状态线程, 带绿色线程的经典 java)
状态机(有点深奥，但在某些圈子里很受欢迎; 个人最爱)
continuation (有点深奥，但在某些圈子里很受欢迎; 个人最爱)

一个系统级线程服务单个客户(如,经典的带有原生线程的Java)

一个系统级线程服务每一个活跃的客户(如. Tomcat与apache的前端;NT完成端口; 线程池)
是否使用标准系统服务,或者构建服务到内核中(如,在一些自定义驱动,内核模块,或者 VxD)

下边的5中组合彷佛很是流行:

一个线程服务多个客户端.使用非阻塞 I/O 和水平触发就绪通知.
一个线程服务多个客户端.使用非阻塞 I/O 和就绪更改通知.
一个线程服务多个客户端. 使用异步 I/O.
一个线程服务多个客户端.使用阻塞 I/O
将服务端代码构建到内核

1. 一个线程服务多个客户端,使用非阻塞 IO 和水平触发就绪通知

... 在全部的网络句柄上都设置为非阻塞模式,使用 select() 或则 poll() 去告知哪一个网络句柄处理有数据等待.此模型是最传统的.这种模式下,内核告诉你是否一个文件描述符就绪,自从上次内核告诉你它以来,你是否对该文件描述符作了任何事情.('水平触发'这个名词来自计算机硬件设计;它与'边缘触发'相反).Jonathon Lemon在他的关于BSDCON 2000 paper kqueue()的论文中介绍了这些术语

注意: 牢记来自内核的就绪通知只是一个提示,这一点尤其重要;当你尝试去读取文件描述符的时候,它可能没有就绪.这就是为何须要在使用就绪通知时使用非阻塞模式的缘由.

一个重要的瓶颈是 read()或 sendfile() 从磁盘块读取时,若是该页当前并不在内存中.在设置非阻塞模式的磁盘文件处理是没有影响的.内存映射磁盘文件也是如此.首先一个服务须要磁盘 I/O时,他的处理块,全部客户端必须等待,所以原生非线程性能将会被浪费了.

这也就是异步 I/O 的目的,固然仅限于没有 AIO 的系统上,用多线程和多进程进行磁盘 I/O 也可能解决这个瓶颈.一种方法是使用内存映射文件,若是 mincore() 表示须要 I/O,让一个工做线程去进行 I/O 操做,并继续处理网络流量.Jef Poskanzer 提到 Pai, Druschel, and Zwaenepoel的1999 Flash web服务器使用这个技巧;他们在Usenix '99发表了关于它的演讲.看起来 mincore() 在BSD-derived Unixes 上是可用的,如像FreeBSD和Solaris,但它不是单Unix规范的一部分.从kernel2.3.51 开始,它也开始是linux的一部分,感谢Chuck Lever.

可是在2003年十一月的 freebsd-hackers list, Vivek Pei 等人报道了使用他们的 Flash web服务器有一个很好的结果.而后在攻击其瓶颈,其中发现一个瓶颈是 mincore(猜想以后这不是一个好办法),另一个就是 sendfile 阻塞磁盘访问;他们一种修改的 sendfile(),当他的访问磁盘页还没有处于核心状态时返回相似 EWOULDBLOCK 的内容,提高了性能.(不知道怎么告诉用户页如今是常驻的...在我看来真正须要的是aio_sendfile().)他们优化的最终结果是在 1GHZ/1GB 的FreeBSD盒子上 SpecWeb99 得分约为800,这比spec.org上的任何文件都要好.

在非阻塞套接字的集合中,关于单一线程如何告知哪一个套接字是准备就绪的,列出了几种方法:

传统的 select()
不幸的, select() 限制了 FD_SETSIZE 的处理.这个限制被编译到标准库和用户程序中.(一些 C 库版本让你在编译应用程序的时候提示这个限制.)
参阅Poller_select (cc,h)是一个如何使用 select() 与其余就绪通知模式交互的示例.
传统的 poll()
对于 poll() 能处理的文件描述符数量的没有硬编码限制,可是当有上千链接时会变得慢,由于大多数文件描述符在某个时刻都是是空闲的,彻底扫描成千上万个文件描述符会花费时间.
一些操做系统(像,Solaris 8)使用像 poll hinting 的技术加速了 poll() 等,Niels Provos 在1999年为Linux实现和并利用基准测试程序测试.
参阅Poller_poll (cc,h, benchmarks)是一个如何使用 poll() 与其余就绪通知模式交互的示例.
/dev/poll
这是推荐在Solaris 代替poll的方法
/dev/poll 的背后思想就是利用 poll() 在大部分的调用时使用相同的参数.使用/dev/poll,获取一个 /dev/poll 的文件描述符,而后把你关心的文件描述符写入到/dev/poll的描述符;而后,你就能够从该句柄中读取当前就绪文件描述符集.
它悄悄的出如今 Solaris 7 中(看 patchid 106541),可是它第一次公开现身是在Solaris 8中;据 Sun 透露,在750客户端的状况下,这只有 poll() 的10％的开销.
在Linux上尝试了 /dev/poll 的各类实现,但它们都没有像 epoll 同样高效,而且从未真正完成.不推荐在Linux上使用 /dev/poll.
参阅Poller_devpoll (cc, h 基础测试)是一个如何使用 /dev/poll 与其余就绪通知模式交互的示例.(注意 - 该示例适用于Linux /dev/poll,可能没法在 Solaris 上正常运行.)
kqueue()
是在FreeBSD系统上推荐使用的代替poll的方法(很快,NetBSD).
看下边 kqueue() 能够指定边缘触发或水平触发.

2. 一个线程服务多个客户端, 使用非阻塞 IO 和就绪改变通知

就绪改变通知(或边缘就绪通知)意味着你向内核提供文件描述符,而后,当该描述符从 not ready 转换为 ready 时,内核会以某种方式通知你.而后它假定你已知文件描述符已准备好,同时不会再对该描述符发送相似的就绪通知,直到你在描述符上进行一些操做使得该描述符再也不就绪(例如,直到你收到 EWOULDBLOCK 错误为止)发送,接收或接受呼叫,或小于请求的字节数的发送或接收传输).

当你使用就绪改变通知时,你必须准备处理好虚假事件,由于最多见的实现是只要接收到任何数据包都发出就绪信号,而无论文件描述符是否准备就绪.

这与"水平触发"就绪通知相反.它对编程错误的宽容度要低一些,由于若是你只错过一个事件,那么事件的链接就会永远停滞不前.能够尽管如此,我发现边缘触发的就绪通知能让使用OpenSSL编程非阻塞客户端变得更容易,所以仍是值得尝试.

[Banga, Mogul, Drusha '99]在1999年描述了这种类型的模式.

有几种API使应用程序检索"文件描述符准备就绪"通知：

kqueue() 这是在FreeBSD(很快,NetBSD)系统上推荐使用边缘触发的方法.
FreeBSD 4.3和之后的版本,以及截至2002年10月的NetBSD-current支持 poll() 的通用替代方法kqueue()/ kevent();它同时支持边缘触发和水平触发.(另见Jonathan Lemon的网页和他的BSDCon 2000 关于kqueue() 的论文.)
与 /dev/poll 同样,你能够分配一个监听对象,不过不是打开文件/dev/poll,而是调用kqueue() 来得到.须要改变你正在监听的事件或者要获取当前事件的列表,能够在kqueue()返回的描述符上调用kevent().它不只能够监听套接字就绪,还能够监听纯文件就绪,信号,甚至是 I/O 完成.
注意: 截至2000年10月,FreeBSD 上的线程库与 kqueue() 没法很好地交互; 所以,当kqueue() 阻塞时,整个进程都会阻塞,而不只仅是调用kqueue()的线程.
参阅Poller_kqueue (cc, h,基础测试)是一个如何使用 kqueue() 与其余就绪通知模式交互的示例
使用 kqueue() 的示例和库:

PyKQueue - kqueue() 的 Python 绑定
Ronald F. Guilmette的示例echo服务器;另外能够看看他2000年9月28日写的关于freebsd.questions的帖子.

epoll
这是Linux 2.6 的内核中推荐使用的边沿触发poll.
2001年7月11日,Davide Libenzi 提出了实时信号的替代方案;他将他的补丁称之为/dev/epoll www.xmailserver.org/linux-patches/nio-improve.html. 这就像实时的信号就绪通知同样,同时它能够合并冗余事件,而且具备更高效的批量事件检索的方法.
当接口从 /dev 中的特殊文件更改成系统调用 sys_epoll 后,Epoll就合并到2.5.46 版本的内核开发树中. 2.4 内核能够也使用旧版 epoll 的补丁.
在2002年万圣节先后,linux 内核邮件列表就统一epoll,aio和其余事件源的问题进行了长时间的争论.它也会会发生,但Davide首先仍是集中精力打造 epoll.
Polyakov的 kevent(Linux 2.6+) 新闻报道: 2006年2月9日和2006年7月9日，Evgeniy Polyakov发布了补丁,彷佛统一了epoll和aio;他的目标是支持网络AIO.看到：

Drepper的新网络接口(Linux 2.6+提案)
在OLS 2006上,Ulrich Drepper提出了一种新的高速异步网络API.看到：

实时信号
Linux2.4 内核中推荐使用的边沿触发poll.
linux 2.4 内核能够经过特定的实时信号分配套接字就绪事件.示例以下:

/* Mask off SIGIO and the signal you want to use. */
sigemptyset(&sigset);
sigaddset(&sigset, signum);
sigaddset(&sigset, SIGIO);
sigprocmask(SIG_BLOCK, &m_sigset, NULL);
/* For each file descriptor, invoke F_SETOWN, F_SETSIG, and set O_ASYNC. */
fcntl(fd, F_SETOWN, (int) getpid());
fcntl(fd, F_SETSIG, signum);
flags = fcntl(fd, F_GETFL);
flags |= O_NONBLOCK|O_ASYNC;
fcntl(fd, F_SETFL, flags);复制代码

当 read() 或 write() 等普通 I/O 函数完成时,发送该信号.要使用该段的话,在循环里面,当poll()处理完全部的描述符后,进入 sigwaitinfo()sigwaitinfo() 循环.
若是 sigwaitinfo 或 sigtimedwait 返回你的实时信号,siginfo.si_fd 和 siginfo.si_band 提供的信息几乎与 pollfd.fd 和 pollfd.revents 在调用 poll() 以后的信息相同,若是你处理该 I/O,那么就继续调用sigwaitinfo()
若是 sigwaitinfo 返回传统的 SIGIO,那么信号队列溢出,你必须经过临时将信号处理程序更改成SIG_DFL来刷新信号队列,而后回到外层poll()循环.
参阅Poller_sigio (cc, h)是一个如何使用 rtsignals 与其余就绪通知模式交互的示例.
参阅Zach Brown的phhttpd,例如直接使用此功能的代码.(仍是不要; phhttpd有点难以弄清楚......)
[Provos，Lever和Tweedie 2000]描述了 phhttpd 的最新基准,使用的不一样的sigtimedwait(),sigtimedwait4(),它容许你经过一次调用检索多个信号.有趣的是 sigtimedwait4() 对他们的主要好处彷佛是容许应用程序来衡量系统过载(所以它能够行为恰当).(请注意,poll()也提供了一样的系统负载测量.）

每一个fd一个信号
Signal-per-fd是由Chandra和Mosberger提出的对实时信号的一种改进,它经过合并冗余事件来减小或消除实时信号队列溢出.但它并无超越 epoll.他们的论文 (www.hpl.hp.com/techreports…)将此方案的性能与select() 和 /dev/poll 进行了比较.
Vitaly Luban于2001年5月18日宣布了一项实施该计划的补丁;他的补丁产生于www.luban.org/GPL/gpl.htm….(注意:截至2001年9月,这个补丁在高负载下可能存在稳定性问题.dkftpbench在大约4500个用户可能会触发oops.)
参阅Poller_sigfd (cc,h)是一个如何使用 signal-per-fd 与其余就绪通知模式交互的示例.

3. 一个线程服务多个客户端,使用异步 I/O.

这在Unix至今都没有流行起来,多是由于较少的操做系统支持了异步 I/O,也多是由于(像非阻塞 I/O)它要求从新思考应用程序.在标准 Unix 下,异步 I/O 被aio_ 接口提供(从该连接向下滚动到"异步输入和输出"),它将信号和值与每一个 I/O操做相关联.信号及其值排队并有效地传递给用户进程.这是来自 POSIX 1003.1b 实时扩展,也是单Unix规范第二版本.

AIO一般与边缘触发完成通知一块儿使用,即当操做完成时,信号排队.(它也能够经过调用aio_suspend()与水平触发的完成通知一块儿使用,虽然我怀疑不多有人这样作.)

glibc 2.1和后续版本提供了一个普通的实现,仅仅是为了兼容标准,而不是为了得到性能上的提升.

截止linux内核 2.5.32,Ben LaHaise的 Linux AIO 实现已合并到主 Linux 内核中.它不使用内核线程,同时还具备很是高效的底层api,可是(从2.6.0-test2开始)还不支持套接字.(2.4内核还有一个 AIO 补丁,但 2.5/2.6 实现有些不一样.)更多信息:

网页"Linux的内核异步 I/O(AIO)支持,试图将有关 2.6 内核的 AIO 实现的全部信息联系在一块儿(2003年9月16日发布).
第3轮: Benjamin C.R. LaHaise 的aio vs /dev/epoll(2002年OLS发表)
Linux2.5中的异步I/O支持由Bhattacharya,Pratt,Pulaverty和Morgan,IBM提供发表在OLS'2003.
Suparna Bhattacharya针对Linux的异步 I/O(aio) 设计说明 - 将 Ben 的 AIO 与 SGI 的 KAIO 和其余一些 AIO 项目进行比较
Linux AIO主页 - Ben的初步补丁,邮件列表等.
linux-aio邮件列表档案
libaio-oracle - 在libaio之上实现标准Posix AIO的库.Joel Becker于2003年4月18日首次提到.

Suparna还建议看看DAFS API 对 AIO 的方法.

Red Hat AS和 Suse SLES 都在2.4内核上提供了高性能的实现.它与2.6内核实现有关,但并不彻底相同.

2006年2月,网络AIO有一个新的尝试;看上面关于Evgeniy Polyakov基于kevent的AIO的说明

在1999年,SGI为 Linux 实现了高速 AIO,从版本1.1开始,听说能够很好地兼容磁盘 I/O 和套接字.它彷佛使用内核线程.对于那些不能等待 Ben 的 AIO 支持套接字的人来讲,会仍然颇有用.

O'Reilly的书POSIX.4: 真实世界的编程听说涵盖了对aio的一个很好的介绍.

Solaris早期非标准的aio实现的教程在线Sunsite.这可能值得一看,但请记住,你须要在精神上将"aioread"转换为"aio_read"等.

请注意,AIO不提供在不阻塞磁盘 I/O 的状况下打开文件的方法; 若是你关心打开磁盘文件致使休眠,Linus建议你只需在另外一个线程中执行 open（）而不是是进行 aio_open() 系统调用.

在Windows下,异步 I/O 与术语"重叠 I/O "和 IOCP 或"I/O完成端口"相关联.微软的 IOCP 结合了现有技术的技术,如异步 I/O(如aio_write)和排队完成通知(如将 aio_sigevent 字段与 aio_write 一块儿使用时),以及阻止某些请求尝试保持运行线程数量相关的新想法具备单个 IOCP 常量.欲得到更多信息,请参阅 sysinternals.com 上的 Mark Russinovich 撰写的I/O 完成端口的内部,Jeffrey Richter的书 "为Microsoft Windows 2000编写服务端程序"(Amazon, MSPress), U.S. patent #06223207, 或者MSDN.

4. 一个线程服务多个客户端

...让 read() 和 write() 阻塞.每一个客户端使用整个栈侦会有很大的缺点,就是消耗内存.不少操做系统也难以操做处理上百个线程.若是每一个线程得到2MB堆栈（不是很是见的默认值),则在 32 位机器上的 (2^30/2 ^21）= 512 个线程上会耗尽虚拟内存,具备 1GB 用户可访问的VM(好比,Linux 一般在 x86 上容许)你能够经过提供更小的栈解决这个问题,可是线程一旦建立,大多数线程库都不容许增长线程栈,因此这样作就意味着你必须使你的程序最小程度地使用内存.你也能够经过转移到64位处理器来解决这个问题.

在Linux, FreeBSD, Solaris上的线程支持是正在完善,即便对于主流用户来讲,64位处理器也即将到来.也许在不就的未来,那些喜爱每一个客户端使用一个线程的人也有能力服务10000个客户端了.然而,在目前这个时候,若是你真的想要支持那么多客户,你可能最好仍是使用其余一些方法.

对于绝不掩饰的亲线程观点的人,请参阅为何事件是一个坏主意(对于高并发服务器)由von Behren,Condit和Brewer,UCB,在HotOS IX上发布.有反线营地的任何人能指出一篇反驳这篇论文的论文吗？:-)

Linux 线程

Linux线程是标准Linux线程库的名称.从 glibc2.0 开始,它就集成到 glibc 中,主要是符合 Posix 标准,但性能和信号支持度上都不尽如人意.

NGPT: Linux 的下一代的 Posix 线程

NGPT是 IBM 启动的为 Linux 带来更好的 Posix 线程兼容性的项目.他目前的稳定版本是2.2,工做的很是好...可是 NGPT 团队宣布他们将 NGPT 代码库置于support-only模式,由于他们以为这是"长期支持社区的最佳方式". NGPT团队将会继续改进 Linux 的线程支持,可是如今主要集中在NPTL.(感谢NGPT团队的出色工做以及他们以优雅的方式转向NPTL.)

NPTL: Linux 原生的 Posix 线程库

NPTL是由Ulrich Drepper(glibc的维护人员)和Ulrich Drepper发起的,目的是为Linux带来的world-class Posix线程库支持.

截至2003年10月5日,NPTL 如今做为附加目录合并到 glibc cvs 树中(就像linux线程),因此它几乎确定会与 glibc 的下一个版本一块儿发布.

Red Hat 9是最先的包含NPTL的发行版本(这对某些用户来讲有点不方便，但有人不得不打破僵局...）

NPTL 连接:

NPTL讨论的邮件列表
NPTL源码
NPTEL的初步公告
描述NPTEL目标的原始白皮书
修订后的白皮书描述了NPTEL的最终设计
Ingo Molnar的第一个基准显示它能够处理10^6个线程
Ulrich的基准测试对比了linux线程,NPTL,和IBM的NGPT的性能.它彷佛显示 NPTL 比 NGPT 更快.

这是我尝试写的描述NPTL历史的文章(也能够看看Jerry Cooperstein的文章):

在2002年3月, NGPT团队的Bill Abt, glibc的维护者与Ulrich Drepper和其余人会面探讨LinuxThreads的发展.会议产生的一个想法是提升互斥性能;Rusty Russell 等人后来实现了快速用户空间锁(futexes)),它如今被用在 NGPT 和 NPTL 中.大多数与会者认为NGPT应该被合并到glibc.

但Ulrich Drepper并不喜欢 NGPT,认为他能够作得更好.(对于那些试图为 glibc 作出补丁的人来讲,这可能不会让人大吃一惊:-)在接下来的几个月里,Ulrich Drepper,Ingo Molnar致力于 glibc 和内核的变化,这些变化构成了 Native Posix线程库(NPTL).NPTL使用了NGPT设计的全部内核改进,并利用一些新功能:

> NPTL使用NGPT引入的三个内核特性：getpid()返回 PID,CLONE_THREAD 和 futexes;NPTL还使用(并依赖)更普遍的新内核功能,做为该项目的一部分开发.

> 引入 2.5.8 内核的 NGPT 中的一些项目获得了修改,清理和扩展,例如线程组处理(CLONE_THREAD).[影响 NGPT 兼容性的 CLONE_THREAD 更改与 NGPT 人员同步,以确保NGPT不会以任何不可接受的方式破坏.]

> NPTL开发和使用的内核功能在设计白皮书中有描述,people.redhat.com/drepper/npt… ...

> 简短列表:TLS支持,各类克隆扩展(CLONE_SETTLS,CLONE_SETTID,CLONE_CLEARTID),POSIX线程信号处理,sys_exit()扩展(在VM发布时发布TID futex)sys_exit_group()系统调用,sys_execve()加强功能并支持分离的线程.

> 还有扩展 PID 空间的工做 - 例如,procfs因为 64K PID 的设计,为max_pid 和 pid 分配可伸缩性的工做而崩溃.此外，还进行了许多仅针对性能的改进.

> 本质上,新功能彻底是使用1:1线程方法 - 内核如今能够帮助改进线程的全部内容,而且咱们为每一个基本线程原语精确地执行最低限度必需的上下文切换和内核调用.

FreeBSD线程支持

FreeBSD同时支持 linux 线程和用户空间线程库.此外,在 FreeBSD 5.0 中引入了一个名为 KSE 的 M:N 实现.概述,参阅www.unobvious.com/bsd/freebsd….

2003年3月25日,Jeff Roberson在 freebsd-arch 上发布了帖子:

...感谢Julian,David Xu,Mini,Dan Eischen,和其它的每一位参加了KSE和libpthread开发的成员所提供的基础,Mini和我已经开发出了一个 1:1 模型的线程实现.此代码与 KSE 并行工做，不会以任何方式更改它.它实际上有助于经过测试共享位来使M:N线程更接近...

并于2006年7月,Robert Watson提出的 1:1 线程应该成为FreeBsd 7.x中的默认实现:

我知道过去曾经讨论过这个问题,但我认为随着7.x向前推动,是时候从新考虑一下这个问题.在许多常见应用程序和特定场景的基准测试中,libthr 表现出比 libpthread 更好的性能... libthr也在咱们的大量平台上实现的,而且已经在几个平台上实现了 libpthread.咱们对 MySQL 和其余大量线程的使用者建议是"切换到libthr",这也是暗示性的! ...因此草书建议是:使libthr成为7.x上的默认线程库.

NetBSD线程支持

根据Noriyuki Soda的说明:

内核支持 M:N 基于 Scheduler Activations 模型线程库将于2003年1月18日合并到NetBSD-current中.

更多细节,看由NethanD系统公司的 Nathan J. Williams在2002年的FREENIX上的演示An Implementation of Scheduler Activations on the NetBSD Operating System.

Solaris 线程支持

Solaris中的线程支持发展...从 Solaris 2 到 Solaris 8,默认线程库使用 M:N 模型，但 Solaris 9 默认为 1:1 模型线程支持.看Sun的多线程编程指导和Sun关于 Java 和 Solaris 线程的笔记

Java线程从JDK 1.3.x及之后开始支持

众所周知,直到 JDK1.3.x 的 Java 不支持处理除每一个客户端一个线程以外的任何网络链接方法.Volanomark是一个很好的微基准测试,它能够在不一样数量链接中测量每秒消息的吞吐量.截至2003年5月,来自不一样供应商的 JDK 1.3实际上可以处理一万个同时链接 - 尽管性能显着降低.请参阅表4,了解哪些 JVM 能够处理10000个链接,以及随着链接数量的增长性能会受到影响.

注意：1:1 线程与 M:N 线程

在实现线程库时有一个选择: 你能够将全部线程支持放在内核中(这称为 1:1 线程模型),或者您能够将其中的至关一部分移动到用户空间(这称为 M:N 线程模型).有一点,M:N被认为是更高的性能,但它太复杂了,很难作到正确,大多数人都在远离它.

为何Molnar更偏好 1:1 比 M:N
Sun正在向 1:1 线程发展
NGPT是一个Linux M:N 线程库.
尽管Ulrich Drepper计划在新的 glibc 线程库中去使用 M:N 线程,他从那之后切换到 1:1 线程模型
MacOSX出现使用 1:1 线程.
FreeBSD 和 NetBSD彷佛仍然相信 M:N线程...孤独的坚持?看起来像 freebsd 7.0 可能会切换到 1:1 线程(见上文),因此也许 M:N 线程的信徒最终被证实是错误的.

5. 将服务器代码构建到内核中

听说 Novell 和微软已经在不一样的时间作过这个,至少有一个 NFS 实现是这样作的,khttpd为Linux和静态网页作了这个,"TUX"(线程linux web服务器)是Ingo Molnar为Linux的一个快速且灵活的内核空间HTTP服务器. Ingo的2000年9月1日公告表示能够从ftp://ftp.redhat.com/pub/redhat/tux 下载 TUX 的alpha版本,并解释如何加入邮件列表以获取更多信息.

linux-kernel列表一直在讨论这种方法的优势和缺点,并且彷佛不是将 Web 服务器移动到内核中,内核应该添加最小的钩子来提升Web服务器的性能.这样,其余类型的服务器能够受益.参见例如Zach Brown的评论关于 userland 与内核 http 服务器的关系.彷佛2.4 linux 内核为用户程序提供了足够的功能，由于X15服务器的运行速度与Tux同样快,但不使用任何内核修改.

Bring the TCP stack into userspace

例如,参见netmap数据包 I/O 框架和Sandstorm基于这个概念验证Web服务器.

Richard Gooch已经写了一篇关于讨论 I/O 选项的论文.

在2001年,Tim Brecht和MMichal Ostrowski测试了多种策略为简化基于 select 的服务器.他们的数据值得一看.

在2003年,Tim Brecht发布了userver的源代码,由Abhishek Chandra, David Mosberger, David Pariag 和 Michal Ostrowski 编写的几台服务器组成的小型Web服务器.它能使用select(), poll(),或者sigio.

早在1999年3月,Dean Gaudet的文章:

我不断被问到"为何大家不使用像Zeus这样的基于select/event的模型？它显然是最快的."...

他的理由归结为"这真的很难，收益还不清楚",然而,在几个月内,很明显人们愿意继续努力.

Mark Russinovich 写了一篇社论和文章讨论在 linux内核2.2 中的 I/O 策略问题.值得一看,甚至他彷佛在某些方面也被误导了.特别是,他彷佛认为Linux 2.2 的异步 I/O (参见上面的F_SETSIG)在数据就绪时不会通知用户进程,只有当新链接到达时.这彷佛是一个奇怪的误解.也能够看看更早的草案,Ingo Molnar于1999年4月30日的反驳,Russinovich对1999年5月2日的评论, 一个来自Alan Cox的反驳,和各类linux-kernel的帖子,我怀疑他试图说 Linux 不支持异步磁盘I/O,这曾经是真的,可是如今 SGI 已经实现了KAIO,它再也不那么真实了.

有关"完成端口"的信息,请参阅sysinternals.com和MSDN上的这些网页,他说这是NT独有的;简而言之,win32的"重叠 I/O "结果过低而不方便，"完成端口"是一个提供完成事件队列的包装器，加上调试魔术试图保持运行的数量,若是从该端口获取完成事件的其余线程正在休眠(可能阻塞I/O)则容许更多线程获取完成事件,从而使线程保持不变。

另请参阅OS/400对I/O完成端口的支持

1999年9月对linux-kernel进行了一次有趣的讨论"> 15,000个同时链接"(和线程的第二周).强调:

Ed Hall发布关于他的经历的一些笔记; 他在运行Solaris的UP P2/333上实现了>1000次链接/秒.他的代码使用了一小块线程(每一个CPU1或2个),每一个线程使用"基于事件的模型”管理大量客户端.
Mike Jagdis 发布了对 poll/select 性能开销的分析,并说"当前的select/poll 实现能够获得显着改善,特别是在阻塞状况下,但因为 select/poll 没有,所以开销仍会随着描述符的数量而增长,而且不能,记住哪些描述符颇有趣的.这很容易用新的API修复.欢迎提出建议......"
Mike发布关于他改进select()和poll()的工做.
Mike 发布了一些可能的API来替换poll()/select(): "你能够编写'pollfd like'结构的'device like'API，'device'监听事件并在你读它时提供表明它们的'pollfd like'结构？..."
Rogier Wolff 建议使用"数字家伙建议的API",www.cs.rice.edu/~gaurav/pap…
Joerg Pommnitz 指出沿着这些线路的任何新API应该不只可以等待文件描述符事件,还可以等待信号和SYSV-IPC.咱们的同步原语至少应该可以作到Win32的WaitForMultipleObjects.
Stephen Tweedie断言,_SETSIG,排队的实时信号和 sigwaitinfo() 的组合是 www.cs.rice.edu/~gaurav/pap… 中提出的API的超集.他还提到,若是你对性能感兴趣,你能够随时阻止信号;而不是使用异步传递信号,进程使用sigwaitinfo()从队列中获取下一个信号.
Jayson Nordwick 比较完成端口和F_SETSIG 同步事件模型,得出的结论是它们很是类似.
Alan Cox 指出SCT的 SIGIO 补丁的旧版本包含在2.3.18ac中.
Jordan Mendelson 发布一些示例代码,展现了如何使用F_SETSIG.
Stephen C. Tweedie 继续比较完成端口和F_SETSIG,并注意到:"使用信号出队机制,若是库使用相同的机制,您的应用程序将获取发往各类库组件的信号",但库能够设置本身的信号处理程序,因此这不该该影响程序(不少).
Doug Royer指出,当他在 Sun 日历服务器上工做时,他在 Solaris 2.6 上得到了 100,000 个链接.其余人则估计Linux须要多少RAM，以及会遇到什么瓶颈。

有趣的阅读！

打开文件句柄的限制

任何Unix: 都由ulimit或setrlimit设置限制
Solaris: 看 Solaris FAQ，问题3.46 (或左右; 他们按期从新编号)
FreeBSD:
编辑 /boot/loader.conf, 增长行
set kern.maxfiles=XXXX
其中XXXX是文件描述符所需的系统限制,并从新启动.感谢一位匿名读者，他写道,他说他在FreeBSD 4.3上得到了超过10000个链接，并说
"FWIW: 你实际上没法经过sysctl轻松调整FreeBSD中的最大链接数....你必须在/boot/loader.conf文件中这样作.
这样作的缘由是 zalloci() 调用初始化套接字和 tcpcb 结构区域在系统启动时很早就发生了，这样区域既能够是类型稳定的又能够交换。
您还须要将 mbuf 的数量设置得更高，由于您在(在未修改的内核上)为 tcptempl 结构每一个链接消耗一个mbuf,用于实现 keepalive."

其余的读者说到:
"从FreeBSD 4.4开始,再也不分配 tcptempl 结构; 你再也不须要担忧每一个链接都会被消耗一个mbuf

也能够看看:

the FreeBSD 手册
SYSCTL TUNING, LOADER TUNABLES,和 KERNEL CONFIG TUNING
调整FreeBSD 4.3 Box对高性能的影响, 守护进程新闻,2001年8月
postfix.org 调整笔记, 涵盖FreeBSD 4.2 和 4.4
the Measurement Factory 的笔记, 大约是FreeBSD 4.3

OpenBSD: 读者说
"在OpenBSD,须要额外的调整来增长每一个进程可用的打开文件句柄的数量: /etc/login.conf 的openfiles-cur参数须要被增长. 您可使用sysctl -w 或 sysctl.conf 更改 kern.max 文件,但它不起做用.这很重要，由于对于非特权进程，login.conf限制为很是低的64，对于特权进程为128
Linux: 参阅Bodo Bauer的 /proc 文档. 在2.4内核
echo 32768 > /proc/sys/fs/file-max
增大系统打开文件的限制.和
ulimit -n 32768
ulimit -n 32768
增大当前进程的限制
On 2.2.x kernels,
在 2.2.x 内核,
echo 32768 > /proc/sys/fs/file-max echo 65536 > /proc/sys/fs/inode-max
增大系统打开文件的限制.和
ulimit -n 32768
ulimit -n 32768
增大当前进程的限制
我验证了 Red Hat 6.0 上的进程(2.2.5 左右加补丁)能够经过这种方式打开至少31000 个文件描述符.另外一位研究员已经证明,2.2.12 上的进程能够经过这种方式打开至少90000 个文件描述符(具备适当的限制).上限彷佛是可用的内存。
Stephen C. Tweedie 发表关于如何使用 initscript 和 pam_limit 在引导时全局或按用户设置 ulimit 限制.
在 2.2 更老的内核,可是,即便进行了上述更改,每一个进程的打开文件数仍限制为1024
另见Oskar1998年的帖子,其中讨论了 2.0.36 内核中文件描述符的每一个进程和系统范围限制。

线程限制

在任何体系结构上,您可能须要减小为每一个线程分配的堆栈空间量,以免耗尽虚拟内存.若是使用pthreads,可使用pthread_attr_init() 在运行时设置它。

Solaris: 我据说,它支持尽量多的线程以适应内存
带有 NPTL 的内核: /proc/sys/vm/max_map_count 也许须要被增长到大于 32000 的线程.（可是,除非你使用64位处理器,不然你须要使用很是小的堆栈线程来得到接近该数量的线程.）参见NPTL邮件列表,例如主题为"没法建立超过32K线程?,了解更多信息。
Linux 2.4: /proc/sys/kernel/threads-max 是最大数量的线程;个人Red Hat 8系统默认为2047.你能够像往常同样经过echo新值到该文件来设置增长值,如."echo 4000 > /proc/sys/kernel/threads-max"
Linux 2.2: 甚至 2.2.13 内核限制了线程数量, 至少在Intel. 我不知道在其余架构上是什么限制.Mingo在英特尔上发布了针对 2.1.131 的补丁移除了这个限制.它已归入2.3.20.
另请参阅Volano关于在2.2内核中提高文件，线程和FD_SET限制的详细说明. 哇.这个文档将引导您完成许多难以理解的内容，但有点过期了。
Java: 请参阅Volano的详细基准信息. 加上他们关于如何调整各类系统的信息去处理大量线程.

Java 问题

经过JDK 1.3, Java的标准网络库大多提供了一个客户端一个线程模型.这是一种非阻塞读的方式,可是没有办法去作非阻塞写.

在2001年5月. JDK 1.4 引进了包 java.nio 去提供彻底支持非阻塞 I/O (和其余好的东西).看发行说明警告.尝试一下,给Sun反馈!

HP 的 java 也包含了一个线程轮训API.

在2000, Matt Welsh为java实现了非阻塞套接字.他的性能基准测试显示他们优于在处理大量(大于10000)链接的服务器中的阻塞套接字.他的类库被称做java-nbio;他是Sandstorm项目的一部分.基准测试显示10000链接的性能是可用的.

参阅 Dean Gaude关于 Java , 网络 I/O, 和线程主题的文章,和 Matt Welsh 写的关于事件对比工做线程的论文

在 NIO 以前,有几个改进Java的网络API的建议:

Matt Welsh 的Jaguar 系统提出预序列化对象,新的 Java 字节码和内存管理更改容许使用 Java 进行异步I/O.
C-C. Chang and T. von Eicken写的将Java链接到虚拟接口体系结构提出内存管理更改容许 Java 使用异步 I/O.
JSR-51是提出 java.nio 包的Sun工程项目. Matt Welsh参加了(谁说Sun不听?).

其余建议

零拷贝
一般状况下,数据会从一处到其余处屡次复制.任何将这些副本消除到裸体物理最小值的方案称为"零拷贝".

Thomas Ogrisegg 在 Linux 2.4.17-2.4.20 下为 mmaped 文件发送零拷贝发送补丁.声称它比 sendfile() 更快.
IO-Lite 是一组 I/O 原语的提议,它摆脱了对许多副本的需求.
在1999年, Alan Cox指出零拷贝有时是不值的会遇到麻烦.(但他确实喜欢sendfile())

Ingo于2000年7月在 2.4 内核中为 TUX 1.0实现了一种零拷贝TCP,他说他很快就会将其提供给用户空间.

Drew Gallatin and Robert 已经为FreeBSD增长了一些零拷贝特性;想法彷佛是若是你在一个套接字上调用 write() 或者 read(),指针是页对齐的,而且传输的数据量至少是一个页面, 同时你不会立刻重用缓冲区,内存管理技巧将会用于避免拷贝. 可是请参阅linux-kernel上关于此消息的后续内容，以了解人们对这些内存管理技巧速度的疑虑.
根据Noriyuki Soda的说明:
自NetBSD-1.6发布以来，经过指定 "SOSEND_LOAN" 内核选项，支持发送端零拷贝.此选项如今是 NetBSD-current 的默认选项(你能够经过在 NetBSD_current 上的内核选项中指定"SOSEND_NO_LOAN"来禁用此功能).使用此功能时，若是将超过4096字节的数据指定为要发送的数据，则会自动启用零复制.
sendfile() 系统调用能够实现零拷贝网络.
Linux和FreeBSD中的sendfile()函数容许您告诉内核发送部分或所有文件. 使操做系统尽量高效地完成。它能够在使用非阻塞 I/O 的线程或服务器的服务器中一样使用.(在 Linux中,目前他的记录还不多;使用_syscall4 去调用它.Andi Kleen 正在写覆盖该内容的 man 页面.另请参阅Jeff Tranter在Linux Gazette issue 91中探索 sendfile 系统调用.) 有传言称 ftp.cdrom.com 受益于 sendfile().
sendfile() 的零拷贝实现正在为2.4内核提供.看LWN Jan 25 2001.
一个开发者在 Freebsd 下使用 sendfile() 的报告显示使用 POLLWRBAND 而不是 POLLOUT 会产生很大的不一样.
Solaris 8 (截至2001年7月更新) 有一个新的系统调用'sendfilev'.手册页的副本在这里. Solaris 8 7/01 发版说明也提到了它.我怀疑这在以阻塞模式发送到套接字时最有用;使用非阻塞套接字会有点痛苦。

使用writev避免使用小帧(或者 TCP_CORK)
一个新的在 Linux 下的套接字选项, TCP_CORK,告诉内核去避免发送部分帧,这有点帮助,例如当有不少小的 write() 调用时,因为某种缘由你不能捆绑在一块儿.取消设置选项会刷新缓冲区.最好使用writev(),但......
看LWN Jan 25 2001,关于TCP-CORK和可能的替代MSG_MORE的关于linux-kernel的一些很是有趣的讨论的摘要.
在过载时表现得智能.
[Provos, Lever, and Tweedie 2000]提到在服务器过载时丢弃传入链接能够改善性能曲线的形状,并下降总体错误率.他们使用平滑版本的" I/O 就绪客户端数"做为过载的衡量标准.此技术应该很容易应用于使用 select, poll 或任何系统调用编写的服务器,这些调用返回每次调用的就绪事件技术（例如 /dev/poll 或 sigtimedwait4()).
某些程序能够从使用非Posix线程中受益.
并不是全部线程都是相同的.例如,Linux 中的 clone() 函数（及其在其余操做系统中的朋友）容许您建立具备其本身的当前工做目录的线程,这在实现ftp服务器时很是有用.有关使用本机线程而不是 pthreads 的示例，请参阅 Hoser FTPd。
缓存本身的数据有时多是一个胜利.
Vivek Sadananda Pai(vivek@cs.rice.edu)在 new-httpd"回复: 修复混合服务器问题",5月9日,声明:
"我在 FreeBSD 和 Solaris/x86 上比较了基于 select 的服务器和多进程服务器的原始性能.在微基准测试中,软件架构的性能差别很小.基于 select 的服务器的巨大性能优点源于进行应用程序级缓存.虽然多进程服务器能够以更高的成本实现,但实际工做负载(与微基准测试相比)更难得到相同的好处.我将把这些测量结果做为论文的一部分展现，这些论文将出如今下一届Usenix会议上.若是你有后记，那么论文能够在www.cs.rice.edu/~vivek/flas…"

其余限制

旧系统库可能使用16位变量来保存文件句柄,这会致使32767句柄之上的麻烦.glibc2.1应该没问题。
许多系统使用16位变量来保存进程或线程ID.将Volano可伸缩性基准测试移植到C会颇有意思，看看各类操做系统的线程数上限是多少.
某些操做系统预先分配了过多的线程本地内存;若是每一个线程得到1MB,而且总VM空间为2GB,则会建立2000个线程的上限.
查看www.acme.com/software/th… 底部的性能对比图.请注意各类服务器如何在 128个以上的链接上出现问题,甚至在 Solaris 2.6上知道缘由的人,让我知道.

注意: 若是TCP堆栈有一个bug,致使 SYN 或 FIN 时间更短(200ms)延迟,如 Linux 2.2.0-2.2.6 所示,而且操做系统或 http 守护程序对链接数有硬限制,你会期待这种行为.可能还有其余缘由.

内核问题

对于Linux,看起来内核瓶颈正在不断修复.看Linux Weekly News,Kernel Traffic, the Linux-Kernel mailing list,和my Mindcraft Redux page.

1999年3月,微软赞助了一项比较 NT 和 Linux 的基准测试,用于服务大量的 http 和 smb客户端,linux的结果不如人意.另见关于Mindcraft 1999年4月基准测试的文章了解更多信息

另请参见Linux可扩展性项目.他们正在作有趣的工做.包括Niels Provos的暗示民意调查补丁,关于雷鸣般的群体问题的一些工做.

另请参与Mike Jagdis致力于改进 select() 和 poll();这是Mike关于它的帖子.

Mohit Aron（aron@cs.rice.edu）写道，TCP中基于速率的时钟能够将"缓慢"链接上的HTTP响应时间提升80％

测量服务器性能

特别是两个测试简单,有趣,并且很难：

每秒原始链接数(每秒能够提供多少512字节文件?)
具备许多慢速客户端的大型文件的总传输速率(在性能进入底池以前,有多少 28.8k 调制解调器客户端能够同时从服务器下载?)

Jef Poskanzer发布了比较许多Web服务器的基准测试.看他的结果www.acme.com/software/th…

我也有关于将thttpd与Apache比较的一些旧笔记可能对初学者感兴趣.

Chuck Lever不断提醒咱们关于Banga和Druschel关于Web服务器基准测试的论文.值得一读。

IBM有一篇名为Java服务器基准测试的优秀论文.[Baylor 等,2000年].值得一读。

例子

Nginx 是一个web服务器，它使用目标操做系统上可用的任何高效网络事件机制.它变得很是流行;这甚至有关于它的两本书

有趣的基于 select() 的服务器

thttpd 很是简单. 使用单进程.他有很是好的性能,可是它不会随着 CPU 的数量而扩展. 也可使用kqueue.
mathopd. 和thttpd类似.
fhttpd
boa
Roxen
Zeus,试图成为绝对最快的商业服务器.看他们的调整指导.
其余非 Java 服务列在www.acme.com/software/th…
BetaFTPd
Flash-Lite - 使用 IO-Lite 的Web服务器。
Flash: 高效便携的Web服务器 - 使用select(), mmap(), mincore().
截至2003年的Flash Web服务器 - 使用 select(), 修改的 sendfile(), 异步 open().
xitami - 使用 select() 去实现它本身的线程抽象,以便无需线程的系统的可移植性.
Medusa - Python中的服务器编写工具包，旨在提供很是高的性能.
userver - 一个小的http服务器,可使用select，poll，epoll或sigio

有趣的基于 /dev/poll 服务器

N.Provos，C.Lever,"Scalable Network I/O in Linux"2000年5月.[ FREENIX track,Proc.USENIX 2000,San Diego,California（2000年6月).]描述了被修改成支持 /dev/poll的 thttpd 版.将性能与phhttpd进行比较。

有趣的基于 epoll 服务器

ribs2
cmogstored - 对大多数网络使用epoll/kqueue,对磁盘和accept4使用线程

有趣的基于 kqueue() 服务器

thttpd (从版本2.21开始?)
Adrian Chadd 说 "我正在作不少工做来使squid实际上像一个kqueue IO系统";他的官方Squid子项目;看squid.sourceforge.net/projects.ht….这显然比Benno的补丁更新

有趣的基于实时信号服务器.

Chromium 的 X15.使用2.4内核 SIGIO 功能以及 sendfile() 和 TCP_CORK，据报道甚至比TUX实现更高的速度. 在社区许可下的源码是可用的.看 Fabio Riccardi 原始公告
Zach Brown 的 phhttpd - "一个更快的服务服务器, 它用于展现 sigio/siginfo 事件模型.若是你尝试在生产环境中使用它,请将此代码视为高度实验性的,同时您本身也格外注意" ,使用 2.3.21或以后的 siginfo 特性, 包含了须要的更新内核补丁.据传甚至比khttpd更快.见他1999年5月31日的一些说明

有趣的基于线程的服务器

有趣的基于内核的服务器

khttpd
Ingo Molnar等人的"TUX" Threaded linUX webserver.2.4内核.

其余有趣的连接

Jeff Darcy在设计高性能服务器的设计笔记
Ericsson的 ARIES 工程 - 在1到12个处理器上,Apache 1与Apache 2对比Tomcat的基准测试结果
Prof. Peter Ladkin 的Web服务器性能页面
Novell 的快速缓存 - 声称每秒点击10000次.至关漂亮的性能图.
Rik van Riel 的Linux性能调优网站

服务端经典的C10k问题(译)