关于envoy 代码的底层文档至关稀少。为了解决这个问题我计划编写一系列文档来描述各个子系统的工做。因为是第一篇, 请让我知道你但愿其余主题覆盖哪些内容。html
一个我所了解到最共同的技术问题是关于envoy使用的线程模型的底层描述,这篇文章将会描述envoy如何使用线程来处理链接的(how envoy maps connections to threads), 同事也会描述Thread Local Storage(TLS)系统是如何使内部代码平行且高效的。linux
Figure 1: Threading overviewgit
如同图一所示,envoy使用了三中不一样类型的线程。github
Main: 这个线程管理了服务器自己的启动和终止, 全部xDS API的处理(包括DNS, 健康检查(health checking) 和一般的集群管理), running, 监控刷新(stat flushing), 管理界面 还有 通用的进程管理(signals, hot restart。在这个线程中发生的全部事情都是异步和非阻塞的(non blocking)。一般,主线程用来协调全部不须要大量cpu完成的关键功能。这容许大部分代码编写的如同单线程同样。编程
Worker 在envoy系统中,默认为每一个硬件(every harware)生成一个worker线程(能够经过--concurrency参数控制),每一个工做线程运行一个无阻塞的事件循环(event loop),for listening on every listener (there is currently no listener sharding), accept 新的链接,为每一个链接实例化过滤栈,以及处理这个链接生命周期的全部io。同时,也容许全部链接代码编写的如同单线程同样。api
File flusher Envoy 写入的每一个文件如今都有一个单独的block的刷新线程。这是由于使用O_NONBLOCK在写入文件系统有时也会阻塞。当Worker线程须要写入文件时,这个数据实际上被移动至in-memory buffer中,最终会被File Flusher线程刷新至文件中。envoy的代码会在一个worker试图写入memory buffer时锁住全部worker。还有一些其余的会在下面讨论。缓存
如上所述, 全部worker线程都会监听端口而没有任何分片,所以,内核智能的分配accept的套接字给worker进程。现代内核通常都很擅长这一点,在开始使用其余监听同一套接字的其余线程以前,内核使用io 优先级提高等特性来分配线程的工做,一样的还有不适用spin-lock来如理全部请求。服务器
一旦woker accept了一个链接,那么这个链接永远不会离开这个worker(一个链接只由同一worker进行处理), 全部关于链接的处理都将会在worker线程内进一步处理,包括任何转发行为。这有一些重要的含义:网络
Envoy链接池中都是worker线程,所以经过http/2 链接池每次只与上游主机创建一个链接,若是有4个worker,那在稳定状态将只有四个http/2链接与上游主机进行链接。数据结构
Envoy以这种方式工做的缘由在于这样几乎全部的代码均可以如同单线程同样以没有锁的方式进行编写。这个设计使得大部分代码易于编写和扩展。
从内存和链接池效率的角度来看,调整 - concurrency选项实际上很是重要。拥有比所须要的worker更多的worker将会浪费大量的内存,形成大量空置的链接,并致使较低的链接池命中率。在lyft,envoy以较低的concurerency运行,性能大体与他们旁边的服务相匹配。
到目前为止,在讨论主线程和worker线程时咱们已经屡次使用术语'non-blocking'.几乎全部代码都是假设没有阻塞的状况下进行编写。可是,这并不是彻底正确(哪里有彻底正确的东西),Envoy确实使用了一些process wide locks.
因为envoy将主线程的职责和worker线程的职责彻底分开,须要在主线程完成复杂的处理同时使每一个worker线程高度可用。本节将介绍Envoy的高级线程本地存储(TLS)系统。在下一节中,我将描述如何使用它来处理集群管理。
如已经描述的那样,主线程基本上处理Envoy过程当中的全部管理/控制平面功能。(控制平面在这里有点过载,但在特使程序自己考虑并与工人作的转发进行比较时,彷佛是合适的)。主线程进程执行某些操做是一种常见模式,而后须要使用该工做的结果更新每一个工做线程,而且工做线程不须要在每次访问时获取锁定
Envoy的TLS系统工做以下:
虽然很是简单,但它很是强大与只读副本更新锁相似.(实质上,worker线程在工做时从不会看到插槽的数据发生任何改变, 变化只发生在event切换的时候5), Envoy用两种不一样的方式来使用它:
在本节中,我将描述TLS如何用于集群管理。群集管理包括xDS API处理和DNS以及运行情况检查。
图3显示了涉及如下组件和步骤的整体流程:
经过这些过程,Envoy可以处理每一个请求而不使用任何锁。除了TLS代码自己的复杂度以外,大部分代码无需理解线程是如何具体工做的,使用单线程的方式便可。这使得大部分代码易于修改且性能较好。
TLS和RCU(Read-Copy Update6)在Envoy内普遍使用。
其余一些例子包括:
还有其余状况,但前面的例子应该已经足够阐释TLS在envoy中的做用。
虽然Envoy总体表现至关不错,可是当它以很是高的并发和高吞吐使用时,有一些已知的点须要注意:
Envoy的线程模型旨在简化编程和提升性能,但若是设置不当,可能会浪费内存和链接使用。Envoy的线程模型容许它在很是高的worker数量和高吞吐量下表现良好。
正如我在Twitter上简略提到的那样,该设计也适合在DPDK之类的完整用户模式网络堆栈上运行,这使得商用服务器在进行完整的L7处理时每秒处理数百万个请求。观察envoy再接下来几年如何进展是一件很是有趣的事情
。
最后一个评论:我屡次被问到为何咱们为Envoy选择C ++?
缘由是它仍然是惟一普遍部署的生产语言,在该语言中能够构建本文所述的体系结构。C ++固然不适合全部项目,甚至许多项目,但对于某些用例,它仍然是完成工做的惟一工具。