早上太燥热,忽然想起三周前有人跟我交流了TSO的问题,我也描述了其原理,这个原理说来也是特别简单,无非就是靠网卡硬件来分段,计算 checksum,从而解放CPU周期。其实只要说一个就够了,既然靠硬件来分段,那么只能由硬件来计算checksum了,由于你根本就不知道硬件的分 段细节,因此你也无法在分段前计算好每个段的checksum....
TSO的原理几乎每一个人都知道,事实上它是怎么实现的这个问题也不难,难的是细节。在作完了正事以后,我想把这个原理展示出来,固然可能和实际的实现有超级大的出入,无论怎样,它是一个原理框图,仔细观察,应该也能本身实现一个比我这个更好的TSO了。
这个设计是一个数字逻辑,时序电路的范畴,而这个领域十分地高大上,并非普通的软件程序员能hold住的,像我这样的半瓶子也同样。因此我依然是按照老 样子,试图直接给出一个结果,而不是要求听书的人事先作一些准备,每每在人们作这些准备工做的时候,就已经厌倦放弃了。
基础知识不难,就是一些门电路,与门,非门,比较器,译码器,触发器之类的,这些东西随便找一本计算机组成原理,都很齐全。关键是怎么组合它们,这是另外一 个领域的编程。此时,我想起了15年前个人高中物理老湿刘丹青在讲电路的时候说过的一句话:让电流流一下。这句话在科班人看来彻底不符合电路设计的基本原 则,他们可能更倾向于首先建模,而后分析,而后使用描述语言VHDL写出代码,最后再给出电路,我以为这适合于设计自己,可是不适合于对一个门外汉讲述其 精彩。对于一个门外汉来说,他惟一所知道的就是,让电流流一下,而后冲过这个门,冲过那个管,好了,高电平变成低电平了....在我看来,就是这么回事。
在一张白纸上,画出一堆的门电路,而后随性随意组合它们,慢慢的,我忽然发现,这个电路就是TSO的框架了。我记得上周帮人固化了路由转发表,然而那种固 化行为可能会由于成本太高而被pass掉,毕竟现在的软实现已经够用了吧。因此只有核心传输网才须要这种固化的转发表,然而TSO倒是服务器领域的首推, 服务器太多了,远比核心转发设备多,它们的CPU须要减负,确实,CPU去计算一些固定模式的东西,有点浪费,它应该花更多的精力去处理一些不可控的东 西。因此TCP分段这种事情天然而然就由网卡代劳了。你,我,他,咱们都遇到过TSO,可是咱们只会开启,关闭它,若是你想知道它究竟是怎么 Offload的,请看下图,让电流流一流:
TCP分段和IP分片的区别很大,这个事你必定要明白。而后才能够看懂上面的图。
以上的解析只是一个特例,事实上,全部的硬件加速机制无非都是同样的机制。当我在看Intel千兆/万兆网卡的手册时,我想到在芯片的内部,这种电路的元 件几乎是海量的,实现了RSS,硬件hash分类等。这就是我所谓的江河泛滥,沿着沟壑瞬间吞噬大地,咱们该如何挖沟填壑,这不是本文的目的,本文只是描 述了这种可能性。这也是这种专用电路和通用CPU之间的本质区别。CPU存在着一个指令集,这意味着它是关注于外部如何调用的,而专用电路的关注点在于内 部的执行逻辑,它几乎不对外提供任何接口,惟一的就是设置几个寄存器的值,好比MTU,数据包长度,数据包头长度等,其它的执行逻辑,外部无权过问。这是 串行编程和并行执行的本质区别。
对于指令系统,也有一些要说的。在内部控制逻辑上,有一个统一的指令分发系统,实际上就是发射出一系列的0和1的组合,这个组合中的0和1做用于各类门电 路,这些门电路接受了这些不一样的输入后,产生不一样的输出,而后再做为另外的门电路的输入,形成不一样的输出,如此反复...难道事实不是这样子吗?你很难否 则定。
让电流流一流,若是你以为比较抽象,那就观察洪水泛滥的过程吧,大河决堤的地点不一样,形成的灾难也不一样,关键在于决堤处的地势以及其所链接的各类地形,这 一切都是同时发生的,和电流同样,水流在通过一个弯道或者一道拱桥的时候,也会有一些延时和分流,这就能够类比电路中的各类门。
吃饭了,吃饭了,真烦!
程序员