【转】Duff's Device

时间 2019-11-12

标签 duff's duff device 繁體版

原文原文链接

在看strcpy、memcpy等的实现发现用了内存对齐，每个word拷贝一次的办法大大提升了实现效率，参加该blog（http://totoxian.iteye.com/blog/1220273）。

duff's device也是利用了相似的原理减小比较的次数来提升了效率。ios

前几天在网上看见了一段代码，叫作“Duff's Device”，后经验证它曾出如今Bjarne的TC++PL里面：

void send( int * to, int * from, int count) // Duff设施，有帮助的注释被有意删去了 { int n = (count + 7 ) / 8 ; switch (count % 8 ) { case 0 : do { * to ++ = * from ++ ; case 7 : * to ++ = * from ++ ; case 6 : * to ++ = * from ++ ; case 5 : * to ++ = * from ++ ; case 4 : * to ++ = * from ++ ; case 3 : * to ++ = * from ++ ; case 2 : * to ++ = * from ++ ; case 1 : * to ++ = * from ++ ; } while ( -- n > 0 ); } } 代码的结构显得很是巧妙，把一个switch语句和一个do-while语句糅合在了一块儿。而在我看过的全部关于C和C++的书中，这样的代码都是毫无道理的。然而，不管是在VS2005仍是在GCC4.1.2下，这段代码都能正确地经过编译。加上适当的main函数，它均可以正常运行。我百思不得其解。上网去查，也没查到好答案。怎么办？先看看它的汇编代码吧，也许能够经过它的汇编代码看出它的意思。 gcc -S send.cpp 粗略地一看，汇编代码都已经上百行了，并且里面还有一个跳转表，十几个标号。通常状况下，几十行的汇编代码都已经不太好看懂了，要把这几百行汇编彻底看懂，估计须要花不少时间。既然直接来太麻烦，那就用简便一点的方法吧： #include < iostream > using namespace std; int main() { int n = 0 ; switch (n) { case 0 : do {cout << " 0 " << endl; case 1 : cout << " 1 " << endl; case 2 : cout << " 2 " << endl; case 3 : cout << " 3 " << endl; } while ( -- n > 0 ); } } 实验结果 n的值程序输出 0 0 1 2 3 1 1 2 3 2 2 3 0 1 2 3 3 3 0 1 2 3 0 1 2 3 其余 (无输出) 这下终于弄清楚了。原来，那段代码的主体仍是do-while循环，但这个循环的入口点并不必定是在do那里，而是由这个switch语句根据n，把循环的入口定在了几个case标号那里。也就是说，程序的执行流程是：程序一开始顺序执行，当它执行到了switch的时候，就会根据n的值，直接跳转到 case n那里（今后，这个swicth语句就再也没有用了）。程序继续顺序执行，再当它执行到while那里时，就会判断循环条件。若为真，则while循环开始，程序跳转到do那里开始执行循环（这时候因为已经没有了switch，因此后面的标号就变成普通标号了，即在没有goto语句的状况下就能够忽略掉这些标号了）；为假，则退出循环，即程序停止。忙活了几个小时，终于明白这段代码是怎么回事了。回想一下，本身之前也曾写过相似C的语法但比C语法简单不少的解释器，用的是递归子程序法。而若是用递归降低法来分析这段代码，是确定会有问题的。至于它是怎么正确编译并运行的，这须要去研究一下C编译器，这个之后再说。如今，仍是再来看看达夫设备吧。其实，这个send函数的签名就已经很具备提示性了：把from数组中的元素拷贝count个到to里面去。因而有人会说，这个工做简单，不就这样吗： void my_send( int * to, int * from, int count) { for ( int i = 0 ; i != count; ++ i) { * to ++ = * from ++ ; } } 这段代码的确很简洁，也是正确的，并且生成的机器码也比send函数短不少。可是却忽略了一个因素：执行效率。计算一下就能够知道，my_send函数里面的循环条件，即i和count的比较运算的次数，是达夫设备的8倍！在作整数赋值这种耗时不多的工做时，这种耗时相对较高的比较工做是会大大地影响函数总体的效率的。达夫设备则是一种很是巧妙的解决办法（固然，它利用到了编译器的一些实现上的工做），并且若是把8换成更大的数的话，效率就还能够提升！它的思路是这样的：把原数组以8个int为单位分红若干个小组，复制的时候以小组为单位复制，即一次复制8个 int。也就是说，在my_send函数中以一次比较运算的代价换来1个int的复制，而在达夫设备中，却能以一次比较运算的代价换来8个int的复制。而switch语句则是用来处理分组时剩下的不到8个的int（这些剩余的不是数组最后的，而是数组最开始的），很巧妙。总结：像达夫设备这样的代码，从语言的角度来看，我我的以为不值得咱们借鉴。由于这毕竟不是“正常”的代码，至少C/C++标准不会保证这样的代码必定不会出错。另外，这种代码估计有不少人根本都没见过，若是本身写的代码别人看不懂，这也会是一件很让人头疼的事。然而，从算法的角度来看，我以为达夫设备是个很高效、很值得咱们去学习的东西。把一次消耗相对比较高的操做“分摊“到了屡次消耗相对比较低的操做上面，就像vector<T>中实现可变长度的数组的思想那样，节省了大量的机器资源，也大大提升了程序的效率。这是值得咱们学习的。