【转】Duff's Device

在看strcpy、memcpy等的实现发现用了内存对齐,每个word拷贝一次的办法大大提升了实现效率,参加该blog(http://totoxian.iteye.com/blog/1220273)。

duff's device也是利用了相似的原理减小比较的次数来提升了效率。ios

 

前几天在网上看见了一段代码,叫作“Duff's Device”,后经验证它曾出如今Bjarne的TC++PL里面: 

void send( int * to, int * from, int count)           //    Duff设施,有帮助的注释被有意删去了  {           int n = (count + 7 ) / 8 ;           switch (count % 8 ) {           case 0 :    do { * to ++ = * from ++ ;           case 7 :          * to ++ = * from ++ ;           case 6 :          * to ++ = * from ++ ;           case 5 :          * to ++ = * from ++ ;           case 4 :          * to ++ = * from ++ ;           case 3 :          * to ++ = * from ++ ;           case 2 :          * to ++ = * from ++ ;           case 1 :          * to ++ = * from ++ ;                  } while ( -- n >    0 );          }   }    代码的结构显得很是巧妙,把一个switch语句和一个do-while语句糅合在了一块儿。而在我看过的全部关于C和C++的书中,这样的代码都是毫无道理的。然而,不管是在VS2005仍是在GCC4.1.2下,这段代码都能正确地经过编译。加上适当的main函数,它均可以正常运行。我百思不得其解。上网去查,也没查到好答案。  怎么办?先看看它的汇编代码吧,也许能够经过它的汇编代码看出它的意思。  gcc -S send.cpp  粗略地一看,汇编代码都已经上百行了,并且里面还有一个跳转表,十几个标号。通常状况下,几十行的汇编代码都已经不太好看懂了,要把这几百行汇编彻底看懂,估计须要花不少时间。  既然直接来太麻烦,那就用简便一点的方法吧:  #include  < iostream >  using   namespace  std;  int  main()  {       int  n  = 0 ;       switch  (n)  {       case   0 :  do   {cout  <<   " 0 "   <<  endl;       case 1 :         cout  <<   " 1 "   <<  endl;       case 2 :         cout  <<   " 2 "   <<  endl;       case   3 :         cout  <<   " 3 "   <<  endl;              }   while ( -- n  > 0 );      }  }  实验结果 n的值 程序输出  0 0  1  2  3  1 1  2  3  2 2  3  0  1  2  3  3 3  0  1  2  3  0  1  2  3  其余 (无输出)  这下终于弄清楚了。原来,那段代码的主体仍是do-while循环,但这个循环的入口点并不必定是在do那里,而是由这个switch语句根据n,把循环的入口定在了几个case标号那里。也就是说,程序的执行流程是:程序一开始顺序执行,当它执行到了switch的时候,就会根据n的值,直接跳转到 case n那里(今后,这个swicth语句就再也没有用了)。程序继续顺序执行,再当它执行到while那里时,就会判断循环条件。若为真,则while循环开始,程序跳转到do那里开始执行循环(这时候因为已经没有了switch,因此后面的标号就变成普通标号了,即在没有goto语句的状况下就能够忽略掉这些标号了);为假,则退出循环,即程序停止。  忙活了几个小时,终于明白这段代码是怎么回事了。回想一下,本身之前也曾写过相似C的语法但比C语法简单不少的解释器,用的是递归子程序法。而若是用递归降低法来分析这段代码,是确定会有问题的。  至于它是怎么正确编译并运行的,这须要去研究一下C编译器,这个之后再说。如今,仍是再来看看达夫设备吧。其实,这个send函数的签名就已经很具备提示性了:把from数组中的元素拷贝count个到to里面去。因而有人会说,这个工做简单,不就这样吗:  void my_send( int   * to,  int   * from,  int  count)  {       for  ( int  i  =   0 ; i  !=  count;  ++ i)  {           * to ++   =   * from ++ ;      }  }  这段代码的确很简洁,也是正确的,并且生成的机器码也比send函数短不少。可是却忽略了一个因素:执行效率。计算一下就能够知道,my_send函数里面的循环条件,即i和count的比较运算的次数,是达夫设备的8倍!在作整数赋值这种耗时不多的工做时,这种耗时相对较高的比较工做是会大大地影响函数总体的效率的。达夫设备则是一种很是巧妙的解决办法(固然,它利用到了编译器的一些实现上的工做),并且若是把8换成更大的数的话,效率就还能够提升!  它的思路是这样的:把原数组以8个int为单位分红若干个小组,复制的时候以小组为单位复制,即一次复制8个 int。也就是说,在my_send函数中以一次比较运算的代价换来1个int的复制,而在达夫设备中,却能以一次比较运算的代价换来8个int的复制。而switch语句则是用来处理分组时剩下的不到8个的int(这些剩余的不是数组最后的,而是数组最开始的),很巧妙。  总结:像达夫设备这样的代码,从语言的角度来看,我我的以为不值得咱们借鉴。由于这毕竟不是“正常”的代码,至少C/C++标准不会保证这样的代码必定不会出错。另外,这种代码估计有不少人根本都没见过,若是本身写的代码别人看不懂,这也会是一件很让人头疼的事。然而,从算法的角度来看,我以为达夫设备是个很高效、很值得咱们去学习的东西。把一次消耗相对比较高的操做“分摊“到了屡次消耗相对比较低的操做上面,就像vector<T>中实现可变长度的数组的思想那样,节省了大量的机器资源,也大大提升了程序的效率。这是值得咱们学习的。
相关文章
相关标签/搜索