练习23:认识达夫设备

原文:Exercise 23: Meet Duff’s Device

译者:飞龙

这个练习是一个脑筋急转弯,我会向你介绍最著名的C语言黑魔法之一,叫做“达夫设备”,以“发明者”汤姆·达夫的名字命名。这一强大(或邪恶?)的代码中,几乎你学过的任何东西都被包装在一个小的结构中。弄清它的工作机制也是一个好玩的谜题。

C的一部分乐趣来源于这种神奇的黑魔法,但这也是使C难以使用的地方。你最好能够了解这些技巧,因为他会带给你关于C语言和你计算机的深入理解。但是,你应该永远都不要使用它们,并总是追求简单易读的代码。

达夫设备由汤姆·达夫“发现”(或创造),它是一个C编译器的小技巧,本来不应该能够正常工作。我并不想告诉你做了什么,因为这是一个谜题,等着你来思考并尝试解决。你需要运行这段代码,之后尝试弄清它做了什么,以及为什么可以这样做。

  1. #include <stdio.h>
  2. #include <string.h>
  3. #include "dbg.h"
  4. int normal_copy(char *from, char *to, int count)
  5. {
  6. int i = 0;
  7. for(i = 0; i < count; i++) {
  8. to[i] = from[i];
  9. }
  10. return i;
  11. }
  12. int duffs_device(char *from, char *to, int count)
  13. {
  14. {
  15. int n = (count + 7) / 8;
  16. switch(count % 8) {
  17. case 0: do { *to++ = *from++;
  18. case 7: *to++ = *from++;
  19. case 6: *to++ = *from++;
  20. case 5: *to++ = *from++;
  21. case 4: *to++ = *from++;
  22. case 3: *to++ = *from++;
  23. case 2: *to++ = *from++;
  24. case 1: *to++ = *from++;
  25. } while(--n > 0);
  26. }
  27. }
  28. return count;
  29. }
  30. int zeds_device(char *from, char *to, int count)
  31. {
  32. {
  33. int n = (count + 7) / 8;
  34. switch(count % 8) {
  35. case 0:
  36. again: *to++ = *from++;
  37. case 7: *to++ = *from++;
  38. case 6: *to++ = *from++;
  39. case 5: *to++ = *from++;
  40. case 4: *to++ = *from++;
  41. case 3: *to++ = *from++;
  42. case 2: *to++ = *from++;
  43. case 1: *to++ = *from++;
  44. if(--n > 0) goto again;
  45. }
  46. }
  47. return count;
  48. }
  49. int valid_copy(char *data, int count, char expects)
  50. {
  51. int i = 0;
  52. for(i = 0; i < count; i++) {
  53. if(data[i] != expects) {
  54. log_err("[%d] %c != %c", i, data[i], expects);
  55. return 0;
  56. }
  57. }
  58. return 1;
  59. }
  60. int main(int argc, char *argv[])
  61. {
  62. char from[1000] = {'a'};
  63. char to[1000] = {'c'};
  64. int rc = 0;
  65. // setup the from to have some stuff
  66. memset(from, 'x', 1000);
  67. // set it to a failure mode
  68. memset(to, 'y', 1000);
  69. check(valid_copy(to, 1000, 'y'), "Not initialized right.");
  70. // use normal copy to
  71. rc = normal_copy(from, to, 1000);
  72. check(rc == 1000, "Normal copy failed: %d", rc);
  73. check(valid_copy(to, 1000, 'x'), "Normal copy failed.");
  74. // reset
  75. memset(to, 'y', 1000);
  76. // duffs version
  77. rc = duffs_device(from, to, 1000);
  78. check(rc == 1000, "Duff's device failed: %d", rc);
  79. check(valid_copy(to, 1000, 'x'), "Duff's device failed copy.");
  80. // reset
  81. memset(to, 'y', 1000);
  82. // my version
  83. rc = zeds_device(from, to, 1000);
  84. check(rc == 1000, "Zed's device failed: %d", rc);
  85. check(valid_copy(to, 1000, 'x'), "Zed's device failed copy.");
  86. return 0;
  87. error:
  88. return 1;
  89. }

这段代码中我编写了三个版本的复制函数:

normal_copy

使用普通的for循环来将字符从一个数组复制到另一个。

duffs_device

这个就是称为“达夫设备”的脑筋急转弯,以汤姆·达夫的名字命名。这段有趣的邪恶代码应归咎于他。

zeds_device

“达夫设备”的另一个版本,其中使用了goto来让你发现一些线索,关于duffs_device中奇怪的do-while做了什么。

在往下学习之前仔细了解这三个函数,并试着自己解释代码都做了什么。

你会看到什么

这个程序没有任何输出,它只会执行并退出。你应当在Valgrind下运行它并确保没有任何错误。

解决谜题

首先需要了解的一件事,就是C对于它的一些语法是弱检查的。这就是你可以将do-while的一部分放入switch语句的一部分的原因,并且在其它地方的另一部分还可以正常工作。如果你观察带有goto again的我的版本,它实际上更清晰地解释了工作原理,但要确保你理解了这一部分是如何工作的。

第二件事是switch语句的默认贯穿机制可以让你跳到指定的case,并且继续运行直到switch结束。

最后的线索是count % 8以及顶端对n的计算。

现在,要理解这些函数的工作原理,需要完成下列事情:

  • 将代码抄写在一张纸上。
  • 当每个变量在switch之前初始化时,在纸的空白区域,把每个变量列在表中。
  • 按照switch的逻辑模拟执行代码,之后再正确的case处跳出。
  • 更新变量表,包括tofrom和它们所指向的数组。
  • 当你到达while或者我的goto时,检查你的变量,之后按照逻辑返回do-while顶端,或者again标签所在的地方。
  • 继续这一手动的执行过程,更新变量,直到确定明白了代码如何运作。

为什么写成这样?

当你弄明白它的实际工作原理时,最终的问题是:为什么要把代码写成这样?这个小技巧的目的是手动编写“循环展开”。大而长的循环会非常慢,所以提升速度的一个方法就是找到循环中某个固定的部分,之后在循环中复制代码,序列化地展开。例如,如果你知道一个循环会执行至少20次,你就可以将这20次的内容直接写在源代码中。

达夫设备通过将循环展开为8个迭代块,来完成这件事情。这是个聪明的办法,并且可以正常工作。但是目前一个好的编译器也会为你完成这些。你不应该这样做,除非少数情况下你证明了它的确可以提升速度。

附加题

  • 不要再这样写代码了。
  • 查询维基百科的“达夫设备”词条,并且看看你能不能找到错误。将它与这里的版本对比,并且阅读文章来试着理解,为什么维基百科上的代码在你这里不能正常工作,但是对于汤姆·达夫可以。
  • 创建一些宏,来自动完成任意长度的这种设备。例如,你想创建32个case语句,并且不想手动把它们都写出来时,你会怎么办?你可以编写一次展开8个的宏吗?
  • 修改main函数,执行一些速度检测,来看看哪个实际上更快。
  • 查询memcpymemmovememset,并且也比较一下它们的速度。
  • 不要再这样写代码了!