1. 链表

1.1. 单链表

图 23.6 “链表”所示的链表即单链表(Single Linked List),本节我们学习如何创建和操作这种链表。每个链表有一个头指针,通过头指针可以找到第一个节点,每个节点都可以通过指针域找到它的后继,最后一个节点的指针域为NULL,表示没有后继。数组在内存中是连续存放的,而链表在内存中的布局是不规则的,我们知道访问某个数组元素b[n]时可以通过基地址+n×每个元素的字节数得到它地址,或者说数组支持随机访问,而链表是不支持随机访问的,只能通过前一个元素的指针域得知后一个元素的地址,因此只能从头指针开始顺序访问各节点。以下代码实现了单链表的基本操作。

例 26.1. 单链表

  1. /* linkedlist.h */
  2. #ifndef LINKEDLIST_H
  3. #define LINKEDLIST_H
  4.  
  5. typedef struct node *link;
  6. struct node {
  7. unsigned char item;
  8. link next;
  9. };
  10.  
  11. link make_node(unsigned char item);
  12. void free_node(link p);
  13. link search(unsigned char key);
  14. void insert(link p);
  15. void delete(link p);
  16. void traverse(void (*visit)(link));
  17. void destroy(void);
  18. void push(link p);
  19. link pop(void);
  20.  
  21. #endif
  1. /* linkedlist.c */
  2. #include <stdlib.h>
  3. #include "linkedlist.h"
  4.  
  5. static link head = NULL;
  6.  
  7. link make_node(unsigned char item)
  8. {
  9. link p = malloc(sizeof *p);
  10. p->item = item;
  11. p->next = NULL;
  12. return p;
  13. }
  14.  
  15. void free_node(link p)
  16. {
  17. free(p);
  18. }
  19.  
  20. link search(unsigned char key)
  21. {
  22. link p;
  23. for (p = head; p; p = p->next)
  24. if (p->item == key)
  25. return p;
  26. return NULL;
  27. }
  28.  
  29. void insert(link p)
  30. {
  31. p->next = head;
  32. head = p;
  33. }
  34.  
  35. void delete(link p)
  36. {
  37. link pre;
  38. if (p == head) {
  39. head = p->next;
  40. return;
  41. }
  42. for (pre = head; pre; pre = pre->next)
  43. if (pre->next == p) {
  44. pre->next = p->next;
  45. return;
  46. }
  47. }
  48.  
  49. void traverse(void (*visit)(link))
  50. {
  51. link p;
  52. for (p = head; p; p = p->next)
  53. visit(p);
  54. }
  55.  
  56. void destroy(void)
  57. {
  58. link q, p = head;
  59. head = NULL;
  60. while (p) {
  61. q = p;
  62. p = p->next;
  63. free_node(q);
  64. }
  65. }
  66.  
  67. void push(link p)
  68. {
  69. insert(p);
  70. }
  71.  
  72. link pop(void)
  73. {
  74. if (head == NULL)
  75. return NULL;
  76. else {
  77. link p = head;
  78. head = head->next;
  79. return p;
  80. }
  81. }
  1. /* main.c */
  2. #include <stdio.h>
  3. #include "linkedlist.h"
  4.  
  5. void print_item(link p)
  6. {
  7. printf("%d\n", p->item);
  8. }
  9.  
  10. int main(void)
  11. {
  12. link p = make_node(10);
  13. insert(p);
  14. p = make_node(5);
  15. insert(p);
  16. p = make_node(90);
  17. insert(p);
  18. p = search(5);
  19. delete(p);
  20. free_node(p);
  21. traverse(print_item);
  22. destroy();
  23.  
  24. p = make_node(100);
  25. push(p);
  26. p = make_node(200);
  27. push(p);
  28. p = make_node(250);
  29. push(p);
  30. while (p = pop()) {
  31. print_item(p);
  32. free_node(p);
  33. }
  34.  
  35. return 0;
  36. }

在初始化时把头指针head初始化为NULL,表示空链表。然后main函数调用make_node创建几个节点,分别调用insert插入到链表中。

  1. void insert(link p)
  2. {
  3. p->next = head;
  4. head = p;
  5. }

图 26.1. 链表的插入操作

链表的插入操作

正如上图所示,insert函数虽然简单,其中也隐含了一种特殊情况(Special Case)的处理,当headNULL时,执行insert操作插入第一个节点之后,head指向第一个节点,而第一个节点的next指针域成为NULL,这很合理,因为它也是最后一个节点。所以空链表虽然是一种特殊情况,却不需要特殊的代码来处理,和一般情况用同样的代码处理即可,这样写出来的代码更简洁,但是在读代码时要想到可能存在的特殊情况。当然,insert函数传进来的参数p也可能有特殊情况,传进来的p可能是NULL,甚至是野指针,本章的函数代码都假定调用者的传进来的参数是合法的,不对参数做特别检查。事实上,对指针参数做检查是不现实的,如果传进来的是NULL还可以检查一下,如果传进来的是野指针,根本无法检查它指向的内存单元是不是合法的,C标准库的函数通常也不做这种检查,例如strcpy(p, NULL)就会引起段错误。

接下来main函数调用search在链表中查找某个节点,如果找到就返回指向该节点的指针,找不到就返回NULL

  1. link search(unsigned char key)
  2. {
  3. link p;
  4. for (p = head; p; p = p->next)
  5. if (p->item == key)
  6. return p;
  7. return NULL;
  8. }

search函数其实也隐含了对于空链表这种特殊情况的处理,如果是空链表则循环体一次都不执行,直接返回NULL

然后main函数调用delete从链表中摘除用search找到的节点,最后调用free_node释放它的存储空间。

  1. void delete(link p)
  2. {
  3. link pre;
  4. if (p == head) {
  5. head = p->next;
  6. return;
  7. }
  8. for (pre = head; pre; pre = pre->next)
  9. if (pre->next == p) {
  10. pre->next = p->next;
  11. return;
  12. }
  13. }

图 26.2. 链表的删除操作

链表的删除操作

从上图可以看出,要摘除一个节点需要首先找到它的前趋然后才能做摘除操作,而在单链表中通过某个节点只能找到它的后继而不能找到它的前趋,所以删除操作要麻烦一些,需要从第一个节点开始依次查找要摘除的节点的前趋。delete操作也要处理一种特殊情况,如果要摘除的节点是链表的第一个节点,它是没有前趋的,这种情况要用特殊的代码处理,而不能和一般情况用同样的代码处理。这样很不爽,能不能把这种特殊情况转化为一般情况呢?可以把delete函数改成这样:

  1. void delete(link p)
  2. {
  3. link *pnext;
  4. for (pnext = &head; *pnext; pnext = &(*pnext)->next)
  5. if (*pnext == p) {
  6. *pnext = p->next;
  7. return;
  8. }
  9. }

图 26.3. 消除特殊情况的链表删除操作

消除特殊情况的链表删除操作

定义一个指向指针的指针pnext,在for循环中pnext遍历的是指向链表中各节点的指针域,这样就把head指针和各节点的next指针统一起来了,可以在一个循环中处理。

然后main函数调用traverse函数遍历整个链表,调用destroy函数销毁整个链表。请读者自己阅读这两个函数的代码。

如果限定每次只在链表的头部插入和删除元素,就形成一个LIFO的访问序列,所以在链表头部插入和删除元素的操作实现了堆栈的pushpop操作,main函数的最后几步把链表当成堆栈来操作,从打印的结果可以看到出栈的顺序和入栈是相反的。想一想,用链表实现的堆栈和第 2 节 “堆栈”中用数组实现的堆栈相比有什么优点和缺点?

习题

1、修改insert函数实现插入排序的功能,链表中的数据按从小到大排列,每次插入数据都要在链表中找到合适的位置再插入。在第 6 节 “折半查找”中我们看到,如果数组中的元素是有序排列的,可以用折半查找算法更快地找到某个元素,想一想如果链表中的节点是有序排列的,是否适用折半查找算法?为什么?

2、基于单链表实现队列的enqueuedequeue操作。在链表的末尾再维护一个指针tail,在tailenqueue,在headdequeue。想一想能不能反过来,在headenqueue而在taildequeue

3、实现函数void reverse(void);将单链表反转。如下图所示。

图 26.4. 单链表的反转

单链表的反转

1.2. 双向链表

链表的delete操作需要首先找到要摘除的节点的前趋,而在单链表中找某个节点的前趋需要从表头开始依次查找,对于n个节点的链表,删除操作的时间复杂度为O(n)。可以想像得到,如果每个节点再维护一个指向前趋的指针,删除操作就像插入操作一样容易了,时间复杂度为O(1),这称为双向链表(Doubly Linked List)。要实现双向链表只需在上一节代码的基础上改动两个地方。

linkedlist.h中修改链表节点的结构体定义:

  1. struct node {
  2. unsigned char item;
  3. link prev, next;
  4. };

linkedlist.c中修改insertdelete函数:

  1. void insert(link p)
  2. {
  3. p->next = head;
  4. if (head)
  5. head->prev = p;
  6. head = p;
  7. p->prev = NULL;
  8. }
  9.  
  10. void delete(link p)
  11. {
  12. if (p->prev)
  13. p->prev->next = p->next;
  14. else
  15. head = p->next;
  16. if (p->next)
  17. p->next->prev = p->prev;
  18. }

图 26.5. 双向链表

双向链表

由于引入了prev指针,insertdelete函数中都有一些特殊情况需要用特殊的代码处理,不能和一般情况用同样的代码处理,这非常不爽,如果在表头和表尾各添加一个Sentinel节点(这两个节点只用于界定表头和表尾,不保存数据),就可以把这些特殊情况都转化为一般情况了。

例 26.2. 带Sentinel的双向链表

  1. /* doublylinkedlist.h */
  2. #ifndef DOUBLYLINKEDLIST_H
  3. #define DOUBLYLINKEDLIST_H
  4.  
  5. typedef struct node *link;
  6. struct node {
  7. unsigned char item;
  8. link prev, next;
  9. };
  10.  
  11. link make_node(unsigned char item);
  12. void free_node(link p);
  13. link search(unsigned char key);
  14. void insert(link p);
  15. void delete(link p);
  16. void traverse(void (*visit)(link));
  17. void destroy(void);
  18. void enqueue(link p);
  19. link dequeue(void);
  20.  
  21. #endif
  1. /* doublylinkedlist.c */
  2. #include <stdlib.h>
  3. #include "doublylinkedlist.h"
  4.  
  5. struct node tailsentinel;
  6. struct node headsentinel = {0, NULL, &tailsentinel};
  7. struct node tailsentinel = {0, &headsentinel, NULL};
  8.  
  9. static link head = &headsentinel;
  10. static link tail = &tailsentinel;
  11.  
  12. link make_node(unsigned char item)
  13. {
  14. link p = malloc(sizeof *p);
  15. p->item = item;
  16. p->prev = p->next = NULL;
  17. return p;
  18. }
  19.  
  20. void free_node(link p)
  21. {
  22. free(p);
  23. }
  24.  
  25. link search(unsigned char key)
  26. {
  27. link p;
  28. for (p = head->next; p != tail; p = p->next)
  29. if (p->item == key)
  30. return p;
  31. return NULL;
  32. }
  33.  
  34. void insert(link p)
  35. {
  36. p->next = head->next;
  37. head->next->prev = p;
  38. head->next = p;
  39. p->prev = head;
  40. }
  41.  
  42. void delete(link p)
  43. {
  44. p->prev->next = p->next;
  45. p->next->prev = p->prev;
  46. }
  47.  
  48. void traverse(void (*visit)(link))
  49. {
  50. link p;
  51. for (p = head->next; p != tail; p = p->next)
  52. visit(p);
  53. }
  54.  
  55. void destroy(void)
  56. {
  57. link q, p = head->next;
  58. head->next = tail;
  59. tail->prev = head;
  60. while (p != tail) {
  61. q = p;
  62. p = p->next;
  63. free_node(q);
  64. }
  65. }
  66.  
  67. void enqueue(link p)
  68. {
  69. insert(p);
  70. }
  71.  
  72. link dequeue(void)
  73. {
  74. if (tail->prev == head)
  75. return NULL;
  76. else {
  77. link p = tail->prev;
  78. delete(p);
  79. return p;
  80. }
  81. }
  1. /* main.c */
  2. #include <stdio.h>
  3. #include "doublylinkedlist.h"
  4.  
  5. void print_item(link p)
  6. {
  7. printf("%d\n", p->item);
  8. }
  9.  
  10. int main(void)
  11. {
  12. link p = make_node(10);
  13. insert(p);
  14. p = make_node(5);
  15. insert(p);
  16. p = make_node(90);
  17. insert(p);
  18. p = search(5);
  19. delete(p);
  20. free_node(p);
  21. traverse(print_item);
  22. destroy();
  23.  
  24. p = make_node(100);
  25. enqueue(p);
  26. p = make_node(200);
  27. enqueue(p);
  28. p = make_node(250);
  29. enqueue(p);
  30. while (p = dequeue()) {
  31. print_item(p);
  32. free_node(p);
  33. }
  34.  
  35. return 0;
  36. }

图 26.6. 带Sentinel的双向链表

带Sentinel的双向链表

这个例子也实现了队列的enqueuedequeue操作,现在每个节点有了prev指针,可以反过来在headenqueue而在taildequeue了。

现在结合第 5 节 “环形队列”想一想,其实用链表实现环形队列是最自然的,以前基于数组实现环形队列,我们还需要“假想”它是首尾相接的,而如果基于链表实现环形队列,我们本来就可以用指针串成首尾相接的。把上面的程序改成环形链表(Circular Linked List)也非常简单,只需要把doublylinkedlist.c中的

  1. struct node tailsentinel;
  2. struct node headsentinel = {0, NULL, &tailsentinel};
  3. struct node tailsentinel = {0, &headsentinel, NULL};
  4.  
  5. static link head = &headsentinel;
  6. static link tail = &tailsentinel;

改成:

  1. struct node sentinel = {0, &sentinel, &sentinel};
  2. static link head = &sentinel;

再把doublylinkedlist.c中所有的tail替换成head即可,相当于把headtail合二为一了。

图 26.7. 环形链表

环形链表

1.3. 静态链表

回想一下我们在例 12.4 “用广度优先搜索解迷宫问题”中使用的数据结构,我把图重新画在下面。

图 26.8. 广度优先搜索的队列数据结构

广度优先搜索的队列数据结构

这是一个静态分配的数组,每个数组元素都有rowcolpredecessor三个成员,predecessor成员保存一个数组下标,指向数组中的另一个元素,这其实也是链表的一种形式,称为静态链表,例如上图中的第6、4、2、1、0个元素串成一条链表。

1.4. 本节综合练习

1、Josephus是公元1世纪的著名历史学家,相传在一次战役中他和另外几个人被围困在山洞里,他们宁死不屈,决定站成一圈,每次数到三个人就杀一个,直到全部死光为止。Josephus和他的一个朋友不想死,于是串通好了站在适当的位置上,最后只剩下他们俩的时候这个游戏就停止了。如果一开始的人数为N,每次数到M个人就杀一个,那么要想不死应该站在什么位置呢?这个问题比较复杂,[具体数学]的1.3节研究了Josephus问题的解,有兴趣的读者可以参考。现在我们做个比较简单的练习,用链表模拟Josephus他们玩的这个游戏,NM作为命令行参数传入,每个人的编号依次是1~N,打印每次被杀者的编号,打印最后一个幸存者的编号。

2、在第 2.11 节 “本节综合练习”的习题1中规定了一种日志文件的格式,每行是一条记录,由行号、日期、时间三个字段组成,由于记录是按时间先后顺序写入的,可以看作所有记录是按日期排序的,对于日期相同的记录再按时间排序。现在要求从这样的一个日志文件中读出所有记录组成一个链表,在链表中首先按时间排序,对于时间相同的记录再按日期排序,最后写回文件中。比如原文件的内容是:

  1. 1 2009-7-30 15:16:42
  2. 2 2009-7-30 15:16:43
  3. 3 2009-7-31 15:16:41
  4. 4 2009-7-31 15:16:42
  5. 5 2009-7-31 15:16:43
  6. 6 2009-7-31 15:16:44

重新排序输出的文件内容是:

  1. 1 2009-7-31 15:16:41
  2. 2 2009-7-30 15:16:42
  3. 3 2009-7-31 15:16:42
  4. 4 2009-7-30 15:16:43
  5. 5 2009-7-31 15:16:43
  6. 6 2009-7-31 15:16:44