练习16:结构体和指向它们的指针

原文:Exercise 16: Structs And Pointers To Them

译者:飞龙

在这个练习中你将会学到如何创建struct,将一个指针指向它们,以及使用它们来理解内存的内部结构。我也会借助上一节课中的指针知识,并且让你使用malloc从原始内存中构造这些结构体。

像往常一样,下面是我们将要讨论的程序,你应该把它打下来并且使它正常工作:

  1. #include <stdio.h>
  2. #include <assert.h>
  3. #include <stdlib.h>
  4. #include <string.h>
  5. struct Person {
  6. char *name;
  7. int age;
  8. int height;
  9. int weight;
  10. };
  11. struct Person *Person_create(char *name, int age, int height, int weight)
  12. {
  13. struct Person *who = malloc(sizeof(struct Person));
  14. assert(who != NULL);
  15. who->name = strdup(name);
  16. who->age = age;
  17. who->height = height;
  18. who->weight = weight;
  19. return who;
  20. }
  21. void Person_destroy(struct Person *who)
  22. {
  23. assert(who != NULL);
  24. free(who->name);
  25. free(who);
  26. }
  27. void Person_print(struct Person *who)
  28. {
  29. printf("Name: %s\n", who->name);
  30. printf("\tAge: %d\n", who->age);
  31. printf("\tHeight: %d\n", who->height);
  32. printf("\tWeight: %d\n", who->weight);
  33. }
  34. int main(int argc, char *argv[])
  35. {
  36. // make two people structures
  37. struct Person *joe = Person_create(
  38. "Joe Alex", 32, 64, 140);
  39. struct Person *frank = Person_create(
  40. "Frank Blank", 20, 72, 180);
  41. // print them out and where they are in memory
  42. printf("Joe is at memory location %p:\n", joe);
  43. Person_print(joe);
  44. printf("Frank is at memory location %p:\n", frank);
  45. Person_print(frank);
  46. // make everyone age 20 years and print them again
  47. joe->age += 20;
  48. joe->height -= 2;
  49. joe->weight += 40;
  50. Person_print(joe);
  51. frank->age += 20;
  52. frank->weight += 20;
  53. Person_print(frank);
  54. // destroy them both so we clean up
  55. Person_destroy(joe);
  56. Person_destroy(frank);
  57. return 0;
  58. }

我打算使用一种和之前不一样的方法来描述这段程序。我并不会对程序做逐行的拆分,而是由你自己写出来。我会基于程序所包含的部分来给你提示,你的任务就是写出每行是干什么的。

包含(include

我包含了一些新的头文件,来访问一些新的函数。每个头文件都提供了什么东西?

struct Person

这就是我创建结构体的地方了,结构体含有四个成员来描述一个人。最后我们得到了一个复合类型,让我们通过一个名字来整体引用这些成员,或它们的每一个。这就像数据库表中的一行或者OOP语言中的一个类那样。

Pearson_create 函数

我需要一个方法来创建这些结构体,于是我定义了一个函数来实现。下面是这个函数做的几件重要的事情:

  • 使用用于内存分配的malloc来向OS申请一块原始的内存。
  • malloc传递sizeof(struct Person)参数,它计算结构体的大小,包含其中的所有成员。
  • 使用了assert来确保从malloc得到一块有效的内存。有一个特殊的常亮叫做NULL,表示“未设置或无效的指针”。这个assert大致检查了malloc是否会返回NULL
  • 使用x->y语法来初始化struct Person的每个成员,它指明了所初始化的成员。
  • 使用strdup来复制字符串name,是为了确保结构体真正拥有它。strdup的行为实际上类似malloc但是它同时会将原来的字符串复制到新创建的内存。

译者注:x->y(*x).y的简写。

Person_destroy 函数

如果定义了创建函数,那么一定需要一个销毁函数,它会销毁Person结构体。我再一次使用了assert来确保不会得到错误的输入。接着我使用了free函数来交还通过mallocstrdup得到的内存。如果你不这么做则会出现“内存泄露”。

译者注:不想显式释放内存又能避免内存泄露的办法是引入libGC库。你需要把所有的malloc换成GC_malloc,然后把所有的free删掉。

Person_print 函数

接下来我需要一个方法来打印出人们的信息,这就是这个函数所做的事情。它用了相同的x->y语法从结构体中获取成员来打印。

main 函数

我在main函数中使用了所有前面的函数和struct Person来执行下面的事情:

  • 创建了两个人:joefrank
  • 把它们打印出来,注意我用了%p占位符,所以你可以看到程序实际上把结构体放到了哪里。
  • 把它们的年龄增加20岁,同时增加它们的体重。
  • 之后打印出每个人。
  • 最后销毁结构体,以正确的方式清理它们。

请仔细阅读上面的描述,然后做下面的事情:

  • 查询每个你不了解的函数或头文件。记住你通常可以使用man 2 function或者man 3 function来让它告诉你。你也可以上网搜索资料。
  • 在每一行上方编写注释,写下这一行代码做了什么。
  • 跟踪每一个函数调用和变量,你会知道它在程序中是在哪里出现的。
  • 同时也查询你不清楚的任何符号。

你会看到什么

在你使用描述性注释扩展程序之后,要确保它实际上能够运行,并且产生下面的输出:

  1. $ make ex16
  2. cc -Wall -g ex16.c -o ex16
  3. $ ./ex16
  4. Joe is at memory location 0xeba010:
  5. Name: Joe Alex
  6. Age: 32
  7. Height: 64
  8. Weight: 140
  9. Frank is at memory location 0xeba050:
  10. Name: Frank Blank
  11. Age: 20
  12. Height: 72
  13. Weight: 180
  14. Name: Joe Alex
  15. Age: 52
  16. Height: 62
  17. Weight: 180
  18. Name: Frank Blank
  19. Age: 40
  20. Height: 72
  21. Weight: 200

解释结构体

如果你完成了我要求的任务,你应该理解了结构体。不过让我来做一个明确的解释,确保你真正理解了它。

C中的结构体是其它数据类型(变量)的一个集合,它们储存在一块内存中,然而你可以通过独立的名字来访问每个变量。它们就类似于数据库表中的一行记录,或者面向对象语言中的一个非常简单的类。让我们以这种方式来理解它:

  • 在上面的代码中,你创建了一个结构体,它们的成员用于描述一个人:名称、年龄、体重、身高。
  • 每个成员都有一个类型,比如是int
  • C会将它们打包到一起,于是它们可以用单个的结构体来存放。
  • struct Person是一个复合类型,这意味着你可以在同种表达式中将其引用为其它的数据类型。
  • 你可以将这一紧密的组合传递给其它函数,就像Person_print那样。
  • 如果结构体是指针的形式,接着你可以使用x->y通过它们的名字来访问结构体中独立的部分。
  • 还有一种创建结构体的方法,不需要指针,通过x.y来访问。你将会在附加题里面见到它。

如果你不使用结构体,则需要自己计算出大小、打包以及定位出指定内容的内存片位置。实际上,在大多数早期(甚至现在的一些)的汇编代码中,这就是唯一的方式。在C中你就可以让C来处理这些复合数据类型的内存构造,并且专注于和它们交互。

如何使它崩溃

使这个程序崩溃的办法涉及到使用指针和malloc系统的方法:

  • 试着传递NULLPerson_destroy来看看会发生什么。如果它没有崩溃,你必须移除Makefile的CFLAGS中的-g选项。
  • 在结尾处忘记调用Person_destroy,在Valgrind下运行程序,你会看到它报告出你忘记释放内存。弄清楚你应该向valgrind传递什么参数来让它向你报告内存如何泄露。
  • 忘记在Person_destroy中释放who->name,并且对比两次的输出。同时,使用正确的选项来让Valgrind告诉你哪里错了。
  • 这一次,向Person_print传递NULL,并且观察Valgrind会输出什么。
  • 你应该明白了NULL是个使程序崩溃的快速方法。

附加题

在这个练习的附加题中我想让你尝试一些有难度的东西:将这个程序改为不用指针和malloc的版本。这可能很困难,所以你需要研究下面这些东西:

  • 如何在栈上创建结构体,就像你创建任何其它变量那样。
  • 如何使用x.y而不是x->y来初始化结构体。
  • 如何不使用指针来将结构体传给其它函数。