2. 自定义函数
我们不仅可以调用C标准库提供的函数,也可以定义自己的函数,事实上我们已经这么做了:我们定义了main
函数。例如:
- int main(void)
- {
- int hour = 11;
- int minute = 59;
- printf("%d and %d hours\n", hour, minute / 60);
- return 0;
- }
main
函数的特殊之处在于执行程序时它自动被操作系统调用,操作系统就认准了main
这个名字,除了名字特殊之外,main
函数和别的函数没有区别。我们对照着main
函数的定义来看语法规则:
函数定义 → 返回值类型 函数名(参数列表) 函数体
函数体 → { 语句列表 }
语句列表 → 语句列表项 语句列表项 …
语句列表项 → 语句
语句列表项 → 变量声明、类型声明或非定义的函数声明
非定义的函数声明 → 返回值类型 函数名(参数列表);
我们稍后再详细解释“函数定义”和“非定义的函数声明”的区别。从第 7 章 结构体开始我们才会看到类型声明,所以现在暂不讨论。
给函数命名也要遵循上一章讲过的标识符命名规则。由于我们定义的main
函数不带任何参数,参数列表应写成void
。函数体可以由若干条语句和声明组成,C89要求所有声明写在所有语句之前(本书的示例代码都遵循这一规定),而C99的新特性允许语句和声明按任意顺序排列,只要每个标识符都遵循先声明后使用的原则就行。main
函数的返回值是int
型的,return 0;
这个语句表示返回值是0,main
函数的返回值是返回给操作系统看的,因为main
函数是被操作系统调用的,通常程序执行成功就返回0,在执行过程中出错就返回一个非零值。比如我们将main
函数中的return
语句改为return 4;
再执行它,执行结束后可以在Shell中看到它的退出状态(Exit Status):
- $ ./a.out
- 11 and 0 hours
- $ echo $?
- 4
$?
是Shell中的一个特殊变量,表示上一条命令的退出状态。关于main
函数需要注意两点:
[K&R]书上的
main
函数定义写成main(){...}
的形式,不写返回值类型也不写参数列表,这是Old Style C的风格。Old Style C规定不写返回值类型就表示返回int
型,不写参数列表就表示参数类型和个数没有明确指出。这种宽松的规定使编译器无法检查程序中可能存在的Bug,增加了调试难度,不幸的是现在的C标准为了兼容旧的代码仍然保留了这种语法,但读者绝不应该继续使用这种语法。其实操作系统在调用
main
函数时是传参数的,main
函数最标准的形式应该是int main(int argc, char *argv[])
,在第 6 节 “指向指针的指针与指针数组”详细介绍。C标准也允许int main(void)
这种写法,如果不使用系统传进来的两个参数也可以写成这种形式。但除了这两种形式之外,定义main
函数的其它写法都是错误的或不可移植的。
关于返回值和return
语句我们将在第 1 节 “return语句”详细讨论,我们先从不带参数也没有返回值的函数开始学习定义和使用函数:
例 3.2. 最简单的自定义函数
- #include <stdio.h>
- void newline(void)
- {
- printf("\n");
- }
- int main(void)
- {
- printf("First Line.\n");
- newline();
- printf("Second Line.\n");
- return 0;
- }
执行结果是:
- First Line.
- Second Line.
我们定义了一个newline
函数给main
函数调用,它的作用是打印一个换行,所以执行结果中间多了一个空行。newline
函数不仅不带参数,也没有返回值,返回值类型为void
表示没有返回值[4],这说明我们调用这个函数完全是为了利用它的Side Effect。如果我们想要多次插入空行就可以多次调用newline
函数:
- int main(void)
- {
- printf("First Line.\n");
- newline();
- newline();
- newline();
- printf("Second Line.\n");
- return 0;
- }
如果我们总需要三个三个地插入空行,我们可以再定义一个threeline
函数每次插入三个空行:
例 3.3. 较简单的自定义函数
- #include <stdio.h>
- void newline(void)
- {
- printf("\n");
- }
- void threeline(void)
- {
- newline();
- newline();
- newline();
- }
- int main(void)
- {
- printf("Three lines:\n");
- threeline();
- printf("Another three lines.\n");
- threeline();
- return 0;
- }
通过这个简单的例子可以体会到:
同一个函数可以被多次调用。
可以用一个函数调用另一个函数,后者再去调第三个函数。
通过自定义函数可以给一组复杂的操作起一个简单的名字,例如
threeline
。对于main
函数来说,只需要通过threeline
这个简单的名字来调用就行了,不必知道打印三个空行具体怎么做,所有的复杂操作都被隐藏在threeline
这个名字后面。使用自定义函数可以使代码更简洁,
main
函数在任何地方想打印三个空行只需调用一个简单的threeline()
,而不必每次都写三个printf("\n")
。
读代码和读文章不一样,按从上到下从左到右的顺序读代码未必是最好的。比如上面的例子,按源文件的顺序应该是先看newline
再看threeline
再看main
。如果你换一个角度,按代码的执行顺序来读也许会更好:首先执行的是main
函数中的语句,在一条printf
之后调用了threeline
,这时再去看threeline
的定义,其中又调用了newline
,这时再去看newline
的定义,newline
里面有一条printf
,执行完成后返回threeline
,这里还剩下两次newline
调用,效果也都一样,执行完之后返回main
,接下来又是一条printf
和一条threeline
。如下图所示:
图 3.1. 函数调用的执行顺序
读代码的过程就是模仿计算机执行程序的过程,我们不仅要记住当前读到了哪一行代码,还要记住现在读的代码是被哪个函数调用的,这段代码返回后应该从上一个函数的什么地方接着往下读。
现在澄清一下函数声明、函数定义、函数原型(Prototype)这几个概念。比如void threeline(void)
这一行,声明了一个函数的名字、参数类型和个数、返回值类型,这称为函数原型。在代码中可以单独写一个函数原型,后面加;
号结束,而不写函数体,例如:
- void threeline(void);
这种写法只能叫函数声明而不能叫函数定义,只有带函数体的声明才叫定义。上一章讲过,只有分配存储空间的变量声明才叫变量定义,其实函数也是一样,编译器只有见到函数定义才会生成指令,而指令在程序运行时当然也要占存储空间。那么没有函数体的函数声明有什么用呢?它为编译器提供了有用的信息,编译器在翻译代码的过程中,只有见到函数原型(不管带不带函数体)之后才知道这个函数的名字、参数类型和返回值,这样碰到函数调用时才知道怎么生成相应的指令,所以函数原型必须出现在函数调用之前,这也是遵循“先声明后使用”的原则。
在上面的例子中,main
调用threeline
,threeline
再调用newline
,要保证每个函数的原型出现在调用之前,就只能按先newline
再threeline
再main
的顺序定义了。如果使用不带函数体的声明,则可以改变函数的定义顺序:
- #include <stdio.h>
- void newline(void);
- void threeline(void);
- int main(void)
- {
- ...
- }
- void newline(void)
- {
- ...
- }
- void threeline(void)
- {
- ...
- }
这样仍然遵循了先声明后使用的原则。
由于有Old Style C语法的存在,并非所有函数声明都包含完整的函数原型,例如void threeline();
这个声明并没有明确指出参数类型和个数,所以不算函数原型,这个声明提供给编译器的信息只有函数名和返回值类型。如果在这样的声明之后调用函数,编译器不知道参数的类型和个数,就不会做语法检查,所以很容易引入Bug。读者需要了解这个知识点以便维护别人用Old Style C风格写的代码,但绝不应该按这种风格写新的代码。
如果在调用函数之前没有声明会怎么样呢?有的读者也许碰到过这种情况,我可以解释一下,但绝不推荐这种写法。比如按上面的顺序定义这三个函数,但是把开头的两行声明去掉:
- #include <stdio.h>
- int main(void)
- {
- printf("Three lines:\n");
- threeline();
- printf("Another three lines.\n");
- threeline();
- return 0;
- }
- void newline(void)
- {
- printf("\n");
- }
- void threeline(void)
- {
- newline();
- newline();
- newline();
- }
编译时会报警告:
- $ gcc main.c
- main.c:17: warning: conflicting types for ‘threeline’
- main.c:6: warning: previous implicit declaration of ‘threeline’ was here
但仍然能编译通过,运行结果也对。这里涉及到的规则称为函数的隐式声明(Implicit Declaration),在main
函数中调用threeline
时并没有声明它,编译器认为此处隐式声明了int threeline(void);
,隐式声明的函数返回值类型都是int
,由于我们调用这个函数时没有传任何参数,所以编译器认为这个隐式声明的参数类型是void
,这样函数的参数和返回值类型都确定下来了,编译器根据这些信息为函数调用生成相应的指令。然后编译器接着往下看,看到threeline
函数的原型是void threeline(void)
,和先前的隐式声明的返回值类型不符,所以报警告。好在我们也没用到这个函数的返回值,所以执行结果仍然正确。
[4] 敏锐的读者可能会发现一个矛盾:如果函数newline
没有返回值,那么表达式newline()
不就没有值了吗?然而上一章讲过任何表达式都有值和类型两个基本属性。其实这正是设计void
这么一个关键字的原因:首先从语法上规定没有返回值的函数调用表达式有一个void
类型的值,这样任何表达式都有值,不必考虑特殊情况,编译器的语法解析比较容易实现;然后从语义上规定void
类型的表达式不能参与运算,因此newline() + 1
这样的表达式不能通过语义检查,从而兼顾了语法上的一致和语义上的不矛盾。