3. open/close

open函数可以打开或创建一个文件。

  1. #include <sys/types.h>
  2. #include <sys/stat.h>
  3. #include <fcntl.h>
  4.  
  5. int open(const char *pathname, int flags);
  6. int open(const char *pathname, int flags, mode_t mode);
  7. 返回值:成功返回新分配的文件描述符,出错返回-1并设置errno

在Man Page中open函数有两种形式,一种带两个参数,一种带三个参数,其实在C代码中open函数是这样声明的:

  1. int open(const char *pathname, int flags, ...);

最后的可变参数可以是0个或1个,由flags参数中的标志位决定,见下面的详细说明。

pathname参数是要打开或创建的文件名,和fopen一样,pathname既可以是相对路径也可以是绝对路径。flags参数有一系列常数值可供选择,可以同时选择多个常数用按位或运算符连接起来,所以这些常数的宏定义都以O_开头,表示or。

必选项:以下三个常数中必须指定一个,且仅允许指定一个。

  • O_RDONLY 只读打开

  • O_WRONLY 只写打开

  • O_RDWR 可读可写打开

以下可选项可以同时指定0个或多个,和必选项按位或起来作为flags参数。可选项有很多,这里只介绍一部分,其它选项可参考open(2)的Man Page:

  • O_APPEND 表示追加。如果文件已有内容,这次打开文件所写的数据附加到文件的末尾而不覆盖原来的内容。

  • O_CREAT 若此文件不存在则创建它。使用此选项时需要提供第三个参数mode,表示该文件的访问权限。

  • O_EXCL 如果同时指定了O_CREAT,并且文件已存在,则出错返回。

  • O_TRUNC 如果文件已存在,并且以只写或可读可写方式打开,则将其长度截断(Truncate)为0字节。

  • O_NONBLOCK 对于设备文件,以O_NONBLOCK方式打开可以做非阻塞I/O(Nonblock I/O),非阻塞I/O在下一节详细讲解。

注意open函数与C标准I/O库的fopen函数有些细微的区别:

  • 以可写的方式fopen一个文件时,如果文件不存在会自动创建,而open一个文件时必须明确指定O_CREAT才会创建文件,否则文件不存在就出错返回。

  • ww+方式fopen一个文件时,如果文件已存在就截断为0字节,而open一个文件时必须明确指定O_TRUNC才会截断文件,否则直接在原来的数据上改写。

第三个参数mode指定文件权限,可以用八进制数表示,比如0644表示-rw-r--r--,也可以用S_IRUSRS_IWUSR等宏定义按位或起来表示,详见open(2)的Man Page。要注意的是,文件权限由openmode参数和当前进程的umask掩码共同决定。

补充说明一下Shell的umask命令。Shell进程的umask掩码可以用umask命令查看:

  1. $ umask
  2. 0022

touch命令创建一个文件时,创建权限是0666,而touch进程继承了Shell进程的umask掩码,所以最终的文件权限是0666&~022=0644。

  1. $ touch file123
  2. $ ls -l file123
  3. -rw-r--r-- 1 akaedu akaedu 0 2009-03-08 15:07 file123

同样道理,用gcc编译生成一个可执行文件时,创建权限是0777,而最终的文件权限是0777&~022=0755。

  1. $ gcc main.c
  2. $ ls -l a.out
  3. -rwxr-xr-x 1 akaedu akaedu 6483 2009-03-08 15:07 a.out

我们看到的都是被umask掩码修改之后的权限,那么如何证明touchgcc创建文件的权限本来应该是0666和0777呢?我们可以把Shell进程的umask改成0,再重复上述实验:

  1. $ umask 0
  2. $ touch file123
  3. $ rm file123 a.out
  4. $ touch file123
  5. $ ls -l file123
  6. -rw-rw-rw- 1 akaedu akaedu 0 2009-03-08 15:09 file123
  7. $ gcc main.c
  8. $ ls -l a.out
  9. -rwxrwxrwx 1 akaedu akaedu 6483 2009-03-08 15:09 a.out

现在我们自己写一个程序,在其中调用open("somefile", O_WRONLY|O_CREAT, 0664);创建文件,然后在Shell中运行并查看结果:

  1. $ umask 022
  2. $ ./a.out
  3. $ ls -l somefile
  4. -rw-r--r-- 1 akaedu akaedu 6483 2009-03-08 15:11 somefile

不出所料,文件somefile的权限是0664&~022=0644。有几个问题现在我没有解释:为什么被Shell启动的进程可以继承Shell进程的umask掩码?为什么umask命令可以读写Shell进程的umask掩码?这些问题将在第 1 节 “引言”解释。

close函数关闭一个已打开的文件:

  1. #include <unistd.h>
  2.  
  3. int close(int fd);
  4. 返回值:成功返回0,出错返回-1并设置errno

参数fd是要关闭的文件描述符。需要说明的是,当一个进程终止时,内核对该进程所有尚未关闭的文件描述符调用close关闭,所以即使用户程序不调用close,在终止时内核也会自动关闭它打开的所有文件。但是对于一个长年累月运行的程序(比如网络服务器),打开的文件描述符一定要记得关闭,否则随着打开的文件越来越多,会占用大量文件描述符和系统资源。

open返回的文件描述符一定是该进程尚未使用的最小描述符。由于程序启动时自动打开文件描述符0、1、2,因此第一次调用open打开文件通常会返回描述符3,再调用open就会返回4。可以利用这一点在标准输入、标准输出或标准错误输出上打开一个新文件,实现重定向的功能。例如,首先调用close关闭文件描述符1,然后调用open打开一个常规文件,则一定会返回文件描述符1,这时候标准输出就不再是终端,而是一个常规文件了,再调用printf就不会打印到屏幕上,而是写到这个文件中了。后面要讲的dup2函数提供了另外一种办法在指定的文件描述符上打开文件。

习题

1、在系统头文件中查找flagsmode参数用到的这些宏定义的值是多少。把这些宏定义按位或起来是什么效果?为什么必选项只能选一个而可选项可以选多个?

2、请按照下述要求分别写出相应的open调用。

  • 打开文件/home/akae.txt用于写操作,以追加方式打开

  • 打开文件/home/akae.txt用于写操作,如果该文件不存在则创建它

  • 打开文件/home/akae.txt用于写操作,如果该文件已存在则截断为0字节,如果该文件不存在则创建它

  • 打开文件/home/akae.txt用于写操作,如果该文件已存在则报错退出,如果该文件不存在则创建它