当前位置：首页 > news >正文

Linux文件操作系统接口介绍，以及文件描述符的本质

news 2025/10/14 21:19:46

目录

前言

一、Linux中有关文件操作的系统接口

1.open：文件的打开（创建）

1）功能用法介绍

什么是标记位？

什么是umask？

2）open的基本使用方法

2.close

3.write

4.read

read的使用方法示例

二、文件操作的本质

1.文件描述符

2.文件描述符的分配规则

3.文件描述符与C语言中的FILE的关系

1）三个标准输入输出流

总结

前言

我们为什么要了解系统调用接口？

各种程序语言操作文件的语句不尽相同，但底层调用的都是相同的系统接口。所以，不管上层语言如何更新变换，只要我们掌握了不变的底层，在面对日益复杂的操作系统时总能找到入手的方向。

一、Linux中有关文件操作的系统接口

Linux中有关文件操作的系统接口主要包括：

①打开/关闭文件的open和close；

②负责读写的read和write。

1.open：文件的打开（创建）

上面两个open在参数上有些不同，下面详细阐述他们的区别：

1）功能用法介绍

功能：open的主要功能是打开一个文件，但如果该文件不存在则会创建按此路径文件。

参数：

①pathname：目标文件的路径，可以是绝对路径或者相对路径；

②flags：标记位。必须指定以下其中之一：

O_RDONLY（只读）、O_WRONLY(只写)、O_RDWR(读写)。

可选标记位组合：

O_CREAT：文件不存在时创建文件；

O_TRUNC：打开时清空文件内容；

O_APPEND：追加写入。

③mode：文件不存在时，指定新文件权限，默认0666，实际收umask影响。

返回值：成功时返回文件描述符fd；失败时返回-1。

~~有关什么是文件描述符在本文后半段会讲解，这里不影响理解open。~~

以下补充标记位和umask以便理解open的使用，读者可按需阅读。

什么是标记位？

在bool类型诞生之前，通过使用32位bite位来传递选项，每一个比特位都代表着一个选项。通常标记位与位运算组合使用。例如下面的三个标记位，他们的本质其实是宏。

O_RDONLY（只读）、O_WRONLY(只写)、O_RDWR(读写)。

组合使用：

多个标记位可通过按位或“ | ”合并一起使用，如

int flags = O_RDWR | O_CREAT | O_TRUNC; / / 作用是读写 + 创建 + 清空文件。

掩码检查：

可以通过按位与“ & ”判断是否包含某个标记位，如：

if(flags & O_CREAT){/ / 检查该传入的标记位是否包含创建选项} ；

什么是umask？

umask是文件创建掩码，它的主要功能是控制新创建的文件或目录的默认权限。

新文件的最终权限 = mode & ~umask。

在程序中可更改umask的值，如下：

在文件中修改的umask不会影响bash中的umask的值，相关知识参考“进程地址空间和写时拷贝”：进程优先级介绍，详解环境变量，详解进程地址空间-CSDN博客

  1 #include<stdio.h>2 #include<sys/types.h>3 #include<sys/stat.h>4 int main()5 {6     umask(0664);                                                                                                                                         7     return 0;                                                                                                            8 }

若读者有意了解在linux环境下，文件权限是如何设置以及怎么修改，可参看：初识Linux：常见指令解读，权限、粘滞位的理解，以及其相关衍生知识-CSDN博客

回到正题，下面讨论open函数的基本使用。

2）open的基本使用方法

若没有目标文件，则open函数中需要传入三个参数，这里传入的flags包括O_WRONLY(只读)，O_CREAT(创建)，O_TRUNC(每次打开文件清空)。

相应的若传入路径中有目标文件，则只用传入两个参数即可。值得注意的是若是选择创建新文件，则flags中必须与上O_CREAT。

  1 #include<stdio.h>2 #include<sys/types.h>3 #include<sys/stat.h>4 #include<fcntl.h>5 #include<unistd.h>6 #include<string.h>7 #define FILE_NAME "log.txt"8 int main()9 {10     int fd =open("log.txt",O_WRONLY | O_CREAT | O_TRUNC,0664);11     if(fd<0)12     {13         perror("open");14         return 1;15     }//…………17     close(fd);18     return 0;29 }

2.close

由上述示例代码，我们引出close的介绍

close的用法十分简单。

作用：释放文件描述符（后面会介绍）及其相关的内核资源。

参数：文件描述符；

返回值：成功返回0，失败返回-1.

文件打开后如不用，应及时close关闭，防止资源耗尽。尽管程序退出时OS会自动关闭所有文件描述符。

3.write

打开关闭文件介绍后，就到了往文件中读写了。

作用：write，往打开的文件中写入内容。

参数：

①fd：被打开的文件描述符——由open返回。

②buf：要写入数据指针（本质上是个缓冲区）

③count：预期写入的字节数。

返回值：ssize_t是一个有符号整数类型（signed size_t），包含在“sys/types.h”等头文件中。

成功，返回实际写入的字节数；失败，返回 -1。

在上述open、close示例代码基础上，加入write相关操作语句。

  1 #include<stdio.h>2 #include<sys/types.h>3 #include<sys/stat.h>4 #include<fcntl.h>5 #include<unistd.h>6 #include<string.h>7 #define FILE_NAME "log.txt"8 int main()9 {10     int fd =open("log.txt",O_WRONLY | O_CREAT | O_TRUNC,0664);11     if(fd<0)12     {13         perror("open");14         return 1;15     }16     const char *str="hello Linux\n";                                                                                                                     17     write(fd,str,strlen(str));18     close(fd);19     return 0;20 }

结果：

4.read

作用：从打开的文件中读取数据。

参数：fd，文件描述符；buf，存储读取数据的数组指针（缓冲区）；count，期望读取的最大字节数。

返回值：成功，返回实际读取的字节数；失败，返回-1；若中途读取到文件末则立即返回0.jiji

read的使用方法示例

目标文件内容

这里笔者创建了一个12字节的char str数组，但这肯定不够将log.txt中的内容完全存放。

于是笔者采用了循环读取的方法，每次读取12个字节，然后打印，再读取，直到将文件内容读完。

  1 #include<stdio.h>2 #include<sys/types.h>3 #include<sys/stat.h>4 #include<fcntl.h>5 #include<unistd.h>6 #include<string.h>7 #define FILE_NAME "log.txt"8 int main()9 {10     int fd =open("log.txt",O_RDONLY);11     if(fd<0)12     {13         perror("open");14         return 1;15     }16     char str[12];17     memset(str,0,sizeof(str));18 19     int total=0;20     while(read(fd,str,sizeof(str)))21     {22         //str[sizeof(str)-1]='\0';23         printf("%s\n",str);24         total+=(sizeof(str));                                                                                                                            25     }26     close(fd);27     return 0;28 }

结果：

二、文件操作的本质

首先需要明确的共识是：系统中存在非常多的文件，大致可分为打开的文件和没被打开的文件。

而进程文件操作的对象，就是那些打开的文件。

换句话说，文件操作的本质就是：进程与被打开文件之间的关系。

1.文件描述符

在上文介绍文件的相关操作时，多次提及文件描述符。下面我们一起探讨什么是文件描述符。

我们知道当程序执行时，操作系统会为其创建进程，以及PCB（Linux环境下为task_struct）用以管理进程，而task_struct中有个成员变量为struct_file * files，files指针指向内存中另一个数据结构——struct_file。

在struct_file中存在着一个成员struct_file * fd_arr【】文件描述符表，fd_arr【】中每个元素都是都是一个指针，指向内存中属于该进程的文件（即该指针存储着这些文件在内存中的地址）。其中文件描述符就是fd_arr【】的数组下标！

即文件描述符的本质就是数组下标。

2.文件描述符的分配规则

3.文件描述符与C语言中的FILE的关系

在C语言中，就像fwrite和fread是系统调用接口write和read的封装一样，C语言将有关文件类型封装成了一个结构体FILE，而该结构体的成员就包括了文件描述符表。

1）三个标准输入输出流

如何证明FILE中封装了文件描述符表？我们可以通过三个标准输入输出来验证。

编写一个简单的程序查看三个标准输入输出的文件描述符fd：

结果：

由上我们也可以得知：

总结

这里对文章进行总结：
我们首先是介绍了Linux中有关文件操作的几个系统接口：open、close、write、read，其中穿插了标记位和umask的介绍和使用。然后我们讨论了文件操作的本质——进程与被打开文件之间的关系，再紧接着阐述了什么是文件描述符及其分配规则，最后我们通过C语言中的三个标准输入输出证明了FILE中存在着文件描述符表，并得知三个标准输入输出默认占用了0 1 2文件描述符。

希望这篇文章对你有所帮助

阅完点赞，手留余香~

查看全文

http://www.dtcms.com/a/193589.html