Linux:五种IO模型与非阻塞IO
五种IO模型
阻塞IO: 在内核将数据准备好之前, 系统调⽤会⼀直等待. 所有的套接字, 默认都是阻塞⽅式.
阻塞IO是最常见的IO模型

⾮阻塞IO: 如果内核还未将数据准备好, 系统调⽤仍然会直接返回, 并且返回EWOULDBLOCK错误
码
非阻塞IO往往需要程序员循环的方式反复尝试读写⽂件描述符, 这个过程称为轮询. 这对CPU来说是较大的浪费, ⼀般只有特定场景下才使用.

信号驱动IO: 内核将数据准备好的时候, 使用SIGIO信号通知应用程序进行IO操作.

IO多路转接: 虽然从流程图上看起来和阻塞IO类似. 实际上最核心在于IO多路转接能够同时等待多
个文件描述符的就绪状态.

异步IO: 由内核在数据拷贝完成时, 通知应⽤程序(而信号驱动是告诉应用程序何时可以开始拷贝数
据).

结论
任何IO过程中, 都包含两个步骤. 第⼀是等待, 第⼆是拷贝. ⽽且在实际的应用场景中, 等待消耗的
时间往往都远远高于拷贝的时间. 让IO更高效, 最核心的办法就是让等待的时间尽量少.
高级IO
同步通信 vs 异步通信
同步和异步关注的是消息通信机制.
所谓同步,就是在发出⼀个调⽤时,在没有得到结果之前,该调⽤就不返回. 但是⼀旦调⽤返回,就得到返回值了; 换句话说,就是由调⽤者主动等待这个调⽤的结果;异步则是相反,调⽤在发出之后,这个调⽤就直接返回了,所以没有返回结果; 换句话说,当⼀个异步过程调⽤发出后,调⽤者不会⽴刻得到结果; ⽽是在调⽤发出后,被调⽤者通过状态、通知来通知调⽤者,或通过回调函数处理这个调⽤.
另外,多进程多线程的时候, 也提到同步和互斥. 这⾥的同步通信和进程之间的同步是完全不相干的概念.
进程/线程同步也是进程/线程之间直接的制约关系是为完成某种任务而建立的两个或多个线程,这个线程需要在某些位置上协调他们的工作次序而等待、传递信息所产生的制约关系. 尤其是在访问临界资源的时候.
阻塞 vs 非阻塞
阻塞和非阻塞关注的是程序在等待调⽤结果(消息,返回值)时的状态.
- 阻塞调⽤是指调⽤结果返回之前,当前线程会被挂起. 调⽤线程只有在得到结果之后才会返回.
- 非阻塞调⽤指在不能⽴刻得到结果之前,该调⽤不会阻塞当前线程.
非阻塞IO
fcntl
⼀个文件描述符, 默认都是阻塞IO
函数原型如下.
#include <unistd.h>
#include <fcntl.h>
int fcntl(int fd, int cmd, ... /* arg */ );传⼊的cmd的值不同, 后⾯追加的参数也不相同
fcntl函数有5种功能:
- 复制⼀个现有的描述符(cmd=F_DUPFD).
- 获得/设置⽂件描述符标记(cmd=F_GETFD或F_SETFD).
- 获得/设置⽂件状态标记(cmd=F_GETFL或F_SETFL).
- 获得/设置异步I/O所有权(cmd=F_GETOWN或F_SETOWN).
- 获得/设置记录锁(cmd=F_GETLK,F_SETLK或F_SETLKW).
此处只是⽤第三种功能, 获取/设置⽂件状态标记, 就可以将⼀个⽂件描述符设置为非阻塞
实现函数SetNoBlock
基于fcntl, 我们实现⼀个SetNoBlock函数, 将⽂件描述符设置为非阻塞
void SetNoBlock(int fd) {int fl = fcntl(fd, F_GETFL);if (fl < 0) {perror("fcntl");return;}fcntl(fd, F_SETFL, fl | O_NONBLOCK);
}使⽤F_GETFL将当前的⽂件描述符的属性取出来(这是⼀个位图).
然后再使⽤F_SETFL将⽂件描述符设置回去. 设置回去的同时, 加上⼀个O_NONBLOCK参数.
轮询方式读取标准输入
#include <stdio.h>
#include <unistd.h>
#include <fcntl.h>
void SetNoBlock(int fd) {int fl = fcntl(fd, F_GETFL);if (fl < 0) {perror("fcntl");return;}fcntl(fd, F_SETFL, fl | O_NONBLOCK);
}
int main() {SetNoBlock(0);while (1) {char buf[1024] = {0};ssize_t read_size = read(0, buf, sizeof(buf) - 1);if (read_size < 0) {perror("read");sleep(1);continue;}printf("input:%s\n", buf);}return 0;
}