当前位置：首页 > news >正文

深入理解 IO 多路复用：从 select 到 epoll

news 2025/7/25 9:23:02

一、常见 IO 模型对比

1. 阻塞 IO（Blocking IO）

2. 非阻塞 IO（Non-blocking IO）

3. 并行 IO（多进程 / 多线程）

4. 多路 IO（IO 多路复用）

二、IO 多路复用：操作系统的 IO 事件检测机制

三、select：经典的多路复用实现

四、epoll：高效的多路复用升级方案

五、select 与 epoll 的核心差异对比

六、总结

在网络编程和系统开发中，IO 操作的效率直接影响着程序的性能，尤其是在高并发场景下。不同的 IO 模型有着截然不同的处理方式，而 IO 多路复用技术则是解决多连接 IO 处理的关键。本文将带你深入了解常见的 IO 模型，并重点解析 select 和 epoll 这两种经典的 IO 多路复用机制。

在探讨 IO 多路复用之前，我们先了解几种基础的 IO 模型，看看它们各自的特点和局限：

IO 多路复用的核心思想是：由操作系统提供一个机制，让程序可以同时监控多个文件描述符（FD）的 IO 事件（如可读、可写），当某个 FD 的事件就绪时，再由程序进行处理。

常见的 IO 多路复用实现有select和epoll（Linux 系统），此外还有 Windows 的IOCP、BSD 的kqueue等。本文重点介绍select和epoll。

select是最早的 IO 多路复用机制之一，几乎所有操作系统都支持，兼容性强。其使用流程如下：

创建文件描述符集合
使用fd_set类型定义变量（如读集合rd_set），用于存放需要监控的文件描述符。
添加关心的文件描述符
通过FD_SET(fd, &rd_set)函数，将需要监控的 FD 加入集合中。
调用 select 等待事件
调用select(max_fd + 1, &rd_set, &wr_set, &ex_set, timeout)，等待监控的 IO 事件（读、写或异常）就绪。
- max_fd是集合中最大的文件描述符，+1是因为 FD 从 0 开始计数。
- timeout为超时时间，若为NULL则一直阻塞等待。
检测就绪的文件描述符
当select返回后，通过FD_ISSET(fd, &rd_set)判断某个 FD 是否就绪，若就绪则进行读写操作。
重置文件描述符集合
select会修改集合中的标志位（就绪的 FD 会被标记），因此每次调用前需要重置集合（通常通过临时集合备份后赋值，如rd_set = temp_set）。

epoll是 Linux 系统为解决select的局限性而设计的高性能 IO 多路复用机制，在高并发场景下表现远优于select。其使用流程如下：

创建 epoll 实例
通过epoll_create(size)创建一个 epoll 实例，返回一个 epoll 文件描述符（epfd），用于后续操作。
- size参数在现代 Linux 中已被忽略，仅需传入一个大于 0 的值即可。
添加 / 修改 / 删除关心的文件描述符
通过epoll_ctl(epfd, op, fd, &event)函数管理需要监控的 FD：
- op：操作类型，如EPOLL_CTL_ADD（添加）、EPOLL_CTL_MOD（修改）、EPOLL_CTL_DEL（删除）。
- event：结构体epoll_event，指定监控的事件类型（如EPOLLIN表示可读）。
调用 epoll_wait 等待事件
调用epoll_wait(epfd, events, maxevents, timeout)，等待 IO 事件就绪。
- 就绪的 FD 会被存放在events数组中（即材料中的rev集合），直接返回给程序。
- maxevents指定最多可处理的就绪事件数。
处理就绪的文件描述符
遍历events数组，直接对就绪的 FD 进行读写操作即可（无需额外检测，数组中仅包含就绪的 FD）。