第五章 Socket 编程与 IO 模型#

一句话理解：Socket 是操作系统给你的”网络文件描述符”——对它读写就是收发网络数据。IO 模型决定你”怎么高效地管理上千个 Socket”。

5.1 概念直觉 —— What & Why#

Socket 是什么？#

1
Socket = IP 地址 + 端口号 = 网络通信的端点
2
在 OS 眼中，Socket 就是一个文件描述符（fd），和文件一样可以 read/write。
3

4
一条 TCP 连接由五元组唯一标识：
5
<源 IP, 源端口, 目的 IP, 目的端口, 协议(TCP/UDP)>

为什么需要 IO 多路复用？#

1
问题：游戏服务器要管理几千个连接，每个连接可能随时有数据到来。
2

3
方案 1：每连接一个线程
4
  → 1000 个连接 = 1000 个线程 → 内存爆炸 + 上下文切换开销
5

6
方案 2：非阻塞 + 轮询
7
  → 每个 fd 都试一遍 recv → CPU 空转浪费
8

9
方案 3：IO 多路复用 ✅
10
  → 一个线程监视所有 fd → 哪个 fd 有数据就处理哪个
11
  → select / poll / epoll

5.2 原理图解#

TCP Socket 编程流程#

sequenceDiagram participant S as 服务器 participant C as 客户端 Note over S: socket() Note over S: bind(ip, port) Note over S: listen() Note over C: socket() C->>S: connect() Note over S: accept() → 新 fd C->>S: send("Hello") S->>C: recv() → "Hello" S->>C: send("World") C->>S: recv() → "World" C->>S: close() S->>S: close()

五种 IO 模型#

graph TD subgraph "IO 模型" bio["阻塞 IO\n调用 recv 时\n线程挂起等数据"] nio["非阻塞 IO\n调用 recv 时\n没数据立即返回\n(需要轮询)"] mux["IO 多路复用\nselect/poll/epoll\n一个线程监视多个 fd"] sig["信号驱动 IO\n内核数据就绪时\n发信号通知"] aio["异步 IO (AIO)\n内核完成数据拷贝后\n通知（真正异步）"] end bio --> nio --> mux --> sig --> aio style bio fill:#d00000,stroke:#e85d04,color:white style nio fill:#e85d04,stroke:#f48c06,color:white style mux fill:#2d6a4f,stroke:#40916c,color:white style aio fill:#7b2cbf,stroke:#9d4edd,color:white

1
关键区别：
2
• 阻塞/非阻塞/IO 多路复用/信号驱动 → 都是同步 IO
3
  （数据从内核缓冲区拷贝到用户缓冲区时，进程阻塞）
4
• 异步 IO → 内核帮你完成全部操作，完成后通知你

5.3 深入剖析#

5.3.1 Socket API 基础#

1
#include <sys/socket.h>   // Linux
2
// #include <winsock2.h>   // Windows
3

4
// === TCP 服务器 ===
5
// 1. 创建 socket
6
int server_fd = socket(AF_INET, SOCK_STREAM, 0);  // TCP
7

8
// 2. 绑定地址
9
sockaddr_in addr{};
10
addr.sin_family = AF_INET;
11
addr.sin_addr.s_addr = INADDR_ANY;  // 监听所有网卡
12
addr.sin_port = htons(8080);         // 端口 8080（网络字节序）
13
bind(server_fd, (sockaddr*)&addr, sizeof(addr));
14

15
// 3. 监听
16
listen(server_fd, 128);  // backlog = 128（半连接/全连接队列大小）
17

18
// 4. 接受连接
19
sockaddr_in client_addr{};
20
socklen_t client_len = sizeof(client_addr);
21
int client_fd = accept(server_fd, (sockaddr*)&client_addr, &client_len);
22
// accept 返回一个新的 fd，用于和这个客户端通信
23

24
// 5. 收发数据
25
char buf[1024];
26
ssize_t n = recv(client_fd, buf, sizeof(buf), 0);
27
send(client_fd, "OK", 2, 0);
28

29
// 6. 关闭
30
close(client_fd);
31
close(server_fd);
32

33
// === TCP 客户端 ===
34
int sock = socket(AF_INET, SOCK_STREAM, 0);
35
sockaddr_in server_addr{};
36
server_addr.sin_family = AF_INET;
37
server_addr.sin_port = htons(8080);
38
inet_pton(AF_INET, "127.0.0.1", &server_addr.sin_addr);
39

40
connect(sock, (sockaddr*)&server_addr, sizeof(server_addr));
41
send(sock, "Hello", 5, 0);
42
close(sock);

1
// === UDP 通信（无需 connect/listen/accept）===
2
int sock = socket(AF_INET, SOCK_DGRAM, 0);  // SOCK_DGRAM = UDP
3

4
// 发送（指定目标地址）
5
sendto(sock, data, len, 0, (sockaddr*)&dest, sizeof(dest));
6

7
// 接收（返回来源地址）
8
sockaddr_in from{};
9
socklen_t fromlen = sizeof(from);
10
recvfrom(sock, buf, sizeof(buf), 0, (sockaddr*)&from, &fromlen);

5.3.2 阻塞 vs 非阻塞#

1
// 阻塞（默认）：没数据就一直等
2
ssize_t n = recv(fd, buf, sizeof(buf), 0);
3
// → 线程挂起，直到有数据或连接关闭
4

5
// 非阻塞：没数据立即返回
6
#include <fcntl.h>
7
fcntl(fd, F_SETFL, fcntl(fd, F_GETFL) | O_NONBLOCK);
8

9
ssize_t n = recv(fd, buf, sizeof(buf), 0);
10
if (n == -1 && errno == EAGAIN) {
11
    // 没有数据，稍后再试
12
}

5.3.3 IO 多路复用#

select#

1
fd_set readfds;
2
FD_ZERO(&readfds);
3
FD_SET(server_fd, &readfds);
4
FD_SET(client_fd, &readfds);
5

6
int max_fd = std::max(server_fd, client_fd);
7
timeval tv = {1, 0};  // 超时 1 秒
8

9
int ready = select(max_fd + 1, &readfds, nullptr, nullptr, &tv);
10
if (ready > 0) {
11
    if (FD_ISSET(server_fd, &readfds)) {
12
        // 新连接到来
13
        accept(server_fd, ...);
14
    }
15
    if (FD_ISSET(client_fd, &readfds)) {
16
        // 客户端有数据
17
        recv(client_fd, buf, ...);
18
    }
19
}

select 的问题：

fd_set 是位图，受 FD_SETSIZE 限制（通常 1024）
每次调用都要把 fd_set 从用户态拷贝到内核态
内核返回后要 O(n) 遍历所有 fd 找出就绪的
每次调用完 fd_set 会被修改，需要重新设置

poll#

1
std::vector<pollfd> fds;
2
fds.push_back({server_fd, POLLIN, 0});
3
fds.push_back({client_fd, POLLIN, 0});
4

5
int ready = poll(fds.data(), fds.size(), 1000);  // 超时 1000ms
6
for (auto& pfd : fds) {
7
    if (pfd.revents & POLLIN) {
8
        // 有数据可读
9
    }
10
}

poll vs select：用 pollfd 数组替代位图，无 1024 限制，但仍然 O(n) 遍历。

epoll（Linux，最优解）#

1
// 1. 创建 epoll 实例
2
int epfd = epoll_create1(0);
3

4
// 2. 注册 fd
5
epoll_event ev{};
6
ev.events = EPOLLIN;       // 监听可读事件
7
ev.data.fd = server_fd;
8
epoll_ctl(epfd, EPOLL_CTL_ADD, server_fd, &ev);
9

10
// 3. 等待事件
11
epoll_event events[1024];
12
int n = epoll_wait(epfd, events, 1024, 1000);  // 超时 1000ms
13

14
// 4. 只遍历就绪的 fd（不是所有 fd！）
15
for (int i = 0; i < n; ++i) {
16
    if (events[i].data.fd == server_fd) {
17
        int client = accept(server_fd, ...);
18
        // 注册新客户端
19
        ev.events = EPOLLIN | EPOLLET;  // 边缘触发
20
        ev.data.fd = client;
21
        epoll_ctl(epfd, EPOLL_CTL_ADD, client, &ev);
22
    } else {
23
        recv(events[i].data.fd, buf, ...);
24
    }
25
}

select vs poll vs epoll 对比#

维度	select	poll	epoll
fd 上限	1024	无限制	无限制
内核实现	线性遍历	线性遍历	红黑树 + 就绪链表
每次调用	拷贝全部 fd	拷贝全部 fd	不拷贝（内核维护）
返回后	O(n) 遍历找就绪	O(n) 遍历找就绪	只返回就绪的 fd
性能	O(n)	O(n)	O(就绪数)
触发模式	LT	LT	LT + ET
跨平台	✅	✅	❌ Linux 专有

ET vs LT#

1
LT (Level Triggered, 水平触发, 默认)：
2
  只要 fd 可读 → 每次 epoll_wait 都返回它
3
  → 你可以分多次读
4

5
ET (Edge Triggered, 边缘触发)：
6
  fd 从不可读变为可读时 → 只通知一次
7
  → 你必须一次读完（循环 read 直到 EAGAIN）
8
  → 性能更好（通知次数少），但编程更难
9

10
ET 的正确使用：
11
  while (true) {
12
      ssize_t n = read(fd, buf, sizeof(buf));
13
      if (n == -1 && errno == EAGAIN) break;  // 读完了
14
      if (n == 0) { /* 对方关闭 */ break; }
15
      process(buf, n);
16
  }

Windows IOCP（完成端口）#

1
IOCP 是 Windows 的异步 IO 模型（Proactor 模式）：
2
• 你告诉内核"帮我读这个 fd"
3
• 内核完成读操作后通知你"读好了，数据在这"
4
• 真正的异步——数据已经在用户缓冲区了
5

6
vs epoll（Reactor 模式）：
7
• epoll 告诉你"这个 fd 可读了"
8
• 你自己调 read() 把数据从内核拷到用户空间
9
• 是同步 IO（read 时进程仍然阻塞）

5.3.4 网络编程模式#

graph TD subgraph "Reactor 模式（主流）" reactor["Reactor\nepoll_wait 监听事件"] reactor -->|"新连接"| acceptor["Acceptor\naccept 新 fd"] reactor -->|"可读/可写"| handler["Handler\nrecv/send + 业务逻辑"] end style reactor fill:#2d6a4f,stroke:#40916c,color:white style acceptor fill:#e85d04,stroke:#f48c06,color:white style handler fill:#7b2cbf,stroke:#9d4edd,color:white

模式	描述	典型应用
单 Reactor 单线程	一个线程 epoll + 处理	Redis
单 Reactor 多线程	一个线程 epoll，线程池处理业务	中型游戏服
多 Reactor 多线程	主 Reactor 接连接，子 Reactor 处理 IO	Nginx, 大型游戏服

5.4 经典面试题#

Q：select、poll、epoll 的区别？

select 用位图，上限 1024，每次全量拷贝和遍历。poll 用数组，无上限但仍 O(n)。epoll 用红黑树+就绪链表，只返回就绪 fd，O(就绪数)。epoll 是 Linux 高性能服务器的标准选择。

Q：epoll 的 ET 和 LT 模式区别？

LT 只要可读就每次返回，可以分多次读。ET 只在状态变化时通知一次，必须一次读完（循环到 EAGAIN）。ET 性能更好但编程更复杂。

Q：什么是 Reactor 模式？

Reactor 用一个事件循环（epoll_wait）监听所有 fd 的事件，事件就绪后分发给对应的 Handler 处理。分为单 Reactor 单线程（如 Redis）、单 Reactor 多线程、多 Reactor 多线程（如 Nginx）。

Q：IO 多路复用是同步还是异步？

同步！select/poll/epoll 只是告诉你”哪个 fd 就绪了”，你仍然需要自己调 read/write，这一步是阻塞的（数据从内核拷贝到用户空间）。真正的异步 IO 是 IOCP——内核帮你完成整个读操作。

Q：C10K 问题是什么？

如何用一台服务器同时处理 10,000 个并发连接。传统每连接一个线程模型会耗尽内存。解决方案：IO 多路复用（epoll）+ 非阻塞 IO + 事件驱动（Reactor）。

5.5 🎮 游戏实战场景#

5.5.1 游戏客户端网络线程#

1
// 游戏客户端：单独的网络线程 + 主线程消息队列
2
// （交叉引用 C++ Ch7 的 SPSC 无锁队列）
3

4
class NetworkThread {
5
    int _sock;
6
    SPSCQueue<NetMessage, 4096> _recv_queue;  // 网络线程 → 主线程
7
    SPSCQueue<NetMessage, 4096> _send_queue;  // 主线程 → 网络线程
8
    std::atomic<bool> _running{true};
9

10
public:
11
    void run() {
12
        while (_running.load()) {
13
            // 用 select/poll 检查读写就绪（客户端只有一个连接，不需要 epoll）
14
            pollfd pfd = {_sock, POLLIN | POLLOUT, 0};
15
            int ret = poll(&pfd, 1, 10);  // 10ms 超时
16

17
            if (pfd.revents & POLLIN) {
18
                // 有数据可读
19
                char buf[4096];
20
                int n = recv(_sock, buf, sizeof(buf), 0);
21
                if (n > 0) {
22
                    // 解析包 → 推入接收队列
23
                    NetMessage msg = parsePacket(buf, n);
24
                    _recv_queue.push(msg);
25
                }
26
            }
27

28
            // 发送队列中的数据
29
            NetMessage out;
30
            while (_send_queue.pop(out)) {
31
                auto data = serializePacket(out);
32
                send(_sock, data.data(), data.size(), 0);
33
            }
34
        }
35
    }
36

37
    // 主线程调用
38
    void sendMessage(const NetMessage& msg) { _send_queue.push(msg); }
39
    bool pollMessage(NetMessage& msg) { return _recv_queue.pop(msg); }
40
};
41

42
// 游戏主循环
43
void gameLoop() {
44
    NetMessage msg;
45
    while (netThread.pollMessage(msg)) {
46
        handleServerMessage(msg);  // 处理服务器消息
47
    }
48
}

5.5.2 RAII Socket 封装#

1
// C++ RAII 封装（跨平台）
2
class Socket {
3
    int _fd = -1;
4
public:
5
    Socket(int domain, int type, int protocol = 0)
6
        : _fd(::socket(domain, type, protocol)) {
7
        if (_fd == -1) throw std::runtime_error("socket() failed");
8
    }
9

10
    ~Socket() { if (_fd != -1) ::close(_fd); }
11

12
    // 禁止拷贝，允许移动
13
    Socket(const Socket&) = delete;
14
    Socket& operator=(const Socket&) = delete;
15
    Socket(Socket&& other) noexcept : _fd(other._fd) { other._fd = -1; }
16
    Socket& operator=(Socket&& other) noexcept {
17
        if (this != &other) {
18
            if (_fd != -1) ::close(_fd);
19
            _fd = other._fd;
20
            other._fd = -1;
21
        }
22
        return *this;
23
    }
24

25
    int fd() const { return _fd; }
26
    int release() { int f = _fd; _fd = -1; return f; }
27
};

5.6 30 秒速答#

Q：select / poll / epoll 的区别？

select 上限 1024，每次全量拷贝+遍历，O(n)。poll 无上限但仍 O(n)。epoll 红黑树+就绪链表，只返回就绪 fd，O(就绪数)，是 Linux 高并发首选。