自定义网络协议与序列化/反序列化
自定义网络协议与序列化/反序列化
如果你做过网络编程,可能会遇到这样的问题:用TCP发了一个“1+1”的计算请求,对方却只收到了“1”;或者一次收到了“1+12+3”这种拼接的内容——这时候怎么判断哪个是完整的请求?又怎么把这些字符串解析成能计算的操作数和运算符?这篇文章就从TCP的“天生缺陷”说起,带你搞懂自定义协议的必要性、序列化与反序列化的核心逻辑,最后通过一个网络计算器实例,把这些知识点落地成可运行的代码。
一、TCP通信的字节流边界问题
先问一个问题:TCP是“面向字节流”的协议,这意味着什么?
你可能知道,发送端调用write
,只是把数据拷贝到操作系统的内核缓冲区,什么时候发、发多少,全由TCP协议自己决定(比如根据网络带宽、接收方缓冲区大小调整);接收端调用read
,可能只读到部分数据(比如对方只发了一半),也可能读到多个拼接的数据(比如对方连续发了两个请求,被TCP打包成一次发送)。
举个例子:你发了两次请求“1+1”和“2+3”,接收端read
时可能拿到“1+12+3”——这时候你怎么区分这是两个请求,而不是一个“1+12+3”的请求?又怎么保证每次处理的都是一个完整的请求?
这就是TCP字节流的“边界问题”——它没法保证应用层能读到“完整的报文”。要解决这个问题,光靠TCP协议不够,必须在应用层自定义协议。
二、应用层协议定制的必要性
协议本质是“通信双方的约定”——比如约定“数据格式是什么”“每个字段代表什么意思”“怎么判断一个报文结束”。没有约定,接收端根本不知道怎么解析数据。
以“网络计算器”为例,我们需要客户端给服务器发“计算请求”,服务器返回“计算结果”。这时候协议该怎么定?
至少要明确两件事:
- 请求格式(Request):需要包含两个操作数(比如
x
和y
)、一个运算符(比如op
,支持+
-
*
/
%
)。 - 响应格式(Response):需要包含计算结果(
result
)、状态码(code
,比如0表示成功,1表示除0错误,2表示非法运算符)。
如果没有这个约定,客户端发个“1+1”,服务器可能以为是字符串“1+1”,而不是“x=1,op=+,y=1”——根本没法计算。
所以,应用层协议的核心作用是:给字节流“贴标签”,让接收端能正确识别数据结构和字段含义。
三、关键技术:序列化与反序列化
协议定好了Request和Response的结构,接下来的问题是:怎么把这些结构化数据(比如C++的类/结构体)通过网络发送?
直接发结构体行不行?比如客户端定义一个struct Request { int x; int y; char op; }
,然后把结构体直接write
到socket——这在同平台(比如都是Linux)可能暂时能用,但跨平台(比如客户端Windows,服务器Linux)一定会出问题。
为什么?因为结构体的内存对齐。不同编译器(比如VS和GCC)对结构体的内存对齐规则可能不同:比如一个struct { char a; int b; }
,VS可能按4字节对齐(总大小8字节),GCC可能按自然对齐(总大小5字节)。直接传结构体,接收端解析时字段会错位(比如把a
的内存当成b
的一部分),结果完全错误。
这时候就需要“序列化”和“反序列化”:
- 序列化(Serialization):把结构化数据(比如Request类对象)转换成通用的字符串或字节流(比如“10 + 20”),消除平台差异。
- 反序列化(Deserialization):把接收到的字符串/字节流还原成结构化数据(比如把“10 + 20”还原成
x=10
,op=+
,y=20
)。
举个生活中的例子:你在QQ发消息,消息里包含“昵称、时间、内容”——这其实是一个结构化数据。QQ会把这三个字段打包成一个字符串(比如“小明|2024-05-20 10:00|你好”),这个过程就是序列化;接收方拿到字符串后,按“|”分割,还原出昵称、时间、内容,这就是反序列化。
四、实战:网络计算器的协议设计与实现
下面我们从0实现一个网络计算器,把“协议定制”“序列化/反序列化”落地。整个过程分三步:设计协议结构、实现序列化/反序列化、保障报文完整性。
4.1 第一步:定义协议结构(Request/Response)
首先,我们用C++类定义请求和响应的结构(代替结构体,方便封装方法):
// protocol.hpp
#pragma once
#include <string>
#include <iostream>// 计算请求:x op y(比如10 + 20)
class Request {
public:int x; // 左操作数int y; // 右操作数char op; // 运算符:+ - * / %std::string sep = " "; // 字段分隔符(空格)// 构造函数Request(int x_ = 0, int y_ = 0, char op_ = 0) : x(x_), y(y_), op(op_) {}// 序列化:把Request对象转成字符串(比如"10 + 20")bool Serialize(std::string& out_str);// 反序列化:把字符串转成Request对象bool Deserialize(const std::string& in_str);
};// 计算响应:result(结果) + code(状态码)
class Response {
public:int result; // 计算结果(仅当code=0时有效)int code; // 状态码:0=成功,1=除0错误,2=模0错误,3=非法运算符std::string sep = " "; // 字段分隔符(空格)// 构造函数Response(int res_ = 0, int code_ = 0) : result(res_), code(code_) {}// 序列化:把Response对象转成字符串(比如"30 0")bool Serialize(std::string& out_str);// 反序列化:把字符串转成Response对象bool Deserialize(const std::string& in_str);
};
4.2 第二步:实现序列化与反序列化
接下来实现Serialize
和Deserialize
方法,核心是“按约定格式处理字符串”。
4.2.1 Request的序列化与反序列化
- 序列化:把
x
、op
、y
用空格拼接成字符串(比如x=10
,op='+'
,y=20
→ “10 + 20”)。 - 反序列化:把字符串按空格分割,提取
x
、op
、y
(比如“10 + 20” →x=10
,op='+'
,y=20
)。
// Request序列化
bool Request::Serialize(std::string& out_str) {// 拼接格式:x + " " + op + " " + yout_str = std::to_string(x) + sep + op + sep + std::to_string(y);return true; // 简单场景,暂不处理异常
}// Request反序列化
bool Request::Deserialize(const std::string& in_str) {// 1. 找第一个分隔符(空格),提取xsize_t first_sep = in_str.find(sep);if (first_sep == std::string::npos) {return false; // 没找到分隔符,格式错误}std::string x_str = in_str.substr(0, first_sep);x = std::stoi(x_str); // 字符串转整数// 2. 找第二个分隔符,提取opsize_t second_sep = in_str.find(sep, first_sep + 1);if (second_sep == std::string::npos) {return false;}op = in_str[first_sep + 1]; // 分隔符后第一个字符是op// 3. 提取ystd::string y_str = in_str.substr(second_sep + 1);y = std::stoi(y_str);return true;
}
4.2.2 Response的序列化与反序列化
逻辑类似,只是字段变成result
和code
:
// Response序列化
bool Response::Serialize(std::string& out_str) {// 拼接格式:result + " " + codeout_str = std::to_string(result) + sep + std::to_string(code);return true;
}// Response反序列化
bool Response::Deserialize(const std::string& in_str) {// 找分隔符,分割result和codesize_t sep_pos = in_str.find(sep);if (sep_pos == std::string::npos) {return false;}std::string res_str = in_str.substr(0, sep_pos);std::string code_str = in_str.substr(sep_pos + 1);result = std::stoi(res_str);code = std::stoi(code_str);return true;
}
4.3 第三步:保障报文完整性——加“长度头”和“分隔符”
现在我们能把Request/Response转成字符串了,但还有个问题:接收端怎么知道一个报文的结束?比如客户端发了“10 + 20”,接收端可能只读到“10 + ”(半包),或者读到“10 + 2020 - 5”(粘包)。
解决方案:给每个报文加一个“长度头”,格式约定为“长度\n有效载荷”——比如“5\n10+20”(长度5表示后面的有效载荷是5个字符)。接收端先读“长度”,再按长度读“有效载荷”,就能保证拿到完整的报文。
我们写两个通用函数Encode
(加长度头)和Decode
(解长度头):
// protocol.hpp 中添加
#include <cstring>// 协议分隔符:用于分割长度头和有效载荷(换行符\n)
const std::string PROTOCOL_SEP = "\n";// Encode:给有效载荷加长度头(格式:长度\n有效载荷)
std::string Encode(const std::string& payload) {int len = payload.size();return std::to_string(len) + PROTOCOL_SEP + payload;
}// Decode:从报文中提取有效载荷(输入是接收缓冲区,输出是有效载荷)
// 返回值:true=解析成功,false=报文不完整
bool Decode(std::string& in_buf, std::string& out_payload) {// 1. 找长度头的分隔符\nsize_t sep_pos = in_buf.find(PROTOCOL_SEP);if (sep_pos == std::string::npos) {return false; // 没找到分隔符,报文不完整}// 2. 提取长度头,转成整数std::string len_str = in_buf.substr(0, sep_pos);int payload_len = std::stoi(len_str);// 3. 检查缓冲区是否包含完整的有效载荷int total_len = len_str.size() + PROTOCOL_SEP.size() + payload_len;if (in_buf.size() < total_len) {return false; // 有效载荷不完整}// 4. 提取有效载荷,并从缓冲区中移除已处理的报文out_payload = in_buf.substr(sep_pos + 1, payload_len);in_buf.erase(0, total_len); // 移除已处理的部分(长度头+有效载荷)return true;
}
五、工程化优化:套接字封装与服务端框架
现在协议和序列化都搞定了,接下来要实现网络通信。为了避免重复写socket代码,我们先封装一个Socket类;再写一个TCP服务器,用多进程处理并发连接。
5.1 套接字封装(Socket类)
把socket的创建、绑定、监听、accept、connect等操作封装成类,方便客户端和服务器复用:
// socket.hpp
#pragma once
#include <sys/socket.h>
#include <netinet/in.h>
#include <arpa/inet.h>
#include <unistd.h>
#include <string>
#include <cerrno>
#include <cstring>
#include <iostream>class Socket {
private:int sock_fd_; // 套接字文件描述符public:Socket() : sock_fd_(-1) {}~Socket() { if (sock_fd_ != -1) close(sock_fd_); }// 1. 创建流式套接字(TCP)bool Create() {sock_fd_ = socket(AF_INET, SOCK_STREAM, 0);if (sock_fd_ < 0) {std::cerr << "Socket create failed: " << strerror(errno) << std::endl;return false;}return true;}// 2. 绑定端口(服务器用,IP默认INADDR_ANY)bool Bind(uint16_t port) {struct sockaddr_in addr;memset(&addr, 0, sizeof(addr));addr.sin_family = AF_INET;addr.sin_port = htons(port); // 主机字节序转网络字节序addr.sin_addr.s_addr = htonl(INADDR_ANY); // 绑定所有网卡IPif (bind(sock_fd_, (struct sockaddr*)&addr, sizeof(addr)) < 0) {std::cerr << "Socket bind failed: " << strerror(errno) << std::endl;return false;}return true;}// 3. 监听(服务器用)bool Listen(int backlog = 10) {if (listen(sock_fd_, backlog) < 0) {std::cerr << "Socket listen failed: " << strerror(errno) << std::endl;return false;}return true;}// 4. 接受连接(服务器用,返回新的通信套接字)int Accept(std::string& client_ip, uint16_t& client_port) {struct sockaddr_in client_addr;socklen_t client_addr_len = sizeof(client_addr);int conn_fd = accept(sock_fd_, (struct sockaddr*)&client_addr, &client_addr_len);if (conn_fd < 0) {std::cerr << "Socket accept failed: " << strerror(errno) << std::endl;return -1;}// 提取客户端IP和端口client_ip = inet_ntoa(client_addr.sin_addr); // 网络字节序转IP字符串client_port = ntohs(client_addr.sin_port); // 网络字节序转主机字节序return conn_fd;}// 5. 连接服务器(客户端用)bool Connect(const std::string& server_ip, uint16_t server_port) {struct sockaddr_in server_addr;memset(&server_addr, 0, sizeof(server_addr));server_addr.sin_family = AF_INET;server_addr.sin_port = htons(server_port);// IP字符串转网络字节序if (inet_pton(AF_INET, server_ip.c_str(), &server_addr.sin_addr) <= 0) {std::cerr << "Invalid server IP: " << server_ip << std::endl;return false;}if (connect(sock_fd_, (struct sockaddr*)&server_addr, sizeof(server_addr)) < 0) {std::cerr << "Socket connect failed: " << strerror(errno) << std::endl;return false;}return true;}// 获取套接字文件描述符int GetFd() const { return sock_fd_; }
};
5.2 多进程TCP服务器实现
服务器的逻辑:主进程监听端口,接受新连接;每收到一个连接,fork一个子进程处理业务(计算请求),主进程继续监听。同时忽略SIGCHLD
信号,避免僵尸进程。
// server.cpp
#include "socket.hpp"
#include "protocol.hpp"
#include <signal.h>
#include <sys/wait.h>
#include <functional>// 忽略SIGCHLD信号,避免僵尸进程
void IgnoreSigchld() {signal(SIGCHLD, SIG_IGN);
}// 处理客户端请求:读取请求→计算→返回响应
void HandleClient(int conn_fd) {std::string in_buf; // 接收缓冲区(累积数据,处理粘包/半包)char buf[1024] = {0};while (true) {// 1. 读取客户端数据ssize_t n = read(conn_fd, buf, sizeof(buf) - 1);if (n < 0) {std::cerr << "Read failed: " << strerror(errno) << std::endl;break;} else if (n == 0) {std::cout << "Client closed connection" << std::endl;break;}// 2. 把读取到的字节流追加到缓冲区buf[n] = '\0'; // 确保字符串结束in_buf += buf;memset(buf, 0, sizeof(buf));// 3. 解析缓冲区中的完整报文(可能有多个)std::string payload;while (Decode(in_buf, payload)) { // 循环解析,直到没有完整报文// 4. 反序列化:payload→Request对象Request req;if (!req.Deserialize(payload)) {std::cerr << "Invalid request format: " << payload << std::endl;continue;}// 5. 执行计算,生成ResponseResponse resp;switch (req.op) {case '+':resp.result = req.x + req.y;resp.code = 0;break;case '-':resp.result = req.x - req.y;resp.code = 0;break;case '*':resp.result = req.x * req.y;resp.code = 0;break;case '/':if (req.y == 0) {resp.code = 1; // 除0错误} else {resp.result = req.x / req.y;resp.code = 0;}break;case '%':if (req.y == 0) {resp.code = 2; // 模0错误} else {resp.result = req.x % req.y;resp.code = 0;}break;default:resp.code = 3; // 非法运算符break;}// 6. 序列化Response→字符串,加长度头std::string resp_str;resp.Serialize(resp_str);std::string encoded_resp = Encode(resp_str);// 7. 发送响应给客户端write(conn_fd, encoded_resp.c_str(), encoded_resp.size());std::cout << "Handled request: " << payload << " → Response: " << resp_str << std::endl;}}close(conn_fd); // 关闭通信套接字
}// TCP服务器类
class TcpServer {
private:Socket listen_sock_;uint16_t port_;public:TcpServer(uint16_t port) : port_(port) {}// 初始化服务器:创建→绑定→监听bool Init() {if (!listen_sock_.Create()) return false;if (!listen_sock_.Bind(port_)) return false;if (!listen_sock_.Listen()) return false;std::cout << "Server init success, listening on port " << port_ << std::endl;return true;}// 启动服务器:接受连接→fork子进程处理void Start() {IgnoreSigchld(); // 忽略SIGCHLD,避免僵尸进程while (true) {std::string client_ip;uint16_t client_port;int conn_fd = listen_sock_.Accept(client_ip, client_port);if (conn_fd < 0) continue;// fork子进程处理客户端请求pid_t pid = fork();if (pid < 0) {std::cerr << "Fork failed: " << strerror(errno) << std::endl;close(conn_fd);continue;} else if (pid == 0) {// 子进程:处理请求(关闭监听套接字,只保留通信套接字)listen_sock_.~Socket(); // 子进程不需要监听套接字,手动析构HandleClient(conn_fd);exit(0); // 处理完请求,子进程退出} else {// 父进程:关闭通信套接字(子进程会复制一份)close(conn_fd);}}}
};int main(int argc, char* argv[]) {if (argc != 2) {std::cerr << "Usage: " << argv[0] << " <port>" << std::endl;return 1;}uint16_t port = std::stoi(argv[1]);TcpServer server(port);if (!server.Init()) return 1;server.Start();return 0;
}
5.3 客户端实现
客户端逻辑:创建套接字→连接服务器→构造请求→发送→接收响应→解析。
// client.cpp
#include "socket.hpp"
#include "protocol.hpp"
#include <random>
#include <unistd.h>// 随机生成计算请求(模拟用户输入)
Request GenerateRandomRequest() {std::random_device rd;std::mt19937 gen(rd());std::uniform_int_distribution<> num_dist(1, 100); // 1~100的随机数std::uniform_int_distribution<> op_dist(0, 4); // 0~4对应5种运算符int x = num_dist(gen);int y = num_dist(gen);char ops[] = "+-*/%";char op = ops[op_dist(gen)];// 避免除0/模0(简化测试)if ((op == '/' || op == '%') && y == 0) {y = 1;}return Request(x, y, op);
}int main(int argc, char* argv[]) {if (argc != 3) {std::cerr << "Usage: " << argv[0] << " <server_ip> <server_port>" << std::endl;return 1;}std::string server_ip = argv[1];uint16_t server_port = std::stoi(argv[2]);// 1. 创建套接字并连接服务器Socket sock;if (!sock.Create()) return 1;if (!sock.Connect(server_ip, server_port)) return 1;std::cout << "Connected to server: " << server_ip << ":" << server_port << std::endl;// 2. 发送10个随机请求for (int i = 0; i < 10; ++i) {// 生成请求Request req = GenerateRandomRequest();std::string req_str;req.Serialize(req_str);std::string encoded_req = Encode(req_str);// 发送请求write(sock.GetFd(), encoded_req.c_str(), encoded_req.size());std::cout << "Sent request: " << req_str << std::endl;// 接收响应char buf[1024] = {0};ssize_t n = read(sock.GetFd(), buf, sizeof(buf) - 1);if (n < 0) {std::cerr << "Read response failed: " << strerror(errno) << std::endl;break;}buf[n] = '\0';std::string in_buf = buf;// 解析响应std::string payload;if (Decode(in_buf, payload)) {Response resp;if (resp.Deserialize(payload)) {if (resp.code == 0) {std::cout << "Received response: " << req_str << " = " << resp.result << std::endl;} else {std::string err_msg;switch (resp.code) {case 1: err_msg = "division by zero"; break;case 2: err_msg = "mod by zero"; break;case 3: err_msg = "invalid operator"; break;}std::cout << "Received error: " << req_str << " → " << err_msg << std::endl;}}}sleep(1); // 每隔1秒发一次,避免请求太密集}// 3. 关闭套接字close(sock.GetFd());std::cout << "Disconnected from server" << std::endl;return 0;
}
六、从手写到底层到通用方案——引入JSON
手写序列化/反序列化虽然能帮我们理解原理,但实际项目中很繁琐(比如字段多了要写大量字符串分割代码)。工业界常用JSON作为通用序列化方案——它是跨语言的文本格式,支持各种数据类型(整数、字符串、数组、对象),还有成熟的库(比如C++的jsoncpp)。
6.1 为什么用JSON?
- 跨语言:Python、Java、Go都支持JSON,不同语言的服务能轻松通信。
- 易读易调试:JSON格式直观(比如
{"x":10,"y":20,"op":"+"}
),方便打印日志和调试。 - 无需手写代码:库会自动处理序列化/反序列化,减少重复工作。
6.2 用jsoncpp替换手写序列化
首先安装jsoncpp库(Ubuntu为例):
sudo apt-get install libjsoncpp-dev
然后修改protocol.hpp
,用JSON实现序列化/反序列化(保留原手写代码,用条件编译切换):
// protocol.hpp 中添加
#include <json/json.h> // jsoncpp头文件// 条件编译:定义USE_JSON则用JSON,否则用手写
#ifdef USE_JSON
// JSON版Request序列化
bool Request::Serialize(std::string& out_str) {Json::Value root;root["x"] = x;root["y"] = y;root["op"] = op; // jsoncpp会自动把char转成字符串Json::FastWriter writer; // 快速序列化(无格式)out_str = writer.write(root);// 去掉JSON字符串末尾的换行符(FastWriter会加)if (!out_str.empty() && out_str.back() == '\n') {out_str.pop_back();}return true;
}// JSON版Request反序列化
bool Request::Deserialize(const std::string& in_str) {Json::Value root;Json::Reader reader;if (!reader.parse(in_str, root)) {std::cerr << "JSON parse failed: " << in_str << std::endl;return false;}// 检查字段是否存在if (!root.isMember("x") || !root["x"].isInt()) return false;if (!root.isMember("y") || !root["y"].isInt()) return false;if (!root.isMember("op") || !root["op"].isString()) return false;x = root["x"].asInt();y = root["y"].asInt();op = root["op"].asString()[0]; // 字符串转charreturn true;
}// JSON版Response序列化
bool Response::Serialize(std::string& out_str) {Json::Value root;root["result"] = result;root["code"] = code;Json::FastWriter writer;out_str = writer.write(root);if (!out_str.empty() && out_str.back() == '\n') {out_str.pop_back();}return true;
}// JSON版Response反序列化
bool Response::Deserialize(const std::string& in_str) {Json::Value root;Json::Reader reader;if (!reader.parse(in_str, root)) {std::cerr << "JSON parse failed: " << in_str << std::endl;return false;}if (!root.isMember("result") || !root["result"].isInt()) return false;if (!root.isMember("code") || !root["code"].isInt()) return false;result = root["result"].asInt();code = root["code"].asInt();return true;
}
#else
// 原手写序列化/反序列化代码(略)
#endif
6.3 编译与测试
用-DUSE_JSON
启用JSON模式,链接jsoncpp库:
# 编译服务器
g++ server.cpp -o server -DUSE_JSON -ljsoncpp
# 编译客户端
g++ client.cpp -o client -DUSE_JSON -ljsoncpp
启动服务器和客户端,会看到请求格式变成JSON:
# 服务器输出
Handled request: {"op":"+","x":10,"y":20} → Response: {"code":0,"result":30}
七、总结
这篇文章从TCP的边界问题出发,讲了自定义协议、序列化/反序列化的核心逻辑,最后用实战代码落地。复习时可以重点关注这几个点:
- TCP边界问题:面向字节流导致读不完整/粘包,必须在应用层解决。
- 协议定制:约定数据格式(Request/Response)和报文结构(长度头+有效载荷)。
- 序列化/反序列化:
- 作用:消除跨平台差异,把结构化数据转通用格式。
- 手写实现:按约定分隔符处理字符串,加长度头保障完整性。
- 通用方案:用JSON等成熟格式,减少重复代码。
- 工程化:套接字封装复用代码,多进程处理并发,忽略SIGCHLD避免僵尸进程。