当前位置: 首页 > news >正文

自定义网络协议与序列化/反序列化

自定义网络协议与序列化/反序列化

如果你做过网络编程,可能会遇到这样的问题:用TCP发了一个“1+1”的计算请求,对方却只收到了“1”;或者一次收到了“1+12+3”这种拼接的内容——这时候怎么判断哪个是完整的请求?又怎么把这些字符串解析成能计算的操作数和运算符?这篇文章就从TCP的“天生缺陷”说起,带你搞懂自定义协议的必要性、序列化与反序列化的核心逻辑,最后通过一个网络计算器实例,把这些知识点落地成可运行的代码。

一、TCP通信的字节流边界问题

先问一个问题:TCP是“面向字节流”的协议,这意味着什么?
你可能知道,发送端调用write,只是把数据拷贝到操作系统的内核缓冲区,什么时候发、发多少,全由TCP协议自己决定(比如根据网络带宽、接收方缓冲区大小调整);接收端调用read,可能只读到部分数据(比如对方只发了一半),也可能读到多个拼接的数据(比如对方连续发了两个请求,被TCP打包成一次发送)。

举个例子:你发了两次请求“1+1”和“2+3”,接收端read时可能拿到“1+12+3”——这时候你怎么区分这是两个请求,而不是一个“1+12+3”的请求?又怎么保证每次处理的都是一个完整的请求?
这就是TCP字节流的“边界问题”——它没法保证应用层能读到“完整的报文”。要解决这个问题,光靠TCP协议不够,必须在应用层自定义协议

二、应用层协议定制的必要性

协议本质是“通信双方的约定”——比如约定“数据格式是什么”“每个字段代表什么意思”“怎么判断一个报文结束”。没有约定,接收端根本不知道怎么解析数据。

以“网络计算器”为例,我们需要客户端给服务器发“计算请求”,服务器返回“计算结果”。这时候协议该怎么定?
至少要明确两件事:

  1. 请求格式(Request):需要包含两个操作数(比如xy)、一个运算符(比如op,支持+ - * / %)。
  2. 响应格式(Response):需要包含计算结果(result)、状态码(code,比如0表示成功,1表示除0错误,2表示非法运算符)。

如果没有这个约定,客户端发个“1+1”,服务器可能以为是字符串“1+1”,而不是“x=1,op=+,y=1”——根本没法计算。

所以,应用层协议的核心作用是:给字节流“贴标签”,让接收端能正确识别数据结构和字段含义

三、关键技术:序列化与反序列化

协议定好了Request和Response的结构,接下来的问题是:怎么把这些结构化数据(比如C++的类/结构体)通过网络发送?
直接发结构体行不行?比如客户端定义一个struct Request { int x; int y; char op; },然后把结构体直接write到socket——这在同平台(比如都是Linux)可能暂时能用,但跨平台(比如客户端Windows,服务器Linux)一定会出问题。

为什么?因为结构体的内存对齐。不同编译器(比如VS和GCC)对结构体的内存对齐规则可能不同:比如一个struct { char a; int b; },VS可能按4字节对齐(总大小8字节),GCC可能按自然对齐(总大小5字节)。直接传结构体,接收端解析时字段会错位(比如把a的内存当成b的一部分),结果完全错误。

这时候就需要“序列化”和“反序列化”:

  • 序列化(Serialization):把结构化数据(比如Request类对象)转换成通用的字符串或字节流(比如“10 + 20”),消除平台差异。
  • 反序列化(Deserialization):把接收到的字符串/字节流还原成结构化数据(比如把“10 + 20”还原成x=10op=+y=20)。

举个生活中的例子:你在QQ发消息,消息里包含“昵称、时间、内容”——这其实是一个结构化数据。QQ会把这三个字段打包成一个字符串(比如“小明|2024-05-20 10:00|你好”),这个过程就是序列化;接收方拿到字符串后,按“|”分割,还原出昵称、时间、内容,这就是反序列化。

四、实战:网络计算器的协议设计与实现

下面我们从0实现一个网络计算器,把“协议定制”“序列化/反序列化”落地。整个过程分三步:设计协议结构、实现序列化/反序列化、保障报文完整性。

4.1 第一步:定义协议结构(Request/Response)

首先,我们用C++类定义请求和响应的结构(代替结构体,方便封装方法):

// protocol.hpp
#pragma once
#include <string>
#include <iostream>// 计算请求:x op y(比如10 + 20)
class Request {
public:int x;       // 左操作数int y;       // 右操作数char op;     // 运算符:+ - * / %std::string sep = " ";  // 字段分隔符(空格)// 构造函数Request(int x_ = 0, int y_ = 0, char op_ = 0) : x(x_), y(y_), op(op_) {}// 序列化:把Request对象转成字符串(比如"10 + 20")bool Serialize(std::string& out_str);// 反序列化:把字符串转成Request对象bool Deserialize(const std::string& in_str);
};// 计算响应:result(结果) + code(状态码)
class Response {
public:int result;  // 计算结果(仅当code=0时有效)int code;    // 状态码:0=成功,1=除0错误,2=模0错误,3=非法运算符std::string sep = " ";  // 字段分隔符(空格)// 构造函数Response(int res_ = 0, int code_ = 0) : result(res_), code(code_) {}// 序列化:把Response对象转成字符串(比如"30 0")bool Serialize(std::string& out_str);// 反序列化:把字符串转成Response对象bool Deserialize(const std::string& in_str);
};

4.2 第二步:实现序列化与反序列化

接下来实现SerializeDeserialize方法,核心是“按约定格式处理字符串”。

4.2.1 Request的序列化与反序列化
  • 序列化:把xopy用空格拼接成字符串(比如x=10op='+'y=20 → “10 + 20”)。
  • 反序列化:把字符串按空格分割,提取xopy(比如“10 + 20” → x=10op='+'y=20)。
// Request序列化
bool Request::Serialize(std::string& out_str) {// 拼接格式:x + " " + op + " " + yout_str = std::to_string(x) + sep + op + sep + std::to_string(y);return true;  // 简单场景,暂不处理异常
}// Request反序列化
bool Request::Deserialize(const std::string& in_str) {// 1. 找第一个分隔符(空格),提取xsize_t first_sep = in_str.find(sep);if (first_sep == std::string::npos) {return false;  // 没找到分隔符,格式错误}std::string x_str = in_str.substr(0, first_sep);x = std::stoi(x_str);  // 字符串转整数// 2. 找第二个分隔符,提取opsize_t second_sep = in_str.find(sep, first_sep + 1);if (second_sep == std::string::npos) {return false;}op = in_str[first_sep + 1];  // 分隔符后第一个字符是op// 3. 提取ystd::string y_str = in_str.substr(second_sep + 1);y = std::stoi(y_str);return true;
}
4.2.2 Response的序列化与反序列化

逻辑类似,只是字段变成resultcode

// Response序列化
bool Response::Serialize(std::string& out_str) {// 拼接格式:result + " " + codeout_str = std::to_string(result) + sep + std::to_string(code);return true;
}// Response反序列化
bool Response::Deserialize(const std::string& in_str) {// 找分隔符,分割result和codesize_t sep_pos = in_str.find(sep);if (sep_pos == std::string::npos) {return false;}std::string res_str = in_str.substr(0, sep_pos);std::string code_str = in_str.substr(sep_pos + 1);result = std::stoi(res_str);code = std::stoi(code_str);return true;
}

4.3 第三步:保障报文完整性——加“长度头”和“分隔符”

现在我们能把Request/Response转成字符串了,但还有个问题:接收端怎么知道一个报文的结束?比如客户端发了“10 + 20”,接收端可能只读到“10 + ”(半包),或者读到“10 + 2020 - 5”(粘包)。

解决方案:给每个报文加一个“长度头”,格式约定为“长度\n有效载荷”——比如“5\n10+20”(长度5表示后面的有效载荷是5个字符)。接收端先读“长度”,再按长度读“有效载荷”,就能保证拿到完整的报文。

我们写两个通用函数Encode(加长度头)和Decode(解长度头):

// protocol.hpp 中添加
#include <cstring>// 协议分隔符:用于分割长度头和有效载荷(换行符\n)
const std::string PROTOCOL_SEP = "\n";// Encode:给有效载荷加长度头(格式:长度\n有效载荷)
std::string Encode(const std::string& payload) {int len = payload.size();return std::to_string(len) + PROTOCOL_SEP + payload;
}// Decode:从报文中提取有效载荷(输入是接收缓冲区,输出是有效载荷)
// 返回值:true=解析成功,false=报文不完整
bool Decode(std::string& in_buf, std::string& out_payload) {// 1. 找长度头的分隔符\nsize_t sep_pos = in_buf.find(PROTOCOL_SEP);if (sep_pos == std::string::npos) {return false;  // 没找到分隔符,报文不完整}// 2. 提取长度头,转成整数std::string len_str = in_buf.substr(0, sep_pos);int payload_len = std::stoi(len_str);// 3. 检查缓冲区是否包含完整的有效载荷int total_len = len_str.size() + PROTOCOL_SEP.size() + payload_len;if (in_buf.size() < total_len) {return false;  // 有效载荷不完整}// 4. 提取有效载荷,并从缓冲区中移除已处理的报文out_payload = in_buf.substr(sep_pos + 1, payload_len);in_buf.erase(0, total_len);  // 移除已处理的部分(长度头+有效载荷)return true;
}

五、工程化优化:套接字封装与服务端框架

现在协议和序列化都搞定了,接下来要实现网络通信。为了避免重复写socket代码,我们先封装一个Socket类;再写一个TCP服务器,用多进程处理并发连接。

5.1 套接字封装(Socket类)

把socket的创建、绑定、监听、accept、connect等操作封装成类,方便客户端和服务器复用:

// socket.hpp
#pragma once
#include <sys/socket.h>
#include <netinet/in.h>
#include <arpa/inet.h>
#include <unistd.h>
#include <string>
#include <cerrno>
#include <cstring>
#include <iostream>class Socket {
private:int sock_fd_;  // 套接字文件描述符public:Socket() : sock_fd_(-1) {}~Socket() { if (sock_fd_ != -1) close(sock_fd_); }// 1. 创建流式套接字(TCP)bool Create() {sock_fd_ = socket(AF_INET, SOCK_STREAM, 0);if (sock_fd_ < 0) {std::cerr << "Socket create failed: " << strerror(errno) << std::endl;return false;}return true;}// 2. 绑定端口(服务器用,IP默认INADDR_ANY)bool Bind(uint16_t port) {struct sockaddr_in addr;memset(&addr, 0, sizeof(addr));addr.sin_family = AF_INET;addr.sin_port = htons(port);  // 主机字节序转网络字节序addr.sin_addr.s_addr = htonl(INADDR_ANY);  // 绑定所有网卡IPif (bind(sock_fd_, (struct sockaddr*)&addr, sizeof(addr)) < 0) {std::cerr << "Socket bind failed: " << strerror(errno) << std::endl;return false;}return true;}// 3. 监听(服务器用)bool Listen(int backlog = 10) {if (listen(sock_fd_, backlog) < 0) {std::cerr << "Socket listen failed: " << strerror(errno) << std::endl;return false;}return true;}// 4. 接受连接(服务器用,返回新的通信套接字)int Accept(std::string& client_ip, uint16_t& client_port) {struct sockaddr_in client_addr;socklen_t client_addr_len = sizeof(client_addr);int conn_fd = accept(sock_fd_, (struct sockaddr*)&client_addr, &client_addr_len);if (conn_fd < 0) {std::cerr << "Socket accept failed: " << strerror(errno) << std::endl;return -1;}// 提取客户端IP和端口client_ip = inet_ntoa(client_addr.sin_addr);  // 网络字节序转IP字符串client_port = ntohs(client_addr.sin_port);    // 网络字节序转主机字节序return conn_fd;}// 5. 连接服务器(客户端用)bool Connect(const std::string& server_ip, uint16_t server_port) {struct sockaddr_in server_addr;memset(&server_addr, 0, sizeof(server_addr));server_addr.sin_family = AF_INET;server_addr.sin_port = htons(server_port);// IP字符串转网络字节序if (inet_pton(AF_INET, server_ip.c_str(), &server_addr.sin_addr) <= 0) {std::cerr << "Invalid server IP: " << server_ip << std::endl;return false;}if (connect(sock_fd_, (struct sockaddr*)&server_addr, sizeof(server_addr)) < 0) {std::cerr << "Socket connect failed: " << strerror(errno) << std::endl;return false;}return true;}// 获取套接字文件描述符int GetFd() const { return sock_fd_; }
};

5.2 多进程TCP服务器实现

服务器的逻辑:主进程监听端口,接受新连接;每收到一个连接,fork一个子进程处理业务(计算请求),主进程继续监听。同时忽略SIGCHLD信号,避免僵尸进程。

// server.cpp
#include "socket.hpp"
#include "protocol.hpp"
#include <signal.h>
#include <sys/wait.h>
#include <functional>// 忽略SIGCHLD信号,避免僵尸进程
void IgnoreSigchld() {signal(SIGCHLD, SIG_IGN);
}// 处理客户端请求:读取请求→计算→返回响应
void HandleClient(int conn_fd) {std::string in_buf;  // 接收缓冲区(累积数据,处理粘包/半包)char buf[1024] = {0};while (true) {// 1. 读取客户端数据ssize_t n = read(conn_fd, buf, sizeof(buf) - 1);if (n < 0) {std::cerr << "Read failed: " << strerror(errno) << std::endl;break;} else if (n == 0) {std::cout << "Client closed connection" << std::endl;break;}// 2. 把读取到的字节流追加到缓冲区buf[n] = '\0';  // 确保字符串结束in_buf += buf;memset(buf, 0, sizeof(buf));// 3. 解析缓冲区中的完整报文(可能有多个)std::string payload;while (Decode(in_buf, payload)) {  // 循环解析,直到没有完整报文// 4. 反序列化:payload→Request对象Request req;if (!req.Deserialize(payload)) {std::cerr << "Invalid request format: " << payload << std::endl;continue;}// 5. 执行计算,生成ResponseResponse resp;switch (req.op) {case '+':resp.result = req.x + req.y;resp.code = 0;break;case '-':resp.result = req.x - req.y;resp.code = 0;break;case '*':resp.result = req.x * req.y;resp.code = 0;break;case '/':if (req.y == 0) {resp.code = 1;  // 除0错误} else {resp.result = req.x / req.y;resp.code = 0;}break;case '%':if (req.y == 0) {resp.code = 2;  // 模0错误} else {resp.result = req.x % req.y;resp.code = 0;}break;default:resp.code = 3;  // 非法运算符break;}// 6. 序列化Response→字符串,加长度头std::string resp_str;resp.Serialize(resp_str);std::string encoded_resp = Encode(resp_str);// 7. 发送响应给客户端write(conn_fd, encoded_resp.c_str(), encoded_resp.size());std::cout << "Handled request: " << payload << " → Response: " << resp_str << std::endl;}}close(conn_fd);  // 关闭通信套接字
}// TCP服务器类
class TcpServer {
private:Socket listen_sock_;uint16_t port_;public:TcpServer(uint16_t port) : port_(port) {}// 初始化服务器:创建→绑定→监听bool Init() {if (!listen_sock_.Create()) return false;if (!listen_sock_.Bind(port_)) return false;if (!listen_sock_.Listen()) return false;std::cout << "Server init success, listening on port " << port_ << std::endl;return true;}// 启动服务器:接受连接→fork子进程处理void Start() {IgnoreSigchld();  // 忽略SIGCHLD,避免僵尸进程while (true) {std::string client_ip;uint16_t client_port;int conn_fd = listen_sock_.Accept(client_ip, client_port);if (conn_fd < 0) continue;// fork子进程处理客户端请求pid_t pid = fork();if (pid < 0) {std::cerr << "Fork failed: " << strerror(errno) << std::endl;close(conn_fd);continue;} else if (pid == 0) {// 子进程:处理请求(关闭监听套接字,只保留通信套接字)listen_sock_.~Socket();  // 子进程不需要监听套接字,手动析构HandleClient(conn_fd);exit(0);  // 处理完请求,子进程退出} else {// 父进程:关闭通信套接字(子进程会复制一份)close(conn_fd);}}}
};int main(int argc, char* argv[]) {if (argc != 2) {std::cerr << "Usage: " << argv[0] << " <port>" << std::endl;return 1;}uint16_t port = std::stoi(argv[1]);TcpServer server(port);if (!server.Init()) return 1;server.Start();return 0;
}

5.3 客户端实现

客户端逻辑:创建套接字→连接服务器→构造请求→发送→接收响应→解析。

// client.cpp
#include "socket.hpp"
#include "protocol.hpp"
#include <random>
#include <unistd.h>// 随机生成计算请求(模拟用户输入)
Request GenerateRandomRequest() {std::random_device rd;std::mt19937 gen(rd());std::uniform_int_distribution<> num_dist(1, 100);  // 1~100的随机数std::uniform_int_distribution<> op_dist(0, 4);     // 0~4对应5种运算符int x = num_dist(gen);int y = num_dist(gen);char ops[] = "+-*/%";char op = ops[op_dist(gen)];// 避免除0/模0(简化测试)if ((op == '/' || op == '%') && y == 0) {y = 1;}return Request(x, y, op);
}int main(int argc, char* argv[]) {if (argc != 3) {std::cerr << "Usage: " << argv[0] << " <server_ip> <server_port>" << std::endl;return 1;}std::string server_ip = argv[1];uint16_t server_port = std::stoi(argv[2]);// 1. 创建套接字并连接服务器Socket sock;if (!sock.Create()) return 1;if (!sock.Connect(server_ip, server_port)) return 1;std::cout << "Connected to server: " << server_ip << ":" << server_port << std::endl;// 2. 发送10个随机请求for (int i = 0; i < 10; ++i) {// 生成请求Request req = GenerateRandomRequest();std::string req_str;req.Serialize(req_str);std::string encoded_req = Encode(req_str);// 发送请求write(sock.GetFd(), encoded_req.c_str(), encoded_req.size());std::cout << "Sent request: " << req_str << std::endl;// 接收响应char buf[1024] = {0};ssize_t n = read(sock.GetFd(), buf, sizeof(buf) - 1);if (n < 0) {std::cerr << "Read response failed: " << strerror(errno) << std::endl;break;}buf[n] = '\0';std::string in_buf = buf;// 解析响应std::string payload;if (Decode(in_buf, payload)) {Response resp;if (resp.Deserialize(payload)) {if (resp.code == 0) {std::cout << "Received response: " << req_str << " = " << resp.result << std::endl;} else {std::string err_msg;switch (resp.code) {case 1: err_msg = "division by zero"; break;case 2: err_msg = "mod by zero"; break;case 3: err_msg = "invalid operator"; break;}std::cout << "Received error: " << req_str << " → " << err_msg << std::endl;}}}sleep(1);  // 每隔1秒发一次,避免请求太密集}// 3. 关闭套接字close(sock.GetFd());std::cout << "Disconnected from server" << std::endl;return 0;
}

六、从手写到底层到通用方案——引入JSON

手写序列化/反序列化虽然能帮我们理解原理,但实际项目中很繁琐(比如字段多了要写大量字符串分割代码)。工业界常用JSON作为通用序列化方案——它是跨语言的文本格式,支持各种数据类型(整数、字符串、数组、对象),还有成熟的库(比如C++的jsoncpp)。

6.1 为什么用JSON?

  • 跨语言:Python、Java、Go都支持JSON,不同语言的服务能轻松通信。
  • 易读易调试:JSON格式直观(比如{"x":10,"y":20,"op":"+"}),方便打印日志和调试。
  • 无需手写代码:库会自动处理序列化/反序列化,减少重复工作。

6.2 用jsoncpp替换手写序列化

首先安装jsoncpp库(Ubuntu为例):

sudo apt-get install libjsoncpp-dev

然后修改protocol.hpp,用JSON实现序列化/反序列化(保留原手写代码,用条件编译切换):

// protocol.hpp 中添加
#include <json/json.h>  // jsoncpp头文件// 条件编译:定义USE_JSON则用JSON,否则用手写
#ifdef USE_JSON
// JSON版Request序列化
bool Request::Serialize(std::string& out_str) {Json::Value root;root["x"] = x;root["y"] = y;root["op"] = op;  // jsoncpp会自动把char转成字符串Json::FastWriter writer;  // 快速序列化(无格式)out_str = writer.write(root);// 去掉JSON字符串末尾的换行符(FastWriter会加)if (!out_str.empty() && out_str.back() == '\n') {out_str.pop_back();}return true;
}// JSON版Request反序列化
bool Request::Deserialize(const std::string& in_str) {Json::Value root;Json::Reader reader;if (!reader.parse(in_str, root)) {std::cerr << "JSON parse failed: " << in_str << std::endl;return false;}// 检查字段是否存在if (!root.isMember("x") || !root["x"].isInt()) return false;if (!root.isMember("y") || !root["y"].isInt()) return false;if (!root.isMember("op") || !root["op"].isString()) return false;x = root["x"].asInt();y = root["y"].asInt();op = root["op"].asString()[0];  // 字符串转charreturn true;
}// JSON版Response序列化
bool Response::Serialize(std::string& out_str) {Json::Value root;root["result"] = result;root["code"] = code;Json::FastWriter writer;out_str = writer.write(root);if (!out_str.empty() && out_str.back() == '\n') {out_str.pop_back();}return true;
}// JSON版Response反序列化
bool Response::Deserialize(const std::string& in_str) {Json::Value root;Json::Reader reader;if (!reader.parse(in_str, root)) {std::cerr << "JSON parse failed: " << in_str << std::endl;return false;}if (!root.isMember("result") || !root["result"].isInt()) return false;if (!root.isMember("code") || !root["code"].isInt()) return false;result = root["result"].asInt();code = root["code"].asInt();return true;
}
#else
// 原手写序列化/反序列化代码(略)
#endif

6.3 编译与测试

-DUSE_JSON启用JSON模式,链接jsoncpp库:

# 编译服务器
g++ server.cpp -o server -DUSE_JSON -ljsoncpp
# 编译客户端
g++ client.cpp -o client -DUSE_JSON -ljsoncpp

启动服务器和客户端,会看到请求格式变成JSON:

# 服务器输出
Handled request: {"op":"+","x":10,"y":20} → Response: {"code":0,"result":30}

七、总结

这篇文章从TCP的边界问题出发,讲了自定义协议、序列化/反序列化的核心逻辑,最后用实战代码落地。复习时可以重点关注这几个点:

  1. TCP边界问题:面向字节流导致读不完整/粘包,必须在应用层解决。
  2. 协议定制:约定数据格式(Request/Response)和报文结构(长度头+有效载荷)。
  3. 序列化/反序列化
    • 作用:消除跨平台差异,把结构化数据转通用格式。
    • 手写实现:按约定分隔符处理字符串,加长度头保障完整性。
    • 通用方案:用JSON等成熟格式,减少重复代码。
  4. 工程化:套接字封装复用代码,多进程处理并发,忽略SIGCHLD避免僵尸进程。
http://www.dtcms.com/a/478348.html

相关文章:

  • 如何给网站做第三方流量监测海珠高端网站建设
  • 守好电网的“最后一公里”:配电台区综合在线监控系统
  • 从零部署 Astro 静态网站到云服务器(含 HTTPS 一键配置)
  • 重生之我在大学自学鸿蒙开发第二天-《MVVM模式》
  • Sequence Encoder-based Spatio temporal Knowledge Graph Completion
  • 学习笔记:Vue Router 中的链接匹配机制与样式控制
  • 做彩票网站电话多少钱网站在线建设
  • 网站建设入什么费用站规划在网站建设中的作用
  • c语言-流程控制语句
  • for和while循环,continue和break的用法
  • Redis-持久化之RDB
  • 网站宣传海报科技狂人
  • 哪个网站可以查到个人名下公司wordpress文章为啥数据库中找不到
  • 踏上编程征程,与 Python 共舞
  • 工业相机传感器CCD的原理及基础知识
  • 【电脑操作】如何快速去掉win11操作系统下默认的鼠标右键菜单的显示更多选项
  • 漏洞问题解决—SSL/TLS Not Implemented (verified)(中危)
  • 公司怎么建立自己网站WordPress云虚拟空间
  • C++速通Lambda表达式
  • 微企点做的网站怎么去底下的wordpress首页
  • 高防服务器分为哪几种?香港高防服务器有什么特点?
  • 用 PyTorch 实现 MNIST 手写数字识别:从入门到实践
  • 设计模式篇之 代理模式 Proxy
  • 智联招聘网站建设情况wordpress 注册 密码
  • Mobius Protocol:在“去中心化”逐渐被遗忘的时代,重建秩序的尝试
  • 网站制作公司费用wordpress 宋体、
  • 长宁怎么做网站优化好住房城乡建设门户网站
  • MySQL InnoDB Cluster 高可用集群部署与应用实践(下)
  • commons-rng(伪随机数生成)
  • qemu 串口模拟输入的整个流程