第13天:数据序列化实战 - 从内存到磁盘的完美转换
第13天:数据序列化实战 - 从内存到磁盘的完美转换
一、今日学习目标
- 🧱 掌握二进制序列化的原理与实现
- 📄 学习JSON格式的序列化方法
- 💾 完成学生信息管理系统的通用数据存储方案
- 🔍 理解不同序列化格式的适用场景
二、二进制序列化详解
1. 内存布局与字节序
struct Student {
int id; // 4字节
char name[20]; // 20字节
double gpa; // 8字节
}; // 总大小32字节(内存对齐)
// 内存布局示意图
+------+---------------------+------+
| id | name | gpa |
| 4B | 20B | 8B |
+------+---------------------+------+
2. 二进制读写实现
#include <fstream>
// 序列化函数
void saveBinary(const Student& s, ofstream& file) {
file.write(reinterpret_cast<const char*>(&s), sizeof(Student));
}
// 反序列化函数
Student loadBinary(ifstream& file) {
Student s;
file.read(reinterpret_cast<char*>(&s), sizeof(Student));
return s;
}
三、JSON序列化实战
1. JSON库安装与配置
# 使用流行的单头文件JSON库
wget https://github.com/nlohmann/json/releases/download/v3.11.2/json.hpp
2. JSON序列化实现
#include "json.hpp"
using json = nlohmann::json;
struct Student {
int id;
string name;
vector<double> scores;
// 转JSON对象
json toJson() const {
return {
{"id", id},
{"name", name},
{"scores", scores}
};
}
// 从JSON解析
static Student fromJson(const json& j) {
return {
j["id"].get<int>(),
j["name"].get<string>(),
j["scores"].get<vector<double>>()
};
}
};
3. 文件存储实现
void saveStudents(const vector<Student>& students) {
json data;
for (const auto& s : students) {
data.push_back(s.toJson());
}
ofstream("students.json") << data.dump(4);
}
vector<Student> loadStudents() {
ifstream file("students.json");
json data = json::parse(file);
vector<Student> result;
for (const auto& item : data) {
result.push_back(Student::fromJson(item));
}
return result;
}
四、序列化格式对比表
特性 | 二进制格式 | JSON格式 |
---|---|---|
可读性 | 不可读 | 良好可读 |
数据大小 | 紧凑(无元数据) | 较大(带格式字符) |
跨平台兼容性 | 需处理字节序 | 天然兼容 |
扩展性 | 修改结构需版本控制 | 支持动态字段 |
最佳场景 | 高性能存储 | 配置文件/网络传输 |
五、综合实战:通用序列化模块
1. 序列化接口设计
class Serializer {
public:
virtual void serialize(const Student& s) = 0;
virtual Student deserialize() = 0;
virtual ~Serializer() = default;
};
// 二进制实现
class BinarySerializer : public Serializer {
// 实现具体方法...
};
// JSON实现
class JsonSerializer : public Serializer {
// 实现具体方法...
};
六、常见问题解答
Q:如何处理结构体版本升级?
- 二进制格式:在文件头添加版本号
- JSON格式:使用可选字段和默认值
Q:大端序和小端序如何转换?
// 网络字节序转换函数
uint32_t htonl(uint32_t hostlong); // 主机到网络字节序
uint32_t ntohl(uint32_t netlong); // 网络到主机字节序
Q:JSON库如何支持中文?
- 确保文件使用UTF-8编码
- 转义中文字符:
json::parse(R"({"name":"\u4E2D\u6587"})")
七、今日总结
✅ 掌握要点:
- 🔄 二进制序列化的内存操作技巧
- 🌐 JSON序列化的跨平台优势
- 🧩 面向接口的序列化架构设计
- ⚖️ 不同序列化方案的选型策略