其他

结构体文件存储：序列化与反序列化实现方法

悠悠楠杉

2025-08-27

0 评论

90 阅读

正在检测是否收录...

08/27

结构体文件存储：序列化与反序列化实现方法

在软件开发中，数据持久化是常见需求，而将结构体存储到文件并能够正确还原是一个关键技术。本文将深入探讨结构体的序列化与反序列化实现方法，帮助开发者掌握这一重要技能。

什么是序列化与反序列化

序列化（Serialization）是指将数据结构或对象状态转换为可以存储或传输的格式的过程，而反序列化（Deserialization）则是将这些数据重新构建为原始对象的过程。这个过程就像把一件家具拆解成零件便于运输（序列化），到达目的地后再重新组装（反序列化）。

为什么需要序列化结构体

结构体作为C/C++等语言中组织数据的常用方式，通常包含多个不同类型的数据成员。当我们需要：
1. 保存程序状态
2. 传输数据到网络
3. 在不同平台间交换数据
4. 实现缓存机制
时，序列化就显得尤为重要。

基本实现方法

1. 二进制直接存储

最简单的序列化方法是将结构体直接写入文件：

c
struct Person {
char name[50];
int age;
float height;
};

void serializeToFile(const Person& p, const char* filename) {
FILE* file = fopen(filename, "wb");
if (file) {
fwrite(&p, sizeof(Person), 1, file);
fclose(file);
}
}

void deserializeFromFile(Person& p, const char* filename) {
FILE* file = fopen(filename, "rb");
if (file) {
fread(&p, sizeof(Person), 1, file);
fclose(file);
}
}

这种方法简单直接，但存在明显问题：
- 跨平台兼容性差（字节序、对齐方式不同）
- 结构体改变后无法读取旧数据
- 安全性问题

2. 文本格式序列化

更健壮的方法是使用文本格式，如JSON、XML或自定义格式：

c void serializeToTextFile(const Person& p, const char* filename) { FILE* file = fopen(filename, "w"); if (file) { fprintf(file, "Name: %s\nAge: %d\nHeight: %.2f", p.name, p.age, p.height); fclose(file); } }

文本格式的优势：
- 可读性强
- 跨平台兼容性好
- 易于调试
但解析(反序列化)会更复杂，需要编写相应的解析器。

高级序列化技术

1. 使用第三方库

许多成熟的序列化库可以简化工作：
- Protocol Buffers (Google)
- FlatBuffers (Google)
- Boost.Serialization (C++)
- JSON库 (如 RapidJSON, nlohmann/json)

以Protocol Buffers为例：

proto // 定义.proto文件 message Person { required string name = 1; required int32 age = 2; optional float height = 3; }

然后使用生成的代码进行序列化：

c++
Person person;
person.setname("John"); person.setage(30);
person.set_height(1.75f);

// 序列化到文件
std::string data;
person.SerializeToString(&data);
SaveToFile(data, "person.dat");

2. 自定义二进制协议

对于性能敏感的场景，可以设计自定义二进制格式：

pragma pack(push, 1) // 取消结构体对齐，确保跨平台一致性

struct SerializedPerson {
uint32t nameLength; char name[50]; int32t age;
float height;
uint32_t checksum; // 校验和确保数据完整性
};

pragma pack(pop)

void serializeCustom(const Person& src, SerializedPerson& dest) {
dest.nameLength = strlen(src.name);
strncpy(dest.name, src.name, 50);
dest.age = htonl(src.age); // 网络字节序转换
dest.height = src.height;
dest.checksum = calculateChecksum(dest);
}

跨语言序列化方案

当数据需要在不同语言间交换时，选择中立的序列化格式尤为重要：

JSON：最通用的文本格式，几乎所有语言都支持
MessagePack：二进制JSON，更紧凑
Protocol Buffers：高效的二进制协议，支持向前向后兼容
Avro：支持动态模式演化

版本兼容性处理

随着软件迭代，数据结构可能变化。良好的序列化方案应考虑：

添加字段时不影响旧版本读取
删除字段时保持兼容
字段类型变更的处理策略

在Protocol Buffers中，可以通过字段编号和optional标记实现：

proto
message Person {
// 保留已删除字段的编号，防止被重用
reserved 4, 5;

required string name = 1;
optional int32 age = 2; // 从required改为optional
optional float height = 3;
optional string email = 6; // 新增字段

}

安全注意事项

序列化可能引入安全风险，特别是从不可信源反序列化时：

缓冲区溢出风险
反序列化恶意构造数据可能导致任意代码执行
数据篡改风险

防护措施：
- 校验数据完整性（如使用校验和）
- 限制反序列化深度
- 使用白名单机制限制可反序列化的类
- 对敏感数据加密

性能优化技巧

对于大规模数据序列化，性能至关重要：

减少内存拷贝：使用零拷贝技术
批量处理：合并小数据包
压缩：对文本格式使用压缩算法
增量序列化：只序列化变化部分
内存映射文件：大文件处理技术

实际应用案例

以游戏存档系统为例，演示完整序列化实现：

c++
// 游戏角色数据结构
struct GameCharacter {
std::string name;
int level;
std::vector inventory;
Position location;
// ...其他字段

// 序列化方法
std::string Serialize() const {
    json j;
    j["name"] = name;
    j["level"] = level;
    j["inventory"] = SerializeInventory();
    j["location"] = location.Serialize();
    return j.dump();
}

// 反序列化方法
bool Deserialize(const std::string& data) {
    try {
        auto j = json::parse(data);
        name = j["name"];
        level = j["level"];
        DeserializeInventory(j["inventory"]);
        location.Deserialize(j["location"]);
        return true;
    } catch (...) {
        return false; // 反序列化失败
    }
}

};

总结思考

结构体序列化是软件开发中的基础技术，选择合适的方法需要权衡：
- 开发效率 vs 运行效率
- 可读性 vs 存储空间
- 灵活性 vs 类型安全

朗读

版权属于：

至尊技术网

本文链接：

https://www.zzwws.cn/archives/36853/（转载时请注明本文出处及文章链接）

作品采用：

《署名-非商业性使用-相同方式共享 4.0 国际 (CC BY-NC-SA 4.0)》许可协议授权

结构体文件存储：序列化与反序列化实现方法

结构体文件存储：序列化与反序列化实现方法

什么是序列化与反序列化

为什么需要序列化结构体

基本实现方法

1. 二进制直接存储

2. 文本格式序列化

高级序列化技术

1. 使用第三方库

2. 自定义二进制协议

pragma pack(push, 1) // 取消结构体对齐，确保跨平台一致性

pragma pack(pop)

跨语言序列化方案

版本兼容性处理

安全注意事项

性能优化技巧

实际应用案例

总结思考

人生倒计时