当前位置: 首页 > news >正文

什么是序列化与反序列化

序列化与反序列化:概念、作用及应用

一、基本定义
  1. 序列化(Serialization)
    将 ** 对象的状态(数据、属性等)转换为可存储或传输的字节流(二进制或文本格式)** 的过程。

    • 目的:使对象能在网络中传输(如 RPC 调用)、存储到文件 / 数据库,或在内存中持久化保存。
    • 本质:将复杂的对象结构 “flatten” 为线性字节序列,便于跨平台、跨进程处理。
  2. 反序列化(Deserialization)
    将字节流恢复为原始对象的过程,是序列化的逆操作。

    • 目的:从存储介质或网络接收端重构对象,恢复其状态和功能。
二、核心作用
  1. 数据存储与持久化

    • 例:将内存中的对象(如用户信息、配置参数)保存到文件(如 JSON、XML、二进制文件)或数据库,以便后续重新加载。
    • 典型场景:缓存系统(如 Redis 存储对象)、日志记录、断点续传。
  2. 网络通信与跨进程交互

    • 在分布式系统中(如 RPC 框架、微服务),对象需通过网络传输时,必须先序列化为字节流,接收方再反序列化为对象。
    • 例:Hadoop 中 MapReduce 任务间传递数据时,自定义的Writable对象需实现序列化接口,确保节点间数据正确传输。
  3. 对象状态共享

    • 在分布式环境中,序列化可用于复制对象状态(如分布式锁、集群节点状态同步)。
三、常见应用场景
  1. 分布式系统

    • Hadoop/Spark:自定义数据类型(如TextIntWritable)需实现Writable接口,确保在 Map/Reduce 任务间序列化传输。
    • RPC 框架(如 gRPC、Thrift):通过序列化协议(如 Protocol Buffers、JSON)定义接口参数和返回值的格式。
  2. 数据交换格式

    • 文本格式:JSON、XML(可读性强,适合跨语言交互,但效率较低)。
    • 二进制格式:Protocol Buffers、Apache Avro、Thrift(体积小、解析快,适合高性能场景)。
    • 语言特定格式:Java 的ObjectOutputStream、Python 的pickle(仅适用于同语言环境,可能存在安全风险)。
  3. 缓存与持久化

    • Redis 支持序列化对象存储(需选择高效格式如 MsgPack)。
    • Java 对象序列化后可写入ObjectInputStream/ObjectOutputStream
四、不同语言的实现方式
语言序列化框架 / 接口特点
JavaSerializable接口、Kryo、Protostuff内置Serializable简单但效率低;Kryo 等第三方库性能更高。
Pythonpickledill、JSON、Protocol Bufferspickle支持复杂对象但不安全;JSON 跨语言友好,需手动转换数据类型。
C++Protobuf、FlatBuffers高性能二进制格式,需定义 IDL(接口描述语言)。
通用JSON、XML、Protobuf、Avro跨语言支持,适合微服务、API 数据交互。
五、关键技术点与注意事项
  1. 序列化协议的选择

    • 性能:二进制格式(如 Protobuf)比文本格式(如 JSON)更快、更紧凑,适合大数据量或高频交互场景。
    • 兼容性:需考虑版本变更时的向后兼容(如 Protobuf 允许新增字段,不破坏旧解析逻辑)。
    • 安全性:避免使用不安全的反序列化接口(如 Python 的pickle直接反序列化不可信数据可能导致代码执行攻击)。
  2. 自定义序列化逻辑

    • 当内置序列化机制无法满足需求时(如忽略敏感字段、压缩数据),需自定义序列化方法。
    • 例:Hadoop 中自定义Writable类型需实现write()(序列化)和readFields()(反序列化)方法,确保数据在集群中正确传输。
  3. 反序列化漏洞

    • 风险:若反序列化不可信数据,可能导致远程代码执行(如 Java 的反序列化漏洞 CVE-2015-4852)。
    • 防护:避免反序列化不可信数据,使用安全的序列化协议(如 Protobuf),或对输入数据进行严格校验。

相关文章:

  • Kubernetes 标签和注解
  • Unity
  • [ linux-系统 ] 进程概念与基本操作
  • 【大模型】DeepResearcher:通用智能体通过强化学习探索优化
  • 嵌入式STM32学习——外部中断EXTI与NVIC的基础练习⭐
  • 大便次数与寿命有关?
  • 通过SSRF击穿内网!kali-ssrf靶场实战!
  • 基于MNIST数据集的手写数字识别(简单全连接网络)
  • 蓝桥杯 16. 外卖店优先级
  • 抖音怎么快速涨粉(抖音推流算法研究)
  • Qt多线程编程实践总结:QtConcurrent与moveToThread应用场景对比(可以说都是干货)
  • 接口(API)开发核心知识点
  • Qt —— 使用Enigma Virtual Box将Qt程序打包为独立可运行exe(附:完整打包方法且完美运行)
  • CSRF防范歪招
  • 分区器介绍
  • Java集合框架详解与使用场景示例
  • PyInstaller 打包后 Excel 转 CSV 报错解决方案:“excel file format cannot be determined“
  • uniapp(vue3)动态计算swiper高度封装自定义hook
  • Foupk3systemX5OS TXW8移动设备
  • UE5中制作动态数字Decal
  • 京东美团饿了么等外卖平台被约谈
  • 优化营商环境,服务上海“五个中心”建设,北外滩有何举措?
  • 睡觉总做梦是睡眠质量差?梦到这些事,才要小心
  • 新华时评:中美经贸会谈为全球经济纾压增信
  • 江西吉水通报一男子拒服兵役:不得考公,两年内经商、升学等受限
  • 水豚出逃40天至今未归,江苏扬州一动物园发悬赏公告