当前位置: 首页 > news >正文

golang常用库之-protojson 库(json.Marshal 和 protojson.Marshal 序列化对比)

文章目录

  • golang常用库之-protojson 库(json.Marshal 和 protojson.Marshal 序列化对比)
    • 什么是protojson 库
      • 什么情况需要用 protojson?
    • json.Marshal 和 protojson.Marshal 序列化对比
      • 简单示例
      • json.Marshal 的潜在问题 (对于 Protobuf 结构体)

golang常用库之-protojson 库(json.Marshal 和 protojson.Marshal 序列化对比)

什么是protojson 库

protojson 库(google.golang.org/protobuf/encoding/protojson)

protojson 是一个用于处理 Protocol Buffers (protobuf) 和 JSON 之间转换的库,主要应用于 Go 语言中。它由 Google 提供,属于 google.golang.org/protobuf 的一部分。以下是它的主要特点和用途:

  • 功能:
    将 protobuf 消息转换为 JSON 格式(序列化)。
    将 JSON 格式的数据转换回 protobuf 消息(反序列化)。

  • 用途:
    在需要与 JSON 格式交互的场景中(如 API 通信、配置文件解析等),protojson 提供了一种高效的方式来实现 protobuf 与 JSON 的互转。
    支持 protobuf 的扩展特性,如自定义选项和字段映射。

  • 特点:
    高性能:相比标准库 encoding/json,protojson 针对 protobuf 的结构进行了优化。
    灵活性:支持自定义转换规则,例如字段名的映射、忽略空值等。

什么情况需要用 protojson?

仅当以下条件全部满足时:

  • 服务端使用 protobuf 定义数据模型。
  • 通信时通过 JSON 格式传输 protobuf 消息(例如为了兼容性)。
  • 你需要处理 protobuf 特有的特性(如自定义字段名、扩展字段等)。

只有涉及 protobuf 消息时才需要 protojson。

如果你正在处理 Protobuf 消息,强烈建议始终使用 protojson 包进行 JSON 的序列化和反序列化。这样可以确保对 Protobuf 的特定类型(如 WKTs, Any, oneof, enums)的处理是正确和一致的

protoc-gen-go 会将 .proto 文件中的 snake_case (如 max_tokens) 转换为 Go 的 CamelCase (如 MaxTokens)。

最佳实践仍然是坚持只使用 protojson 来处理 Protobuf 消息的 JSON 序列化/反序列化。

json.Marshal 和 protojson.Marshal 序列化对比

标准库的 encoding/json

  • 只认 Go struct 定义的字段和 tag,不理解 Protobuf 的 proto tag。
  • 字段名用 Go 的导出字段名(通常是驼峰),遇到 Protobuf 特有类型(如 *timestamppb.Timestamp、*anypb.Any)只会把它们序列化为结构体,而不是标准的 Protobuf JSON 格式。
  • 不会自动处理 Protobuf 枚举、oneof、默认值、proto3 的空值语义等。

protojson 库(google.golang.org/protobuf/encoding/protojson)

  • 严格遵循 Protobuf 官方 JSON Mapping 规范。
  • 字段名会自动转为 snake_case,与 proto 文件中的字段对齐(除非你设置 UseProtoNames)。
  • 能正确处理 Protobuf 的特殊类型(如 Timestamp、Any、Duration 等),保证序列化结果和其他语言(比如 Java/Python/C++)中的实现一致。
  • 枚举默认导出为字符串而不是数字,和约定一致。
  • 处理空值、默认值、oneof 和未知字段等复杂特性。
  • 支持严格/宽松模式、字段排序、原始字段名、保留未知字段等选项,适用于与 gRPC、APIs 等环境交互。

跨语言与跨平台交互需要遵守 Protobuf 的规范,尤其是和 gRPC-Gateway、Google APIs, Istio, Cloud 原生等生态协作时。protojson 的行为是 Protobuf 官方定义的 JSON 行为,兼容性和正确性才有保证。

序列化器能否用于 Protobuf GO 结构体?输出标准 Protobuf JSON?能正确处理特殊 proto 类型?
encoding/json可以,但有限
protojson.Marshal可以

简单示例

假设你的 proto 结构:

message User {string user_name = 1;google.protobuf.Timestamp created_at = 2;
}

Go 代码:

body := &pb.User{UserName: "tom",CreatedAt: timestamppb.Now(),
}

json.Marshal(body) 结果:

{"UserName": "tom","CreatedAt": {"seconds": ...,"nanos": ...} // 不是标准的 RFC 3339 字符串
}

protojson.Marshal(body) 结果:

{"userName": "tom","createdAt": "2024-05-09T08:00:00Z" // 标准时间格式
}

json.Marshal 的潜在问题 (对于 Protobuf 结构体)

字段名: json.Marshal 会遵循 Go 结构体字段上的 json:“…” 标签。对于 protoc 生成的结构体,这些标签可能直接是 proto 文件的字段名 (如 json:“max_tokens,omitempty”) 或者根据 protoc-gen-go 版本和选项有所不同。这可能导致 JSON 字段名不是标准的 camelCase。

虽然可以用 json.Marshal,但是想要获得符合 Protobuf 规范、兼容所有环境、能正确处理复杂 proto 类型和语义的 JSON,就必须用 protojson。只用标准库可能会导致兼容性、可读性和正确性的问题。

字段名映射:
protojson 默认使用 protobuf 字段的原始名称(如 snake_case),而 encoding/json 默认使用 Go 结构体的字段名(如 CamelCase)。
如果需要自定义 JSON 字段名,可以在 protobuf 文件中通过 json_name 选项指定:

message YourMessage {string field_name = 1 [json_name = "customName"];
}

空值处理:
protojson 默认会忽略 protobuf 消息中的空值字段(如 0、“”、nil),而 encoding/json 可以通过 omitempty 控制。
如果需要保留空值,可以使用 protojson.MarshalOptions

jsonData, err := protojson.MarshalOptions{EmitUnpopulated: true,
}.Marshal(pbMessage)

protojson 默认忽略空值,encoding/json 依赖 omitempty

相关文章:

  • 【Linux学习笔记】系统文件IO之重定向原理分析
  • IOC和Bean
  • 1 2 3 4 5顺序插入,形成一个红黑树
  • 区块链技术中的Java SE实战:从企业级应用到5大核心问题解析
  • R 语言科研绘图 --- 桑基图-汇总
  • Kubernetes生产实战(十四):Secret高级使用模式与安全实践指南
  • AI Agent(8):安全与伦理考量
  • PyTorch API 4 - 分布式通信、分布式张量
  • SpringCloud之Eureka基础认识-服务注册中心
  • 一、数据仓库基石:核心理论、分层艺术与 ETL/ELT 之辨
  • 第十七次博客打卡
  • MySQL 从入门到精通(六):视图全面详解 —— 虚拟表的灵活运用
  • vue开发用户注册功能
  • JVM 数据区域
  • 微服务6大拆分原则
  • Linux 下 Java 部署环境搭建与项目部署详细步骤
  • PyTorch 线性回归模型构建与神经网络基础要点解析
  • 【金仓数据库征文】学校AI数字人:从Sql Server到KingbaseES的数据库转型之路
  • 十六、统一建模语言 UML
  • cdn 是什么?
  • 第三届“老山国际春茶节”活动在云南麻栗坡举办
  • 王受文已任全国工商联党组成员
  • 民生访谈|今年上海还有哪些重要演出展览?场地配套如何更给力?
  • 明星站台“胖都来”背后:百元起录视频,20万可请顶流
  • 这个五月,有三部纪录电影值得一看
  • 李云泽:房地产“白名单”贷款审批通过金额增至6.7万亿元