当前位置: 首页 > news >正文

数据编码(Encoding)

对数据做编码可以减少存储和 I/O开销,常见的技术比如 Dictionary Encoding,Run-Length Encoding,Bitpacking,Delta Encoding,Frame-of-Reference等。

本篇文章对这些编码方案进行介绍,举例说明,最后总结各种encoding的适用场景。

一、Dictionary Encoding(字典编码)

字典编码是一种通过建立字典来压缩数据的方法。它将重复出现的值替换为较短的引用,从而减少存储空间。

工作原理:

  1. 扫描数据,建立值到编码的映射字典
  2. 用编码替换原始值
  3. 存储字典和编码后的数据

示例:

原始数据:[“apple”, “banana”, “apple”, “orange”, “banana”]

建立字典:

{
0: “apple”,
1: “banana”,
2: “orange”
}

编码后数据:
[0, 1, 0, 2, 1]

优点:

  • 对重复值较多的数据压缩效果好<

相关文章:

  • 01_K近邻
  • 网络基础-----C语言经典题目(12)
  • kivy android打包buildozer.spec GUI配置
  • LeetCode 1295.统计位数为偶数的数字:模拟
  • 4:机器人目标识别无序抓取程序二次开发
  • 4.30阅读
  • 变量char2、*char2、pChar3、*pChar3的存储位置
  • Qwen3-32B的幻觉问题
  • uv安装及使用
  • C++初阶-string类2
  • Vue Router路由原理
  • 网工_ICMP协议
  • ZYNQ MPSOC之PL与PS数据交互DMA方式
  • MCP 服务器搭建【sse 类型】实现上市公司年报查询总结, 127.0.0.1:8000/sse直接配置配合 Cherry Studio使用简单
  • 讯飞星辰焕新发布!Agent规模化应用的通关密码
  • 学习笔记——《Java面向对象程序设计》-常用实用类
  • 复刻低成本机械臂 SO-ARM100 材料齐活篇
  • 欧拉计划 Project Euler61(循环的多边形数)题解
  • Java中的多态与继承
  • 共筑数字经济新生态 共绘数字中国新蓝图 ——思特奇受邀出席2025年第八届数字中国建设峰会
  • 陈颖已任上海黄浦区委常委、统战部部长
  • 视频丨英伟达总裁黄仁勋:美勿幻想AI领域速胜中国
  • 来论|受美国“保护”,日本民众要付出什么代价?
  • 北方旱情持续,水利部:大中型灌区春灌总体有保障
  • 看见“看得见的手”,看见住房与土地——读《央地之间》
  • “乐购浦东”消费券明起发放,多个商家同期推出折扣促销活动