Zstd(Zstandard)压缩算法
要压缩的数据量越小,压缩的难度就越大。这个问题对所有压缩算法都是通用的,原因是压缩算法从过去的数据中学习如何压缩未来的数据。但是,在新数据集开始时,没有“过去”可以构建。
官网
为了解决这种情况,Zstd 提供了一种训练模式,可用于针对所选类型的数据调整算法。 训练 Zstandard 是通过为其提供几个样本(每个样本一个文件)来实现的。此训练的结果存储在一个名为 “dictionary” 的文件中,该文件必须在压缩和解压缩之前加载。 使用此字典,可在小数据上实现的压缩率显著提高。