新型压缩编码算法基础近日确定!
本人自接触计算机起就有压缩数字信息的想法,第一份正式的编程项目是掌上辞典的资料压缩/解压,因此对Huffman有研究。二十几年来一直没放弃这方面的研究,十五年前里程碑帖以为可行,但是经过几次验证后发现还是没有达到目标,于是继续苦心钻研,终于在前几日看到了成功的曙光。
本编码的目标:
压缩其它压缩软件——如zip、rar、7zip——等无法压缩的文件,有如下几个主要应用场景:
- 音视频文件:wav文件、mp3文件、tta文件、tak文件、flac文件、avi文件、mkv文件。可供保留有大量影音资料的收藏者、口述历史库、长期保存监控资料、大数据数据库备份、视频/直播站点备份(或减少传输数据量)等的需要。
- 图像文件:bmp文件(因为有jpg和png,可能应用度不高)、jpg文件、png文件。
- 压缩包文件:zip压缩包、rar压缩包、7z压缩包等。
- 大规模数据库备份。
本编码的特点:
- 无损压缩。
- 使用自研编码,没有使用Huffman编码以及本人搜索到的资料使用的算法。
- 使用通用的、固定的字典,可以轻松实现不同应用程序使用不同字典,不同程序间有隔离性。
- 压缩包中不包含字典,尽可能的缩小压缩包的尺寸。
- 已生成的压缩包有大概率可以再次压缩,可持续减小压缩包尺寸,甚至可以达成某种保密性。如果出现压缩包没缩减的情况,用zip、rar、7zip等压缩一遍即可再次压缩。
本编码的缺点:
- 有些文件可能无法实现压缩效果,但是用其它压缩软件压缩后大概率可以压缩。
- 压缩速度慢。现阶段的算法压缩效率低,后期随着研究的深入有恨大的改善可能。
- 需要一定的基础数据量才可能有压缩效果,现在推算出的数据量大概是2Gb。
本人写此文时46岁,无业状态。此压缩编码为本人个人研究项目,与过往任职过的公司都无关。
此编码虽然耗费了长时间尝试研究,但是实现算法很简单。ANSI C都可以实现(现在验证程序是C++所写)。
有合作意愿的Dalao可以通过 fxat@qq.com 联系。