H265/AV1/H266 帧间搜索对比
一 三种编码对比
在H265(HEVC),AV1和H266(VVC) 这三种主流视频编码标准中,帧间预测技术都在不断演进,核心目标是在提升压缩效率和控制编码复杂度之间取得更好的平衡。
特性维度 | H265/HEVC | AV1 | H266 |
运动估计策略 | 主要为TSearch及其改进算法 | 支持钻石搜索,螺旋搜索等多种算法 | 继承并优化了TZSearch,同时引入多种解码端细化技术 |
块划分结构 | 四叉树+对称/非对称运动划分 | 超级块+丰富的分区类型(四叉,二叉,T型三分等) | 四叉树嵌套多类型树QTMT, 划分最精细灵活 |
核心技术工具 | Merge/AMVP | 复合预测,扭曲运动 | 仿射运动预测,几何划分,双向光流BDOF,解码端运动矢量细化DMVR |
编码复杂度 | 基准 | 高于H265 | 远高于H265(约10倍或更多) |
二 详细对比
H265/HEVC
H265在H264的基础上,通过引入更灵活的块划分和运动向量预测,在压缩效率和复杂度之间取得了良好的平衡。
划分结构:采用了四叉树结构的CU划分,并引入了非对称运动划分,支持更多矩形块,能更好的适应水平和垂直方向的运动。
运动估计与补偿:广泛采用TSearch算法及其改进版本进行运动估计。通过Merge和AMVP术,高效的利用时空相邻块的运动信息,减少需要直接编码的运动向量数据量
设计哲学:为高效视频压缩奠定了基础,很多设计思想被后续标准继承和发展
AV1 灵活与创新
作为开放媒体联盟的代表,AV1的设计目标是在H265的基础上追求更高的压缩效率,引入了大量创新的帧间预测工具。
划分结构:从超级块(128x128或64x64)出发,支持递归,多种类的划分,包括二分划分,四划分和独特的T型三分划分,能极其精确的贴合物体轮廓
运动估计与补偿:运动估计算法丰富,标准支持钻石搜索等,学界和业界在搜索如螺旋搜索等新算法以降低复杂度。
复合预测:允许将两个独立的运动矢量得到的预测块进行加权平均,更好的处理遮挡,透明物体等复杂场景
扭曲运动:使用仿射运动模型来模拟旋转,缩放等非平移运动,比简单的平移预测更精确
设计哲学:提供庞大的工具箱,通过复杂的码率失真优化选择最佳工具组合,以高编码复杂度换取高压缩率。
H266/VVC 精细与极致
H266/VVC旨在应对4k/8k超高清视频的挑战,其帧间预测的精细度和复杂度都达到了新的高度。
划分结构:革命性的四叉树加嵌套多类型的树QTMT结构,一个编码块可以先进性四叉树划分,然后对子块继续应用二叉树和三叉树划分,能产生大量极其细长的矩形块如 128x8,更高效的表示画面中的尖锐边缘和线状物体。
运动估计与补偿:在继承H265运动估计框架并优化的同时,重点引入了多项在解码端进行运动信息精细化的技术,减少编码端需要传输的信息。
仿射运动预测:描述块的旋转,缩放等复杂运动
双向光流:允许沿着对角线,为具有不同运动方向的对象提供更精确的预测
双向光流BDOF:在解码端对两个双向预测块之间的像素进行精细的局部运动补偿,进一步减少残差。
解码端运动矢量细化DMVR:在解码端进行小范围的Motion Vector搜索,提升运动向量精度
