FDConv:频率动态卷积在密集图像预测中的突破性进展
FDConv:频率动态卷积在密集图像预测中的突破性进展
FDConv:频率动态卷积在密集图像预测中的突破性进展
论文简介:频率域赋能的动态卷积新范式
在计算机视觉领域,动态卷积通过为不同输入生成自适应权重,显著提升了模型的表达能力,但现有方法往往伴随巨大的参数开销。2025年CVPR收录的论文《Frequency Dynamic Convolution for Dense Image Prediction》提出了一种创新的频率动态卷积(FDConv)方法,通过在傅里叶域学习频率分集权重,在仅增加3.6M参数的情况下,实现了比传统动态卷积更优的性能。
论文的核心 insight 在于:卷积核的频率特性是影响特征提取能力的关键因素,而现有动态卷积在空间域直接学习权重会导致参数冗余和频率特性重叠。FDConv通过傅里叶变换将卷积核分解到频率域,利用频率分集策略构建高效动态权重,在目标检测、实例分割和语义分割等密集预测任务上均取得state-of-the-art结果。
实验设置:严谨可控的性能验证框架
为全面验证FDConv的有效性,论文在统一且严格的实验框架下进行了多维度对比,具体设置如下:
数据集与任务选择
实验主要基于COCO 2017数据集展开,涵盖三大密集预测任务:
- 目标检测:采用COCO标准的80类目标检测任务,评估指标为box AP(平均精度)