【CVPR 2025】即插即用DarkIR, 频域-空间协同的高效暗光恢复!
1. 【前言】
低光环境下的图像往往伴随噪声、模糊等退化问题,传统方法多将去模糊与低光增强任务独立处理,难以应对复杂场景。CVPR2025论文《DarkIR: Robust Low-Light Image Restoration》提出了一种高效鲁棒的多任务神经网络DarkIR,通过结合频域与空间域信息,设计轻量化注意力机制,在低光图像恢复任务中实现了性能与效率的双重突破。
2.【论文基本信息】
- 论文标题:DarkIR: Robust Low-Light Image Restoration
- 作者:Daniel Feijoo, Juan C. Benito, Alvaro Garcia, Marcos V. Conde
- 机构:Cidaut AI(西班牙)、维尔茨堡大学计算机视觉实验室(德国)
- 开源代码:https://github.com/cidautai/DarkIR
- 核心任务:低光图像增强、去模糊、去噪的多任务联合恢复
➔➔➔➔点击查看原文,获取更多即插即用模块合集
3.【创新点概述】
3.1 频域-空间域协同建模
- 频域增强:利用傅里叶变换的振幅特性,在低分辨率下高效校正光照,避免传统方法在时域处理的高计算成本。
- 空间域去模糊:通过扩张卷积构建大感受野空间注意力模块(Di-SpAM),针对性解决长曝光导致的运动模糊。
3.2 轻量化架构设计
- 采用非对称编解码器结构:编码器专注低光增强(频域处理),解码器聚焦去模糊(空间域上采样),减少参数冗余。
- 引入简化通道注意力(SCA)和门控FFN,替代复杂激活函数,降低计算量的同时保持性能。
3.3 多任务联合优化
- 设计包含像素损失、感知损失、边缘损失和架构引导损失的复合损失函数,确保光照、细节和结构的全面恢复。
- 在LOLBlur、Real-LOLBlur等数据集上实现state-of-the-art,参数比LEDNet减少55%,MAC操作减少4倍。
4.【整体架构流程】
4.1 编码器(EBlock):频域低光增强
- 傅里叶域处理:通过快速傅里叶变换(FFT)操作于振幅分量,增强光照相关的低频信息,再经逆傅里叶变换(IFFT)返回空间域。
- 空间注意力(SpAM):结合倒置残差块与简化通道注意力,提取光照增强所需的空间特征。
- 低分辨率重建:编码器输出8倍下采样的光照校正图像,用于架构引导损失的正则化。
4.2 解码器(DBlock):空间域去模糊
- 扩张空间注意力(Di-SpAM):采用扩张因子1、4、9的深度卷积提取多尺度特征,结合通道注意力增强细节交互,解决长距离依赖问题。
- 门控FFN:替代传统激活函数,通过线性变换与门控机制提升计算效率。
- 上采样重建:基于编码器的光照增强特征,逐步上采样并恢复图像锐度,生成最终清晰图像。
4.3 损失函数设计
- 像素损失:(L1)范数约束增强图像与真实图像的像素级差异。
- 感知损失:基于VGG19的LPIPS损失,保证视觉语义相似性。
- 边缘损失:梯度L2损失,强化高频边缘结构的恢复。
- 架构引导损失:约束编码器输出的上采样结果与真实图像的一致性,确保光照校正效果。
4.4 核心模块对比
模块 | 传统方法局限 | DarkIR创新设计 | 优势 |
---|---|---|---|
光照增强 | 时域处理计算密集 | 频域振幅增强+低分辨率重建 | 计算量降低50% |
去模糊 | 小感受野难以处理长曝光模糊 | 扩张卷积+Di-SpAM | 有效感受野扩大3倍 |
注意力机制 | Transformer计算冗余 | 简化通道注意力+门控FFN | 参数减少60% |
5.【实验结果】
5.1 消融实验
5.1.1 模块有效性验证
- 实验设置:在LOLBlur数据集上验证EBlock、DBlock及Di-SpAM的贡献。
- 关键结果:
- 仅用EBlock时PSNR为26.17dB,加入DBlock后提升至26.90dB,证明去模糊模块的必要性;
- Di-SpAM相比传统大核注意力(LKA),参数减少18.5%,PSNR提升0.55dB。
5.1.2 频域处理必要性
- 移除傅里叶域增强后,PSNR下降0.6dB,验证频域振幅调整对光照恢复的关键作用。
5.2 低光去模糊任务对比
5.2.1 定量结果
- 数据集:LOLBlur(合成)、Real-LOLBlur(真实场景)。
- 关键指标:
- 在LOLBlur上,DarkIR-m的PSNR达27.00dB,比LEDNet提升1.26dB,参数仅为其44.7%(3.31M vs. 7.4M);
- Real-LOLBlur中,DarkIR的盲评指标MUSIQ达48.79,超越RetinexFormer、Restormer等。
5.2.2 效率对比
- 相比Restormer,DarkIR的MAC操作减少95%(7.25G vs. 144.25G),推理速度提升20倍,适合边缘设备部署。
5.3 多任务泛化能力
- 数据集:LOLv2-Real、LSRW(真实低光图像)。
- 结果:DarkIR-mt在LSRW-Huawei数据集上PSNR达18.93dB,超越RetinexNet、SCI等单任务模型,证明对噪声、模糊的鲁棒性。
5.4 可视化分析
-在真实夜间手持拍摄图像中,DarkIR有效消除运动模糊和传感器噪声,色彩还原更自然。
6.【论文总结展望】
总结
DarkIR通过频域-空间域协同建模与轻量化架构设计,实现了低光图像恢复的高效多任务处理,在主流数据集上刷新了性能标杆,同时将计算成本大幅降低。其核心创新在于突破传统方法的任务分离局限,通过编解码分工和注意力机制优化,在保持模型轻量的同时实现了全局信息整合。
展望
未来可探索:
- 动态频域-空间融合:引入自适应机制,根据场景复杂度动态调整频域与空间处理的权重;
- 视频低光恢复扩展:将单图模型拓展至时空域,结合光流信息处理视频序列的连续模糊与光照变化;
- 跨设备部署优化:针对移动端硬件特性,进一步量化压缩模型,提升实时性。
➔➔➔➔点击查看原文,获取更多即插即用模块合集