当前位置: 首页 > news >正文

【CVPR 2025】即插即用DarkIR, 频域-空间协同的高效暗光恢复!

1. 【前言】

低光环境下的图像往往伴随噪声、模糊等退化问题,传统方法多将去模糊与低光增强任务独立处理,难以应对复杂场景。CVPR2025论文《DarkIR: Robust Low-Light Image Restoration》提出了一种高效鲁棒的多任务神经网络DarkIR,通过结合频域与空间域信息,设计轻量化注意力机制,在低光图像恢复任务中实现了性能与效率的双重突破。

2.【论文基本信息】

  • 论文标题:DarkIR: Robust Low-Light Image Restoration
  • 作者:Daniel Feijoo, Juan C. Benito, Alvaro Garcia, Marcos V. Conde
  • 机构:Cidaut AI(西班牙)、维尔茨堡大学计算机视觉实验室(德国)
  • 开源代码:https://github.com/cidautai/DarkIR
  • 核心任务:低光图像增强、去模糊、去噪的多任务联合恢复

➔➔➔➔点击查看原文,获取更多即插即用模块合集
在这里插入图片描述

3.【创新点概述】

3.1 频域-空间域协同建模

  • 频域增强:利用傅里叶变换的振幅特性,在低分辨率下高效校正光照,避免传统方法在时域处理的高计算成本。
  • 空间域去模糊:通过扩张卷积构建大感受野空间注意力模块(Di-SpAM),针对性解决长曝光导致的运动模糊。

3.2 轻量化架构设计

  • 采用非对称编解码器结构:编码器专注低光增强(频域处理),解码器聚焦去模糊(空间域上采样),减少参数冗余。
  • 引入简化通道注意力(SCA)和门控FFN,替代复杂激活函数,降低计算量的同时保持性能。

3.3 多任务联合优化

  • 设计包含像素损失、感知损失、边缘损失和架构引导损失的复合损失函数,确保光照、细节和结构的全面恢复。
  • 在LOLBlur、Real-LOLBlur等数据集上实现state-of-the-art,参数比LEDNet减少55%,MAC操作减少4倍。

4.【整体架构流程】

在这里插入图片描述

4.1 编码器(EBlock):频域低光增强

  • 傅里叶域处理:通过快速傅里叶变换(FFT)操作于振幅分量,增强光照相关的低频信息,再经逆傅里叶变换(IFFT)返回空间域。
  • 空间注意力(SpAM):结合倒置残差块与简化通道注意力,提取光照增强所需的空间特征。
  • 低分辨率重建:编码器输出8倍下采样的光照校正图像,用于架构引导损失的正则化。

4.2 解码器(DBlock):空间域去模糊

  • 扩张空间注意力(Di-SpAM):采用扩张因子1、4、9的深度卷积提取多尺度特征,结合通道注意力增强细节交互,解决长距离依赖问题。
  • 门控FFN:替代传统激活函数,通过线性变换与门控机制提升计算效率。
  • 上采样重建:基于编码器的光照增强特征,逐步上采样并恢复图像锐度,生成最终清晰图像。

4.3 损失函数设计

  • 像素损失:(L1)范数约束增强图像与真实图像的像素级差异。
  • 感知损失:基于VGG19的LPIPS损失,保证视觉语义相似性。
  • 边缘损失:梯度L2损失,强化高频边缘结构的恢复。
  • 架构引导损失:约束编码器输出的上采样结果与真实图像的一致性,确保光照校正效果。

4.4 核心模块对比

模块传统方法局限DarkIR创新设计优势
光照增强时域处理计算密集频域振幅增强+低分辨率重建计算量降低50%
去模糊小感受野难以处理长曝光模糊扩张卷积+Di-SpAM有效感受野扩大3倍
注意力机制Transformer计算冗余简化通道注意力+门控FFN参数减少60%

5.【实验结果】

5.1 消融实验

5.1.1 模块有效性验证
  • 实验设置:在LOLBlur数据集上验证EBlock、DBlock及Di-SpAM的贡献。
  • 关键结果
    • 仅用EBlock时PSNR为26.17dB,加入DBlock后提升至26.90dB,证明去模糊模块的必要性;
    • Di-SpAM相比传统大核注意力(LKA),参数减少18.5%,PSNR提升0.55dB。
5.1.2 频域处理必要性
  • 移除傅里叶域增强后,PSNR下降0.6dB,验证频域振幅调整对光照恢复的关键作用。
    在这里插入图片描述

5.2 低光去模糊任务对比

5.2.1 定量结果
  • 数据集:LOLBlur(合成)、Real-LOLBlur(真实场景)。
  • 关键指标
    • 在LOLBlur上,DarkIR-m的PSNR达27.00dB,比LEDNet提升1.26dB,参数仅为其44.7%(3.31M vs. 7.4M);
    • Real-LOLBlur中,DarkIR的盲评指标MUSIQ达48.79,超越RetinexFormer、Restormer等。
5.2.2 效率对比
  • 相比Restormer,DarkIR的MAC操作减少95%(7.25G vs. 144.25G),推理速度提升20倍,适合边缘设备部署。

5.3 多任务泛化能力

  • 数据集:LOLv2-Real、LSRW(真实低光图像)。
  • 结果:DarkIR-mt在LSRW-Huawei数据集上PSNR达18.93dB,超越RetinexNet、SCI等单任务模型,证明对噪声、模糊的鲁棒性。

5.4 可视化分析

-在真实夜间手持拍摄图像中,DarkIR有效消除运动模糊和传感器噪声,色彩还原更自然。

在这里插入图片描述

6.【论文总结展望】

总结

DarkIR通过频域-空间域协同建模与轻量化架构设计,实现了低光图像恢复的高效多任务处理,在主流数据集上刷新了性能标杆,同时将计算成本大幅降低。其核心创新在于突破传统方法的任务分离局限,通过编解码分工和注意力机制优化,在保持模型轻量的同时实现了全局信息整合。

展望

未来可探索:

  1. 动态频域-空间融合:引入自适应机制,根据场景复杂度动态调整频域与空间处理的权重;
  2. 视频低光恢复扩展:将单图模型拓展至时空域,结合光流信息处理视频序列的连续模糊与光照变化;
  3. 跨设备部署优化:针对移动端硬件特性,进一步量化压缩模型,提升实时性。

➔➔➔➔点击查看原文,获取更多即插即用模块合集
在这里插入图片描述

http://www.dtcms.com/a/292252.html

相关文章:

  • 深度学习 ---参数初始化以及损失函数
  • 从0到1学Pandas(一):Pandas 基础入门
  • Mixed Content错误:“mixed block“ 问题
  • React + ts 中应用 Web Work 中集成 WebSocket
  • linux初识网络及UDP简单程序
  • 2025年母单脱焦虑计划:社交恐惧者的塔罗赋能训练营
  • leetcode 1695. 删除子数组的最大得分 中等
  • 二分查找-852.山峰数组的峰顶索引-力扣(LeetCode)
  • 力扣 hot100 Day52
  • LeetCode 633.平方数之和
  • XML高效处理类 - 专为Office文档XML处理优化
  • Mysql-场景篇-2-线上高频访问的Mysql表,如何在线修改表结构影响最小?-1--Mysql8.0版本后的INSTANT DDL方案(推荐)
  • 【MySQL】MySQL基本概念
  • NISP-PTE基础实操——命令执行
  • MySQL高可用主从复制原理及常见问题
  • mysql_innodb_cluster_metadata源数据库
  • n1 armbian docker compose 部署aipan mysql
  • 板凳-------Mysql cookbook学习 (十二--------5)
  • vue3实现高性能pdf预览器功能可行性方案及实践(pdfjs-dist5.x插件使用及自定义修改)
  • Redis高级篇之最佳实践
  • VUE 中父级组件使用JSON.stringify 序列化子组件传递循环引用错误
  • TDengine时序数据库 详解
  • 扣子Coze智能体实战:自动化拆解抖音对标账号,输出完整分析报告(喂饭级教程)
  • STM32-SPI全双工同步通信
  • 什么是分布式事务,分布式事务的解决方案有哪些?
  • PyTorch 模型开发全栈指南:从定义、修改到保存的完整闭环
  • 自编码器表征学习:重构误差与隐空间拓扑结构的深度解析
  • vue2.0 + elementui + i18n:实现多语言功能
  • 智能Agent场景实战指南 Day 18:Agent决策树与规划能力
  • SpringBoot+Mybatis+MySQL+Vue+ElementUI前后端分离版:权限管理(三)