当前位置: 首页 > news >正文

DnCNN:超越高斯去噪器:用于图像去噪的深度CNN残差学习

源码、配套笔记&讲解视频,点击文末名片

  1. 研究背景与动机
    1)什么是图像噪声?,是怎么来的?——拍照像接雨水
    想象你拿个小桶去接雨水(相机传感器在接光)。
  • 雨太小/天太黑:桶里水滴稀稀拉拉,抖动就明显——这就是低光/高ISO下的“沙点”。
  • 桶壁不完美:材料有杂质、电子器件有热噪、读出电路有抖动,都会混进细碎杂质。
  • 风一吹:压缩、传输、后期处理也可能带来块状/纹理状的“脏东西”。
    最后到你手里的照片=真实画面+乱七八糟的小杂质。我们把“挑出杂质、保住真相”的过程,就叫图像去噪。

2)为什么难?——一锅米里挑沙子

  • 沙子长得像米:噪声不是总呈大块大块的,它常常伪装成很细的纹理,跟真实细节黏在一起。
  • 每锅都不一样:有的是夜景(噪声重),有的是日景(噪声轻);有的相机“沙子粒形大”,有的小;手机、单反、监控头各有各的“脏法”。
  • 挑完不能少米:去噪不是“磨碎一切”——过度平滑就变成“水煮粥”,锐利的边缘、纹理的层次一不小心就被抹没了。
    一句话:不能把“噪声”当“细节”,也不能把“细节”当“噪声”。

3)早期怎么做?——“规则手册派”
想象你有一本厨房规则手册:

  • 规则1:同锅里相似的米粒应该看起来差不多;
  • 规则2:边缘通常是突变,其他地方应当平滑些;
  • 规则3:图像在某些变换下(比如小波/字典)会变得稀稀疏疏,容易分出“米”和“沙”。
    经典方法(如各种滤波、非局部相似、稀疏表示)就是凭这些先验规则来“滤沙”。
    好处:可解释、效果稳。
    局限:规则写得再细,也很难涵盖所有真实世界;而且很多方法计算慢,不同“锅”(不同噪声强度/相机)还要调不同参数。

4)深度学习登场——“训练一只挑沙子的鼻子”
后来大家发现,与其写越来越厚的规则手册,不如示范成千上万锅米给模型看,让它自己总结:

  • 给它看“有沙的米”和“干净的米”,
  • 让它学会闻出沙子(把噪声识别出来),
  • 再把沙子一把拎走,剩下就是干净米。
    这就是学习型(数据驱动)去噪的直觉:
  • 优点:适应性强、推理快(前向一遍),特别擅长复杂细节的保留。
  • 挑战:得有多样而真实的数据教它;还得小心,别把细节当噪声给“学没了”。

5)“学噪声而不是学图”——为什么更顺手?
很多现代做法(如 DnCNN 这类代表作)选择直接学习“噪声长什么样”,而不是学“干净图长什么样”。

  • 直觉图:照片=干净图 + 噪声。
  • 学会预测“噪声”后,用“照片−噪声”就得到干净图。
  • 像在黑板上先找出粉尘再擦掉,比“把整幅画重画一遍”更省力。
  • 这通常训练更稳、更快,对不同“脏法”的适应也更好。

6)为什么这个方向重要?——“相机里的一步好清洗”
去噪是图像算法的地基:

  • 做超分、去模糊、增强、识别/检测/分割之前,先把噪声降下来,后面的任务都更准。
  • 手机相机、医学影像、天文观测、安防监控、显微成像……全都离不开。
  • 真实世界噪声很“野”:不同设备、不同光线、不同处理链——这逼着算法从“实验室好看”走向“野外也可靠”。

7)今天还在研究什么?——三道关

  1. 真实噪声建模:不是只会应付“教科书里的高斯噪声”,而是能打得过手机/相机/压缩带来的复合噪声。
  2. 细节与干净的平衡:既要干净、又要纹理不糊、边缘不粘;在主观观感和客观指标之间拿捏火候。
  3. 泛化与效率:一个模型尽量适配多设备多场景,同时在移动端/低算力也能跑得动。

8)把它记住的“顺口溜”

  • 噪声像沙:来源多样、粒形多变、容易和细节混。
  • 老法靠规:规则清晰但覆盖有限、速度慢。
  • 新法靠学:看海量示例,学会“闻沙子”。
  • 先闻再拎:学噪声→减掉噪声,比重画全图更省力。
  • 地基越稳,楼越高:去噪好,后续任务才好。
  1. 核心创新点
    总结:DnCNN不是去“重画整幅画”,而是先把脏东西(噪声)找出来,再一把拎走。它的几招组合拳让训练更稳、效果更好、泛化更强。

2.1 学“噪声残差”而不是学“干净图”

  • 思路:输入是噪声图 y,目标不是直接预测干净图 x,而是预测“噪声” v。最后用 x=y−v^
  • 直觉:找出粉尘再擦掉,比“把整张黑板重画一遍”更省力、更易收敛。论文里把这事叫残差学习(Residual Learning)。

2.2 残差学习 × 批量归一化(BN)

  • 创新点:在去噪这个任务里,把残差学习和BN放在一起,训练更快更稳,并且效果更好(作者强调此前在CNN去噪里几乎没人系统用BN)。
  • 类比:残差像“嗅觉”让模型先聚焦噪声,BN像“通风系统”让每层的输入分布更稳定;
  • 论文证据:有对比曲线显示“残差+BN”的组合收敛更快、PSNR 更高;作者还指出两者是相辅相成而不是单向加成。

2.3 “不裁不缩”:全卷积深层架构 + 3×3 卷积 + 无池化

  • 结构:首层 Conv+ReLU,中间多层 Conv+BN+ReLU,末层 Conv 输出残差;全程不做池化,靠层数堆叠扩大感受野。
  • 直觉:像用多次“细刷子(3×3)”反复拂去灰尘,而不是一次粗糙大扫帚;不池化就不丢分辨率,细节不“糊”。
  • 论文里明确了层次与感受野设计逻辑(感受野≈有效补丁尺寸),在σ=25时选了约17层以匹配主流方法的有效感受范围。

2.4 “边缘不花”:简单零填充,边界无伪影

  • 以往很多方法要做复杂的“对称填充/多阶段填充”,DnCNN直接在卷积前零填充,却没有产生难看的边界条纹。
  • 含义:更简洁的工程方案,同时保持视觉质量。

2.5 “一鱼三吃”的统一视角:把SISR、JPEG去块都当‘通用去噪’

  • 关键洞见:只要把“残差”理解成“观测与理想的差”,超分辨率(SISR)和JPEG去块都能被写成“去掉残差”的同一框架里。
  • 结果:一个模型就能同时搞定盲高斯去噪 + 多倍率SISR + 多质量JPEG去块。这让部署、维护、参数管理都更轻

2.6 “不用先猜噪声”:单模型盲去噪

  • 做法:训练时覆盖一个噪声范围(如 [0,55]),测试时无需预估σ,直接上模型。
  • 好处:鲁棒、方便、少出错(避免噪声估计误差的连锁反应)。

2.7 “有来有回”——与TNRD的理论关联

  • DnCNN可以被解释为单阶段TNRD的泛化:用ReLU替代影响函数、加深网络、引入BN,并以预测残差为目标。
  • 意义:不仅是“工程上好使”,也能在优化视角下讲清为什么这样有效。

2.8 “跑得快,还更准”:指标与视觉双提升

  • 在固定噪声的高斯去噪上,DnCNN超过BM3D、WNNM、TNRD等传统与判别式强基线;在盲去噪上,单模型也能优于这些按噪声等级训练的模型。
  • 同时受益于GPU并行,推理速度与落地友好度兼顾。
  1. 模型的网络结构
    [图片]

3.1 层级组成(对应你图里的三种色块)

  1. 首层:Conv + ReLU
  • 卷积核:3×3;通道数:c∈{1,3};输出通道=64。
  • 作用:把原图提到64张特征图,为后续表征打底。
  1. 中间层(第2 ~ 第D−1层):Conv + BN + ReLU(重复堆叠)
  • 每层卷积核:3×3,输入/输出通道均为64;卷积后接批量归一化(BN),再接ReLU。
  • 作用:逐层“剥离”噪声模式,同时用BN稳住特征分布、加速训练。
  1. 末层:Conv(无激活)
  • 卷积核:3×3,输出通道=c(灰度=1,彩色=3)。
  • 作用:把64通道特征线性还原成残差图像(噪声图)。

与很多低级视觉CNN不同,DnCNN全程不使用池化;为保持尺寸一致,各层卷积前做零填充(zero padding),实测不会产生边界伪影。
3.2 深度、感受野与“有效补丁”

  • 过滤器固定用 3×3,当深度为 D(不含最后重建步)时,感受野约为 (2D+1)×(2D+1)。
  • 论文根据主流去噪“有效补丁”大小来选深度:
    • DnCNN-S(定噪声):D≈17(感受野≈35×35);
    • DnCNN-B/3(盲去噪/一体式三任务):加深到20层。

3.3 前向数据流(和你的图一一对应)
Noisy y
→ Conv+ReLU(提特征,64通道)
→ [Conv+BN+ReLU] × (D−2)(反复细化、稳态分布)
→ Conv(线性重建)
→ Residual v^(噪声图)
→ Clean x=y−v^(得到干净图)。

http://www.dtcms.com/a/509442.html

相关文章:

  • 公司网站设计与制作一哥优购物官方网站
  • 万网网站空间费北京市建设厅官方网站
  • 西宁网站制作公司手机编程软件有哪些
  • 成都市城乡住房建设厅网站房地产开发公司名字
  • 单页网站如何制作深圳门户网站建设方案
  • 福千欣隆网站建设公司 概况直接打开百度
  • 六安网站建设公司net 网站开发
  • 【CTF】JWT漏洞实验
  • 加密网站扬州做网站的网络公司
  • 网站备案 山东核验点网站建设论文开题报告
  • 方维网络的品牌网站建设wordpress删除主题数据
  • 美食网站设计目的尤溪网站建设
  • 建设部网站造价咨询工业设计软件上市公司
  • 外贸自建站的推广方式门户网站建设的平台
  • 呼和浩特网站建设哪家最便宜如何把wordpress头部去掉
  • 兰州网站订制网站建设与准备
  • 专业网站优化软件重庆承越网站建设公
  • 谷歌推广网站开发公司是否可以代建筑公司支付材料款
  • 上海本地网站建设小程序代码怎么获取
  • FTP 和 SFTP:作用、使用场景及详细使用教程
  • 东莞常平网站建设网站建设要做原型图吗
  • 重庆市建设工程信息网官网怎么查看seo业务培训
  • 长沙个人网站建设网站中医建设
  • 【图像理解进阶】如何用大模型实现手写汉字识别?Python实战教程
  • 淇县住房和城乡建设局网站怎样用手机做推广免费网站
  • 外贸网站建设不可缺少的灵活性超级优化空间
  • 企业网站的设计思路手机网站建设渠道
  • 荣欣建设集团有限公司网站广东东莞电子厂
  • 群晖做自己的电影网站织梦网站栏目建设
  • 嵌入式开发学习日志41——stm32之SPI总线基本结构