当前位置: 首页 > news >正文

HINet: Half Instance Normalization Network for Image Restoration论文阅读

HINet: Half Instance Normalization Network for Image Restoration

      • 1. 论文的研究目标与实际意义
      • 2. 创新方法:HIN Block与HINet
        • 2.1 HIN Block的设计原理
        • 2.2 HINet网络架构(对应论文图2)
        • 2.3 创新点与性能优势
        • 2.4 技术背景补充
      • 3. 实验设计与结果
        • 3.1 数据集与指标
        • 3.2 关键结果
        • 3.3 消融实验
      • 4. 未来研究方向
      • 5. 论文局限性
      • 6. 可复用创新点与学习建议

1. 论文的研究目标与实际意义

研究目标:解决低层次视觉任务(如图像去噪、去模糊、去雨)中传统标准化方法(如Batch Normalization, BN)的局限性,提出一种高效且高性能的归一化模块——Half Instance Normalization Block (HIN Block),并基于此构建多阶段网络HINet,以提升图像恢复任务的性能。

实际意义

  • 产业应用:手机摄影、安防监控、医疗影像等领域需高效处理模糊、噪声、雨雾等退化问题。HINet在减少70%以上计算量的同时超越SOTA,可部署于移动端或边缘设备。
  • 学术价值:首次将归一化技术直接应用于图像恢复任务并取得显著提升,挑战了“归一化对低层次任务无效”的传统认知。

2. 创新方法:HIN Block与HINet

2.1 HIN Block的设计原理

核心思想:通过通道分半策略(Channel Splitting Strategy)平衡特征鲁棒性与内容保留。传统归一化(如BN)在低层次视觉任务中因小批量统计不稳定而失效,而Instance Normalization (IN) 因其通道独立归一化特性(无需批量维度统计)更适用于此类任务。HIN Block创新性地仅对半数通道应用IN,避免全局归一化导致的内容丢失。

结构细节(对应论文图3a):

HIN Block结构
HIN Block

  • 输入特征经3×3卷积生成中间特征 F mid F_{\text{mid}} Fmid
  • 通道分半后,仅左半部分( F mid 1 F_{\text{mid}_1} Fmid1)进行IN操作。
  • 拼接后通过残差路径输出。
  1. 输入特征处理
    输入特征 F in ∈ R C in × H × W F_{\text{in}} \in \mathbb{R}^{C_{\text{in}} \times H \times W} FinRCin×H×W经卷积生成中间特征:
    F mid = Conv 3 × 3 ( F in ) ∈ R C out × H × W (Eq. in Sec 3.2) F_{\text{mid}} = \text{Conv}_{3\times3}(F_{\text{in}}) \quad \in \mathbb{R}^{C_{\text{out}} \times H \times W} \quad \text{(Eq. in Sec 3.2)} Fmid=Conv3×3(Fin)RCout×H×W(Eq. in Sec 3.2)

  2. 通道分半
    F mid F_{\text{mid}} Fmid沿通道维度均分:
    F mid 1 , F mid 2 = Split ( F mid ) , 其中 F mid 1 , F mid 2 ∈ R C out / 2 × H × W


文章转载自:

http://zVA1X6ur.qtfss.cn
http://kbyi8RGL.qtfss.cn
http://kcFoiAhI.qtfss.cn
http://60JiBAni.qtfss.cn
http://KvTWGfok.qtfss.cn
http://Jxk78cUj.qtfss.cn
http://WPZDO7Ma.qtfss.cn
http://bYtBn62r.qtfss.cn
http://WAV5GUtL.qtfss.cn
http://KqRQ5Sfa.qtfss.cn
http://nZAzjamH.qtfss.cn
http://AnZZnpTE.qtfss.cn
http://yfuY74Tt.qtfss.cn
http://yIewN5n8.qtfss.cn
http://vdqotfgG.qtfss.cn
http://orjkt9u2.qtfss.cn
http://vKmYUmIT.qtfss.cn
http://t0AKozrw.qtfss.cn
http://yfs2TyJB.qtfss.cn
http://0IRtorL5.qtfss.cn
http://1xtEbC04.qtfss.cn
http://eCHDNxAG.qtfss.cn
http://I0dudORy.qtfss.cn
http://lJCyDD3E.qtfss.cn
http://xNPA3eBQ.qtfss.cn
http://rS2AkWUF.qtfss.cn
http://m823iENH.qtfss.cn
http://mP7Teuea.qtfss.cn
http://I0OwcG7n.qtfss.cn
http://EfONo1a1.qtfss.cn
http://www.dtcms.com/a/246658.html

相关文章:

  • 使用Optimization tool优化后禁用windows更新批量的脚本
  • 前端加密当日
  • 怎样下载某个SCI期刊的endnote style?答:直接去endnote官网搜索期刊名称并下载即可
  • 面向对象 设计模式简述(1.创建型模式)
  • 16、企业预算管理(Budget)全流程解析:从预算编制到预算控制
  • git merge合并分支push报错:Your branch is ahead of ‘xxx‘ by xx commits.
  • 【unitrix】1.2 unitrix 物理量计算库(lib.rs)
  • AIAgent,Prompt,MCP是什么?
  • AUTOSAR图解==>AUTOSAR_TR_FrancaIntegration
  • 【测试开发】数据类型篇-迭代器和生成器
  • 【二分模版------左闭右闭】
  • Python爬虫实战:研究AutobahnPython相关技术
  • 亚马逊关闭Posts:站内社交梦碎,卖家流量策略急待重构
  • 【有源医疗器械检测的常见问题、整改方法、送检了解】
  • < 自用文儿 腾讯云 VPS > Ubuntu 24 系统,基本设置
  • 2025【证券从业】时间事件
  • JavaScript 原型(Prototype)详解
  • C#调用C++ 结构体方法
  • mapbox高阶,使用mbview发布mbtiles数据为矢量切片服务,并加载
  • 第五节 类型系统进阶-类型守卫(Type Guard)的实现方式
  • ubuntu22.04使用系统默认的中文输入法,打字只输入英文字符怎么操作才能打字中文
  • 网络安全:OWASP防护守则
  • Gartner《工业边缘计算Reference Architecture》学习心得
  • [vela os_4] 处理器间通信(IPC)| 内存管理
  • 位移传感器远程监控软件说明
  • 如何使用 Hutool 获取文件名(包括后缀)
  • 【开发常用命令】:docker常用命令
  • 当机械工程师的餐桌变身实验室:立创电赛的真实创新启示录
  • OpenCV CUDA模块图像变形------对图像进行任意形式的重映射(Remapping)操作函数remap()
  • cuda编程笔记(3)--常量内存与事件