当前位置: 首页 > news >正文

ResNet(残差网络)中的残差是什么?

ResNet(残差网络)提出的 残差(Residual)是深度学习中的一种关键创新,旨在解决深层神经网络训练中的梯度消失/爆炸和退化问题(随着网络加深,准确率不升反降)。其核心思想是通过引入“跳跃连接”(Shortcut Connection),让网络直接学习输入与输出之间的残差(即变化部分),而非直接学习完整的输出。

1. 残差的核心定义

在ResNet中,残差指的是:  

残差= 期望输出 - 输入

假设输入为 x ,某一层的期望输出为 H(x) ,则网络改为学习残差 F(x) = H(x) - x,而原始输出可通过 H(x) = F(x) + x 重构。

传统网络:直接拟合 H(x)(复杂映射)。  

ResNet:拟合残差 F(x) = H(x) - x (简单映射,通常 F(x) 接近零)。

 

2. 残差块(Residual Block)的结构

ResNet通过残差块实现这一思想,其结构如下:  

y = F(x, Wi) + x

x为输入,F(x, Wi)是需要学习的残差函数(如堆叠的卷积层)。  + x 是跳跃连接(恒等映射,不引入额外参数)。  y :输出。  

 

若输入输出维度不同,需对 x 线性投影(如1x1卷积):  

y = F(x, Wi) + Ws

 

3. 为什么残差学习有效?

缓解梯度消失:跳跃连接提供了梯度传播的捷径,使深层网络更容易训练。  

简化优化问题:学习残差 F(x) 比直接学习 H(x) 更容易(尤其是当 H(x) 约等于x 时,残差趋近零)。  

避免网络退化:即使增加的层无效,残差结构也能退化为恒等映射F(x) = 0 ,保持性能不下降。

 

4. 实际应用

经典残差块:包含两个3x3卷积层(ResNet-34)。  

瓶颈结构:用1x1卷积降维/升维(ResNet-50/101等更深的网络)。  

变体:Pre-activation ResNet(将BN和ReLU提到卷积前)。

 

5. 直观理解

假设目标是让网络学习“将输入加1”:  

传统网络需精确拟合  H(x) = x + 1 。  

ResNet只需拟合 F(x) = 1 ,而 H(x) = F(x) + x = 1 + x。  

当网络加深时,冗余层可以学习F(x) = 0,避免破坏已有功能。

 

总结

ResNet的残差设计通过跳跃连接将深层网络的训练转化为微小扰动(残差)的学习,极大提升了网络的深度和性能。这一思想不仅影响了图像分类(如ResNeXt、EfficientNet),还广泛应用于目标检测(Faster R-CNN)、语义分割(U-Net++)等领域。

相关文章:

  • 今日行情明日机会——20250328
  • zynq7000 + ucos3 + lwip202_v1_2调试过程
  • 从混乱思绪到清晰表达:记录想法如何改变你的学习人生
  • Problem A: 计算奇数和
  • 央视少儿APP V2.6.2
  • (Kotlin)Android 自定义蓝牙扫描动画:多波浪扩散效果
  • acwing 每日一题4888. 领导者
  • 19款超级华丽动画的图片轮播HTML5+CSS3模板源码
  • Linux驱动开发--SPI子系统
  • Electron应用生命周期全解析:从启动到退出的精准掌控
  • python 将mkv格式视频转换成mp4格式
  • 禅道品牌全面战略升级:开创项目管理国产化替代新格局
  • VLAN 聚合
  • 最短路径题目练习
  • 内核、进程和线程---操作系统
  • Audacity Nyquist插件开发:插件标头详解
  • pnpm node_modules 高效删除
  • BAPLIE船图文件:EDI 核心字段与应用场景解析
  • 一维码与二维码的全面区别及选择指南:详解优劣势与应用
  • HCIP VRRP MSTP 交换综合实验
  • 国际博物馆日|航海博物馆:穿梭于海洋神话与造船工艺间
  • 柬埔寨果农:期待柬埔寨榴莲走进中国市场
  • 倒票“黄牛”屡禁不绝怎么破?业内:强化文旅市场票务公开制度
  • 气急败坏!20多名台湾艺人被台当局列为“重点核查对象”
  • 海外考古大家访谈|冈村秀典:礼制的形成与早期中国
  • 圆桌丨全球化博弈与人工智能背景下,企业如何落地合规体系