当前位置: 首页 > news >正文

Class29ResNet

Class29ResNet

ResNet
ResNet(Residual Network,残差网络)是深度神经网络中的一个重要里程碑,由微软研究院的何恺明等人于2015年提出,用于解决随着网络加深训练变得困难的问题。它首次在ImageNet2015竞赛中获得冠军,并且在很多任务中成为标准架构的基础。

在这里插入图片描述

随着深度神经网络层数变多,虽然模型的表达能力更强,但却遇到了梯度消失/爆炸、准确率下降等问题:

传统网络越深,准确率可能反而变低(训练误差上升)

原因不是过拟合,而是训练更深层网络时的优化困难

残差块
在这里插入图片描述
在这里插入图片描述
在深度网络中,我们希望通过叠加更多层(串联),使神经网络能够表示更复杂的函数。

残差块(Residual Block):是 ResNet 中的基本模块,它不像传统神经网络那样只用串联层来学习一个函数
𝑓(𝑥),而是把输入 𝑥直接绕过中间层加到输出上。

快速通道(右边):就是指那个**“跳跃连接”**,它不做任何处理,直接把𝑥传给后面的加法运算。

在这里插入图片描述

𝑥:是输入

𝑔(𝑥):是经过两层卷积(或其它处理)之后的输出

𝑥+𝑔(𝑥):是加上跳跃连接后的最终输出

在这里插入图片描述

项目左侧(BasicBlock)右侧(有1x1Conv)
跳跃路径identity(直接跳)1x1卷积调整
用途输入输出一致时使用尺寸/通道变化时使用
常见于ResNet-18/34ResNet-50/101/152

总结
残差块可以使得很深的网络更加容易训练,甚至可以训练一千层的网络。

残差网络对于随后的深层神经网络的设计产生了深远影响,无论是卷积类网络还是全连接类网络。

http://www.dtcms.com/a/309714.html

相关文章:

  • 机器学习——逻辑回归(LogisticRegression)的核心参数:以约会数据集为例
  • 数智管理学(四十三)
  • Python LRU缓存应用与示例
  • C++拷贝构造函数
  • rhcsa笔记大全
  • 【2025/08/01】GitHub 今日热门项目
  • PendingIntent的flag和原理解析
  • 【Halcon 】Halcon 实战:如何为 XLD 模板添加极性信息以提升匹配精度?
  • Linux系统编程Day3-- Linux常用操作(续)
  • 【BUUCTF系列】[GXYCTF2019]Ping Ping Ping 1
  • 【Linux我做主】细说环境变量
  • 鸿蒙智能居家养老系统构思(续二)—— 适老化烹饪中心详细构思
  • 前端渲染三国杀:SSR、SPA、SSG
  • SpringBoot3.x入门到精通系列:1.4 项目结构与核心注解
  • 三十九、【扩展工具篇】Allpairspy 组合用例生成器:智能设计高效测试集
  • spring中自带的执行定时任务的注解是什么?
  • 铁皮矫平机是什么?
  • 掌握长尾关键词提升SEO
  • 4-verilog简单状态机
  • 使用mybatis生成器生成实体类mapper和查询参数文件,简单spring mvc 项目。使用log4j输出日志到控制台和文件中。使用配置文件注册Bean
  • 【U8+】删除部门的时候提示已经在总账(辅助总账)中使用,不可删除。
  • 从0到1学PHP(十三):PHP 安全编程:构建稳固的应用防线
  • (一)LoRA微调BERT:为何在单分类任务中表现优异,而在多分类任务中效果不佳?
  • 自动化测试准备工作:概念篇
  • Java HTTPS 请求失败排查与证书导入全过程
  • 从豆瓣小组到深度洞察:一个基于Python的舆情分析爬虫实践
  • 【05】VM二次开发——模块参数配置--带渲染/不带渲染(WinForm界面调用 模块参数配置)
  • JVM指针压缩的那些事
  • JVM学习日记(十三)Day13
  • C#线程同步(二)锁