当前位置: 首页 > news >正文

每天五分钟深度学习:两个角度解释正则化解决网络过拟合的原理

本文重点

前面我们学习了当神经网络模型出现过拟合问题的时候,我们可以使用正则化技术来解决这个问题,并且我们通过梯度下降的公式可以看到,当使用正则化技术的时候,更新参数的时候,很明显的一点是参数比不使用正则化技术变小了。那么为什么变小了就可以解决过拟合问题呢?本文我们将来从两个角度来解释这个问题。

角度一

我们知道神经网络之所以过拟合就是神经网络模型太大了,所以导致了过拟合问题的发生,那么我们就需要降低神经网络模型的复杂程度,我们知道神经网络的每一个神经元实质就是一个参数w,当神经网络中w参数变小了,那么就相当于模型神经元的效果失效了,如图所示,当没有使用正则化的时候,此时神经网络为:

当使用正则化的时候,此时模型的部分参数会变小,变小的那部分神经元的效果就不好了,或者说失效了,此时的神经网络看起来就像是这样的:

(有的神经元被删掉了,被删掉的神经元就表示失效了,或者效果变弱了),我们可以看到时使用正则化的神经网络中部分神经元失效了,那么神经元数量减少了,也就是说神经网络模型结构变得不复杂了,刚才我们说过了之所以过拟合就是因为神经网络模型结构复杂,那么模型结构不复杂了,那么也就相当于解决过拟合了。

http://www.dtcms.com/a/473443.html

相关文章:

  • 【Android Gradle学习笔记】第二天:Gradle工程目录结构
  • 【知识拓展Trip Six】宿主OS是什么,传统虚拟机和容器又有什么区别?
  • AI眼镜:作为人机交互新范式的感知延伸与智能融合终端
  • 开发网站 语言卡片式网站
  • 长乐市住房和城乡建设局网站在线购物商城网站建设
  • qt5.14查看调试源码
  • 深度学习实战:Python水果识别 CNN算法 卷积神经网络(TensorFlow训练+Django网页源码)✅
  • J1939基础通信
  • 前端开发与后端开发的区别是什么?
  • 模块使用教程(基于STM32)——蓝牙模块
  • BaseLine与BackBone
  • 多视图几何--密集匹配--视差平面推导
  • 官网和商城结合的网站网站推广合同模板
  • 微软新模型UserLM:如何为AI助手打造一个“真实世界”模拟器
  • Linux中页面分配alloc_pages相关函数
  • Qt---布局管理器
  • 基于单片机的图书馆智能座位管理平台
  • 中国机械工业建设集团有限公司网站高端网站建设论坛
  • Envoy Gateway + ext_authz 做“入口统一鉴权”,ABP 只做资源执行
  • vscode免密码认证ssh连接virtual box虚拟机
  • 3.6 JSON Mode与JSON Schema
  • React Native::关于react的匿名函数
  • 基于JETSON ORIN+FPGA+GMSL AI相机的工业双目视觉感知方案
  • 常规的鱼眼镜头有哪些类型?能做什么?
  • 虚实之间:AR/VR开发中的性能优化艺术
  • 新手要如何让网站被收录公司查询信息查询
  • PostgreSQL 的 hstore、arrays 数据类型
  • Java集合体系 —— Set篇
  • 硅基计划5.0 MySQL 贰 SQL约束三大范式
  • 设计模式——工厂模式