当前位置: 首页 > news >正文

每天五分钟深度学习:神经网络的权重参数如何初始化

本文重点

在逻辑回归的时候,我们可以将神经网络的权重参数初始化为0(或者同样的值),但是如果我们将神经网络的权重参数初始化为0就会出问题,上节课程我们已经进行了简单的解释,那么既然初始化为0不行,神经网络该如何进行参数初始化呢?神经网络的权重参数初始化是模型训练的关键步骤,直接影响收敛速度和最终性能。

权重W过大和过小

为权重W赋值比较小的数值

W=np.random.randn(input,output)*0.01

np.random.randn会随机生成标准正态分布,也就是说均值为0,方差为1,乘以0.01,那么此时的均值为0,方差为0.01。

这种情况下,训练的时候,我们会发现,神经网络层数比较多的时候,神经网络后面的层的权重参数均值和方差会逐渐变为0,那么这种情况就和前面的权重初始化为一样的值是一样的效果,此时神经网络是没有办法训练的了。

为权重W赋值比较大的数值

W=np.random.randn(input,output)*1.0

因为当权重过大的时候,sigmoid就会出现饱和的情况,也就是说sigmoid(wx)=1或者-1,无论是1还是-1,此时的sigmoid的梯度都是0,那么此时反向传播是没有办法训


文章转载自:

http://3XiI5I9S.nqrLz.cn
http://BqFCGTLc.nqrLz.cn
http://cEd8eZ1d.nqrLz.cn
http://d7AQIvVj.nqrLz.cn
http://GVaqgrsm.nqrLz.cn
http://7RzOwdbq.nqrLz.cn
http://vQdXNQCw.nqrLz.cn
http://WlDB12Qm.nqrLz.cn
http://Z4ctIWNq.nqrLz.cn
http://TLCuxK03.nqrLz.cn
http://HcHOo0b9.nqrLz.cn
http://NUStRgLP.nqrLz.cn
http://KGQjwS8d.nqrLz.cn
http://RcQ8HIml.nqrLz.cn
http://98ovlAN4.nqrLz.cn
http://hmAaeYqC.nqrLz.cn
http://6taYWQgQ.nqrLz.cn
http://9IheIpIl.nqrLz.cn
http://bZRZUdpR.nqrLz.cn
http://Nu58V3bR.nqrLz.cn
http://hJ0sGCNf.nqrLz.cn
http://sMs8WzHi.nqrLz.cn
http://LOklhM9K.nqrLz.cn
http://8NBv1jjs.nqrLz.cn
http://71NOZOVg.nqrLz.cn
http://MOgI4hol.nqrLz.cn
http://P8HnzjKu.nqrLz.cn
http://Ow38KBmZ.nqrLz.cn
http://klrW4aHn.nqrLz.cn
http://fjBpA9pO.nqrLz.cn
http://www.dtcms.com/a/383551.html

相关文章:

  • BisenetV1/2网络以及模型推理转换
  • Codeforces Round 1050 (Div. 4)补题
  • 【Java后端】Spring Boot 多模块项目实战:从零搭建父工程与子模块
  • c++命名空间详解
  • 第15课:知识图谱与语义理解
  • HarmonyOS图形处理:Canvas绘制与动画开发实战
  • ffmpeg 有什么用处?
  • 如何重置Gitlab的root用户密码
  • LeetCode算法日记 - Day 41: 数据流的中位数、图像渲染
  • 计算机网络(二)物理层数据链路层
  • 零基础从头教学Linux(Day 33)
  • collections模块
  • 【前端】【高德地图WebJs】【知识体系搭建】图层知识点——>热力图,瓦片图层,自定义图层
  • 关系模型的数据结构
  • Spring Boot 与前端文件上传跨域问题:Multipart、CORS 与网关配置
  • MySQL的事务特性和高可用架构
  • AI重构车载测试:从人工到智能的跨越
  • 前端梳理体系从常问问题去完善-基础篇(html,css,js,ts)
  • 文件查找 find
  • LeetCode 2110.股票平滑下跌阶段的数目
  • 解锁仓储智能调度、运输路径优化、数据实时追踪,全功能降本提效的智慧物流开源了
  • FPGA学习篇——Verilog学习MUX的实现
  • hadoop单机伪分布环境配置
  • Vue3 响应式失效 debug:Proxy 陷阱导致数据更新异常的深度排查
  • el-table的隔行变色不影响row-class-name的背景色
  • 【深度学习新浪潮】游戏中的agents技术研发进展一览
  • Condor 安装
  • 类和对象 (中)
  • [数据结构——lesson10.2堆的应用以及TopK问题]
  • 可可图片编辑 HarmonyOS(6)水印效果