当前位置：首页 > news >正文

每天五分钟深度学习：神经网络的权重参数如何初始化

news 2025/9/15 8:41:35

本文重点

在逻辑回归的时候，我们可以将神经网络的权重参数初始化为0（或者同样的值），但是如果我们将神经网络的权重参数初始化为0就会出问题，上节课程我们已经进行了简单的解释，那么既然初始化为0不行，神经网络该如何进行参数初始化呢？神经网络的权重参数初始化是模型训练的关键步骤，直接影响收敛速度和最终性能。

为权重W赋值比较小的数值

W=np.random.randn(input,output)*0.01

np.random.randn会随机生成标准正态分布，也就是说均值为0，方差为1，乘以0.01，那么此时的均值为0，方差为0.01。

这种情况下，训练的时候，我们会发现，神经网络层数比较多的时候，神经网络后面的层的权重参数均值和方差会逐渐变为0，那么这种情况就和前面的权重初始化为一样的值是一样的效果，此时神经网络是没有办法训练的了。

为权重W赋值比较大的数值

W=np.random.randn(input,output)*1.0

因为当权重过大的时候，sigmoid就会出现饱和的情况，也就是说sigmoid(wx)=1或者-1，无论是1还是-1，此时的sigmoid的梯度都是0，那么此时反向传播是没有办法训

BisenetV1/2网络以及模型推理转换

Codeforces Round 1050 (Div. 4)补题

c++命名空间详解

第15课：知识图谱与语义理解

ffmpeg 有什么用处？

如何重置Gitlab的root用户密码

零基础从头教学Linux（Day 33）

collections模块

关系模型的数据结构

MySQL的事务特性和高可用架构

文件查找 find

LeetCode 2110.股票平滑下跌阶段的数目

FPGA学习篇——Verilog学习MUX的实现

hadoop单机伪分布环境配置

Condor 安装

类和对象 (中)

可可图片编辑 HarmonyOS（6）水印效果