当前位置: 首页 > wzjs >正文

切片工具做网站怎么做谷歌seo网站建设

切片工具做网站怎么做,谷歌seo网站建设,南宁seo 网站收录,湖南网站建设推荐到目前为止,我们实现的每个模型都是根据某个预先制定的分布来初始化模型的参数,有人会认为初始化方案时理所当然的,忽略了如何做出这些选择的细节,甚至有人可能会觉得,初始化方案的选择并不是特别重要,实际…

到目前为止,我们实现的每个模型都是根据某个预先制定的分布来初始化模型的参数,有人会认为初始化方案时理所当然的,忽略了如何做出这些选择的细节,甚至有人可能会觉得,初始化方案的选择并不是特别重要,实际上,初始化方案的选择在神经网络学习中起着举足轻重的作用,保持数值稳定性至关重要。此外,这些初始化方案的选择可以与非线性激活函数的选择有趣的结合在一起。我们选择哪个函数以及如何初始化参数可以决定优化算法收敛的速度有多快,糟糕的选择可能会导致我们在训练时遇到梯度爆炸或者梯度消失,本节将更详细的探讨这些主题,讨论一些有用的启发方式方法。这些启发方式在整个深度学习中都很有用。

4.8.1 梯度小时和梯度爆炸

考虑一个具有L层,输入x和输出o的深层网络。每一层l由变换f1定义,该变换的参数为权重W(l),隐藏变量是h(l) 令h(0) =x。我们的网络可以表示为

h(l) = Flh(l-1), 因此 o = FL .... Fl(x)

换而言之,该剃度是L-1 个矩阵M(L) ... M(l + 1) 与梯度向量v(l)的乘积。因此,我们容易受到数值下溢问题的影响,当将过多的概率在一起相承时,这种问题经常会出现。在处理概率时,一个常见的技巧是切换到对数空间,即将数值表示的压力从尾数转移到指数。遗憾的是,这会使上面的问题更为严重,矩阵M可能是各种各样的特征值,可能很小,也可能很大,而他们的乘积可能非常大,也可能非常小。

不稳定梯度带来的风险不仅在于数值表示,也威胁到优化算法的稳定性。我们可能面临一些问题,要么是梯度爆炸问题,参数更新过大,破坏了模型的稳定收敛,要么是梯度消失问题,参数更新过小,在每次更新时几乎不会移动。导致模型无法学习。

1 梯度消失

曾经sigmoid 函数很流行,因为它类似于阈值函数,由于早期的人工神经网络受到生物神经网络的启发,神经元要饿完全激活,要么完全不激活的想法很吸引力。然而,却是导致梯度消失的一个常见原因,我们仔细看着sigmoid函数为什么导致梯度消失

%matplotlib inline

import torch

from d2l import torch as d2l

x = torch.arange(-8.0, 8.0, 0.1, requires_grad = True);

y = torch.sigmoid(x)

y.backward(torch.ones_like(x))

d2l.plot(x.detach().numpy(),[y.detach().numpy(),x.grad.numpy()],legend=['sigmoid','gradient'],figsize=(4.5,2.5))

正如上图曲线所示sigmoid函数输入很大或者很小梯度就会消失此外反向传播通过许多除非恰好sigmoid函数输入接近位置否则整个乘积梯度可能会消失网络很多层时候除非我们很小心否则某一层可能会切断梯度事实这个问题曾经困扰深度网络训练因此更稳定RelU系列函数已经成为从业者默认选择(虽然从神经科学的角度看起来不会太合理)

  1. 梯度爆炸

梯度消失相反梯度爆炸可能同样令人烦恼为了更好说明这一点我们生成100高斯随机矩阵将他们某个初始矩阵相乘对于我们选择尺寸矩阵乘积发生了爆炸当这种情况深度网络初始化所导致我们没有机会梯度下降优化收敛

M = torch.normal(0, 1, size = (4,4))

printf('一个矩阵\n');

for i in range(100)

M = torch.mm(M, torch.normal(0, 1, size(4, 4)));

3 打破对成型

神经网络设计中另一个问题参数固有对称性假设我们有一个简单多层感知有一个隐藏两个隐藏单元在这种情况下我们可以第一层权重进行排列并且同样输出层权重进行重排列可以获得相同函数第一个隐藏单元第二个隐藏单元没有什么区别换句话说每一层隐藏单元之间具有排列对称性

4.8.2 参数初始化

解决上述问题一种方法进行参数初始化优化期间适当正则化也可以进一步提高稳定性

http://www.dtcms.com/wzjs/134803.html

相关文章:

  • html5手机版seo优化服务
  • 网站建设_你真的懂吗?制作网页一般多少钱
  • 某服装公司网站建设论文抖音推广佣金平台
  • 贵阳做网站多少钱促销方案
  • 网站建设项目的工作分解ciliba磁力搜索引擎
  • 安乡网站制作软考培训机构哪家好一点
  • 网站后台上传模板网络营销的含义
  • 网站重要组成部分竞价推广价格
  • 怎么用自己的网站做邮箱小学生简短小新闻
  • 网站建设书案例疫情最新数据消息地图
  • 如何做淘客推广网站磁力猫torrent kitty
  • dw8做网站步骤图全国推广优化网站
  • 网站开发兼容问题全球最牛的搜索引擎
  • 做网站西域数码阿里云杭州优化商务服务公司
  • 网站自动弹窗代码搜索引擎营销的成功案例
  • 网站开发超链接点击后变色站长工具seo综合查询关键词
  • 宁波企业网站制作推荐2024年阳性什么症状
  • 做网站多少钱 注意什么网络推广公司排行榜
  • 自己做的网站怎么改背景图西安seo网站排名
  • 涡阳网站建设百度搜索推广收费标准
  • 如何在自己网站上做支付宝吗最新热搜新闻
  • 昆明网站开发兼职群线上推广怎么做
  • 广告公司网站(附falsh及源代码)在线优化网站
  • 用scala做的网站免费个人网站申请
  • 页面布局怎么设置什么叫优化
  • python如何做自己的网站整合营销理论主要是指
  • 石景山网站制作案例关键词seo如何优化
  • 电子商务网站建设的步骤一般为(搜索引擎优化名词解释
  • 网站建设与推广策划书晋江友情链接是什么意思
  • 免费扑克网站代码优势的seo网站优化排名