当前位置: 首页 > wzjs >正文

切片工具做网站怎么做网店运营培训

切片工具做网站怎么做,网店运营培训,php网站本地搭建,新冠感染最新数据到目前为止,我们实现的每个模型都是根据某个预先制定的分布来初始化模型的参数,有人会认为初始化方案时理所当然的,忽略了如何做出这些选择的细节,甚至有人可能会觉得,初始化方案的选择并不是特别重要,实际…

到目前为止,我们实现的每个模型都是根据某个预先制定的分布来初始化模型的参数,有人会认为初始化方案时理所当然的,忽略了如何做出这些选择的细节,甚至有人可能会觉得,初始化方案的选择并不是特别重要,实际上,初始化方案的选择在神经网络学习中起着举足轻重的作用,保持数值稳定性至关重要。此外,这些初始化方案的选择可以与非线性激活函数的选择有趣的结合在一起。我们选择哪个函数以及如何初始化参数可以决定优化算法收敛的速度有多快,糟糕的选择可能会导致我们在训练时遇到梯度爆炸或者梯度消失,本节将更详细的探讨这些主题,讨论一些有用的启发方式方法。这些启发方式在整个深度学习中都很有用。

4.8.1 梯度小时和梯度爆炸

考虑一个具有L层,输入x和输出o的深层网络。每一层l由变换f1定义,该变换的参数为权重W(l),隐藏变量是h(l) 令h(0) =x。我们的网络可以表示为

h(l) = Flh(l-1), 因此 o = FL .... Fl(x)

换而言之,该剃度是L-1 个矩阵M(L) ... M(l + 1) 与梯度向量v(l)的乘积。因此,我们容易受到数值下溢问题的影响,当将过多的概率在一起相承时,这种问题经常会出现。在处理概率时,一个常见的技巧是切换到对数空间,即将数值表示的压力从尾数转移到指数。遗憾的是,这会使上面的问题更为严重,矩阵M可能是各种各样的特征值,可能很小,也可能很大,而他们的乘积可能非常大,也可能非常小。

不稳定梯度带来的风险不仅在于数值表示,也威胁到优化算法的稳定性。我们可能面临一些问题,要么是梯度爆炸问题,参数更新过大,破坏了模型的稳定收敛,要么是梯度消失问题,参数更新过小,在每次更新时几乎不会移动。导致模型无法学习。

1 梯度消失

曾经sigmoid 函数很流行,因为它类似于阈值函数,由于早期的人工神经网络受到生物神经网络的启发,神经元要饿完全激活,要么完全不激活的想法很吸引力。然而,却是导致梯度消失的一个常见原因,我们仔细看着sigmoid函数为什么导致梯度消失

%matplotlib inline

import torch

from d2l import torch as d2l

x = torch.arange(-8.0, 8.0, 0.1, requires_grad = True);

y = torch.sigmoid(x)

y.backward(torch.ones_like(x))

d2l.plot(x.detach().numpy(),[y.detach().numpy(),x.grad.numpy()],legend=['sigmoid','gradient'],figsize=(4.5,2.5))

正如上图曲线所示sigmoid函数输入很大或者很小梯度就会消失此外反向传播通过许多除非恰好sigmoid函数输入接近位置否则整个乘积梯度可能会消失网络很多层时候除非我们很小心否则某一层可能会切断梯度事实这个问题曾经困扰深度网络训练因此更稳定RelU系列函数已经成为从业者默认选择(虽然从神经科学的角度看起来不会太合理)

  1. 梯度爆炸

梯度消失相反梯度爆炸可能同样令人烦恼为了更好说明这一点我们生成100高斯随机矩阵将他们某个初始矩阵相乘对于我们选择尺寸矩阵乘积发生了爆炸当这种情况深度网络初始化所导致我们没有机会梯度下降优化收敛

M = torch.normal(0, 1, size = (4,4))

printf('一个矩阵\n');

for i in range(100)

M = torch.mm(M, torch.normal(0, 1, size(4, 4)));

3 打破对成型

神经网络设计中另一个问题参数固有对称性假设我们有一个简单多层感知有一个隐藏两个隐藏单元在这种情况下我们可以第一层权重进行排列并且同样输出层权重进行重排列可以获得相同函数第一个隐藏单元第二个隐藏单元没有什么区别换句话说每一层隐藏单元之间具有排列对称性

4.8.2 参数初始化

解决上述问题一种方法进行参数初始化优化期间适当正则化也可以进一步提高稳定性

http://www.dtcms.com/wzjs/512810.html

相关文章:

  • 聊城做网站厉害的公司网上商城推广13种方法
  • php做网站后台语言如何自己开发一个平台
  • 如何利用网站新闻做推广百度网首页
  • 做网站有高手没有哈尔滨网络推广
  • 有网站如何做appseo是怎么优化
  • 个人视频网站怎么做网络营销seo是什么意思
  • 深圳网站建设i9988互联网seo是什么
  • 如何做网站公司名seo企业网络营销方案策划
  • 做网站制作外包流量精灵app
  • 镇海区住房和建设交通局网站单页网站制作教程
  • 平面设计接单平台哪个靠谱点seo排名关键词
  • 新手做网站流程怎么做市场推广
  • 网站开发页面设计广州疫情防控措施
  • 佛山做网站需要多少钱收录优美图片手机版
  • 企业网站规划原则网络营销的主要手段
  • 网站建设 服务器 预算报价清单北京优化seo公司
  • 电商网站开发详细流程开发软件app需要多少钱
  • 专业的开发网站建设价格搜易网优化的效果如何
  • 微信小程序怎么收费标准网站seo资讯
  • 如何做网站广告统计网站流量的网站
  • 网站排名易下拉刷词快速排名软件seo系统
  • 做网站抽奖系统贵州萝岗seo整站优化
  • 免费建立教育网站网站长尾关键词排名软件
  • 今日的重大新闻seo厂家电话
  • 个人主题网站手游代理平台哪个好
  • 网站建设与管理属于什么部门郑州技术支持seo
  • 万维网网站域名续费百度24小时人工电话
  • 自己做网站用花钱么图片外链生成工具在线
  • 建筑案例网站seo排名优化公司价格
  • 梧州网站建设公司怎么做seo网站关键词优化