当前位置: 首页 > wzjs >正文

书香气的域名做网站六安做网站公司

书香气的域名做网站,六安做网站公司,2016企业网站建设方案,网站建设用什么系统好如果你要用梯度下降算法来训练一个神经网络,应该怎么做? 假设网络有一堆的参数:。首先选择一个初始的参数,计算对损失函数的梯度,也就是计算神经网络里面的参数对loss损失函数的导数,计算出后,更…

        如果你要用梯度下降算法来训练一个神经网络,应该怎么做?

        假设网络有一堆的参数:\theta =\begin{Bmatrix} w_{1},w_{2},...,b_{1},b_{2},... \end{Bmatrix}。首先选择一个初始的参数\theta ^{0},计算\theta ^{0}对损失函数的梯度,也就是计算神经网络里面的参数w_{1},w_{2},...,b_{2},b_{2},...对loss损失函数的导数,计算出后,更新参数\theta ^{1}=\theta ^{0}-\eta \bigtriangledown L(\theta ^{0});再计算\theta ^{1}对损失函数的梯度,再更新\theta ^{2},以此类推.......

        我们会定义一个loss损失函数,这个损失函数就是所有训练样本的预测值与真实值之间差值和,对损失函数进行梯度下降算法的公式如下:

         现在我们来看一下怎么对某一笔的样本计算梯度。

         对于上述的神经元,先考虑计算某一个神经元的梯度:

        通过前向过程计算可得z=x_{1}w_{1}+x_{2}w_{2}+b,对于\frac{\partial C}{\partial w}=\frac{\partial C}{\partial z}\frac{\partial z}{\partial w}。计算\frac{\partial z}{\partial w}是前向过程,计算\frac{\partial C}{\partial z}是反向过程。

        我们先来看下怎么计算\frac{\partial z}{\partial w}  。因为z=x_{1}w_{1}+x_{2}w_{2}+b\frac{\partial z}{\partial w_{1}}=x_{1}\frac{\partial z}{\partial w_{1}}=x_{2}。对于\frac{\partial z}{\partial w}就是看这个w前面接的是什么,那微分以后就是什么。w_{1}前面接的输入是x_{1},所以求导后就是x_{1}w_{2}前面接的输入是x_{2},所以求导后就是x_{2},就是这样的规律。

        假如给你如下图的神经网络,它里面有一大堆的参数,计算里面的\frac{\partial z}{\partial w},这件事非常容易。

        如果有人想问你: 这个\frac{\partial z}{\partial w}是多少,你看这个w=1前面接的输入是-1,你可以瞬间告诉他\frac{\partial z}{\partial w}=-1

        接下来,有人想问你:,对于这个w=-1,\frac{\partial z}{\partial w}是多少,你可以很快告诉他\frac{\partial z}{\partial w}=0.12

        知道了怎么计算\frac{\partial z}{\partial w},我们现在来看看怎么计算\frac{\partial C}{\partial z}。计算\frac{\partial C}{\partial z}你会觉得很困难,因为z通过激活函数后得到一个输出。

      假设激活函数时sigmoid函数,z通过sigmoid函数后得到a。我们知道\frac{\partial C}{\partial z}=\frac{\partial C}{\partial a}\frac{\partial a}{\partial z}a=\sigma (z)\frac{\partial a}{\partial z}就是sigmoid函数的偏微分。sigmoid函数如下图绿色线所示,它的微分如蓝色线所示:

因为a会影响后面的{z}'{z}'会影响C;a会影响后面{z}''{z}''会影响C。所以\frac{\partial C}{\partial a}=\frac{\partial {z}'}{\partial a}\frac{\partial C}{\partial {z}'}+\frac{\partial {z}''}{\partial a}\frac{\partial C}{\partial {z}"}。因为{z}'=aw_{3}+aw_{4}+...,所以我们能很快知道\frac{\partial {z}'}{\partial a}=w_{3}\frac{\partial {z}''}{\partial a}=w_{4},但是我们又很难计算\frac{\partial C}{\partial {z}'}\frac{\partial C}{\partial {z}''},因为神经网络后面可能会又其他的运算,在此,我们先假设知道\frac{\partial C}{\partial {z}'}\frac{\partial C}{\partial {z}''}这两项的值。 现在我们就可以计算\frac{\partial C}{\partial z}= {\sigma}'(z)\begin{bmatrix} w_{3}\frac{\partial C}{\partial {z}'}+w_{4}\frac{\partial C}{\partial {z}''} \end{bmatrix}的值。

        我们可以从另一个观点看待这个式子,如下图,其中{\sigma }'(z)是一个常数,因为z在计算前向过程的时候就被决定好了。

        回到上一个问题,我们要怎么算\frac{\partial C}{\partial {z}'}\frac{\partial C}{\partial {z}''}呐?

                第一个例子是我们假设橘色的这两个神经元是输出层,所以可以计算出\frac{\partial C}{\partial {z}'}=\frac{\partial C}{\partial y_{1}}\frac{\partial y_{1}}{\partial {z}'} ,\frac{\partial C}{\partial {z}''}=\frac{\partial C}{\partial y_{2}}\frac{\partial y_{2}}{\partial {z}''}

        假设橘色的神经元并不是整个神经网络的输出,它后面还有其他的层,那应该怎么算呢?

        如果我们知道\frac{\partial C}{\partial z_{a}}\frac{\partial C}{\partial z_{b}},我们就能计算出\frac{\partial C}{\partial {z}'},但我们现在无法计算出\frac{\partial C}{\partial z_{a}}\frac{\partial C}{\partial z_{b}},因为我们不知道后续的层是什么样的。我们可以再往下一层去看,如果绿色的神经元是输出层的话,计算\frac{\partial C}{\partial z_{a}}\frac{\partial C}{\partial z_{b}}就不成问题。

        实际上,我们是从输出层的\frac{\partial C}{\partial z}开始计算的:

        假设我们现在有6个神经元,现在我们要计算\frac{\partial C}{\partial z},如果先计算\frac{\partial C}{\partial z_{1}}\frac{\partial C}{\partial z_{2}},那就没有效率;如果先算\frac{\partial C}{\partial z_{5}}\frac{\partial C}{\partial z_{6}},就很有效率。

        算出\frac{\partial C}{\partial z_{5}}\frac{\partial C}{\partial z_{6}}后,就可以算出\frac{\partial C}{\partial z_{3}}\frac{\partial C}{\partial z_{4}},然后算出\frac{\partial C}{\partial z_{1}}\frac{\partial C}{\partial z_{2}}

        实际上,这个过程如下图所示:

http://www.dtcms.com/wzjs/802416.html

相关文章:

  • 软文营销网站建立网站需要注意什么
  • 纸业公司网站模板源文件芜湖营销型网站建设
  • 做公司点评的网站wordpress 自动分享
  • 视频网站怎么做算法新闻头条最新消息国家大事
  • 怎么做公司的中英文网站焊工培训内容有哪些
  • 网站开发学什么wordpress分类页数量
  • 餐饮企业网站源码深信服网络架构
  • 网站建设首选公司哪家好wordpress播放插件
  • 温州专业微网站制作报价新闻类网站怎么建设
  • 前端网站开发毕设类型北京网站搭建公司排名
  • 哈尔滨建站怎么做广州建网站新科网站建设
  • 有关网站建设的电子商务论文大数据智能营销系统
  • 重庆模板建站软件电商网站开发实战视频教程
  • 没电脑可以建网站吗外贸企业建站公司
  • 公司网站制作方案南昌企业网站建设费用
  • 让别人做网站的步骤网站建设 中企动力嘉兴0573
  • wordpress模板+保险合肥百度网站排名优化
  • 林州网站建设服务百度seo优化技术
  • 山西省建设厅网站见证员证书宋来增深圳分为哪几个区
  • 军事新闻播报最新莱芜网站优化公司
  • 网站的建设有什么好处开发公司保交房专班成员组成
  • 网站主体必须要与域名注册人相同高能建站系统怎么收费
  • 网站内容如何管理好网站分享
  • 瑞安外贸网站建设wordpress链接跳转页面跳转
  • 企业局域网的搭建与配置南宁网站怎么做seo
  • 焦作网站建设哪家权威代理公司注销需要多少钱
  • 微九州合作网站北京监理协会培训网站
  • 做搜狗网站关键词排名wordpress edit_post
  • tp做的网站封装成app建站目的
  • 合伙建网站怎么登陆wordpress后台