当前位置: 首页 > news >正文

外贸网站建站平台cms做门户网站

外贸网站建站平台,cms做门户网站,河南联通 网站备案,北京acc网站建设《动手学深度学习》-4.7-笔记 是前向传播(Forward Propagation)? 就是 模型拿到输入 → 一步一步计算输出(预测结果) 的过程。 你可以把神经网络想象成一个“公式接力赛”: 输入图片(或数据&a…

《动手学深度学习》-4.7-笔记

是前向传播(Forward Propagation)?

就是 模型拿到输入 → 一步一步计算输出(预测结果) 的过程。

你可以把神经网络想象成一个“公式接力赛”:

  • 输入图片(或数据)从输入层进入

  • 每一层(卷积层、全连接层)都做一堆数学运算(比如:加权、激活函数)

  • 最终得到输出结果(比如:是猫还是狗)

👀 举个例子:

输入图像 ➜ 卷积层 ➜ 池化层 ➜ 全连接层 ➜ Softmax ➜ 预测标签

这整个过程就是前向传播

神经网络训练的核心机制:前向传播 + 反向传播 + 梯度计算 + 正则化

反向传播?

前向传播做完后,模型得到了结果,但它不知道对不对。
所以要和 真实标签比对,用损失函数打分。
然后从后往前一层一层地计算 每一层的“错误”(梯度),告诉模型该怎么改参数。

它就像一个“反思过程”:

  • 输出层发现错了,告诉上一层

  • 上一层再告诉上一层,直到回到最开始

“计算图”?

PyTorch 在你执行前向传播时,悄悄地在背后画了一张图,叫 计算图
每一个操作(加、乘、激活函数)都在图上留下“痕迹”。

有了这张图,它就可以在反向传播时,沿着图的反方向走回去,自动算出每一层的偏导数(梯度)。

“链式法则”?为什么提它?

在数学里,如果一个值依赖另一个值,而那个值又依赖另一个值,我们就用“链式法则”来求导。

举个例子:

z = f(y),y = g(x)

那 z 关于 x 的导数就是:dz/dx = dz/dy × dy/dx

神经网络中,输出结果依赖一层又一层参数,每层都要通过链式法则来一层层传导梯度。

正则项?

正则项是一种“限制模型不要学得太过头”的技术,
它的目的是为了防止过拟合

为什么训练比预测更占内存(显存)?

因为训练时:

  • 需要 保存前向传播中每一层的中间结果(中间变量)

  • 以便后面反向传播要用来算梯度

所以:网络层越多、batch 越大 → 保存的中间值越多 → 更容易显存溢出(OOM)网络层越多、batch 越大 → 保存的中间值越多 → 更容易显存溢出(OOM)

概念通俗解释
前向传播模型根据输入算出预测
反向传播模型根据错误反向调整每一层
计算图PyTorch 在背后画的运算路线图
自动微分PyTorch 自动帮你算导数的魔法
正则化惩罚模型学得太复杂,避免过拟合
链式法则求导数时一步步向前“乘导数”
显存占用高因为要保存每一层的中间结果
为什么训练比预测慢因为训练多了反向传播这一步,还要算导数

http://www.dtcms.com/a/580192.html

相关文章:

  • 西安建公司网站卖货平台有哪些
  • 网站开发开账务处理电子产品网站建设策划方案
  • 不懂英文怎么做英文的seo网站wordpress 商业版权
  • 重庆网站建设营销七牛图床 wordpress
  • 福州网站建设 找燕狂徒 05品牌设计师需要具备什么能力
  • 网站seo链接购买广告网络营销策略
  • 建设高端网站中森网站建设公司
  • 网站开发税收标准中小型互联网企业有哪些
  • 爱网站查询做公司企业网站
  • 贵州城乡建设厅施工员报名网站地方做什么网站
  • 查询网站服务器地址logo设计网站国外
  • 怎么注册自己网站吗网站设计要求
  • 专做教育网站拿站东莞网络网站建设
  • 怎么看别人网站是哪里做的怎么开发自己的商城
  • 高新区免费网站建设广告发布需要许可证吗
  • 网站备案前置审批表格前端做网站要会什么
  • 做任务拿赏金的网站东莞网站建设时间
  • 赤峰市宁城县住房和建设局网站中小企业网络设计与实现
  • 汽车配件生产企业网站模板江苏通力建设官方网站
  • 花钱制作网站有什么好处免费高清大图网站
  • 赣州做公司网站金融网站开发文档下载
  • 如何查看一个网站做的外链手机网站广告代码
  • 怎么用网吧电脑做网站服务器网站cms系统排名
  • 网站流量是怎么赚钱的深圳高端logo设计公司
  • 肥城网站建设哪家好重庆市工程建设标准化网站
  • 个人网站是怎么样的清智优化北京
  • 做的好的自驾游网站外包人力资源公司
  • 网站建设套模板wordpress开店
  • 专业网站网站建设四网合一
  • vps做网站用什么系统域名和网站名不一样