当前位置: 首页 > news >正文

前向传播与反向传播(附视频链接)

b站视频链接

一、前向传播(Forward Propagation)

1. 基本概念

前向传播是神经网络从输入数据出发,通过逐层计算(线性变换 + 激活函数),最终得到预测输出并计算损失值的过程。

核心作用:将输入 “映射” 为输出,同时生成损失函数(衡量预测与真实标签的差距),为反向传播提供 “优化目标”。

适用场景:所有参数化模型(如线性回归、全连接神经网络、CNN、Transformer 等),本质是 “参数→输出→损失” 的正向计算链。

2. 核心流程

本文举例的神经网络为:隐藏层为h,有2个神经单元,1表示偏置,

下图为y2的计算过程,非线性变换采用sigmod激活函数

计算示例

二、反向传播(Backward Propagation)

1. 基本概念

反向传播是从损失值出发,通过 “链式法则” 反向计算每个参数(W,b)对损失的梯度(即∂L∂W,∂L∂b\frac{\partial \mathcal{L}}{\partial W}, \frac{\partial \mathcal{L}}{\partial b}WL,bL)的过程。

核心作用:为梯度下降提供 “参数更新的方向和幅度”—— 梯度表示 “参数变化 1 单位时,损失的变化量”,是优化参数的核心依据。

本质:将 “全局损失” 分解为 “每个局部参数的梯度”,避免暴力计算,大幅降低计算量。

2. 核心流程

总损失:

w20的梯度计算流程,本质是链式法则求偏导

更新w20参数,利用梯度下降法。同理可更新其他参数,注意如w11这层的参数更新需要考虑到Eo1和Eo2的反向传递

三、前向传播与反向传播的联系

维度前向传播(Forward)反向传播(Backward)+ 梯度下降
计算方向输入→隐藏层→输出(正向)损失→输出层→隐藏层→输入层(反向)
核心目的计算预测值y^\hat{y}y^和损失 L\mathcal{L}L计算参数梯度∂L∂θ\frac{\partial \mathcal{L}}{\partial \theta}θL,更新参数减小损失
核心操作线性变换(z=xW+bz = xW + bz=xW+b)+ 激活函数链式法则(梯度传递)+ 梯度下降(参数更新)
依赖关系依赖输入数据和当前参数依赖前向传播的中间结果(z1,h1,z2z_1, h_1, z_2z1,h1,z2)和损失

四、总结

  1. 前向传播是 “基础”:没有前向传播的损失值,反向传播就没有优化目标;
  2. 反向传播是 “关键”:没有反向传播的梯度,梯度下降就无法确定参数更新方向;
  3. 三者构成训练循环:前向传播→计算损失→反向传播求梯度→梯度下降更新参数→重复迭代,直到损失收敛到最小值。
  4. 通用性:无论网络结构多复杂(如 CNN 的卷积层、Transformer 的注意力层),前向 / 反向传播的核心逻辑不变 —— 只是线性变换和激活函数的形式不同,梯度计算的细节需适配结构调整。
http://www.dtcms.com/a/435227.html

相关文章:

  • 广州建设工程造价管理站橙色网站欣赏
  • ipv6之6to4配置案例
  • 太仓有专门做网站的地方吗沧州企业网站专业定制
  • gRPC从0到1系列【14】
  • JVM的内存分配策略有哪些?
  • 卡特兰数【模板】(四个公式模板)
  • Process Monitor 学习笔记(5.5):保存/打开追踪记录——复盘、复现与分享的正确姿势
  • 【机器学习宝藏】深入解析经典人脸识别数据集:Olivetti Faces
  • 【C++】深入理解红黑树:概念、性质和实现
  • 制作卖东西网站玩具网站 下载
  • 网站建设培训课程wordpress描述插件
  • php网站超市源码下载十大永久免费crm
  • 网站色彩代码carousel wordpress
  • 帮别人做网站一般app开发费用多少
  • 上海网站建设服务市价编程做网站容易还是做软件
  • Go 语言流程控制详解:if / switch / for
  • 企业网站栏目设计h5手机网站实例
  • 操作系统应用开发(十三)RustDesk文件服务搭建——东方仙盟筑基期
  • 莱州网站建设服务程序开发的步骤是什么
  • 网站域名多少钱一年杭州seo公司排名
  • 武昌网站制作公司深圳vi设计公司推荐
  • AI驱动的软件质量保障:未来已来
  • Lama Cleaner图片去水印工具最新版IOPaint-1.5.3使用教程-优雅草卓伊凡
  • Spring Boot 配置属性绑定
  • tauri中的wry和tao是干啥的?都是什么作用
  • 个人网站建设发布信息wordpress移动端悬浮导航代码
  • 神经网络评估指标:准确率、召回率等详解(代码验证)
  • linux免密切换
  • 藏语自然语言处理入门 - 2 分词
  • 2020年美国新冠肺炎疫情数据分析与可视化