当前位置: 首页 > news >正文

2.2 反向传播:神经网络如何“学习“?

一、神经网络就像小学生

想象一个刚学算术的小学生,老师每天布置练习题,学生根据例题尝试解题,老师批改后指出错误。神经网络的学习过程与此相似:

  • 输入层:相当于练习题(如数字图片)
  • 输出层:学生的答案(如识别数字是"3")
  • 损失函数:老师的批改(计算错误程度)
  • 反向传播:学生根据错误调整计算步骤的过程

二、前向传播:先做一遍练习题

假设我们要识别数字"3",神经网络的处理过程如下:

示例:

1输入层数据:[0.5, 0.8]  # 像素值
2权重参数:w1=0.3, w2=0.6, 偏置b=0.1
3
4# 隐藏层计算
5h = (0.5*0.3) + (0.8*0.6) + 0.1 = 0.73  
6激活值 = 1/(1+e^(-0.73)) ≈ 0.675  # Sigmoid函数
7
8# 输出层计算
9最终输出 = 0.675*0.4 + 0.2 = 0.47  # 假设目标值是0.8
10误差 = (0.8-0.47)^2 / 2 = 0.0545
11

此时网络认为图片有47%概率是"3",但正确答案应该是80%1

三、反向传播:老师批改作业

反向传播就像老师用红笔标注错误步骤:

1. 计算总误差(老师打分)

使用均方误差公式:
总误差 = Σ(预测值 - 真实值)^2 / 2

2. 逆向追溯责任(找错误根源)

通过链式法则逐层计算各参数的责任比例:

预览

以输出层权重w5为例:

1误差对w5的梯度 = (预测值-真实值) * 激活输出 * 激活导数  
2              = (0.47-0.8) * 0.675 * 0.675*(1-0.675) ≈ -0.033
3

3. 调整参数(学生改正错误)

按梯度方向调整参数:

1新w5 = 原w5 - 学习率*梯度  
2     = 0.4 - 0.1*(-0.033) = 0.4033
3

参数调整幅度就像调音量:误差越大,调整幅度越大

四、生活中的反向传播

假设你调整咖啡配方:

  1. 第一次:3g糖→太苦(误差大)
  2. 反向分析:糖量影响最大
  3. 第二次:5g糖→稍好(误差减小)
  4. 继续调整奶量、咖啡粉...

经过多次调整,最终找到最佳配方——这就是神经网络的学习过程!

五、优化学习效率的三个技巧

  1. 学习率:就像调整步伐大小
    • 太大容易错过最佳点(0.1是常用初始值)
  1. 动量:像下坡时的惯性
    • 避免在局部最优处卡住
  1. 批量训练:像同时批改多份作业
    • 更稳定地找到调整方向

六、核心公式总结

步骤

关键公式

类比

前向传播

a = σ(w*x + b)

做练习题

损失计算

L = ½Σ(y_true - y_pred)^2

计算错题数

反向传播

∂L/∂w = ∂L/∂a * ∂a/∂z * ∂z/∂w

分析错误原因

参数更新

w_new = w_old - η*∂L/∂w

调整学习方法

参考资料

  1. 反向传播手推公式示例
  2. 链式法则图解
  3. 动量优化原理
  4. 神经网络参数更新可视化
  5. 5分钟-通俗易懂 - 神经网络 反向传播算法(手算)_哔哩哔哩_bilibili

相关文章:

  • 从Vec3实现复习运算符重载
  • Deepseek R1模型本地化部署与API实战指南:释放企业级AI生产力
  • 如何在 Vue 3 中使用 Vue Router 和 Vuex
  • 联想小新 510S-14IKB (80UX) 原厂Win10系统oem镜像下载
  • Hive查询之排序
  • 面试题整理:操作系统
  • Python 用户输入和While循环(使用while 循环来处理列表和字典)
  • PerfMonitor高效处理器性能监控与分析利器
  • [实现Rpc] 客户端划分 | 框架设计 | common类的实现
  • React AJAX:深入理解与高效实践
  • Java 数据类型
  • pptx2md - 将PPT文件转换成Markdown
  • 从零搭建微服务项目(第7章——微服务网关模块基础实现)
  • 如何解决DeepSeek服务器繁忙的问题?
  • JUC并发-4.wait和notify以及Atomic原理
  • 【JavaWeb学习Day16】
  • 什么是scaling laws?
  • 实现MiniQMT远程下单:跨设备交易指令的高效传递
  • pnpm, eslint, vue-router4, element-plus, pinia
  • Spring AOP源码解析
  • 消息人士称俄方反对美国代表参加俄乌直接会谈
  • 李强:把做强国内大循环作为推动经济行稳致远的战略之举
  • 董军在第六届联合国维和部长级会议上作大会发言
  • 在稳市场稳预期下,投资者教育给了散户更多底气
  • 人民日报评外卖平台被约谈:摒弃恶性竞争,实现行业健康发展
  • GDP逼近五千亿,向海图强,对接京津,沧州剑指沿海经济强市