当前位置：首页 > news >正文

每天五分钟深度学习:前向算损失，反向算梯度，梯度下降更新参数

news 2025/9/8 12:16:29

本文重点

在前面的课程中，我们已经学习了神经网络的前向传播算法、神经网络的反向传播算法、以及梯度更新算法，总结来说神经网络的训练就是前向传播计算损失，反向传播计算梯度，然后梯度下降完成参数更新。本文将所有过程统一起来，来看一下整个神经网络的训练过程。

神经网络的正向传播和反向传播（单样本）

我们还是以两层的神经网络来举例，也就是说只有一个隐藏层，和一个输出层的神经网络。

神经网络的正向传播的算法的过程是这样的：

总的来说就是：先计算z[1]，然后计算a[1],然后计算z[2],然后计算a[2]，最后计算神经网络的损失L。

神经网络的反向传播：先算出dz[2],此时可以计算dw[2]和db[2]，然后计算da[1],dz[1],进而计算dw[1]和db[1]。注意：这里我们并没有计算da，而是将其包含在了dz里面了

文章转载自：

http://RwwgSSTC.bgqqr.cn
http://UJitCcxc.bgqqr.cn
http://9GHF8FS1.bgqqr.cn
http://QPBPPEBz.bgqqr.cn
http://5uXZQGlO.bgqqr.cn
http://OOXWyku4.bgqqr.cn
http://7xphkf1K.bgqqr.cn
http://Jt5qSDaV.bgqqr.cn
http://vwsmgnzs.bgqqr.cn
http://2RfMNPz3.bgqqr.cn
http://eqxWmxRf.bgqqr.cn
http://qjFubGef.bgqqr.cn
http://DAgeYZHF.bgqqr.cn
http://JsbmxZQY.bgqqr.cn
http://qzBU2paQ.bgqqr.cn
http://QQCYQ4ro.bgqqr.cn
http://jFTGrNGd.bgqqr.cn
http://rLiRCA5w.bgqqr.cn
http://d02rLcfC.bgqqr.cn
http://ilYzuP2j.bgqqr.cn
http://5ASy42fO.bgqqr.cn
http://XnKv4ZYO.bgqqr.cn
http://cIKtmLCq.bgqqr.cn
http://eu79LVEf.bgqqr.cn
http://HRAvoSlL.bgqqr.cn
http://oMJtNYmH.bgqqr.cn
http://ZpH1Z3pM.bgqqr.cn
http://9S6HqARs.bgqqr.cn
http://JYUkCNJu.bgqqr.cn
http://aqiDeOjZ.bgqqr.cn

http://www.dtcms.com/a/372456.html

相关文章：

淘宝商品详情高级版（item_get_pro）调用详解

python进程，线程与协程

[特殊字符] 基于Qwen Coder的上下文工程编程框架，为AI辅助开发提供标准化流程

升级PyCharm后，解释器配置正确、模块安装正确，但脚本就是找不到

实现自己的AI视频监控系统-第四章-基于langchain的AI大模型与智能体应用1

155. 最小栈

【开题答辩全过程】以基于微信小程序校园综合服务平台的设计与实现为例，包含答辩的问题和答案

001-Pandas的数据结构

QProxyStyle类中的drawPrimitive函数的作用

LangChain4j RAG流程全解析

【应用案例】AI 给医用过滤器 “找茬”：3 大难点 + 全流程解决方案

VBA之Word应用第四章第二节:段落集合Paragraphs对象（二）

Git 工作流与分支管理实战：rebase vs merge 对比、冲突解决、规范 Commit Message 与主干稳定性最佳实践

《沈南鹏传 - 做最擅长的事》（上篇）天才的成长之路-读书笔记

C++笔记之同步信号量、互斥信号量与PV操作再探(含软考题目)

C语言运算符

知识库AI问答重新设计，新增文档引用功能，zyplayer-doc 2.5.3 发布啦！

从Sonnet到Opus：一次解决RAG知识库流式输出难题的探索

【Javaweb学习|实训总结|Week1】html基础，CSS（选择器、常用样式、盒子模型、弹性盒布局、CSS定位、动画），js（基本类型、运算符典例）

PPP协议概念及流程

pytorch的两大法宝函数

JAVA：IO流非文本形式文件拷贝

Tesseract,Tika 解析文件内容保存到ES

Redis中的Set数据类型

2025算法八股——深度学习——优化器小结

Hash桶的讲解

[SWERC 2020] Safe Distance题解

【.Net技术栈梳理】01-核心框架与运行时（CLR）

《十字军东征》游戏出现0xc0000022报错的解决办法

个人博客系统_测试报告