当前位置：首页 > news >正文

链式法则解释上游梯度应用

news 2025/8/23 6:17:14

过程。

假设我们有一个计算图：

Code 代码

<span style="background-color:var(--bgColor-default)"><span style="color:var(--fgColor-default, var(--color-fg-default))"><code>x → x² → L (损失函数)
</code></span></span>

根据链式法则：

Code 代码

<span style="background-color:var(--bgColor-default)"><span style="color:var(--fgColor-default, var(--color-fg-default))"><code>dL/dx = dL/d(x²) * d(x²)/dx
</code></span></span>

其中：

dL/d(x²) 就是 upstream_grad（上游梯度）
d(x²)/dx = 2x 是平方函数的导数
x 就是 self.data

所以：

Python

<span style="background-color:var(--bgColor-default)"><span style="color:var(--fgColor-default, var(--color-fg-default))"><code><span style="color:var(--color-prettylights-syntax-keyword)">self</span>.grad += upstream_grad * <span style="color:var(--color-prettylights-syntax-constant)">2</span> * <span style="color:var(--color-prettylights-syntax-keyword)">self</span>.data
<span style="color:var(--color-prettylights-syntax-comment)">#          = dL/d(x²)   * d(x²)/dx</span></code></span></span>

http://www.dtcms.com/a/344019.html

相关文章：

《Windows Server 2022》 [2025年8月版 ] [官方IOS] 下载

设计模式：抽象工厂模式

DeepSeek辅助编写的测试xlsx文件写入性能的程序

多线程下为什么用ConcurrentHashMap而不是HashMap

Python万里长征6（非教程）pandas筛选数据三基础、三核心、三高级

Kafka 为什么具有高吞吐量的特性？

C# 浮点数与定点数详细解析

邀请函 | 2025达索系统高峰论坛，跨界融合定义未来制造

SamOutVXP：革命性轻量级语言模型，突破传统推理限制

不同类型代理 IP 在爬虫场景下的表现对比

苹果紧急修复ImageIO零日漏洞CVE-2025-43300，已被在野利用

开源AI编程工具Kilo Code的深度分析：与Cline和Roo Code的全面对比

QT之QSS常用颜色总结

【黑客技术零基础入门】计算机网络---子网划分、子网掩码和网关（非常详细）零基础入门到精通，收藏这一篇就够了

【每天一个知识点】AIOps 与自动化管理

二、高可用架构（Nginx + Keepalived + MySQL 主从）

集成算法（聚类）

Vue生命周期以及自定义钩子和路由

Manus AI 与多语言手写识别技术全解析

c++最新进展

linux下top命令分析内存不足vs负载过高

MeterSphere接口自动化多场景批量运行复制引用

疯狂星期四文案网第47天运营日记

云市场周报 (2025.08.22)：阿里云RDS降价、腾讯云Serverless容器新品发布

Adobe Photoshop 2025 版本介绍与使用指南

AE下载安装教程（附安装包）Adobe Media Encoder超详细图文安装教程

Azure TTS Importer：一键导入，将微软TTS语音接入你的阅读软件！

开发避坑指南(30)：Vue3 表格动态增加删除行解决方案

数据库备份sql文件过大，phpAdmin无法执行Sql

深入理解Spring事务传播行为：原理、应用与实践