当前位置：首页 > news >正文

小白的进阶之路系列之十----人工智能从初步到精通pytorch综合运用的讲解第三部分

news 2025/9/17 22:46:38

本文将介绍Autograd基础。

PyTorch的Autograd特性是PyTorch灵活和快速构建机器学习项目的一部分。它允许在一个复杂的计算中快速而简单地计算多个偏导数（也称为梯度）。这个操作是基于反向传播的神经网络学习的核心。

autograd的强大之处在于它在运行时动态地跟踪你的计算，这意味着如果你的模型有决策分支，或者循环的长度直到运行时才知道，计算仍然会被正确地跟踪，你会得到正确的梯度来驱动学习。这一点，再加上模型是用Python构建的这一事实，提供了比依赖于静态分析更严格的结构模型来计算梯度的框架更大的灵活性。

我们需要Autograd做什么？

机器学习模型是一个函数，有输入和输出。在这个讨论中，我们将把输入作为一个i维向量 $\vec{x}$ ，带有元素 $x_i$ ．然后我们可以将模型M表示为输入的向量值函数： $\vec{y}=\vec{M}(\vec{x})$ （我们把M的输出值当作一个向量，因为一般来说，一个模型可以有任意数量的输出。）

由于我们将主要在训练的背景下讨论自梯度，我们感兴趣的输出将是模型的损失。损失函数 $L(\vec{y})=L(\vec{M}(\vec{x}))$ 是模型输出的单值标量函数。该函数表示我们的模型预测与特定输入的理想输出之间的距离。注意：在这一点之后，我们通常会在上下文清楚的地方省略向量符号-例如： $y$ 而不是 $\vec{y}$ 。

在训练模型时，我们希望将损失最小化。在一个完美模型的理想情况下，这意味着调整它的学习权值——也就是函数的可调参数——使得所有输入的损失为零。在现实世界中，这意味着一个不断调整学习权重的迭代过程，直到我们看到对于各种各样的输入，我们得到了一个可以容忍的损失。

我们如何决定将重物推多远，朝哪个方向？我们想要最小化损失，这意味着使它对输入的一阶导数等于0。即 $\frac{\partial{L}}{\partial{x}}=0$

但是，回想一下，损失不是直接来自输入，而是模型输出的函数（直接是输入的函数）， $\frac{\partial{L}}{\partial{x}}=\frac{\partial{L(\vec{y})}}{\partial{x}}$ ．根据微分的链式法则，我们有 $\frac{\partial{L(\vec{y})}}{\partial{x}}=\frac{\partial{L(\vec{y})}}{\partial{y}}*\frac{\partial{M(x)}}{\partial{x}}$ 。在这个式子中， $\frac{\partial{M(x)}}{\partial{x}}$ 就是事情变得复杂的地方。模型输出相对于其输入的偏导数，如果我们再次使用链式法则展开表达式，将涉及对模型中每个乘法学习权值、每个激活函数和每个其他数学变换的许多局部偏导数。每个这样的偏导数的完整表达式是通过计算图的每个可能路径的局部梯度的乘积的和，该计算图以我们试图测量的梯度的变量结束。

特别是，我们对学习权值上的梯度很感兴趣——它们告诉我们改变每个权值的方向，以使损失函数更接近于零。

由于这种局部导数的数量（每个对应于模型计算图中的单独路径）将随着神经网络的深度呈指数增长，计算它们的复杂性也会呈指数增长。这就是autograd的用武之地：它跟踪每一次计算的历史。PyTorch模型中的每个计算张量都携带其输入张量和用于创建它的函数的历史记录。结合PyTorch函数意味着作用于张量的事实，每个函数都有一个内置的实现来计算它们自己的导数，这大大加快了学习所需的局部导数的计算速度。

一个简单的例子

这是很多的理论——但是在实践中使用自动光栅是什么样子的呢？

让我们从一个简单的例子开始。首先，我们将做一些导入来绘制结果：

# %matplotlib inlineimport torchimport matplotlib.pyplot as plt
import matplotlib.ticker as ticker
import math

接下来，我们将创建一个输入张量，它在区间上充满了均匀间隔的值[0,2π]，并指定requires_grad=True。（像大多数创建张量的函数一样，torch.linspace()接受一个可选的requires_grad选项。）设置此标志意味着在接下来的每个计算中，autograd将在该计算的输出张量中积累计算的历史。

a = torch.linspace(0., 2. * math.pi, steps=25

文章转载自：

http://G0fMFZ99.hLfsn.cn
http://TejHPBz2.hLfsn.cn
http://9Hn2CqwD.hLfsn.cn
http://1ct2oWaF.hLfsn.cn
http://9vlFQywn.hLfsn.cn
http://NwnrBK4m.hLfsn.cn
http://Kxm48hAD.hLfsn.cn
http://aUDk1Iky.hLfsn.cn
http://x6EwmSqp.hLfsn.cn
http://DF9WdHdC.hLfsn.cn
http://K9VIHsJH.hLfsn.cn
http://a0p0Ykrq.hLfsn.cn
http://dtv9aYZV.hLfsn.cn
http://98jSlP4k.hLfsn.cn
http://1TyX4ypB.hLfsn.cn
http://FDzQHN2N.hLfsn.cn
http://8tO9XimK.hLfsn.cn
http://QX9Egl0n.hLfsn.cn
http://HUiJXY4h.hLfsn.cn
http://dBfVUIDW.hLfsn.cn
http://OtKAyiS2.hLfsn.cn
http://sFQFY6x8.hLfsn.cn
http://lhVmb1n4.hLfsn.cn
http://StD5l7BS.hLfsn.cn
http://5GQG5pX1.hLfsn.cn
http://dodFEk5o.hLfsn.cn
http://jj6Y5lqn.hLfsn.cn
http://rpImC7OU.hLfsn.cn
http://tLMd7FJ2.hLfsn.cn
http://ynhb2AKl.hLfsn.cn

查看全文

http://www.dtcms.com/a/226571.html

Ubuntu22.04 安装 ROS2 Humble

嵌入式鸿蒙开发环境搭建操作方法与实现

Ubuntu上进行VS Code的配置

JDK21深度解密 Day 11：云原生环境中的JDK21应用

JVM——从JIT到AOT：JVM编译器的云原生演进之路

微服务-Sentinel

LabVIEW准分子激光器智能控制系统

神经网络与深度学习（第二章）

可视化大屏通用模板Axure原型设计案例

Python 在金融中的应用- Part 1

HarmonyOS鸿蒙Taro跨端框架

React---day6、7

Go 语言 + Word 文档模板：WordZero 引擎如何让企业文档处理效率提升 300%？

Qt实现的水波进度条和温度进度条

移除3D对象的某些部分点云

OpenGL 3D 编程

CSS 3D 变换中z-index失效问题

谷粒商城-分布式微服务项目-高级篇[三]

迈向分布式智能：解析MCP到A2A的通信范式迁移

百度蜘蛛池的作用是什么？技术@baidutopseo

【基于阿里云搭建数据仓库(离线)】Data Studio创建资源与函数

[RoarCTF 2019]Easy Calc

【Ragflow】24.Ragflow-plus开发日志：增加分词逻辑，修复关键词检索失效问题

使用 OpenCV (C++) 进行人脸边缘提取

(12)-java+ selenium-＞元素定位大法之By_link_text

【 HarmonyOS 5 入门系列】鸿蒙HarmonyOS示例项目讲解

4.RV1126-OPENCV 图像轮廓识别

工作流引擎-16-开源审批流项目之整合Flowable官方的Rest包

ck-editor5的研究 (5)：优化-页面离开时提醒保存，顺便了解一下 Editor的生命周期和 6大编辑器类型

Cursor 编辑器介绍：专为程序员打造的 AI 编程 IDE

我们需要Autograd做什么？

一个简单的例子

相关文章：