当前位置：首页 > news >正文

Pytorch框架笔记

news 2025/9/25 15:43:39

微积分

对于一个多元函数，我们将其输入简化为一个一个向量。
在这里插入图片描述
说明:
对于所有 $A∈Rm×n\mathbf{A} \in \mathbb{R}^{m \times n}$ ，都有 $∇xAx=A⊤\nabla_{\mathbf{x}} \mathbf{A} \mathbf{x} = \mathbf{A}^\top$
$Ax\mathbf{A} \mathbf{x}$ 是一个向量，而对于向量的求导是一个矩阵（因为这里向量的每个维度上都是一个多元函数），经过简单计算可以知道正好为 $A⊤\mathbf{A}^\top$ .

对于所有 $A∈Rn×n\mathbf{A} \in \mathbb{R}^{n \times n}$ ，都有 $∇xx⊤Ax=(A+A⊤)x\nabla_{\mathbf{x}} \mathbf{x}^\top \mathbf{A} \mathbf{x} = (\mathbf{A} + \mathbf{A}^\top)\mathbf{x}$
在这里插入图片描述

$∇x∥x∥2=∇xx⊤x=2x\nabla_{\mathbf{x}} \|\mathbf{x} \|^2 = \nabla_{\mathbf{x}} \mathbf{x}^\top \mathbf{x} = 2\mathbf{x}$
在上面这个公式中将 $E\mathbf{E}$ 带入 $A\mathbf{A}$ ，即可得到这个这个式子。

自动微分

为张量建立梯度

由上面数学推导可知，标量函数对一个向量求导的结果就是它的梯度。梯度的形状和这个用来求导的向量的形状是一样的。
深度学习框架为了存贮自动微分的结果，会为用于求导的张量（一维的话是向量）开辟一个同样的大小的内存空间

from mxnet import autograd, np, npxnpx.set_np()x = np.arange(4.0)# 通过调用attach_grad来为一个张量的梯度分配内存
x.attach_grad()
# 在计算关于x的梯度后，将能够通过'grad'属性访问它，它的值被初始化为0
x.grad

上述代码就是为张量分配了一个梯度。

为被求导函数建立计算图

现在的深度学习框架一般使用反向传播的方法计算梯度。而使用到的工具就是计算图。
框架会为被求导的函数构造一个计算图。

# 把代码放到autograd.record内，以建立计算图
with autograd.record():y = 2 * np.dot(x, x)
y

计算图的作用如下：
在这里插入图片描述
当需要求梯度时，程序就从后往前遍历计算图：

图的结点时操作，边是数据。程序会根据操作类型进行求导。
比如上图中遇到的第一个操作是乘法，就会保留c和d的因子。然后继续跟着图的反向传播继续链式求导。
最终会将结果保存在梯度当中。

非标量函数求梯度

比如向量函数，矩阵函数。
向量函数：
在这里插入图片描述

计算分离

对于被求导的函数，可以将其部分作为一个整体冻结，求导的时候只作为一个常数。
在这里插入图片描述

Python控制流的梯度计算

在框架中，不仅能对数学上的函数做自动微分，还能对变成中的函数（python控制流如条件和循环）做自动微分。
在这里插入图片描述
这里构造了一个分段线性的函数，这不是个连续的函数，其每一段都是y = kx,但不同的区间中k不一样。
由此可以像最后这样表达来验证求导是不是有效的。

框架查询

查函数和类

import torchprint(dir(torch.distributions))

函数和类的用法

help(torch.ones)

查看全文

http://www.dtcms.com/a/403779.html

OD C卷 - 剩余银饰的重量

Linux 用户和组管理

phpstudy建设网站教程网站快捷导航ie怎么做

网站颜色字体颜色网站建设宀金手指花总十五

毕赤酵母（K. phaffii）番茄红素细胞工厂构建：材料方法详解与关键技术细节

SpringCloud项目阶段八：利用redis分布式锁解决集群状态下任务抢占以及实现延迟队列异步审核文章

广州seo网站多少钱河北邯郸seo网站建设网站优化

湘潭市建设路学校网站国内最新新闻事件今天

.NET MVC 框架基础大全

系统性学习C++-第一讲-C++入门基础

MySQL笔记9

【算法】day5 二分查找

2016年做网站好不好上海百姓网

什么是推免生？具备哪些条件才能保研成功？

11. Linux 防火墙管理

江苏专业网站建设公司电话手机淘宝官网首页

百度如何关键字网站域名关联网站loading动画效果

【大模型LLM面试合集】有监督微调_微调

网站的广告语应该怎么做临海外发加工网

MySQL-主从复制

杭州网站设计制作怎么把图片做超链接到网站

深度学习与大脑的关系是“模拟-验证-超越”的迭代循环

05 初始化

Python print()函数详解

2025 PHP7/8 实战入门：15 天精通现代 Web 开发——第 5 课：数组与字符串处理

网站底部放什么wordpress免费主题开源

时态--10--现在完成进⾏时

新手建站网站内做动图

超越工具链整合：价值流智能时代的企业级DevOps平台选型之道

LLMs之ThinkingModel：DeepSeek-V3.1的简介、安装和使用方法、案例应用之详细攻略

微积分