当前位置: 首页 > news >正文

要找人做公司网站应该怎么做开发工具控件属性怎么打开

要找人做公司网站应该怎么做,开发工具控件属性怎么打开,设计上海门票,手机网站建设与布局目录 1. 自动微分是什么? 1.1 计算图 1.2 requires_grad 属性 2. 标量和向量的梯度计算 2.1 标量梯度 2.2 向量梯度 3. 梯度上下文控制 3.1 禁用梯度计算 3.2 累计梯度 4. 梯度下降实战 4.1 求函数最小值 4.2 线性回归参数求解 5. 总结 在深度学习中&a…

目录

1. 自动微分是什么?

1.1 计算图

1.2 requires_grad 属性

2. 标量和向量的梯度计算

2.1 标量梯度

2.2 向量梯度

3. 梯度上下文控制

3.1 禁用梯度计算

3.2 累计梯度

4. 梯度下降实战

4.1 求函数最小值

4.2 线性回归参数求解

5. 总结


在深度学习中,自动微分是神经网络训练的核心机制之一。PyTorch通过torch.autograd模块提供了强大的自动微分功能,能够自动计算张量操作的梯度。今天,我们就来深入探讨PyTorch的自动微分机制,并通过一些实战案例来理解它的原理和应用。

1. 自动微分是什么?

在神经网络训练中,我们通常需要计算损失函数对模型参数的梯度,以便通过梯度下降法更新参数,从而最小化损失函数。手动计算梯度是非常繁琐且容易出错的,尤其是当网络结构复杂时。自动微分通过自动构建计算图并计算梯度,极大地简化了这一过程。

1.1 计算图

计算图是自动微分的核心概念。它是一个有向图,节点表示张量(Tensor),边表示张量之间的操作。当我们对张量进行操作时,PyTorch会自动构建一个动态计算图,并在反向传播时沿着这个图计算梯度。

例如:
在上述代码中,x y 是输入张量,即叶子节点,z 是中间结果,loss 是最终输出。每一步操作都
会记录依赖关系:
z = x * yz 依赖于 x y
loss = z.sum()loss 依赖于 z
这些依赖关系形成了一个动态计算图,如下所示:

1.2 requires_grad 属性

在PyTorch中,每个张量都有一个requires_grad属性,用于指定是否需要计算梯度。如果requires_grad=True,则该张量的所有操作都会被记录在计算图中;如果requires_grad=False,则不会记录操作,也不会计算梯度。

x = torch.tensor(1.0, requires_grad=True)
y = x ** 2
y.backward()
print(x.grad)  # 输出梯度

2. 标量和向量的梯度计算

2.1 标量梯度

当我们对一个标量进行操作时,可以直接调用backward()方法来计算梯度。

x = torch.tensor(1.0, requires_grad=True)
y = x ** 2
y.backward()
print(x.grad)  # 输出:tensor(2.)

2.2 向量梯度

对于向量,我们需要提供一个与输出形状相同的梯度张量作为backward()的参数。

x = torch.tensor([1.0, 2.0, 3.0], requires_grad=True)
y = x ** 2
y.backward(torch.tensor([1.0, 1.0, 1.0]))
print(x.grad)  # 输出:tensor([2., 4., 6.])

如果我们将输出转换为标量(例如通过求和),则可以直接调用backward()

x = torch.tensor([1.0, 2.0, 3.0], requires_grad=True)
y = x ** 2
loss = y.sum()
loss.backward()
print(x.grad)  # 输出:tensor([2., 4., 6.])

3. 梯度上下文控制

在某些情况下,我们可能不需要计算梯度,或者希望控制梯度的计算过程。PyTorch提供了几种方式来控制梯度计算的上下文。

3.1 禁用梯度计算

使用torch.no_grad()上下文管理器可以临时禁用梯度计算。

x = torch.tensor(1.0, requires_grad=True)
with torch.no_grad():y = x ** 2
print(y.requires_grad)  # 输出:False

3.2 累计梯度

默认情况下,多次调用backward()会累计梯度。如果需要清零梯度,可以使用x.grad.zero_()

x = torch.tensor([1.0, 2.0, 3.0], requires_grad=True)
for i in range(3):y = x ** 2loss = y.sum()if x.grad is not None:x.grad.zero_()loss.backward()print(x.grad)
# 输出:tensor([2., 4., 6.])tensor([2., 4., 6.])tensor([2., 4., 6.])

4. 梯度下降实战

4.1 求函数最小值

通过梯度下降法,我们可以找到函数的最小值。以下是一个简单的例子,通过梯度下降法找到函数y = x^2的最小值。

x = torch.tensor([3.0], requires_grad=True)
lr = 0.1
epochs = 50
for epoch in range(epochs):y = x ** 2if x.grad is not None:x.grad.zero_()y.backward()with torch.no_grad():x -= lr * x.gradprint(f'Epoch {epoch}, x: {x.item()}, y: {y.item()}')

4.2 线性回归参数求解

我们还可以通过梯度下降法求解线性回归模型的参数。以下是一个简单的线性回归模型,通过梯度下降法求解参数ab

x = torch.tensor([1, 2, 3, 4, 5], dtype=torch.float)
y = torch.tensor([3, 5, 7, 9, 11], dtype=torch.float)
a = torch.tensor([1.0], requires_grad=True)
b = torch.tensor([1.0], requires_grad=True)
lr = 0.01
epochs = 1000
for epoch in range(epochs):y_pred = a * x + bloss = ((y_pred - y) ** 2).mean()if a.grad is not None and b.grad is not None:a.grad.zero_()b.grad.zero_()loss.backward()with torch.no_grad():a -= lr * a.gradb -= lr * b.gradif (epoch + 1) % 100 == 0:print(f'Epoch {epoch + 1}, Loss: {loss.item()}')
print(f'a: {a.item()}, b: {b.item()}')

5. 总结

通过这篇文章,我们学习了PyTorch的自动微分机制,包括:

  • 如何构建计算图。

  • 如何计算标量和向量的梯度。

  • 如何控制梯度计算的上下文。

  • 如何通过梯度下降法求解函数最小值和线性回归模型的参数。

自动微分是深度学习的核心技术之一,希望这篇文章能帮助你更好地理解和使用PyTorch的自动微分功能。

http://www.dtcms.com/a/471692.html

相关文章:

  • Ubuntu 22.04 安装 AppImage
  • 电商网站开发流程图百度有刷排名软件
  • 昆明百度搜索排名优化如何做网站的优化
  • 业主验证超时问题解决方案
  • 新乡网站开发的公司电话亚马逊图书官网
  • 贵州省建设局八大员报名网站管理咨询行业
  • [GazeTracking] 摄像头交互与显示 | OpenCV
  • 车载互联系统网站建设佛山网站建设哪里有
  • 红酒营销 网站建设南京短视频制作公司
  • 同一域名可以做相同网站吗建设银行广安官方网站
  • 泽成seo网站排名只做二手奢侈品的网站
  • 监测网站空白栏目网页设计论文提纲
  • 怎么制作网站来赚钱投广告哪个平台好
  • app应用网站单页模板不想花钱怎么做网站
  • phpcms资讯类网站模板建立网站需要什么手续
  • 关于协会网站建设的意见计算机网络技术网站开发与设计
  • PWN环境配置
  • 怎样做pdf电子书下载网站个性化网站有哪些
  • 电商网站在线支付怎么做巨鹿做网站哪家好
  • 网站制作五个界面上海装修公司口碑哪家好
  • 江西省新的建设厅三类人员网站企业网站源码 vue
  • gta5手机网站大全手工制作大全图片教程
  • 微信公众号做电影网站公司注册如何网上核名
  • 鞍山做网站专业公司网站建设公司哪个好
  • 为什么电脑打开那个做网站都是那一个北京公司名称
  • 【完整源码+数据集+部署教程】 肺结节图像分割系统源码&数据集分享 [yolov8-seg-LAWDS等50+全套改进创新点发刊_一键训练教程_Web前端展示
  • LangChain4j集成SpringBoot接入百炼大模型(Qwen)
  • 网站手机版管理链接天津外贸网站建设公司
  • 校园局域网站建设费用Pc端做社区网站用什么框架
  • 图片渐隐 网站头部flash公司企业展厅设计公司