当前位置: 首页 > news >正文

Pytorch框架——自动微分和反向传播

一、自动微分概念

自动微分(Automatic Differentiation,AD)是一种利用计算机程序自动计算函数导数的技术,它是机器学习和优化算法中的核心工具(如神经网络的梯度下降),通过反向传播计算并更新梯度。

计算梯度的目的是更新权重w和b,\theta _{1}=\theta _{0}-lr*value,其中value是梯度值,学习率需要提前指定,求导计算梯度,前面我们学过了手动求导,这次使用自动微分的方法,来简化我们的工作量。

注意:

1. w和b一定是可自动微分的张量,类型是浮点型,超参数requries_grad=Ture表示允许自动微分。

2. detach():自动微分的张量不能转换成numpy数组, 通过 张量.detach().numpy() 剥离成不自动微分后可以转换。detach()返回一个与当前张量共享数据的新张量,该张量是不开启自动微分的,不参与梯度计算。

    clone():返回一个与当前张量数据相同的新张量,默认开启自动微分,但新张量拥有独立的存储。

3. 默认梯度是累加的,所以多轮中每个轮次需要在自动微分之前进行清零!!!

4. 查看张量底层数据地址时推荐使用 张量名.data_ptr() 

import torch# TODO 单轮
#定义权重,并开启自动微分
w = torch.tensor([10,20],requires_grad=Ture,dtype=torch.float)
#定义损失函数(loss,cost,criterion...)
loss = 2 * w**2
#自动微分求梯度,自动更新梯度
loss.sun().backward()
#手动更新权重
w.data = w.data - 0.01*w.grad# TODO 多轮
#定义权重,并开启自动微分
w = torch.tensor([10,20],requires_grad=Ture,dtype=torch.float)
#定义遍历轮次
epochs = 500
for epoch in range(epochs):loss = 2 * w**2# 默认梯度是累加的,所以每轮需要在自动微分之前进行清零if w.grad is not None:w.grad.zero_()loss.sum().backward()# 格式化输出print(f"当前轮次:{epoch + 1} 当前权重: {w.data},固定学习率:{0.01} 更新后梯度: {w.grad},下一个权重: {w.data - 0.01 * w.grad}")#手动更新权重w.data = w.data - 0.01*w.grad

推导w和b的方法:

import torch
x = torch.ones(2, 5)
y = torch.zeros(2, 3)
w = torch.randn(5, 3, requires_grad=True)
b = torch.randn(3, requires_grad=True)# 1.首先获取损失函数
loss_fn = torch.nn.MSELoss()
# 2.然后,计算预测值-> z=wx+b 注意: 这里面的wx是矩阵乘法,需要遵循 (n,m)*(m,p)=(n,p)
z = x.matmul(w) + b
# 3.接着,根据损失函数计算损失值
loss = loss_fn(z, y)
# 4.最后,反向传播推导更新梯度
loss.sum().backward()# 5.打印结果
print(f'w.grad: {w.grad}')
print(f'b.grad: {b.grad}')

二、 反向传播及案例

正向传播:从输入到输出,目的是预测结果和损失值;

反向传播:从输出到输入,更新参数做出优化。

案例:使用pytorch构建一个回归模型

步骤:

1.获取数据集,提前封装数据为张量

2.模型训练预测以及计算损失值

3.绘制损失曲线以及预测和真实值的拟合线

from sklearn.datasets import make_regression
import torch
from torch.utils.data import DataLoader, TensorDataset
from torch.nn import Linear, MSELoss
from torch.optim import SGD
import matplotlib.pyplot as plt
plt.rcParams['font.sans-serif'] = ['SimHei']
plt.rcParams['axes.unicode_minus'] = False# 1.获取数据集,提前封装成张量
def get_data():X,y,coef = make_regressionn(n_samples=100,n_features=1,n_targets=1,noise=10,random_state=1,coef=Ture,bias=14.5)X = torch.tensor(X,dtype=torch.float32)y = torch.tensor(y,dtype=torch.float32)return X,y,coef# 2.模型训练预测及损失值计算
def get_model_and_loss_list(x, y, epochs):# 2.1 处理数据封装为数据加载器,为了分批次训练,避免内存溢出dataloader = DataLoader(TensorDataset(x,y),batch_size = 5,shuffle=Ture)# 2.2 创建模型对象,为了模型预测model = Linear(in_features=1,out_features=1)# 2.3 创建损失函数对象,为了计算损失值loss_fn = MSELoss()# 2.4 创建SGD优化器对象,为了更新模型参数optimizer = SGD(model.parameters(),lr=0.03)# 2.5 模型训练预测和计算损失# 2.5.1 定义一个空列表,用于保存每轮损失值,再定义累加损失和批次,用于计算每轮的损失值loss_list,total_loss,batch_cnt = [],0.0,0# for循环,外循环轮次,内循环批次for epoch in range(epochs):for batch_x,batch_y in dataloader:# [重点] 正向传播# 计算预测值y_predict = model(batch_x)# 计算损失值,MSE计算要求形状必须一致,否则自动广播会出现无效计算loss = loss_fn(y_predict,batch_y.reshape(-1,1))# 累加损失和批次total_loss += loss.item()batch_cnt += 1# [重点] 反向传播# 梯度清零optimizer.zero_grad()# 梯度计算loss.backward()# 参数更新 step()底层是w1 = w0-lr*梯度optimizer.step()# TODO 内层循环结束,即一轮结束,可以计算每轮损失值,并保存到列表中epoch_loss = total_loss / batch_cntloss_list.append(epoch_loss)print(f"第{epoch + 1}轮,损失值为:{epoch_loss:.2f}")# TODO 外层循环结束,即所有轮次结束,可以返回模型和损失值列表# 打印模型参数字典print(f"模型参数:{model.state_dict()}")# print(f"模型权重:{model.weight}, 偏置:{model.bias}")# 返回结果return model, loss_list# 3.绘制损失曲线及预测和真实值拟合线
def plot_show(epochs, model, loss_list, x, y, coef):# todo 1.绘制每轮损失曲线plt.plot(range(epochs), loss_list)plt.xlabel('训练的轮数')plt.ylabel('该轮的平均损失')plt.title('损失变化曲线图')plt.grid()plt.show()#  todo 2.绘制预测和真实值拟合线plt.scatter(x, y)# 使用x的最小值,最大值生成1000个x值等差张量X = torch.linspace(x.min(), x.max(), 1000)# 细节:  numpy * 张量 -> 不可以     张量 * numpy -> 可以, 要么把v放到前面位置要么把coef转为张量y_pred = torch.tensor([v * model.weight + model.bias for v in X])y_true = torch.tensor([v * coef + 14.5 for v in X])plt.plot(X, y_pred, label='训练', color='red')plt.plot(X, y_true, label='真实', color='green')plt.legend()plt.grid()plt.show()if __name__ =='__main__':# 1.获取数据集,提前封装数据为张量x, y, coef = get_data()# 2.模型训练预测以及计算损失值epochs = 4000model, loss_list = get_model_and_loss_list(x, y, epochs)# 3.绘制损失曲线以及预测和真实值拟合线plot_show(epochs, model, loss_list, x, y, coef)

相关文章:

  • python类成员概要
  • ChatNT-用于DNA、RNA和蛋白质任务的多模态对话代理-文献精读143
  • Unity3D仿星露谷物语开发62之添加NPC角色
  • 嵌入式PADS中元件封装绘制与实现
  • 重复的囚徒困境博弈中应该如何决策?--阿克塞尔罗德竞赛(Axelrod‘s Tournament)实验
  • 数据结构与算法:贪心(一)
  • java中的类与对象
  • QGraphicsView
  • 使用Word2Vec实现中文文本分类
  • 【均价趋势副图指标】识别洗盘,拉升,最佳潜伏点,止盈防守跟踪操盘技术图文解说
  • Emacs定制:文件管理dired
  • 2025最新版!Windows Python3 超详细安装图文教程(支持 Python3 全版本)
  • 坚持做一件事情和好奇做一件事,本质区别和思考
  • 知识点|MVC模式(Model–view–controller)
  • 知识点|MTV模式(Model-template-view)
  • Day53打卡 @浙大疏锦行
  • 三维重建 —— 3. 单视几何
  • 为应对激烈竞争环境,IBMS系统如何提升企业管理效率
  • 深入讲解 Ollama 的源码
  • 快速幂算法详解:从暴力到优雅的数学优化
  • 做网站的服务器带宽一般多少/网站推广排名教程
  • 世纪佳缘网站开发公司/营销型高端网站建设
  • wordpress 判断标签/seo外链专员
  • 辽阳网站建设企业/市场营销毕业论文
  • wordpress积分内容/seo关键词排名优化是什么
  • 四川城乡与住房建设部网站/怎么弄属于自己的网站