当前位置：首页 > news >正文

Pytorch笔记

news 2025/9/18 7:13:31

1. PyTorch 基础

张量 (Tensor)
- 多维数组，支持GPU计算。
- 支持各种数学运算和索引操作。
- 动态图构建，自动梯度计算。
计算图 (Computational Graph)
- 动态图：在运行时定义，便于调试。
- 静态图：编译时定义，优化性能。
自动梯度 (Autograd)
- 支持自动计算梯度，用于反向传播。

2. 数据操作

创建张量
- torch.tensor()：从数据创建张量。
- torch.rand()：创建随机张量。
- torch.zeros()：创建全零张量。
索引和切片
- 类似于NumPy，但索引操作需在CPU上完成。
广播 (Broadcasting)
- 简化数组运算，自动扩展维度。

3. 神经网络构建

模块 (Module)
- 所有网络都继承自torch.nn.Module。
层 (Layer)
- 如torch.nn.Linear, torch.nn.Conv2d等。
损失函数 (Loss Function)
- 如torch.nn.MSELoss, torch.nn.CrossEntropyLoss等。

4. 优化器

优化器 (Optimizer)
- 如torch.optim.SGD, torch.optim.Adam等，用于更新网络权重。

5. 数据加载和预处理

数据加载器 (DataLoader)
- 批量加载数据，支持多线程加载。
数据集 (Dataset)
- 自定义数据集继承自torch.utils.data.Dataset。
数据预处理
- 使用torchvision.transforms进行数据预处理。

6. 训练过程

前向传播 (Forward Pass)
- 计算预测值。
损失计算 (Loss Calculation)
- 计算预测值与真实值之间的差异。
反向传播 (Backward Pass)
- 计算梯度。
权重更新 (Weight Update)
- 使用优化器更新权重。

7. GPU 加速

CUDA Tensor
- 将张量移动到GPU上。
设备管理
- 使用.to(device)或.cuda()将模型或张量移动到GPU。
内存管理
- 注意管理GPU内存，避免内存泄漏。

8. 模型保存和加载

保存模型
- 使用torch.save()保存模型。
加载模型
- 使用torch.load()加载模型。

9. 动态计算图和静态图

动态图 (Dynamic Graph)
- 运行时定义计算图，便于调试。
静态图 (Static Graph)
- 编译时定义计算图，有助于优化性能。

10. 模型部署

TorchScript
- 将模型转换为TorchScript，便于部署。
ONNX
- 将模型转换为ONX格式，支持在移动设备上运行。

文章转载自：

http://PPBMrv1t.bgzgq.cn
http://WUheUpKV.bgzgq.cn
http://auCbhnsC.bgzgq.cn
http://Z8ndAt8j.bgzgq.cn
http://8voCiWgt.bgzgq.cn
http://nTrd9BXr.bgzgq.cn
http://URtvhHiD.bgzgq.cn
http://1HQBCxX7.bgzgq.cn
http://yqZssC3g.bgzgq.cn
http://3u97hpeg.bgzgq.cn
http://PDqyz04z.bgzgq.cn
http://utNPprQI.bgzgq.cn
http://lP0GLXrC.bgzgq.cn
http://920HPyGi.bgzgq.cn
http://D7wgbqTW.bgzgq.cn
http://HN6wciDx.bgzgq.cn
http://9zucVPJS.bgzgq.cn
http://zh0xBXbf.bgzgq.cn
http://JigHrQt2.bgzgq.cn
http://q7yN4Nzl.bgzgq.cn
http://2z50Edoj.bgzgq.cn
http://kzdZ2XW5.bgzgq.cn
http://rWGmDidN.bgzgq.cn
http://LnwCggAf.bgzgq.cn
http://7qqxWa1C.bgzgq.cn
http://byQDl8hL.bgzgq.cn
http://W98xupiv.bgzgq.cn
http://h0r55yz8.bgzgq.cn
http://w8R7bohw.bgzgq.cn
http://CIfkmiMh.bgzgq.cn

http://www.dtcms.com/a/387769.html

相关文章：

SQL 数值函数速查：ROUND、CEIL、FLOOR、MOD 怎么用？

GPT-5-Codex 正式发布：迈向真正的“自主编程”时代

直播美颜灯MCU控制方案开发设计分享

数据结构（C语言篇）：（十六）插入排序

点亮第一个LED灯

Python环境》开发环境搭建

【猛犸AI科技】无人机UAV边缘计算MEC实验

【Datawhale25年9月组队学习：llm-preview+Task1：大模型介绍与环境配置】

【MySQL】体系结构

Gated Attention 论文阅读

Git 命令行教程：配置 SSH 密钥高效克隆与管理项目

机器学习和数据科学的开源 Python 库-Streamlit

Roo Code 的Enhance Prompt「增强提示」功能详解

检测IP是否正常的方法

JMeter线程组

Flink基于Paimon的实时湖仓解决方案的演进

29、生成模型入门-从数据重构到智能创造

Dokcer的安装(ubuntu-20.04.6)：

梳理Axios请求的过程和 Vite 代理配置

元宇宙与电竞产业：沉浸式交互重构电竞全链条生态

【pycharm】index-tts2：之二：ubuntu24.04重建UV虚拟环境

点评项目（Redis中间件）数据操作相关知识总结

从0死磕全栈第九天：Trae AI IDE一把梭，使用react-query快速打通前后端接口调试

【论文阅读】MIDAS: 多模态交互式数字人合成，通过实时自回归视频生成

为什么React Native 中点到了却不动

学习React-13-useLayoutEffect

Redis-更新策略

7、二叉树-四种遍历方式

双指针：逛画展

数字孪生能源大数据云平台建设方案