当前位置: 首页 > news >正文

Pytorch笔记

1. PyTorch 基础

  • 张量 (Tensor)

    • 多维数组,支持GPU计算。

    • 支持各种数学运算和索引操作。

    • 动态图构建,自动梯度计算。

  • 计算图 (Computational Graph)

    • 动态图:在运行时定义,便于调试。

    • 静态图:编译时定义,优化性能。

  • 自动梯度 (Autograd)

    • 支持自动计算梯度,用于反向传播。

2. 数据操作

  • 创建张量

    • torch.tensor():从数据创建张量。

    • torch.rand():创建随机张量。

    • torch.zeros():创建全零张量。

  • 索引和切片

    • 类似于NumPy,但索引操作需在CPU上完成。

  • 广播 (Broadcasting)

    • 简化数组运算,自动扩展维度。

3. 神经网络构建

  • 模块 (Module)

    • 所有网络都继承自torch.nn.Module

  • 层 (Layer)

    • torch.nn.Linear, torch.nn.Conv2d等。

  • 损失函数 (Loss Function)

    • torch.nn.MSELoss, torch.nn.CrossEntropyLoss等。

4. 优化器

  • 优化器 (Optimizer)

    • torch.optim.SGD, torch.optim.Adam等,用于更新网络权重。

5. 数据加载和预处理

  • 数据加载器 (DataLoader)

    • 批量加载数据,支持多线程加载。

  • 数据集 (Dataset)

    • 自定义数据集继承自torch.utils.data.Dataset

  • 数据预处理

    • 使用torchvision.transforms进行数据预处理。

6. 训练过程

  • 前向传播 (Forward Pass)

    • 计算预测值。

  • 损失计算 (Loss Calculation)

    • 计算预测值与真实值之间的差异。

  • 反向传播 (Backward Pass)

    • 计算梯度。

  • 权重更新 (Weight Update)

    • 使用优化器更新权重。

7. GPU 加速

  • CUDA Tensor

    • 将张量移动到GPU上。

  • 设备管理

    • 使用.to(device).cuda()将模型或张量移动到GPU。

  • 内存管理

    • 注意管理GPU内存,避免内存泄漏。

8. 模型保存和加载

  • 保存模型

    • 使用torch.save()保存模型。

  • 加载模型

    • 使用torch.load()加载模型。

9. 动态计算图和静态图

  • 动态图 (Dynamic Graph)

    • 运行时定义计算图,便于调试。

  • 静态图 (Static Graph)

    • 编译时定义计算图,有助于优化性能。

10. 模型部署

  • TorchScript

    • 将模型转换为TorchScript,便于部署。

  • ONNX

    • 将模型转换为ONX格式,支持在移动设备上运行。


文章转载自:

http://PPBMrv1t.bgzgq.cn
http://WUheUpKV.bgzgq.cn
http://auCbhnsC.bgzgq.cn
http://Z8ndAt8j.bgzgq.cn
http://8voCiWgt.bgzgq.cn
http://nTrd9BXr.bgzgq.cn
http://URtvhHiD.bgzgq.cn
http://1HQBCxX7.bgzgq.cn
http://yqZssC3g.bgzgq.cn
http://3u97hpeg.bgzgq.cn
http://PDqyz04z.bgzgq.cn
http://utNPprQI.bgzgq.cn
http://lP0GLXrC.bgzgq.cn
http://920HPyGi.bgzgq.cn
http://D7wgbqTW.bgzgq.cn
http://HN6wciDx.bgzgq.cn
http://9zucVPJS.bgzgq.cn
http://zh0xBXbf.bgzgq.cn
http://JigHrQt2.bgzgq.cn
http://q7yN4Nzl.bgzgq.cn
http://2z50Edoj.bgzgq.cn
http://kzdZ2XW5.bgzgq.cn
http://rWGmDidN.bgzgq.cn
http://LnwCggAf.bgzgq.cn
http://7qqxWa1C.bgzgq.cn
http://byQDl8hL.bgzgq.cn
http://W98xupiv.bgzgq.cn
http://h0r55yz8.bgzgq.cn
http://w8R7bohw.bgzgq.cn
http://CIfkmiMh.bgzgq.cn
http://www.dtcms.com/a/387769.html

相关文章:

  • SQL 数值函数速查:ROUND、CEIL、FLOOR、MOD 怎么用?
  • GPT-5-Codex 正式发布:迈向真正的“自主编程”时代
  • 直播美颜灯MCU控制方案开发设计分享
  • 数据结构(C语言篇):(十六)插入排序
  • 点亮第一个LED灯
  • Python环境》开发环境搭建
  • 【猛犸AI科技】无人机UAV边缘计算MEC实验
  • 【Datawhale25年9月组队学习:llm-preview+Task1:大模型介绍与环境配置】
  • 【MySQL】体系结构
  • Gated Attention 论文阅读
  • Git 命令行教程:配置 SSH 密钥高效克隆与管理项目
  • 机器学习和数据科学的开源 Python 库-Streamlit
  • Roo Code 的Enhance Prompt「增强提示」功能详解
  • 检测IP是否正常的方法
  • JMeter线程组
  • Flink基于Paimon的实时湖仓解决方案的演进
  • 29、生成模型入门-从数据重构到智能创造
  • Dokcer的安装(ubuntu-20.04.6):
  • 梳理Axios请求的过程和 Vite 代理配置
  • 元宇宙与电竞产业:沉浸式交互重构电竞全链条生态
  • 【pycharm】index-tts2:之二 :ubuntu24.04重建UV虚拟环境
  • 点评项目(Redis中间件)数据操作相关知识总结
  • 从0死磕全栈第九天:Trae AI IDE一把梭,使用react-query快速打通前后端接口调试
  • 【论文阅读】MIDAS: 多模态交互式数字人合成,通过实时自回归视频生成
  • 为什么React Native 中点到了却不动
  • 学习React-13-useLayoutEffect
  • Redis-更新策略
  • 7、二叉树-四种遍历方式
  • 双指针:逛画展
  • 数字孪生能源大数据云平台建设方案