当前位置: 首页 > news >正文

Python day39

@浙大疏锦行 python day39.

        图像数据介绍:区别于机器学习中的数据(特征1,特征2,,,),单个图像数据通常有三维,即(C,H,W)分别代表了通道数、高度以及宽度;而在大规模训练中通常会按照batch的形式训练,此时为四维(B,C,H,W);

        使用MLP神经网络时,就需要将上面的多维数据展平为一维数据(Flatten);

        使用batch训练的模式时,模型的定义并不需要修改,只需要在Dataloader中设置batch size大小即可,Pytorch会自动进行处理,每次从Dataloader中读取batch size大小的数据;

        显存可以看作GPU使用的内存,如果训练过程中显存不够,则会爆出OOT的错误;针对训练过程中占用的显存大致包括如下部分:模型的参数,梯度,优化器状态,输入的数据以及前向传播反向传播中的中见变量,如果不能选择合适的设置可能会导致无法训练;主要通过调整batch size的大小来调整显存的占用,通常合适的 batch_size = 硬件显存允许的最大值 × 0.8(预留安全空间);

        使用batch进行训练时,更新参数所用的梯度为batch内每个样本梯度的平均值,因此使用batch或者较大的batch训练的好处就是可以训练更稳定更迅速,但是相应的显存占用也会增多。

http://www.dtcms.com/a/322958.html

相关文章:

  • Web3: 用ERC-1400革新公司股权激励
  • 【原创】基于 Flask 的简单文件收集器
  • 【33】C#实战篇——点击按钮弹出指定路径对话框,选择指定类型文件;;;文件过滤器显示指定的一种文件,几种类型文件 同时显示
  • Pytest中实现自动生成测试用例脚本代码
  • 扩散LLM推理新范式:打破生成长度限制,实现动态自适应调节
  • 在ubuntu服务器下安装cuda和cudnn(笔记)
  • ImageJ 实用技巧:通过 Overlay 实现图像透明标记的完整教程
  • NTP /Chrony 网络时间协议
  • 当配置项只支持传入数字,即无法指定单位为rem,需要rem转px
  • 本地连接跳板机
  • 【Windows】成批复制某个特定的文件
  • 《算法导论》第 13 章 - 红黑树
  • 基于Dify实现对Excel的数据分析--动态配置图表
  • pytorch+tensorboard+可视化CNN
  • 物理AI与人形机器人:从实验室到产业化的关键跨越
  • 多线程和多进程编程中常见的性能瓶颈问题
  • C# 异步编程(使用异步Lambda表达式)
  • 专题二_滑动窗口_找到字符串中所有字母异位词
  • Arduino系列教程:点亮一个LED灯
  • 本地部署网络流量分析工具 ntopng 并实现外部访问( Windows 版本
  • C++高频知识点(十七)
  • 【lucene】HitsThresholdChecker命中阈值检测器
  • istio笔记03--快速上手多集群mesh
  • 本地WSL ubuntu部署whisper api服务
  • NVIDIA Jetson JetPack 全面解析:从硬件到定制镜像
  • 智能情趣设备、爆 bug:可被远程操控。。。
  • 目标检测数据集 - 无人机检测数据集下载「包含COCO、YOLO两种格式」
  • Python 中的 Mixin
  • 二十、MySQL-DQL-条件查询
  • 第八章:终极合体 —— 实现智能一键分组