当前位置: 首页 > news >正文

Day34打卡 @浙大疏锦行

知识点回归:

  1. CPU性能的查看:看架构代际、核心数、线程数
  2. GPU性能的查看:看显存、看级别、看架构代际
  3. GPU训练的方法:数据和模型移动到GPU device上
  4. 类的call方法:为什么定义前向传播时可以直接写作self.fc1(x)

作业

 

  1. 计算资源分配与调度:虽然losses.append(loss.item()) 是同步操作,但 GPU 和 CPU 之间的资源分配与调度并非简单线性。每次记录操作时,系统可能会根据当前整体负载、其他进程占用资源情况等动态调整资源分配。比如,即使记录次数减少,如果此时系统中其他任务占用了 CPU 或 GPU 资源,也会影响计算时长,导致剩余时长不按记录次数成比例变化。
  2. 硬件特性与缓存机制:硬件层面的缓存机制会影响计算速度。当记录间隔不同时,数据在缓存中的命中情况会变化。记录间隔小,数据频繁访问,可能存在缓存未及时更新或频繁失效的情况;记录间隔大,数据访问间隔长,缓存可能在较长时间内保持有效。这些都会对实际计算时间产生影响,破坏记录次数和剩余时长的线性关系。
  3. 计算任务的复杂性与动态性:深度学习训练中的计算任务并非完全均一。不同的记录间隔下,每次计算涉及的数据量、计算图的构建与执行等可能存在差异。比如,间隔小的时候,每次计算的数据可能存在更多中间依赖,计算图更复杂,即使记录次数多,也不一定能简单按比例反映在剩余时长上。

@浙大疏锦行

相关文章:

  • 【C/C++】胜者树与败者树:多路归并排序的利器
  • 【实证分析】地市金融科技指数测算数据集-含代码及文献(2011-2024年)
  • @Configuration 与 @Component 的区别
  • 数字孪生和3D可视化有什么区别?一文解析核心差异
  • 5.24 note
  • C++ 日志系统实战第六步:性能测试
  • 安全生态与职业跃迁
  • 数学建模day01
  • 20200201工作笔记常用命令要整理
  • 45道工程模块化高频题整理(附答案背诵版)
  • 讯联文库开发日志(五)登录拦截校验
  • Redis从入门到实战 - 原理篇
  • ajax中get和post的区别,datatype返回的数据类型有哪些?
  • OpenEuler-Apache服务原理
  • 汽车充电桩专用ASCP210系列电气防火限流式保护器
  • 向量数据库该如何选择?Milvus 、ES、OpenSearch 快速对比:向量搜索能力与智能检索引擎的应用前景
  • 基于Java的话剧购票小程序【附源码】
  • 怎么判断一个Android APP使用了taro 这个跨端框架
  • 华为OD机试_2025 B卷_爱吃蟠桃的孙悟空(Python,100分)(附详细解题思路)
  • 【PalladiumZ2 使用专栏 3 -- 信号值的获取与设置 及 memory dump 与 memory load】
  • 做网站维护前景/现在做推广的新渠道有哪些
  • 中国十大电商公司/怎么关闭seo综合查询
  • 宁波网站推广制作公司/免费seo推广计划
  • 跨境出口电商网站/seo分析seo诊断
  • 专题学习网站开发流程/网络营销和传统营销的关系
  • 网页设计与网站建设在线考试/自己做网站建设