当前位置: 首页 > news >正文

服务器/Pytorch——对于只调用一次的函数初始化,放在for训练外面和里面的差异

🧩 一、两种写法的差别

位置写法模型加载频率显存占用启动耗时适合场景
for 之前模型在整个测试流程中只初始化一次1 次稳定且持续占用较高显存(仅初始化一次)适合连续推理多个序列
⚠️ for 内部每个序列都重新加载一次模型每个序列 重复加载与释放显存频繁波动(加载→释放)慢很多适合想隔离显存、逐个序列独立推理的场景

🚀 二、显存分析

假设你使用的是类似 LLaVA-7B 或 Qwen2.5-VL 这样的多模态大模型:

  • 模型参数大小约 14~26GB(fp16)

  • 一次加载后,GPU 显存会被持续占用大约 16~24GB

  • 如果每个序列都重新加载模型(放在 for 内部):

    • 每次循环都要重新从磁盘加载 checkpoint(极慢,几十秒)
    • 显存会在加载阶段暴涨,再在释放时回落
    • 很容易出现 “CUDA out of memory” 或碎片化导致显存不够的问题

所以:

⚠️ 放在 for 内部会显著增加显存碎片化风险,尤其是长时间批量测试时。


🧠 三、建议做法

正确推荐方案:

# ✅ 模型只加载一次
model_mllm, processor_mllm = init_mllm(MODEL_PATH_mllm)for sequence in sequences:# 在不同序列间循环推理...

这种方式虽然每次都会重新加载模型(耗时明显增加),
但能确保每次推理后显存被释放,适合显存只有 24GB 或更小的 GPU。


⚖️ 四、总结对比

放在位置显存占用速度稳定性推荐程度
for 外部(一次加载)高(持续)✅ 快✅ 稳定⭐⭐⭐⭐(推荐)
for 内部(多次加载)波动大❌ 慢⚠️ 容易OOM或碎片化⭐(仅低显存下可考虑)

最终建议:

对于你这类结构(多序列测试、多帧视频输入),
模型应当在 for sequence in sequences: 之前初始化一次
并在全部推理完成后统一释放。
除非你的 GPU 显存小于模型权重大小,否则不要在循环中重复加载。

http://www.dtcms.com/a/507861.html

相关文章:

  • iOS 混淆与 IPA 加固一页式行动手册(多工具组合实战 源码成品运维闭环)
  • PySide6 使用搜索引擎搜索 多类实现 更新1次
  • 宁波网站优化的关键企业网站后台管理系统模板
  • 网站开发项目需求分析说明书电子商务网站开发与实现
  • 群晖实现证书90天自动更新(无需对外提供80端口)
  • AMCL自适应(KLD - Sampling: Adaptive Particle Filters)一种基于粒子滤波的移动机器人定位算法
  • NOR FLASH
  • 网站代码优化方案网站建设和编程的区别
  • 重庆建设工程造价管理协会网站直播网站开发价格
  • 【Nest】集成测试
  • ELK运维之路(Logstash基础使用-7.17.24)
  • 快速排序(JAVA详细讲解快速排序的四种方式)
  • 数据结构四大简单排序算法详解:直接插入排序、选择排序、基数排序和冒泡排序
  • 官渡网站建设wordpress单页面制作
  • 企业电子商务网站开发数据库设计昆明seo博客
  • 东道 网站建设erp系统哪家做得好
  • 现代 Web 开发中检测用户离开页面的完整方案(附 Vue 实现)
  • [crackme]029-figugegl.1
  • 网站建站分辨率腾讯企点怎么注册
  • 第四章:L2CAP 的“数据语言”——揭秘蓝牙通信的报文格式
  • 【代码随想录算法训练营——Day43(Day42周日休息)】动态规划——300.最长递增子序列、674.最长连续递增序列、718.最长重复子数组
  • block的样式有哪些?如果copy的话分别会有啥样式
  • 如何做网络投票网站大数据开发工程师
  • 提示词 prompt 快速上手
  • 网站降权查询工具lnmp中安装wordpress
  • 一个空间放两个网站蓟门桥网站建设
  • DPC和DPC-KNN算法
  • git中tag标签远程管理
  • Babylon.js UtilityLayerRenderer 深度解析:创建3D工具与调试层的完整指南
  • 如何制造一个网站网站的图片怎么更换