当前位置: 首页 > news >正文

模型参数、模型存储精度、参数与显存

模型参数量衡量单位

M:百万(Million)

B:十亿(Billion)

1 B = 1000 M 1B = 1000M 1B=1000M

参数存储精度

模型参数是固定的,但是一个参数所表示多少字节不一定,需要看这个参数以什么样的精度去存储。

  1. 单精度浮点数(FP32):每个参数占用4字节(32位),提供较高的数值精度。
  2. 半精度浮点数(FP16):每个参数占用2字节(16位),可以节省存储空间和计算资源,但精度有所降低。
  3. 8位整数(INT8):每个参数占用1字节(8位),主要用于量化模型,进一步减少存储和计算开销,但精度显著降低。
  4. 双精度浮点数(FP64):每个参数占用8字节(64位),提供最高精度,但存储和计算成本也最高。

参数所占显存

参数显存 = 参数数量 × 每个参数的字节数(B)

这里的 B 指的是字节

总显存 = 参数显存 + 激活值显存 + 梯度显存 + 优化器状态显存

在使用 checkpoint 进行推理的时候,主要计算参数显存。

举例:

一个 7b 参数的模型,参数存储精度为 float16,那么:

  • 总参数个数: 7 ∗ 10 9 7 * 10^9 7109
  • 一个参数所占字节数: 16 / 8 = 2 ( B ) 16 / 8 = 2(B) 16/8=2(B)
  • 参数所占总字节数,即参数显存 7 ∗ 10 9 ∗ 2 = 14 ∗ 10 9 ( B ) = 14 ∗ 10 9 / 1024 / 1024 / 1024 ≈ 14 ( G ) 7 * 10^9 * 2 = 14*10^9(B)= 14*10^9 / 1024 / 1024 / 1024 ≈ 14(G) 71092=14109(B)=14109/1024/1024/102414(G)

简单来看,如果是float16,参数显存就是 参数量*2;如果是 float32,参数显存就是 参数量*4;如果是int8,参数显存就是 参数量*1

相关文章:

  • python46
  • Code Composer Studio快捷键
  • 101.为AI知识问答寻找朗读合适API
  • 5G+边缘计算推动下的商品详情API低延迟高效率新方案
  • 第十一章 通用定时器(上篇)
  • 工业安全零事故的智能守护者:一体化AI智能安防平台
  • DSP——时钟树讲解
  • qt3d自定义生成mesh图形
  • AISHELL-5 全球首套智能驾舱中文语音交互数据集开源
  • 看板会议如何高效进行
  • 编程的本质难点:超越技术层面的五大核心障碍-优雅草卓伊凡
  • 一个n8n构建的能和LLM对话的Agent
  • Cesium1.95中高性能加载1500个点
  • Llama 4开源项目多维分析研究
  • 深入浅出Asp.Net Core MVC应用开发系列-AspNetCore中的日志记录
  • 供应链管理-物流:自动驾驶分为几个级别/L0无自动化/L1驾驶辅助/L2部分自动化/L3有条件自动化/L4高度自动化/L5完全自动化
  • Mybatis逆向工程,动态创建实体类、条件扩展类、Mapper接口、Mapper.xml映射文件
  • XML Group端口详解
  • CANopen转Modbus TCP转换器助生产线智能化升级
  • Numpy7——数学2(矩阵基础,线性方程基础)
  • 怎么在vk网站上做推广/重庆森林在线观看
  • 代刷网站只做软件吗/网站优化名词解释
  • 徐州网站制作需要多少钱/百度链接提交收录入口
  • 苏州市城市建设局网站/公司网站建设公司
  • 怎么网站建设公司/网站链接分析工具
  • wordpress网站响应速度插件/游戏推广文案