当前位置：首页 > news >正文

模型参数、模型存储精度、参数与显存

news 2025/9/23 19:04:53

模型参数量衡量单位

M：百万（Million）

B：十亿（Billion）

$1 B = 1000 M$

参数存储精度

模型参数是固定的，但是一个参数所表示多少字节不一定，需要看这个参数以什么样的精度去存储。

单精度浮点数（FP32）：每个参数占用4字节（32位），提供较高的数值精度。
半精度浮点数（FP16）：每个参数占用2字节（16位），可以节省存储空间和计算资源，但精度有所降低。
8位整数（INT8）：每个参数占用1字节（8位），主要用于量化模型，进一步减少存储和计算开销，但精度显著降低。
双精度浮点数（FP64）：每个参数占用8字节（64位），提供最高精度，但存储和计算成本也最高。

参数所占显存

参数显存 = 参数数量 × 每个参数的字节数(B)

这里的 B 指的是字节

总显存 = 参数显存 + 激活值显存 + 梯度显存 + 优化器状态显存

在使用 checkpoint 进行推理的时候，主要计算参数显存。

举例：

一个 7b 参数的模型，参数存储精度为 float16，那么：

总参数个数： $7 * 10^9$
一个参数所占字节数： $16/8 = 2 (B)$
参数所占总字节数，即参数显存： $7 * 10^9 * 2 = 14*10^9(B)= 14*10^9 / 1024 / 1024 / 1024 ≈ 14(G)$

简单来看，如果是float16，参数显存就是 参数量*2；如果是 float32，参数显存就是 参数量*4；如果是int8，参数显存就是 参数量*1。

查看全文

http://www.dtcms.com/a/242578.html

python46

Code Composer Studio快捷键

101.为AI知识问答寻找朗读合适API

5G+边缘计算推动下的商品详情API低延迟高效率新方案

第十一章通用定时器（上篇）

工业安全零事故的智能守护者：一体化AI智能安防平台

DSP——时钟树讲解

qt3d自定义生成mesh图形

AISHELL-5 全球首套智能驾舱中文语音交互数据集开源

看板会议如何高效进行

编程的本质难点：超越技术层面的五大核心障碍-优雅草卓伊凡

一个n8n构建的能和LLM对话的Agent

Cesium1.95中高性能加载1500个点

Llama 4开源项目多维分析研究

深入浅出Asp.Net Core MVC应用开发系列-AspNetCore中的日志记录

供应链管理-物流：自动驾驶分为几个级别/L0无自动化/L1驾驶辅助/L2部分自动化/L3有条件自动化/L4高度自动化/L5完全自动化

Mybatis逆向工程，动态创建实体类、条件扩展类、Mapper接口、Mapper.xml映射文件

XML Group端口详解

CANopen转Modbus TCP转换器助生产线智能化升级

Numpy7——数学2（矩阵基础，线性方程基础）

图注意力卷积神经网络GAT在无线通信网络拓扑推理中的应用

龙蜥开发者说：我的龙蜥开源之旅 | 第 32 期

【在线五子棋对战】四、MySQL API 使用

代码训练LeetCode(27)接雨水

Leetcode 3572. Maximize Y‑Sum by Picking a Triplet of Distinct X‑Values

力扣热题100之二叉树的层序遍历

PostgreSQL 数据库技术峰会重庆站回顾｜IvorySQL 开源实践与社区生态

商业 |AI超级工厂：“AI+制造”的终极目标？

嵌入式学习之系统编程（十三）数据库

Python模拟滑块验证码轨迹的深度实践指南

模型参数量衡量单位

参数存储精度

参数所占显存

相关文章：