当前位置: 首页 > news >正文

3B模型大概占多少存储

3B模型下大概占多少存储

  • 模型参数总量:3 × 10⁹ 个参数

  • 单位换算

    • 1 KB = 10³ 字节
    • 1 MB = 10⁶ 字节
    • 1 GB = 10⁹ 字节

下面将分别针对 FP32、FP16、INT8、INT4 四种精度,展示每个参数占用的字节数、计算公式,以及最终得到的磁盘占用。

1. FP32(单精度浮点)

  • 每参数字节数:4 字节
  • 参数总数:3 × 10⁹
计算步骤
  1. 先计算所有参数占用的总字节数:

    3 × 10⁹(参数) × 4(字节/参数) = 12 × 10⁹ 字节
    
  2. 将字节数转换为 GB:

    12 × 10⁹ 字节 ÷ (10⁹ 字节/GB) = 12 GB
    

结论:FP32 权重文件约 12 GB

2. FP16(半精度浮点)

  • 每参数字节数:2 字节
  • 参数总数:3 × 10⁹
计算步骤
  1. 计算总字节数:

    3 × 10⁹(参数) × 2(字节/参数) = 6 × 10⁹ 字节
    
  2. 转换为 GB:

    6 × 10⁹ 字节 ÷ (10⁹ 字节/GB) = 6 GB
    

结论:FP16 权重文件约 6 GB

3. INT8(8 位整数量化)

  • 每参数字节数:1 字节
  • 参数总数:3 × 10⁹
计算步骤
  1. 计算总字节数:

    3 × 10⁹(参数) × 1(字节/参数) = 3 × 10⁹ 字节
    
  2. 转换为 GB:

    3 × 10⁹ 字节 ÷ (10⁹ 字节/GB) = 3 GB
    

结论:INT8 权重文件约 3 GB

4. INT4(4 位整数量化)

  • 每参数字节数:0.5 字节

    • 4 位 = ½ 个字节
  • 参数总数:3 × 10⁹

计算步骤
  1. 计算总字节数:

    3 × 10⁹(参数) × 0.5(字节/参数) = 1.5 × 10⁹ 字节
    
  2. 转换为 GB:

    1.5 × 10⁹ 字节 ÷ (10⁹ 字节/GB) = 1.5 GB
    

结论:INT4 权重文件约 1.5 GB

汇总表格

精度类型每参数占用计算公式总字节数转换后大小说明
FP324 字节3 × 10⁹ × 4 = 12 × 10⁹ 字节12 × 10⁹ 字节12 GB单精度浮点,训练常用
FP162 字节3 × 10⁹ × 2 = 6 × 10⁹ 字节6 × 10⁹ 字节6 GB半精度浮点,推理常用
INT81 字节3 × 10⁹ × 1 = 3 × 10⁹ 字节3 × 10⁹ 字节3 GB8 位量化,适合边缘设备
INT40.5 字节3 × 10⁹ × 0.5 = 1.5 × 10⁹ 字节1.5 × 10⁹ 字节1.5 GB4 位量化,存储最小,但可能精度损失更大

说明:上表仅计算了模型权重文件的大小,不包含配置文件(config.json)、分词器文件(tokenizer.jsonvocab.txt 等)和可能存在的拆分索引文件。实际下载的文件夹会略大(通常额外增加几百 MB)。

总结

  • FP32(4 字节/参数):约 12 GB,适合训练阶段使用。
  • FP16(2 字节/参数):约 6 GB,兼顾精度与推理效率。
  • INT8(1 字节/参数):约 3 GB,适合资源受限的部署场景。
  • INT4(0.5 字节/参数):约 1.5 GB,存储需求最小,但相对更容易影响模型性能。

以 LLaMA 3.2 3B 模型为例,其在不同精度下的显存需求如下

精度类型显存需求(约)
FP166.5 GB
FP83.2 GB
INT41.75 GB

相关文章:

  • 结构体和指针1
  • python学习打卡day45
  • jmeter之导出接口
  • Java建造者模式(Builder Pattern)详解与实践
  • C#学习第28天:内存缓存和对象池化
  • 给网站添加live2d看板娘
  • 终极数据结构详解:从理论到实践
  • 我用AI降低AI率:一次“用魔法打败魔法”的实验
  • 装载机防撞系统:智能守护,筑牢作业现场人员安全防线
  • unity Addressable的基本使用
  • 今日行情明日机会——20250606
  • 5.3 Spring Boot整合JPA
  • 手机如何防止ip关联?3种低成本方案
  • 淘酒屋(香港)控股公司副总裁郭钢出席2025西班牙葡萄酒行业论坛
  • 从混乱到秩序:探索管理系统如何彻底改变工作流程
  • 区块链技术相关
  • Three.js中AR实现详解并详细介绍基于图像标记模式AR生成的详细步骤
  • 二叉树基础全解:存储方式、遍历原理与查找树对比
  • MySQL用户和授权
  • Verilog编程技巧01——如何编写三段式状态机
  • 新网站域名备案流程/图片外链
  • 做新媒体每天必看的网站/专门搜索知乎内容的搜索引擎
  • 佛山专业的网站建设公司/百度网络营销中心app
  • 个人网站类型/推广app的单子都在哪里接的
  • 软件开发外包公司靠谱吗/肇庆seo按天计费
  • 长沙网站设计公司怎么样/河南靠谱seo电话