当前位置：首页 > news >正文

机器学习中为什么要用混合精度训练

news 来源：原创 2025/6/28 11:00:25

FP16与显存占用关系

显存（Video RAM，简称 VRAM）是显卡（GPU）专用的内存。

FP32（单精度浮点）：传统深度学习默认使用32位浮点数

每个参数占用`4字节`例如：1亿参数的模型 → 约400MB显存

FP16（半精度浮点）：

每个参数占用`2字节`（直接减半）相同模型 → 约200MB显存

双精度浮点（FP64）占 8字节。
EEE 754标准：FP64遵循该国际标准，用 64位（8字节）存储一个浮点数

混合精度方案的解决方式：

关键部分保留FP32：模型权重在优化时会保留FP32副本（主权重）损失计算使用FP32非关键部分使用FP16：前向传播的中间激活值反向传播的梯度

2025暑期学习计划参考

【C语言】知识总结·指针篇

TCP/IP协议简要概述

【Pandas】pandas DataFrame last_valid_index

PHP语法基础篇(六)：数组

ROS：录制相机、IMU、GNSS等设备数据

gemini-cli 踩坑实录

vue a-table自定义表头颜色+合并表格