【NVIDIA B200】2.all_reduce_perf NVIDIA B200 8-GPU 系统 All-Reduce 性能深度解析
目录
一、测试环境与方法论
二、性能指标体系与测试结果
2.1 核心性能指标定义
2.2 完整性能数据表格
三、性能特征深度分析
3.1 延迟主导阶段(<4KB)
3.2 带宽增长阶段(4KB-4MB)
3.3 饱和带宽阶段(>4MB)
原数据:
# nvidia-smi
Wed Sep 3 05:08:14 2025
+-----------------------------------------------------------------------------------------+
| NVIDIA-SMI 570.124.06 Driver Version: 570.124.06 CUDA Version: 12.8 |
|-----------------------------------------+------------------------+----------------------+
| GPU Name Persistence-M | Bus-Id Disp.A | Volatile Uncorr. ECC |
| Fan Temp Perf Pwr:Usage/Cap | Memory-Usage | GPU-Util Compute M. |
| | | MIG M. |
|=========================================+========================+======================|
| 0 NVIDIA B200