当前位置: 首页 > news >正文

NCCL-TEST ib集群测试UCX代替方案

添加UCX变量

export OMPI_MCA_pml=ucx
export OMPI_MCA_btl='^openib'

运行过程指定UCX参数

mpirun -np 8 --allow-run-as-root \--mca pml ucx \--mca btl ^openib \

参考本地训练运行代码

#!/bin/bashexport TMOUT=0source /etc/profile.d/set_cuda_env.sh
source /etc/profile.d/set_openmpi_env.sh# 设置使用UCX并禁用openib
export OMPI_MCA_pml=ucx
export OMPI_MCA_btl='^openib'
# 可选:禁用vader和tcp,强制使用UCX
export OMPI_MCA_btl_base_verbose=1cd ./nccl-tests || exit 1# local server
local_run(){# 使用mpirun运行,确保UCX被使用mpirun -np 8 --allow-run-as-root \--mca pml ucx \--mca btl ^openib \./build/all_reduce_perf -b 128M -e 8G -f 2 -g 8 | tee /root/NCCL.log 2>&1
}local_run

http://www.dtcms.com/a/360229.html

相关文章:

  • mit6.031软件构造 笔记 Testing
  • ROI、 binning、下采样功能区别
  • windows编译minicap.so文件
  • 由题构造 嵌入汇编(汇编)
  • NAS Docker 安装N8N
  • 计算机视觉与深度学习 | 双目立体特征提取与匹配算法综述——理论基础、OpenCV实践与MATLAB实现指南
  • 猛犸Lark max 无线麦克风录音爆音问题的解决
  • 【STC库函数】使用芯片自带的EEPROM来保存掉电不丢失的数据
  • 开发常用工具专栏
  • 赵玉平《梁山政治》读书笔记(下部)
  • wifi控制舵机
  • WinExec
  • Nginx反向代理及配置
  • c++ 线程局部存储(Thread-Local Storage,TLS)
  • Langflow Memory 技术深度分析
  • java--浅拷贝深拷贝
  • Introduction to GIS —— Chapter 3(Vector Data Model)
  • 雪花算法生成分布式ID
  • AI 智能体汇总,自动执行任务的“真 Agent”
  • 动态规划入门(三):一些经典动态规划模型
  • 赵玉平《刘备谋略》读书笔记(下部)
  • 小迪自用web笔记22
  • 01背包day35
  • 设计模式 | 常见的设计模式(单例、工厂、代理、适配器、责任链等等)
  • VisionProC#联合编程火花塞距离检测与VisionPro操作
  • libmodbus库,c++配置方法
  • 【CUDA入门·Lesson 1】Ubuntu实战:CUDA 概念、nvidia-smi 工具与 GPU 参数详解
  • 在Unity中,让子物体不随父物体移动或转动的方法!
  • 下一代防火墙(NGFW):从定义到功能
  • 试试 Xget 加速 GitHub 克隆仓库