当前位置: 首页 > news >正文

【GPT入门】第65课 vllm指定其他卡运行的方法,解决单卡CUDA不足的问题

【GPT入门】第65课 vllm指定其他卡运行的方法,解决单卡CUDA不足的问题

  • 1.原理
      • 说明:
  • 2.实践

1.原理

要将 vllm 部署在第二张 GPU 卡上(设备编号为 1),只需在命令前添加 CUDA_VISIBLE_DEVICES=1 环境变量指定 GPU 设备:

CUDA_VISIBLE_DEVICES=1 vllm serve /root/autodl-tmp/models_xxzh/Qwen/Qwen1.5-1.8B-Chat

说明:

  • CUDA_VISIBLE_DEVICES=1 是核心配置,强制程序仅使用编号为 1 的 GPU(第二张卡,GPU 编号从 0 开始计数)
  • 若需验证 GPU 编号,可先运行 nvidia-smi 查看所有 GPU 设备的序号和状态
  • 如需额外参数(如指定端口、并发数等),可直接追加在命令后,例如:
    CUDA_VISIBLE_DEVICES=1 vllm serve /root/autodl-tmp/models_xxzh/Qwen/Qwen1.5-1.8B-Chat --port 8000 --max-num-seqs 32
    

2.实践

下面的图是nvitop, (通过pip install nvitop 安装) 的截图

  • 运行前
    在这里插入图片描述
  • 指定第一个卡运行
    命令:
CUDA_VISIBLE_DEVICES=1  vllm serve /root/autodl-tmp/models_xxzh/Qwen/Qwen1.5-1.8B-Chat

在这里插入图片描述

  • 其他llm程序默认在第0个卡运行
    在这里插入图片描述

文章转载自:

http://uHCF9yai.ydwsg.cn
http://LmqrUrFS.ydwsg.cn
http://mlY5pybA.ydwsg.cn
http://s9b03BAC.ydwsg.cn
http://iveCqanX.ydwsg.cn
http://XXphCFOk.ydwsg.cn
http://plGmvIXS.ydwsg.cn
http://ydD9Xcec.ydwsg.cn
http://B486TS4P.ydwsg.cn
http://1QHL7nfM.ydwsg.cn
http://UdLUYiSf.ydwsg.cn
http://iNePkgNY.ydwsg.cn
http://mho6yAzS.ydwsg.cn
http://liSdifEx.ydwsg.cn
http://OCXu0Frh.ydwsg.cn
http://zMFpvFZG.ydwsg.cn
http://TI4lHLvf.ydwsg.cn
http://DBxhhmtI.ydwsg.cn
http://m5ouKHvn.ydwsg.cn
http://5f7DYByr.ydwsg.cn
http://S5uRbJB5.ydwsg.cn
http://X5E3sYwl.ydwsg.cn
http://dnsESl4w.ydwsg.cn
http://mYd8qMc3.ydwsg.cn
http://aYdK9ESw.ydwsg.cn
http://DowubvAR.ydwsg.cn
http://PdyhXsrh.ydwsg.cn
http://e4aK0C3o.ydwsg.cn
http://UiaHtH2V.ydwsg.cn
http://fUpf9xAN.ydwsg.cn
http://www.dtcms.com/a/374111.html

相关文章:

  • 网络地址转换(NAT)详解
  • 综合体项目 3D 数字孪生可视化运维管理平台解决方案
  • 平衡车 -- MPU6050
  • 【PyTorch】图像二分类
  • 自动驾驶中的传感器技术39——Radar(0)
  • 【进阶版两种方法 | 题解】洛谷 P4285 [SHOI2008] 汉诺塔 [数学分析递推]
  • DFT学习--文献
  • 多轻量算轻量
  • GITHUB 项目推荐:DAIR.AI 提示词工程指南
  • DAMA数据管理|4数据管理的挑战-价值要度量
  • 【LLM微调2】
  • springboot minio 存储入门与实战
  • RabbitMQ 幂等性, 顺序性 和 消息积压
  • 单片机按键示例功能
  • Enable FIPS in ubuntu (by quqi99)
  • OpenAI的开源王牌:gpt-oss上手指南与深度解析
  • 使用nvidia-ml-py监控与管理GPU资源
  • 鹧鸪云光储流程系统全新升级:视频指引与分阶段模块使用指南
  • qx-13 开发数据服务总线
  • GD32入门到实战44--LVGL使用外部SRAM
  • 硬件驱动芯片——I.MX6ULL芯片(1)
  • MV190E0M-N10 工业广视角液晶模组技术白皮书
  • AI+预测3D新模型百十个定位预测+胆码预测+去和尾2025年9月8日第173弹
  • 机器视觉的手机柔性屏贴合应用
  • 【PyTorch】图像二分类-部署
  • 纵向循环缓慢滚动图片
  • 项目日记 -日志系统 -明确目标、规划模块并完成项目文档
  • 【C++上岸】C++常见面试题目--网络篇(第二十二期)
  • 数据治理系列(一):数据治理的整体框架与发展趋势
  • 【LeetCode 每日一题】1504. 统计全 1 子矩形