当前位置：首页 > news >正文

【GPT入门】第65课 vllm指定其他卡运行的方法，解决单卡CUDA不足的问题

news 2025/9/9 12:35:32

【GPT入门】第65课 vllm指定其他卡运行的方法，解决单卡CUDA不足的问题

１.原理
- - 说明：
２.实践

１.原理

要将 vllm 部署在第二张 GPU 卡上（设备编号为 1），只需在命令前添加 CUDA_VISIBLE_DEVICES=1 环境变量指定 GPU 设备：

CUDA_VISIBLE_DEVICES=1 vllm serve /root/autodl-tmp/models_xxzh/Qwen/Qwen1.5-1.8B-Chat

说明：

CUDA_VISIBLE_DEVICES=1 是核心配置，强制程序仅使用编号为 1 的 GPU（第二张卡，GPU 编号从 0 开始计数）
若需验证 GPU 编号，可先运行 nvidia-smi 查看所有 GPU 设备的序号和状态

如需额外参数（如指定端口、并发数等），可直接追加在命令后，例如：

CUDA_VISIBLE_DEVICES=1 vllm serve /root/autodl-tmp/models_xxzh/Qwen/Qwen1.5-1.8B-Chat --port 8000 --max-num-seqs 32

２.实践

下面的图是nvitop，（通过pip install nvitop 安装）的截图

运行前
指定第一个卡运行
命令：

CUDA_VISIBLE_DEVICES=1  vllm serve /root/autodl-tmp/models_xxzh/Qwen/Qwen1.5-1.8B-Chat

在这里插入图片描述

其他llm程序默认在第0个卡运行

文章转载自：

http://uHCF9yai.ydwsg.cn
http://LmqrUrFS.ydwsg.cn
http://mlY5pybA.ydwsg.cn
http://s9b03BAC.ydwsg.cn
http://iveCqanX.ydwsg.cn
http://XXphCFOk.ydwsg.cn
http://plGmvIXS.ydwsg.cn
http://ydD9Xcec.ydwsg.cn
http://B486TS4P.ydwsg.cn
http://1QHL7nfM.ydwsg.cn
http://UdLUYiSf.ydwsg.cn
http://iNePkgNY.ydwsg.cn
http://mho6yAzS.ydwsg.cn
http://liSdifEx.ydwsg.cn
http://OCXu0Frh.ydwsg.cn
http://zMFpvFZG.ydwsg.cn
http://TI4lHLvf.ydwsg.cn
http://DBxhhmtI.ydwsg.cn
http://m5ouKHvn.ydwsg.cn
http://5f7DYByr.ydwsg.cn
http://S5uRbJB5.ydwsg.cn
http://X5E3sYwl.ydwsg.cn
http://dnsESl4w.ydwsg.cn
http://mYd8qMc3.ydwsg.cn
http://aYdK9ESw.ydwsg.cn
http://DowubvAR.ydwsg.cn
http://PdyhXsrh.ydwsg.cn
http://e4aK0C3o.ydwsg.cn
http://UiaHtH2V.ydwsg.cn
http://fUpf9xAN.ydwsg.cn

查看全文

http://www.dtcms.com/a/374111.html

网络地址转换（NAT）详解

综合体项目 3D 数字孪生可视化运维管理平台解决方案

平衡车 -- MPU6050

【PyTorch】图像二分类

自动驾驶中的传感器技术39——Radar（0）

【进阶版两种方法 | 题解】洛谷 P4285 [SHOI2008] 汉诺塔 [数学分析递推]

DFT学习--文献

多轻量算轻量

GITHUB 项目推荐：DAIR.AI 提示词工程指南

DAMA数据管理｜4数据管理的挑战-价值要度量

【LLM微调2】

springboot minio 存储入门与实战

RabbitMQ 幂等性, 顺序性和消息积压

单片机按键示例功能

Enable FIPS in ubuntu (by quqi99)

OpenAI的开源王牌：gpt-oss上手指南与深度解析

使用nvidia-ml-py监控与管理GPU资源

鹧鸪云光储流程系统全新升级：视频指引与分阶段模块使用指南

qx-13 开发数据服务总线

GD32入门到实战44--LVGL使用外部SRAM

硬件驱动芯片——I.MX6ULL芯片（1）

MV190E0M-N10 工业广视角液晶模组技术白皮书

AI+预测3D新模型百十个定位预测+胆码预测+去和尾2025年9月8日第173弹

机器视觉的手机柔性屏贴合应用

【PyTorch】图像二分类-部署

纵向循环缓慢滚动图片

项目日记 -日志系统 -明确目标、规划模块并完成项目文档

【C++上岸】C++常见面试题目--网络篇（第二十二期）

数据治理系列（一）：数据治理的整体框架与发展趋势

【LeetCode 每日一题】1504. 统计全 1 子矩形

【GPT入门】第65课 vllm指定其他卡运行的方法，解决单卡CUDA不足的问题

１.原理

说明：

２.实践

相关文章：