当前位置: 首页 > news >正文

vllm专题(一):安装-GPU

vLLM 是一个 Python 库,支持以下 GPU 变体。选择您的 GPU 类型以查看供应商特定的说明:
1. NVIDIA CUDA
vLLM 包含预编译的 C++ 和 CUDA(12.1)二进制文件。
2. AMD ROCm
vLLM 支持配备 ROCm 6.3 的 AMD GPU。
注意
此设备没有预构建的 wheel 包,因此您必须使用预构建的 Docker 镜像或从源代码构建 vLLM。
3. Intel XPU
vLLM 初步支持在 Intel GPU 平台上进行基本模型推理和服务。
注意
此设备没有预构建的 wheel 包或镜像,因此您必须从源代码构建 vLLM。

一、要求

  • 操作系统:Linux
  • Python:3.9 – 3.12
    1. NVIDIA CUDA
  • GPU:计算能力 7.0 或更高(例如 V100、T4、RTX20xx、A100、L4、H100 等)
    2. AMD ROCm
  • GPU:MI200s (gfx90a)、MI300 (gfx942)、Radeon RX

相关文章:

  • 【开源免费】基于SpringBoot+Vue.JS个人博客系统(JAVA毕业设计)
  • 以下是一个使用 HTML、CSS 和 JavaScript 实现的登录弹窗效果示例
  • 什么是Spring Boot?
  • FreeRTOS-rust食用指南
  • Python程序打包 |《Python基础教程》第18章笔记
  • SQLAlchemy 中字段类型与常见数据库(MySQL、PostgreSQL 和 SQLite)的全面映射关系
  • 在VS中通过vcpkg包管理器来安装使用qt5
  • Win11网络受限问题解决方案
  • AWS CodeBuild 配置完整指南
  • 读书笔记 - 修改代码的艺术
  • 【SQL教程|07】sql中条件查询where用法示例
  • 如何正确安装Python----Python安装的避坑指南
  • Swagger 转 Word 技术方案
  • DeepSeek:开启智能时代的新引擎
  • DeepSeek NSA:突破数据瓶颈,开启AI模型训练新范式
  • 算法1-2 Bookself B
  • 几个C#上位机相关的工具库
  • 使用Java爬虫获取京东商品SKU信息的完整指南
  • Ubuntu18.04/20.04开机自启运行脚本
  • Python利用markdown库实现Markdown到HTML的高效转换(附安全处理与样式扩展)
  • 人民日报和音:相信中国就是相信明天
  • 征稿启事|澎湃·镜相第三届非虚构写作大赛暨2026第六届七猫现实题材征文大赛
  • 山东:小伙为救同学耽误考试属实,启用副题安排考试
  • 市场监管总局等五部门约谈外卖平台企业
  • 习近平出席中国-拉美和加勒比国家共同体论坛第四届部长级会议开幕式并发表重要讲话
  • 泽连斯基批准美乌矿产协议