当前位置：首页 > news >正文

vllm专题（一）：安装-GPU

news 2025/10/16 21:23:27

vLLM 是一个 Python 库，支持以下 GPU 变体。选择您的 GPU 类型以查看供应商特定的说明：
1. NVIDIA CUDA
vLLM 包含预编译的 C++ 和 CUDA（12.1）二进制文件。
2. AMD ROCm
vLLM 支持配备 ROCm 6.3 的 AMD GPU。
注意
此设备没有预构建的 wheel 包，因此您必须使用预构建的 Docker 镜像或从源代码构建 vLLM。
3. Intel XPU
vLLM 初步支持在 Intel GPU 平台上进行基本模型推理和服务。
注意
此设备没有预构建的 wheel 包或镜像，因此您必须从源代码构建 vLLM。

一、要求

操作系统：Linux
Python：3.9 – 3.12
1. NVIDIA CUDA
GPU：计算能力 7.0 或更高（例如 V100、T4、RTX20xx、A100、L4、H100 等）
2. AMD ROCm
GPU：MI200s (gfx90a)、MI300 (gfx942)、Radeon RX

http://www.dtcms.com/a/25691.html

相关文章：

【开源免费】基于SpringBoot+Vue.JS个人博客系统（JAVA毕业设计）

以下是一个使用 HTML、CSS 和 JavaScript 实现的登录弹窗效果示例

什么是Spring Boot？

FreeRTOS-rust食用指南

Python程序打包 |《Python基础教程》第18章笔记

SQLAlchemy 中字段类型与常见数据库（MySQL、PostgreSQL 和 SQLite）的全面映射关系

在VS中通过vcpkg包管理器来安装使用qt5

Win11网络受限问题解决方案

AWS CodeBuild 配置完整指南

读书笔记 - 修改代码的艺术

【SQL教程｜07】sql中条件查询where用法示例

如何正确安装Python----Python安装的避坑指南

Swagger 转 Word 技术方案

DeepSeek：开启智能时代的新引擎

DeepSeek NSA：突破数据瓶颈，开启AI模型训练新范式

算法1-2 Bookself B

几个C#上位机相关的工具库

使用Java爬虫获取京东商品SKU信息的完整指南

Ubuntu18.04/20.04开机自启运行脚本

Python利用markdown库实现Markdown到HTML的高效转换（附安全处理与样式扩展）

Pytorch实现论文之三元DCGAN生成RGB图像用于红外图像着色生成

JavaScript 基础入门——数组的操作与应用

h5、vue3抓拍功能

centos 9 时间同步服务

RESTful API的设计原则是什么？

rust笔记2-特质trait

开发小技巧分享 02：xml解析工具

【面试】Java面试频繁问到的题最新整理（附答案）

【深度学习】Transformer技术报告：架构与原理

[论文阅读] SeeSR: Towards Semantics-Aware Real-World Image Super-Resolution