当前位置: 首页 > news >正文

vllm专题(一):安装-GPU

vLLM 是一个 Python 库,支持以下 GPU 变体。选择您的 GPU 类型以查看供应商特定的说明:
1. NVIDIA CUDA
vLLM 包含预编译的 C++ 和 CUDA(12.1)二进制文件。
2. AMD ROCm
vLLM 支持配备 ROCm 6.3 的 AMD GPU。
注意
此设备没有预构建的 wheel 包,因此您必须使用预构建的 Docker 镜像或从源代码构建 vLLM。
3. Intel XPU
vLLM 初步支持在 Intel GPU 平台上进行基本模型推理和服务。
注意
此设备没有预构建的 wheel 包或镜像,因此您必须从源代码构建 vLLM。

一、要求

  • 操作系统:Linux
  • Python:3.9 – 3.12
    1. NVIDIA CUDA
  • GPU:计算能力 7.0 或更高(例如 V100、T4、RTX20xx、A100、L4、H100 等)
    2. AMD ROCm
  • GPU:MI200s (gfx90a)、MI300 (gfx942)、Radeon RX
http://www.dtcms.com/a/25691.html

相关文章:

  • 【开源免费】基于SpringBoot+Vue.JS个人博客系统(JAVA毕业设计)
  • 以下是一个使用 HTML、CSS 和 JavaScript 实现的登录弹窗效果示例
  • 什么是Spring Boot?
  • FreeRTOS-rust食用指南
  • Python程序打包 |《Python基础教程》第18章笔记
  • SQLAlchemy 中字段类型与常见数据库(MySQL、PostgreSQL 和 SQLite)的全面映射关系
  • 在VS中通过vcpkg包管理器来安装使用qt5
  • Win11网络受限问题解决方案
  • AWS CodeBuild 配置完整指南
  • 读书笔记 - 修改代码的艺术
  • 【SQL教程|07】sql中条件查询where用法示例
  • 如何正确安装Python----Python安装的避坑指南
  • Swagger 转 Word 技术方案
  • DeepSeek:开启智能时代的新引擎
  • DeepSeek NSA:突破数据瓶颈,开启AI模型训练新范式
  • 算法1-2 Bookself B
  • 几个C#上位机相关的工具库
  • 使用Java爬虫获取京东商品SKU信息的完整指南
  • Ubuntu18.04/20.04开机自启运行脚本
  • Python利用markdown库实现Markdown到HTML的高效转换(附安全处理与样式扩展)
  • Pytorch实现论文之三元DCGAN生成RGB图像用于红外图像着色生成
  • JavaScript 基础入门——数组的操作与应用
  • h5、vue3抓拍功能
  • centos 9 时间同步服务
  • RESTful API的设计原则是什么?
  • rust笔记2-特质trait
  • 开发小技巧分享 02:xml解析工具
  • 【面试】Java面试频繁问到的题最新整理(附答案)
  • 【深度学习】Transformer技术报告:架构与原理
  • [论文阅读] SeeSR: Towards Semantics-Aware Real-World Image Super-Resolution