当前位置: 首页 > news >正文

在 Ubuntu 系统中基于 Miniconda 安装 VLLM 并启动模型 + Dify 集成指南

本文将详细介绍在 Ubuntu 系统已安装 Miniconda 的前提下,通过虚拟环境安装 VLLM、两种启动模型的方法(含参数详解),以及 Docker 部署的 Dify 如何添加 VLLM 模型,全程步骤清晰且命令可直接复制。

一、基础环境准备(Miniconda 已安装前提下)

1.1 创建 Python 3.12 专属虚拟环境

为避免 VLLM 与其他 Python 项目的依赖冲突,需创建独立虚拟环境。执行以下命令创建名为vllm-env、Python 版本为 3.12 的环境:

conda create -n vllm-env python=3.12 -y

1.2 激活虚拟环境

创建完成后,需激活环境才能进行后续操作(激活后终端提示符前会显示(vllm-env),表示当前处于该环境中):

conda activate vllm-env

1.3 确认 Python 版本(确保符合要求)

VLLM 对 Python 版本有明确要求(3.8+,此处指定 3.12),执行命令验证版本是否正确:

python --version
  • 成功标志:输出Python 3.12.x(x 为具体小版本号,如 3.12.4)。

1.4 使用清华源安装 VLLM

通过 pip 安装 VLLM,指定清华源可大幅加速下载速度(避免默认源的网络延迟):

pip install vllm -i https://pypi.tuna.tsinghua.edu.cn/simple
  • 安装过程:会自动下载 VLLM 及其依赖包(如transformerstokenizers等),耐心等待至显示 “Successfully installed...”。

1.5 验证 VLLM 安装(确认版本)

安装完成后,执行命令查看 VLLM 版本,确认安装成功:

python -c "from modelscope import __version__; print('ModelScope版本:', __version__)"
  • 成功标志:输出类似vllm 0.4.3(版本号随更新可能变化,0.4.0 + 版本均支持 Python 3.12)。

二、VLLM 启动模型的两种方法(含参数详解)

VLLM 支持 “命令行服务部署” 和 “Python 代码调用” 两种启动方式,分别适用于 “生产服务” 和 “开发测试” 场景,以下详细介绍每种方法及参数意义。

2.1 方法一:VLLM Server 命令行启动(推荐用于服务部署)

通过vllm serve命令启动 HTTP 服务,可对外提供模型调用接口(如供 Dify、API 请求等使用),以下以常用的Qwen/Qwen3-32B-AWQ模型(量化模型,节省 GPU 内存)为例,完整命令及参数解释如下:

2.1.1 完整启动命令(以多 GPU 为例)
vllm serve --model /home/yourname/.cache/modelscope/hub/models/Qwen/Qwen3-32B-AWQ --tensor-parallel-size 2 --gpu-memory-utilization 0.8 --max-num-batched-tokens 8192 --port 8000
2.1.2 每个参数的详细解释
参数名称 作用说明 取值建议
--model 指定模型路径或 Hugging Face 模型 ID(核心参数) 本地路径:如示例中/home/.../Qwen3-32

文章转载自:

http://PVaJYfkG.pnmtk.cn
http://2aoBzGt4.pnmtk.cn
http://hvmWIXaB.pnmtk.cn
http://8cq9qQKJ.pnmtk.cn
http://mIVnUwCf.pnmtk.cn
http://JL7q9A9Q.pnmtk.cn
http://8zyPHi3M.pnmtk.cn
http://9N35rRcl.pnmtk.cn
http://sJ47dRGk.pnmtk.cn
http://GZmre9Zr.pnmtk.cn
http://lYV0XX0s.pnmtk.cn
http://ysumx1Gt.pnmtk.cn
http://lQLnkY5s.pnmtk.cn
http://m3OyRhNu.pnmtk.cn
http://PYUtd7mZ.pnmtk.cn
http://f3nRzO8D.pnmtk.cn
http://Xi76I7Op.pnmtk.cn
http://Myp36PNA.pnmtk.cn
http://GFes7cJi.pnmtk.cn
http://89wdFCBI.pnmtk.cn
http://rBIY0vZu.pnmtk.cn
http://r8Dm0n6D.pnmtk.cn
http://4XSKkK2M.pnmtk.cn
http://IyISJbxE.pnmtk.cn
http://zxE14nGg.pnmtk.cn
http://cP1HJ9Sc.pnmtk.cn
http://ObJA9CMf.pnmtk.cn
http://yVAIhpNz.pnmtk.cn
http://C2kYyQAa.pnmtk.cn
http://88reXqmi.pnmtk.cn
http://www.dtcms.com/a/382157.html

相关文章:

  • JavaWeb--day4--WebHttp协议Tomcat
  • Linux命令行的核心理念与实用指南(进阶版)
  • 机器学习-模型验证
  • 3-机器学习与大模型开发数学教程-第0章 预备知识-0-3 函数初步(多项式、指数、对数、三角函数、反函数)
  • 使用Aop和自定义注解实现SpringTask定时任务中加锁逻辑的封装
  • 远程依赖管理新范式:cpolar赋能Nexus全球协作
  • 【个人项目】【前端实用工具】OpenAPI to TypeScript 转换器
  • 贪心算法应用:物流装箱问题详解
  • 《用 TensorFlow 构建回归模型:从零开始的预测之路》
  • charles功能
  • Ceph OSD 元数据信息
  • Stanford CS336 | Assignment 2 - FlashAttention-v2 Pytorch Triotn实现
  • 【Docker】容器
  • C++ 类型推导(第一部分)
  • 联邦学习模型完成之后在验证集上面,如何判断输出正确与否
  • 优选算法---链表
  • 从理据到算法:认知语义学象似性对人工智能深层语义分析的重塑与前瞻
  • 39.网络流入门
  • PTQ 模型 量化方法
  • 基于Spring Boot的家政服务管理系统+论文示例参考
  • uniapp封装长按一直触发事件和松开后触发一次的事件(自定义事件)
  • Unity核心概念⑦:Transform
  • 【数据行业发展】可信数据空间~数据价值的新型基础设施
  • 使用“洋葱架构”构建单体应用
  • DAY 27 函数专题2:装饰器-2025.9.14
  • 浅析Linux进程信号处理机制:基本原理及应用
  • php学习(第五天)
  • C盘清理技巧分享的技术文章大纲
  • PINN物理信息神经网络驱动的三维声波波动方程求解MATLAB代码
  • 深度学习优化器进化史:从SGD到AdamW的原理与选择