当前位置：首页 > news >正文

Dify网页版 + vllm + Qwen

news 2025/10/30 15:21:44

1. 安装

pip install -U xformers torch torchvision torchaudio triton --index-url https://download.pytorch.org/whl/cu121
pip install modelscope vllm

2. 下载Qwen开源模型

#模型下载
from modelscope import snapshot_download
model_dir = snapshot_download('Qwen/Qwen2.5-0.5B-Instruct')

3. 启动 vLLM 的 OpenAI 兼容服务

如果使用云服务器请先确认暴露端口

以闪电云为例：

sudo apt install rinetd
echo "0.0.0.0 8880 127.0.0.1 9000" > /etc/rinetd.conf
sudo systemctl restart rinetd

启动vllm服务

命令行输入 vllm serve Qwen/Qwen2.5-1.5B-Instruct --port 9999 --dtype float16

# 使用绝对路径 vllm serve /root/.cache/modelscope/hub/models/Qwen/Qwen2.5-0.5B-Instruct --port 9000 --dtype float16

连通性测试

`4.使用OpenAl-API-compatible插件部署`

查看全文

http://www.dtcms.com/a/172815.html

论文报错4

Ubuntu安装编译环境

JookDB：一款国产的通用数据库开发工具

网络传输中字节序

PostgreSQL 的 pg_current_wal_lsn 函数

Pinia状态管理工具速成

【NLP】 28. 语言模型的评估方式：MRR, PERPLEXITY, BLEU, WER从困惑度到实际效果

C++ 类与对象（下）—— 进阶特性与底层机制解析(构造函数初始化，类型转换，static成员，友元，内部类，匿名对象)

torch.nn.Sequential() and torch.nn.ModuleList()

Linux 系统的指令详解介绍

位运算的应用

数据结构——算法复杂度

Linux系统安装PaddleDetection

棋类游戏中的智能决策 ——蒙特卡洛树搜索(MCTS)算法解析

C# 反射

SpringMVC——第7章:HttpMessageConverter

数学复习笔记 2

GoogleTest：GMock初识

AVL树和红黑树的插入算法

政务服务智能化改造方案和案例分析

浔川AI测试版内测报告

无重复字符的最长子串（3）

第三章 - 软件质量工程体系

JAVA在线考试系统考试管理题库管理成绩查询重复考试学生管理教师管理源码

QTtricks

神经网络开发实战：从零基础到企业级应用（含CNN、RNN、BP网络代码详解）

开源PDF解析工具Marker深度解析

Python-numpy中ndarray对象创建，数据类型，基本属性

2025年企业Radius认证服务器市场深度调研：中小企业身份安全投入产出比最优解

基于CBOW模型的词向量训练实战：从原理到PyTorch实现

1. 安装

2. 下载Qwen开源模型

3. 启动 vLLM 的 OpenAI 兼容服务

4.使用OpenAl-API-compatible插件部署

相关文章：

`4.使用OpenAl-API-compatible插件部署`