当前位置：首页 > news >正文

vllm+openwebui，玩转私有化AI

news 2025/10/15 11:02:53

架构

采用vllm推理框架，启动llamafactory微调训练好的大模型

openwebui做前端调用

使用

vllm启动：vllm serve /root/autodl-tmp/model/Qwen/Qwen2.5-VL-3B-Instruct-merge（模型地址）

安装open webui流程

#创建一个open-webui的conda环境
conda activate open-webui
# 安装open-webui
pip install -U open-webui torch transformers

# 切换到新建的环境
conda activate open-webui
#配置
export HF_ENDPOINT=https://hf-mirror.com
#因为open-webui默认为ollama框架，所以使用vllm框架启动大模型的话需要将这里改为false
export ENABLE_OLLAMA_API=false
#调用大模型的地址，vllm的默认启动端口为8000
export OPENAI_API_BASE_URL=http://127.0.0.1:8000/v1

#启动openwebui
open-webui serve

启动openwebui后，如果没有跳转到web页面的话，需要自己手动配置一下8080端口转发

然后再去访问8080端口，就会出现这个页面，这个是随便输入的

然后就可以跟大模型进行对话

http://www.dtcms.com/a/96217.html

相关文章：

无人机监视系统工作原理与运行要点！

HAL_UARTEx_ReceiveToIdle_DMA 开启，但是无法进入空闲中断；

Day 25:股票的最大利润 + 1到n求和

Pyside6 开发使用Qt Designer

getID3获取本地或远程视频时长

如何高效利用 Postman Mock Server？模拟 API 响应，加速开发

Google PLA 营销库存服务设计技术难点与要点

【PySpark大数据分析概述】01 大数据分析概述

编程技术水平横向和垂直发展的抉择全方位分析

复习一下冒泡排序算法

推荐：大模型靠啥理解文字？通俗解释：词嵌入embedding

06-ADC

MYTOOL-电路模块

windows安装JDK并配置环境变量

Arduino示例代码讲解：Serial Event example 连续事件例子

鸿蒙北向应用开发:deveco 5.0 kit化文件相关2

python经典类、新式类写法、多继承

docker save如何迁移镜像更节省空间？

数据结构与算法：2，冒泡排序

配置完nfs后vmware虚拟机下ubuntu/无法联网问题

iPaaS集成平台如何帮助制造业实现数字化转型

某投行日志记录解决方案二之日志异步落盘：自定义注解+反射+AOP+异步多线程，实现高并发场景下的统一日志治理方案

【Android】屏幕刷新机制（概览）

vs2017开启性能探测器失败

【计算机操作系统】线程的概念和特点

如何通过python将视频转换为字符视频

优化 Docker 构建之方法（Methods for Optimizing Docker Construction）

验证码通过“Canvas 绘制”与“Base64 图片”渲染两种不同的实现方式显示

城电科技｜零碳园区光伏太阳花绽放零碳绿色未来

《论语别裁》第02章为政（08）诗的伟大