当前位置: 首页 > news >正文

vllm+openwebui,玩转私有化AI

架构

采用vllm推理框架,启动llamafactory微调训练好的大模型

openwebui做前端调用

使用

vllm启动:vllm serve /root/autodl-tmp/model/Qwen/Qwen2.5-VL-3B-Instruct-merge(模型地址)

安装open webui流程

#创建一个open-webui的conda环境
conda activate open-webui
# 安装open-webui
pip install -U open-webui torch transformers

# 切换到新建的环境
conda activate open-webui
#配置
export HF_ENDPOINT=https://hf-mirror.com
#因为open-webui默认为ollama框架,所以使用vllm框架启动大模型的话需要将这里改为false
export ENABLE_OLLAMA_API=false
#调用大模型的地址,vllm的默认启动端口为8000
export OPENAI_API_BASE_URL=http://127.0.0.1:8000/v1

#启动openwebui
open-webui serve

启动openwebui后,如果没有跳转到web页面的话,需要自己手动配置一下8080端口转发

然后再去访问8080端口,就会出现这个页面,这个是随便输入的

然后就可以跟大模型进行对话

http://www.dtcms.com/a/96217.html

相关文章:

  • 无人机监视系统工作原理与运行要点!
  • HAL_UARTEx_ReceiveToIdle_DMA 开启,但是无法进入空闲中断;
  • Day 25:股票的最大利润 + 1到n求和
  • Pyside6 开发 使用Qt Designer
  • getID3获取本地或远程视频时长
  • 如何高效利用 Postman Mock Server? 模拟 API 响应,加速开发
  • Google PLA 营销库存服务设计技术难点与要点
  • 【PySpark大数据分析概述】01 大数据分析概述
  • 编程技术水平横向和垂直发展的抉择全方位分析
  • 复习一下冒泡排序算法
  • 推荐:大模型靠啥理解文字?通俗解释:词嵌入embedding
  • 06-ADC
  • MYTOOL-电路模块
  • windows安装JDK并配置环境变量
  • Arduino示例代码讲解:Serial Event example 连续事件例子
  • 鸿蒙北向应用开发:deveco 5.0 kit化文件相关2
  • python经典类、新式类写法、多继承
  • docker save如何迁移镜像更节省空间?
  • 数据结构与算法:2,冒泡排序
  • 配置完nfs后vmware虚拟机下ubuntu/无法联网问题
  • iPaaS集成平台如何帮助制造业实现数字化转型
  • 某投行日志记录解决方案二之日志异步落盘: 自定义注解+反射+AOP+异步多线程,实现高并发场景下的统一日志治理方案
  • 【Android】屏幕刷新机制(概览)
  • vs2017开启性能探测器失败
  • 【计算机操作系统】线程的概念和特点
  • 如何通过python将视频转换为字符视频
  • 优化 Docker 构建之方法(Methods for Optimizing Docker Construction)
  • 验证码通过“Canvas 绘制”与“Base64 图片”渲染两种不同的实现方式显示
  • 城电科技|零碳园区光伏太阳花绽放零碳绿色未来
  • 《论语别裁》第02章 为政(08) 诗的伟大