当前位置: 首页 > news >正文

Debain-12.9使用xinference部署重排模型/rerank

Debain-12.9使用xinference部署重排模型/rerank

  • 基础环境准备
  • 下载模型
  • 部署模型
  • 注册服务
  • 注册dify模型

基础环境准备

基础环境安装

下载模型

modelscope download --model 'BAAI/bge-reranker-v2-m3' --local_dir 'BAAI/bge-reranker-v2-m3'

部署模型

xinference launch --model-path ~/ollama/BAAI/bge-reranker-v2-m3 --model-name bge-reranker-v2-m3 --model-uid bge-reranker-v2-m3 --model-type rerank --trust-remote-code TRUE --api-key vl-5bgrMOCJ5OSBKQV5XbHz --endpoint "http://127.0.0.1:19997"

注册服务

在这里插入图片描述

注册dify模型

需要先安装插件Xorbits Inference
在这里插入图片描述

http://www.dtcms.com/a/68764.html

相关文章:

  • 程序编译生成的文件
  • 面试常见概念区分:并发与并行、同步与异步、阻塞与非阻塞、线程同步与互斥
  • 【MySQL】基本操作 —— DML 与约束
  • HashMap ,HashTable , ConcurrentHashMap 面试
  • C++ primer plus 内存模型和命名空间下
  • OSC32IN与OSC32OUT对于无源晶振而言有区别吗?
  • 数字滤波器的设计实现及应用(论文+仿真)
  • 在教育领域的大模型知识引擎 × DeepSeek应用
  • 显示模组bonding缺划专案
  • RabbitMQ入门:从安装到高级消息模式
  • SWPU 2022 新生赛
  • Fisher准则例题
  • 【大语言模型】【个人知识库正式内容】提示工程:如何设计模型的提示语
  • Linux操作系统下Git的使用详细步骤
  • 什么是mysql索引回表?
  • jmeter-sample
  • 论文阅读笔记——LORA: LOW-RANK ADAPTATION OF LARGE LANGUAGE MODELS
  • 自定义MDCAdapter,进行线程池级别的日志ID传递
  • 安装 Powerlevel10k 及 Oh My Zsh 的使用
  • opencascade 源码学习几何变换 BRepBuilderAPI-BRepBuilderAPI_Transform
  • 【GB28181】RTSP服务器传输AAC音频
  • JVM垃圾收集器相关面试题(1)
  • WPS 接入 DeepSeek-R1 深度实践:打造全能AI办公助手
  • VXLAN 组播 RP
  • QT编程之QGIS
  • 【Flutter】数据库实体类构造函数加密注意事项
  • 深度学习有哪些算法?
  • 30、map 和 unordered_map的区别和实现机制【高频】
  • FreeRTOS之信号量
  • 【后端】【django】Django DRF `@action` 详解:自定义 ViewSet 方法