当前位置: 首页 > news >正文

Debain-12.9使用xinference部署重排模型/rerank

Debain-12.9使用xinference部署重排模型/rerank

  • 基础环境准备
  • 下载模型
  • 部署模型
  • 注册服务
  • 注册dify模型

基础环境准备

基础环境安装

下载模型

modelscope download --model 'BAAI/bge-reranker-v2-m3' --local_dir 'BAAI/bge-reranker-v2-m3'

部署模型

xinference launch --model-path ~/ollama/BAAI/bge-reranker-v2-m3 --model-name bge-reranker-v2-m3 --model-uid bge-reranker-v2-m3 --model-type rerank --trust-remote-code TRUE --api-key vl-5bgrMOCJ5OSBKQV5XbHz --endpoint "http://127.0.0.1:19997"

注册服务

在这里插入图片描述

注册dify模型

需要先安装插件Xorbits Inference
在这里插入图片描述

相关文章:

  • 程序编译生成的文件
  • 面试常见概念区分:并发与并行、同步与异步、阻塞与非阻塞、线程同步与互斥
  • 【MySQL】基本操作 —— DML 与约束
  • HashMap ,HashTable , ConcurrentHashMap 面试
  • C++ primer plus 内存模型和命名空间下
  • OSC32IN与OSC32OUT对于无源晶振而言有区别吗?
  • 数字滤波器的设计实现及应用(论文+仿真)
  • 在教育领域的大模型知识引擎 × DeepSeek应用
  • 显示模组bonding缺划专案
  • RabbitMQ入门:从安装到高级消息模式
  • SWPU 2022 新生赛
  • Fisher准则例题
  • 【大语言模型】【个人知识库正式内容】提示工程:如何设计模型的提示语
  • Linux操作系统下Git的使用详细步骤
  • 什么是mysql索引回表?
  • jmeter-sample
  • 论文阅读笔记——LORA: LOW-RANK ADAPTATION OF LARGE LANGUAGE MODELS
  • 自定义MDCAdapter,进行线程池级别的日志ID传递
  • 安装 Powerlevel10k 及 Oh My Zsh 的使用
  • opencascade 源码学习几何变换 BRepBuilderAPI-BRepBuilderAPI_Transform
  • 半年不到再换岗:伊春市委常委、政法委书记方春彪任伊春森工集团党委书记
  • 专访|金七猫奖得主:以非遗为舟,在现实题材中疗愈与成长
  • 大学2025丨北大教授陈平原:当卷不过AI时,何处是归途
  • 当“诈骗诱饵”盯上短剧
  • 香港特区政府强烈谴责美参议员恐吓国安人员
  • 四川内江警方通报一起持刀伤人致死案:因车辆停放引起,嫌犯被抓获