当前位置: 首页 > news >正文

ragflow 通过HuggingFace 配置rerank模型

本地启动召回模型 

import os
os.environ["HF_ENDPOINT"] = "https://hf-mirror.com"from flask import Flask, request, jsonify
import torch
from transformers import AutoTokenizer, AutoModelForSequenceClassification
import numpy as npapp = Flask(__name__)# 加载模型
model_name = "BAAI/bge-reranker-v2-m3"
tokenizer = AutoTokenizer.from_pretrained(model_name)
model = AutoModelForSequenceClassification.from_pretrained(model_name)
model.eval()
print("model ok")@app.route('/rerank', methods=['POST'])
def rerank():data = request.jsonprint(data)query = data['query']texts = data.get('texts', [])# 构建输入对pairs = [[query, text] for text in texts]print(f"构建了 {len(pairs)} 个查询-文档对")# 编码inputs = tokenizer(pairs, padding=True, truncation=True,return_tensors='pt', max_length=512)# 推理with torch.no_grad():scores = model(**inputs).logits.squeeze().tolist()# 格式化结果results = []for i, score in enumerate(scores):results.append({"index": i,"score": float(score)})return jsonify(results)if __name__ == '__main__':app.run(host='0.0.0.0', port=8080)print("api ok")

2 配置模型

http://www.dtcms.com/a/341585.html

相关文章:

  • 有序二叉树的删除
  • leetcode 3 无重复字符的最长子串
  • 个人使用AI开发的《PlSqlRewrite4GaussDB(PLSQL自动转换工具)1.0.1 BETA》发布
  • 【OneAI】使用Rust构建的轻量AI网关
  • linux环境问题
  • HyperMesh许可证分配优化策略
  • 【Ansible】变量、机密、事实
  • 福昕PDF编辑软件高级版下载与详细图文安装教程!!
  • Pub/Sub是什么意思
  • LWIP的Socket API 与实现关系
  • c#入门笔记(3)
  • 图像数据增强的高效执行
  • Linux下运行Jmeter压测
  • Kafka如何保证「消息不丢失」,「顺序传输」,「不重复消费」,以及为什么会发生重平衡(reblanace)
  • 攻克PostgreSQL专家认证
  • Git Commit 提交信息标准格式
  • Python打卡Day47 注意力热图可视化
  • 字符设备驱动、块设备驱动和网络设备驱动
  • Gitee仓库 日常操作详细步骤
  • Linux服务器性能优化总结
  • 【数据结构】快速排序算法精髓解析
  • shell脚本——搜索某个目录下带指定前缀的文件
  • 50.Seata-AT模式
  • Cyberduck (FTP和SFTP工具) v9.2.3.43590
  • 189.轮转数组
  • 设计模式的一些笔记
  • list集合可以一边遍历一遍修改元素吗?
  • Rust 入门 包 (二十一)
  • 计算机网络基础复习
  • 【数据分享】295个地级市互联网用户、邮电业务数据(2001-2022)