当前位置: 首页 > news >正文

重排序模型解读:gte-multilingual-reranker-base 首个GTE系列重排模型诞生

模型介绍

gte-multilingual-reranker-base 模型是 GTE 模型系列中的第一个 reranker 模型,由阿里巴巴团队开发。

在这里插入图片描述

模型特征:

  • Model Size: 306M
  • Max Input Tokens: 8192

benchmark

关键属性:

  • 高性能:与类似大小的 reranker 模型相比,在多语言检索任务和多任务表示模型评估中实现最先进的 (SOTA) 结果。
  • 训练架构:使用仅编码器 transformers 架构进行训练,从而获得更小的模型尺寸。与以前基于仅解码 LLM 架构的模型(例如 gte-qwen2-1.5b-instruct)不同,该模型对推理的硬件要求较低,推理速度提高了 10 倍。
  • 长上下文:支持高达 8192 个令牌的文本长度。
  • 多语言功能:支持 70 多种语言。

在这里插入图片描述

评价

还处于新出现的阶段,是新晋的GTE重排序模型,模型综合性能可以,商业化需要在生产/测试环境中实测过才好上生产。

huggingface:https://huggingface.co/Alibaba-NLP/gte-multilingual-reranker-base

paper:https://arxiv.org/pdf/2407.19669

建议安装 xformers 并启用 unpadding 来加速,参考enable-unpadding-and-xformers

地址:https://huggingface.co/Alibaba-NLP/new-impl#recommendation-enable-unpadding-and-acceleration-with-xformers

除了开源的GTE系列机型外,GTE系列机型在阿里云上也以商业API服务的形式提供。请注意,商业 API 背后的模型与开源模型并不完全相同。

用法示例

python 调用示例:
使用 Huggingface transformers (transformers>=4.36.0)

import torch
from transformers import AutoModelForSequenceClassification, AutoTokenizermodel_name_or_path = "Alibaba-NLP/gte-multilingual-reranker-base"tokenizer = AutoTokenizer.from_pretrained(model_name_or_path)
model = AutoModelForSequenceClassification.from_pretrained(model_name_or_path, trust_remote_code=True,torch_dtype=torch.float16
)
model.eval()pairs = [["中国的首都在哪儿","北京"], ["what is the capital of China?", "北京"], ["how to implement quick sort in python?","Introduction of quick sort"]]
with torch.no_grad():inputs = tokenizer(pairs, padding=True, truncation=True, return_tensors='pt', max_length=512)scores = model(**inputs, return_dict=True).logits.view(-1, ).float()print(scores)# tensor([1.2315, 0.5923, 0.3041])

云api地址:https://help.aliyun.com/zh/model-studio/text-rerank-api

相关文章:

  • 【网络编程】十一、四万字详解 TCP 协议
  • 2025.05.17淘天机考笔试真题第二题
  • profibusDP主站转profinet网关接ABB电机保护单元与1200plc通讯
  • 大额支付系统和小额支付系统的区别在哪呢?
  • Qt做的应用程序无法彻底关闭的问题解析
  • 如何通过交流沟通实现闭环思考模式不断实现自身强效赋能-250517
  • JavaScript基础-作用域链
  • 【和春笋一起学C++】(十四)指针与const
  • cadence安装license manager无法开启,显示并行配置不正确
  • 【C语言练习】047. 理解递归与循环的转换
  • 期望是什么:(无数次的均值,结合概率)21/6=3.5
  • C++---string类
  • 编程日志5.10
  • 向量数据库Qdrant的Collection参数配置说明
  • 【嵌入式项目-MCU代码2】
  • day28 python 类与继承
  • 使用Spring Boot与Spring Security构建安全的RESTful API
  • 二叉树的中序遍历 递归调用的完整展开
  • 完整卸载 Fabric Manager 的方法
  • Python海龟绘图(Turtle Graphics)核心函数和关键要点
  • 知名中医讲师邵学军逝世,终年51岁
  • 广西鹿寨一水文站“倒刺扶手”存安全隐患,官方通报处理情况
  • 阳光保险拟设立私募证券投资基金,总规模200亿元
  • 美F-35险被胡塞武装击中,损失增大让行动成“烂尾仗”
  • 中办、国办关于持续推进城市更新行动的意见
  • 科普|男性这个器官晚到岗,可能影响生育能力