当前位置：首页 > news >正文

Rerank的评测

news 2025/7/24 10:15:32

RAG中如果第一次的召回不是很理想，最好优先排查一下相似度检索算法。如果发现是相似度算法的问题，那么可以增大top-k，然后引入更精确的算法进行rerank

针对rerank的评测，使用命中率（hit rate）和平均倒数排名两个指标（MRR）。

命中率（Hit rate）：计算在前k个检索文档中找到正确答案的查询比例。简单来说，它是关于我们的系统在前几次猜测中正确的频率。
平均倒数排名(MRR):对于每个查询，MRR通过查看排名最高的相关文档的排名来评估系统的准确性。具体来说，它是所有查询中这些秩的倒数的平均值。因此，如果第一个相关文档是顶部结果，则倒数排名为1;如果是第二个，倒数是1/2，以此类推。

评测rerank模型需要通过embedding 模型的支持。因此想要通过rerank模型提升效果需要实际的选择rerank模型和embedding模型。

上图来自llamaindex项目团队的一个对比测试（https://www.llamaindex.ai/blog/boosting-rag-picking-the-best-embedding-reranker-models-42d079022e83）

那么从表中选择最优解可以大大提高我们的召回效果。

http://www.dtcms.com/a/223185.html

相关文章：

大模型-modelscope下载和使用chatglm3-6b模型

【JUC】深入解析 JUC 并发编程：单例模式、懒汉模式、饿汉模式、及懒汉模式线程安全问题解析和使用 volatile 解决内存可见性问题与指令重排序问题

C++八股 —— 手撕线程池

Java限制单价小数位数方法

GitLens 教学（学习更新中）

2025年渗透测试面试题总结-匿名[校招]红队攻防工程师（题目+回答）

特伦斯 S75 电钢琴：重塑演奏美学的至臻之选

数字化那点事系列文章

软件工程：关于招标合同履行阶段变更的法律分析

[网页五子棋][对战模块]前后端交互接口(建立连接、连接响应、落子请求/响应)，客户端开发(实现棋盘/棋子绘制)

系统思考：经营决策沙盘

WebBuilder数据库：企业数据管理的能力引擎

Vad-R1：通过从感知到认知的思维链进行视频异常推理

初学c语言21（文件操作）

C语言进阶--自定义类型详解（结构体、枚举、联合）

2022 RoboCom 世界机器人开发者大赛-本科组（省赛）解题报告 | 珂学家

【仿生机器人】机器人情绪系统的深度解析

从监控到告警：Prometheus+Grafana+Alertmanager+告警通知服务全链路落地实践

Docker Compose使用自定义用户名密码启动Redis

经典SQL查询问题的练习第二天

JNI开发流程

OS9.【Linux】基本权限(下)

Vue-收集表单信息

动态IP与区块链：重构网络信任的底层革命

Maven高级篇

迈迪工具集添加标准件

【征求意见】四川省大数据发展研究会关于对《数据资源建设费用测算标准》团体标准征求意见的通知

ASR、TTS与语音克隆技术简介

LevelDB、BoltDB 和 RocksDB区块链应用比较

一、虚拟货币概述