当前位置: 首页 > news >正文

Rerank的评测

RAG中如果第一次的召回不是很理想,最好优先排查一下相似度检索算法。如果发现是相似度算法的问题,那么可以增大top-k,然后引入更精确的算法进行rerank

针对rerank的评测,使用命中率(hit rate)和平均倒数排名两个指标(MRR)。

  • 命中率(Hit rate):计算在前k个检索文档中找到正确答案的查询比例。简单来说,它是关于我们的系统在前几次猜测中正确的频率。

  • 平均倒数排名(MRR):对于每个查询,MRR通过查看排名最高的相关文档的排名来评估系统的准确性。具体来说,它是所有查询中这些秩的倒数的平均值。因此,如果第一个相关文档是顶部结果,则倒数排名为1;如果是第二个,倒数是1/2,以此类推。

评测rerank模型需要通过embedding 模型的支持。因此想要通过rerank模型提升效果需要实际的选择rerank模型和embedding模型。

上图来自llamaindex项目团队的一个对比测试(https://www.llamaindex.ai/blog/boosting-rag-picking-the-best-embedding-reranker-models-42d079022e83)

那么从表中选择最优解可以大大提高我们的召回效果。

相关文章:

  • 大模型-modelscope下载和使用chatglm3-6b模型
  • 【JUC】深入解析 JUC 并发编程:单例模式、懒汉模式、饿汉模式、及懒汉模式线程安全问题解析和使用 volatile 解决内存可见性问题与指令重排序问题
  • C++八股 —— 手撕线程池
  • Java限制单价小数位数方法
  • GitLens 教学(学习更新中)
  • 2025年渗透测试面试题总结-匿名[校招]红队攻防工程师(题目+回答)
  • 特伦斯 S75 电钢琴:重塑演奏美学的至臻之选
  • 数字化那点事系列文章
  • 软件工程:关于招标合同履行阶段变更的法律分析
  • [网页五子棋][对战模块]前后端交互接口(建立连接、连接响应、落子请求/响应),客户端开发(实现棋盘/棋子绘制)
  • 系统思考:经营决策沙盘
  • WebBuilder数据库:企业数据管理的能力引擎
  • Vad-R1:通过从感知到认知的思维链进行视频异常推理
  • 初学c语言21(文件操作)
  • C语言进阶--自定义类型详解(结构体、枚举、联合)
  • 2022 RoboCom 世界机器人开发者大赛-本科组(省赛)解题报告 | 珂学家
  • 【仿生机器人】机器人情绪系统的深度解析
  • 从监控到告警:Prometheus+Grafana+Alertmanager+告警通知服务全链路落地实践
  • Docker Compose使用自定义用户名密码启动Redis
  • 经典SQL查询问题的练习第二天
  • 上海网站建设培训/资源搜索神器
  • 做直播网站vps可以吗/中国免费网站服务器2020
  • 模板网站可以做推广吗/百度手机极速版
  • 优质网站建设/爱站seo查询软件
  • 大理如何做百度的网站/软件公司
  • 商务网站建设实验/英雄联盟世界排名