当前位置：首页 > news >正文

ASRank: Zero-Shot Re-Ranking with Answer Scent for DocumentRetrieval

news 2025/9/23 19:39:38

一、动机

传统的检索方法不能将最相关的文档放在前面

二、解决方法

参考信息线索：一条相关信息的轨迹，引导用户找到正确的答案。

第一步：利用LLM生成答案线索，在整个过程中只执行一次。

第二步：使用较小的模型根据生成的答案线索对文档进行重新排序

三、方法详细

首先使用已有的检索方法检索到一些相关的文档，检索到了K个文档，记为下面：

第一步：利用LLM进行答案的线索生成

LLM是基于自回归模型来生成，序列中的每个单词的概率，即条件概率，通常使用Transformer模型实现，所以，我们还要使用一个掩码来遮盖未来的单词序列。表达式如下：

通过零样本的方法，让LLM生成一个答案线索，来引导LLM生成与查询语境相符的答案

第二步：重排序

贝叶斯定理：获得新的信息后，如何更新我们对事件发生的概率

概率的知识：

相乘（联合概率）：当你需要计算 两个事件同时发生的概率 时，使用相乘。这是 条件概率 或 联合概率 的基本概念。它可以表示为 P(A∩B)=P(A∣B)⋅P(B)，即两个事件依赖或独立发生的概率。

相加（加法规则）：当你需要计算 至少一个事件发生的概率 时，使用相加。如果事件是互斥的，可以直接相加；如果事件是 非互斥 的，需要减去它们同时发生的部分，以避免重复计算。

ASRANK是一个无监督的重排序方法，它的核心就是，通过LLM来评估文档的相关性，利用低一步产生的答案线索，作为上下文来判断相关性。

文档的相关性的得分计算如下：

文档的评估得分就是在给定的文档、查询、和答案线索的条件下，计算答案的每个token的logit然后对所有的logit求和就是这个文档整体的相关性

根据贝叶斯定理，来重构这个相关性分数：

用下面的这个公式计算查询和文档和答案线索条件下生成的答案概率：

最后使用下面的公式来计算文档的相关性分数：

注：注解，在基础相关的情况下，前面相关的概率

最后，我们选择分数最高的为最相关的文档：

四、结果

1.数据集：

TriviaQA、Natural Questions (NQ)、WebQuestions、EntityQuestions、ArchivalQA、HotpotQA、NFCorpus、DBPedia、Touche 和 News、TREC-DL19

2.评估指标

exact match, recall, F1 scores

3.实验结果

http://www.dtcms.com/a/114935.html

相关文章：

蓝桥杯_LITS游戏俄罗斯方块模拟暴力搜索 DFS 剪纸枚举

TRPO和PPO算法详解

C++单例模式

让ChatGPT用DeepReaserch指导进行学术写作

vue猜词游戏

进程内存分布--之理论知识

中钧科技通过数字赋能，编织“数字互联网”助力数字化进程！

SSM整合实战

手搓多模态-03 顶层和嵌入层的搭建

玄机-应急响应-入侵排查

图解AUTOSAR_SWS_FlexRayARTransportLayer

性能问题排查工具介绍

移动应用开发实验室2024二面纳新题复盘

【家政平台开发(20)】系统监控与日志管理设计：稳固运行的基石

【内网安全】DHCP 饿死攻击和防护

[特殊字符] 驱动开发硬核特训 · Day 4

Vue3响应式引擎解密：从依赖追踪到性能调优的深度之旅

微服务系统记录

Java 数组与 ArrayList 核心区别解析：从源码到实战！！！

远距离无线网络传输设备-网桥（1/5/15 km）

C++Primer - 动态内存管理

优选算法的妙思之流：分治——归并专题

静态库与动态库

整理一些大模型部署相关的知识

对责任链模式的理解

7.4 SVD 的几何背景

JCR一区文章，壮丽细尾鹩莺算法Superb Fairy-wren Optimization-附Matlab免费代码

介质访问控制——信道划分

from fastmcp import FastMCP和from mcp.server.fastmcp import FastMCP的区别是什么？

C51单片机学习笔记——LCD1602调试