当前位置：首页 > news >正文

RAG升级：Re-rank模型微调，实现极致检索精度

news 2025/7/16 8:53:27

传统的RAG召回阶段通常采用**双编码器（Bi-Encoder）**架构，如基于向量的相似度搜索。它将查询（Query）和文档块（Passage）独立编码为向量，然后快速计算它们之间的相似度。这种方式速度快，适合在海量数据中进行初步筛选（召回）。

双编码器的局限：由于查询和文档块是独立编码的，模型无法捕捉它们之间细微的、深度的交互信息。例如，它可能难以理解否定、反讽、复杂的条件关系等。

Re-rank模型的出现：Re-rank模型通常采用交叉编码器（Cross-Encoder）架构。它将查询和单个文档块拼接在一起，作为一个整体输入到Transformer模型中，让模型内部的自注意力机制充分捕捉二者之间的深度交互关系，最终输出一个单一的相关性分数。

RAG中的两阶段检索流程：

虚拟线程,多线程,单线程

小白成长之路-LVS

AI生成单词消消乐游戏. HTML代码

hercules zos 安裝 jdk 8

MyBatis04-MyBatis小技巧

DevOps

JVM 锁自动升级机制详解

哈希扩展 --- 布隆过滤器

会计 - 22 - 外币折算

CTFSHOW pwn161 WP

如何成为 PostgreSQL 中级专家

JAVA AI智能体——1 入门

day5--上传视频