当前位置：首页 > news >正文

RAG应用：交叉编码器（cross-encoder）和重排序（rerank）

news 2025/7/21 0:20:40

文章目录

- - - Sentence Transformers
    - 交叉编码器
    - 交叉编码器使用示例
    - 检索和重排序

Sentence Transformers

Sentence Transformers 支持两种类型的模型: Bi-encoders 和 Cross-encoders。Bi-encoders 更快更可扩展，但 Cross-encoders 更准确。虽然两者都处理类似的高水平任务，但何时使用一个而不是另一个是相当不同的。Bi-encoders 更适合搜索，而 Cross-encoders 更适合分类和高精度排序。

交叉编码器

正如之前所说，交叉编码器同时编码两个句子，并输出一个分类标签。交叉编码器第一次生成一个单独的嵌入，它捕获了句子的表征和相关关系。与双向编码器生成的嵌入 (它们是独立的) 不同，交叉编码器是互相依赖的。这也是为什么交叉编码器更适合分类，并且其质量更高，他们可以捕获两个句子之间的关系！反过来说，如果你需要比较上千个句子的话，交叉编码器会很慢，因为他们要编码所有的句子对。

假如你有四个句子A, B, C, D，并且你需要比较所有的可能对:

一个双向编码器需要独立编码每个句子，所以它需要编码四个句子。
一个交叉编码器需要

http://www.dtcms.com/a/223595.html

相关文章：

信息安全管理与评估2025山东卷

Root权限：解锁Android的终极力量

LLM + RAG + Vanna 综合实战

移动端图片浏览插件

机器视觉视觉中的棋盘格到底是什么？为什么是棋盘格？

python训练 60天挑战-day40

在Mathematica中使用WhenEvent求解微分方程

【数据库】并发控制

shell脚本打包成可以在麒麟桌面操作系统上使用的deb包

leetcode:479. 最大回文数乘积（python3解法，数学相关算法题）

第十九章正则表达式

【Web应用】若依框架：基础篇12 项目结构

Linux 的主要时钟类型

运行python文件规范日志

开发体育平台，怎么接入最合适的数据接口

Display Driver Uninstaller(DDU卸载显卡驱动工具)官网下载

element上传文件多选实现文件排序

GROMACS 软件包介绍与使用指南

LangChain-LangGraph框架应用实例

Catch That Cow POJ - 3278

java代码性能优化

什么是Docker容器？

初探Linux内核：解锁Linux操作系统的基本核心的奥秘（二）

JavaSE:面向对象进阶之接口（Interface）

基于频分复用导频的MMSE信道估计方法设计与仿真

kuboard自带ETCD存储满了处理方案

编程技能：格式化打印01，vsprintf 函数族简介

(22)大文件流式处理

MySql--定义表存储引擎、字符集和排序规则

黑森林实验室 FLUX.1Kontext：革新图像修改的 AI 力量