当前位置：首页 > news >正文

RAG模型

news 2025/10/15 19:21:58

一，RAG模型的3个核心

1.Retriever第一阶段

（1）语义检索：

负责从数据集中检索出与查询相关的数据，如关键词匹配，相似度等查询。
支持模糊查询和长尾问题，例如：“治疗糖尿病的最新药物是什么？”

（2）高效索引：

使用向量数据库（如FAISS、Pinecone、Milvus）构建文档索引，支持快速最近邻搜索（ANN），在毫秒级返回相关文档。

（3）混合检索策略：

结合稀疏检索（如BM25，基于关键词统计）和稠密检索（基于语义向量），平衡精度与效率。

2.Generator第二阶段

负责基于Retriever检索到的相关信息，生成自然、连贯且知识丰富的文本,用于计算查询与文档的匹配分数。

（1）信息融合：

接收Retriever返回的多个相关文档片段，整合信息生成答案。
处理矛盾或重复内容（如不同来源的冲突信息）。

（2）可控生成：

通过提示词（prompt）或控制令牌（control tokens）引导生成方向（如指定回答长度、风格）。
支持生成结构化文本（如JSON、表格）。

（3）上下文建模：

理解对话历史或长文本上下文，生成符合场景的回复。

（4）混合检索策略：

结合稀疏检索（如BM25，基于关键词统计）和稠密检索（基于语义向量），平衡精度与效率。

3.Ranker第三阶段

负责对Retriever返回的多个相关文档或段落进行精细排序，以便Generator能够基于最相关、最权威的信息生成答案。

（1）相关性排序：

对Retriever返回的候选文档按与查询的相关性从高到低排序。
区分文档质量（如学术论文的引用次数、新闻的时效性）。

（2）上下文理解：

评估文档间的逻辑关系和互补性（如多个文档是否覆盖查询的不同方面）。
避免信息重复或矛盾（如不同来源的冲突数据）。

（3）动态调整：

根据用户反馈或生成结果优化排序策略（如多轮对话中的上下文累积）。。

查看全文

http://www.dtcms.com/a/99305.html

医疗CMS高效管理：简化更新维护流程

Open HarmonyOS 5.0 分布式软总线子系统 (DSoftBus) 详细设计与运行分析报告

自动化测试知识详解

RuoYi基础学习

拦截器和过滤器详解

前端D3.js面试题及参考答案

Linux安装Cmake （Centos 7.9）

Python小练习系列 Vol.3：生成有效括号组合（回溯 + DFS）

【15】Selenium 爬取实战

stringstream的使用

d2025329

PyGame开发贪吃蛇小游戏

Hive SQL中 ?+.+ 的用法，字段剔除

在Qt中判断输入的js脚本是否只包含函数

【Linux】常见信号 + 进程和作业

Java常用异步方式总结

硬实时操作系统（Hard Real-Time OS）与软实时操作系统（Soft Real-Time OS）的区别

matplot显示中文

json-server使用方法

Android14 SystemUI中添加第三方AIDL

java.util包之java.util.Collection介绍

并发编程之最小化共享

21_js正则_表单验证

Java基于SpringBoot的网络云端日记本系统，附源码+文档说明

若依——基于AI+若依框架的实战项目（实战篇（上））

SourceMap原理

打破循环依赖的三大法宝：Spring Boot实战解析

Msys2安装编译Redis

LearnOpenGL-笔记-其六