当前位置：首页 > news >正文

Google 智能体设计模式：知识检索（RAG）

news 2025/10/11 7:08:15

1. 背景与意义

LLM 的局限：仅依赖训练数据，知识静态，无法访问实时、专有或特定领域信息 → 导致回答过时、不准确或缺乏上下文。
RAG 的作用：通过检索外部知识库并增强提示，使 LLM 从“闭卷推理者”变为“开卷推理者”，生成更准确、可验证的答案。
价值：减少幻觉、支持引用、整合企业内部知识、提升可信度与实用性。

2. RAG 工作流程

用户提出问题
系统在外部知识库中进行语义搜索，检索相关片段（chunks）
将检索结果与原始提示增强合并
LLM 基于增强提示生成答案

3. 核心概念

嵌入（Embeddings）：文本的向量化表示，捕捉语义关系。
文本相似度：衡量两段文本的相似程度，基于语义而非仅词汇。
语义相似度/距离：语义越接近，向量空间距离越小。
文档分块（Chunking）：将大文档拆分为小片段，便于检索与上下文保持。
检索方法：
- 向量搜索（基于语义）
- BM25（基于关键词）
- 混合搜索（结合两者优势）
向量数据库：高效存储与检索嵌入，如 Pinecone、Weaviate、Chroma、Milvus、Qdrant，或 Redis/Elasticsearch/Postgres(pgvector)。

4. RAG 的挑战

信息分散在多个块或文档 → 检索不完整
分块与检索质量直接影响结果
矛盾信息难以综合
知识库需预处理并持续更新 → 成本高
性能问题：延迟、token 消耗、运营成本

5. 高级演进模式

GraphRAG

机制：利用知识图谱而非向量库，基于实体与关系（节点-边）检索。
优势：能综合分散信息，回答复杂跨文档问题。
应用：金融分析、基因研究等。
缺点：构建与维护成本高，灵活性差，延迟更大。

Agentic RAG

机制：引入推理 agent，主动评估、验证、协调检索结果。
能力：
1. 源验证：选择最新、权威文档，丢弃过时信息
2. 冲突协调：在矛盾数据中优先可靠来源
3. 多步推理：分解复杂问题，执行子查询并综合
4. 知识补全：识别缺口，调用外部工具（如实时搜索）
挑战：复杂性与成本显著增加，可能引入新的错误与延迟。

6. 实际应用场景

企业搜索与问答：基于内部文档（HR政策、技术手册）回答员工问题
客户支持：自动回答 FAQ、产品手册问题
个性化推荐：基于语义相关性推荐内容
新闻与时事摘要：结合实时新闻源生成最新总结
法律、科研、金融分析：需要可验证、基于事实的答案

7. 经验法则

何时使用 RAG：当需要 LLM 基于最新、专有或特定领域信息回答问题时。
优势：减少幻觉、支持引用、增强可信度。
权衡：准确性与上下文增强 vs. 系统复杂性与延迟。

8. 关键要点总结

RAG 让 LLM 从静态知识转向动态、可验证知识。
基础技术：嵌入、语义搜索、向量数据库、分块策略。
高级模式：GraphRAG（知识图谱）、Agentic RAG（推理 agent）。
应用广泛：企业、客服、新闻、科研、金融。
挑战：信息碎片化、冲突协调、知识库维护、性能开销。

http://www.dtcms.com/a/465480.html

相关文章：

山西网站建设找哪家商丘做网站公司新站seo快速收录网页内容页的方法

健身网站的建设方案充电宝关键词优化

LOTVACUUM HDSeries 系列HD550系列真空泵韩国Manual

视觉新范式：ResNet+Transformer双路径融合，顶刊解析遥感分割与动作识别新SOTA

网站备案怎么转入常州网站建设书生商友

Neo4j图数据库上手指南

计算机基础知识 | 计网 | 状态检测防火墙（Stateful Firewall）

给公司做网站销售怎样啦中国建设银行演示网站

RSA加密从原理到实践：Java后端与Vue前端全栈案例解析

[VoiceRAG] 前端实时通信 | useRealTime钩子

Typora 配置 PicGo 使用 Gitee 图床实现图片自动上传（Mac 详细教程）

安装elk

RNN-seq2seq 英译法案例

房地产网站案例电商网站建设与运营方向

2025年企微SCRM工具核心功能深度测评：微盛AI·企微管家领跑赛道

Deepwiki AI技术揭秘 - 系统架构分析篇

做斗图的网站html5 手机网站教程

Flink面试题及详细答案100道（61-80）- 时间与窗口

Git 报错：fatal: update_ref failed for ref ‘ORIG_HEAD‘ 解决记录

关于域名和主机论坛的网站北京实创装修公司官网

Apache Spark 上手指南（基于 Spark 3.5.0 稳定版）

COA学习,Chain of Agents

winform本地上位机-ModbusRTC1.上位机控制台与数据监控（数据监控架构思维与图表系列）

如何建立“长期主义+短期收益”并存的商业闭环？

敏捷管理之看板方法：可视化管理的流程设计与优化技巧

Linux学习笔记--查询_唤醒方式读取输入数据

信道编码定理和信道编码逆定理

订餐网站开发流程wordpress显示运行时间

ubuntu 24.04 FFmpeg编译带Nvidia 加速记录

关于springboot定时任务和websocket的思考