当前位置: 首页 > news >正文

Google 智能体设计模式:知识检索(RAG)

1. 背景与意义

  • LLM 的局限:仅依赖训练数据,知识静态,无法访问实时、专有或特定领域信息 → 导致回答过时、不准确或缺乏上下文。
  • RAG 的作用:通过检索外部知识库并增强提示,使 LLM 从“闭卷推理者”变为“开卷推理者”,生成更准确、可验证的答案。
  • 价值:减少幻觉、支持引用、整合企业内部知识、提升可信度与实用性。
    在这里插入图片描述

2. RAG 工作流程

  1. 用户提出问题
  2. 系统在外部知识库中进行语义搜索,检索相关片段(chunks)
  3. 将检索结果与原始提示增强合并
  4. LLM 基于增强提示生成答案

3. 核心概念

  • 嵌入(Embeddings):文本的向量化表示,捕捉语义关系。
  • 文本相似度:衡量两段文本的相似程度,基于语义而非仅词汇。
  • 语义相似度/距离:语义越接近,向量空间距离越小。
  • 文档分块(Chunking):将大文档拆分为小片段,便于检索与上下文保持。
  • 检索方法
    • 向量搜索(基于语义)
    • BM25(基于关键词)
    • 混合搜索(结合两者优势)
  • 向量数据库:高效存储与检索嵌入,如 Pinecone、Weaviate、Chroma、Milvus、Qdrant,或 Redis/Elasticsearch/Postgres(pgvector)。

4. RAG 的挑战

  • 信息分散在多个块或文档 → 检索不完整
  • 分块与检索质量直接影响结果
  • 矛盾信息难以综合
  • 知识库需预处理并持续更新 → 成本高
  • 性能问题:延迟、token 消耗、运营成本

5. 高级演进模式

GraphRAG

  • 机制:利用知识图谱而非向量库,基于实体与关系(节点-边)检索。
  • 优势:能综合分散信息,回答复杂跨文档问题。
  • 应用:金融分析、基因研究等。
  • 缺点:构建与维护成本高,灵活性差,延迟更大。

Agentic RAG

  • 机制:引入推理 agent,主动评估、验证、协调检索结果。
  • 能力
    1. 源验证:选择最新、权威文档,丢弃过时信息
    2. 冲突协调:在矛盾数据中优先可靠来源
    3. 多步推理:分解复杂问题,执行子查询并综合
    4. 知识补全:识别缺口,调用外部工具(如实时搜索)
  • 挑战:复杂性与成本显著增加,可能引入新的错误与延迟。

6. 实际应用场景

  • 企业搜索与问答:基于内部文档(HR政策、技术手册)回答员工问题
  • 客户支持:自动回答 FAQ、产品手册问题
  • 个性化推荐:基于语义相关性推荐内容
  • 新闻与时事摘要:结合实时新闻源生成最新总结
  • 法律、科研、金融分析:需要可验证、基于事实的答案

7. 经验法则

  • 何时使用 RAG:当需要 LLM 基于最新、专有或特定领域信息回答问题时。
  • 优势:减少幻觉、支持引用、增强可信度。
  • 权衡:准确性与上下文增强 vs. 系统复杂性与延迟。

8. 关键要点总结

  • RAG 让 LLM 从静态知识转向动态、可验证知识。
  • 基础技术:嵌入、语义搜索、向量数据库、分块策略。
  • 高级模式:GraphRAG(知识图谱)、Agentic RAG(推理 agent)。
  • 应用广泛:企业、客服、新闻、科研、金融。
  • 挑战:信息碎片化、冲突协调、知识库维护、性能开销。
http://www.dtcms.com/a/465480.html

相关文章:

  • 山西网站建设找哪家商丘做网站公司新站seo快速收录网页内容页的方法
  • 健身网站的建设方案充电宝关键词优化
  • LOTVACUUM HDSeries 系列HD550系列真空泵韩国Manual
  • 视觉新范式:ResNet+Transformer双路径融合,顶刊解析遥感分割与动作识别新SOTA
  • 网站备案怎么转入常州网站建设书生商友
  • Neo4j图数据库上手指南
  • 计算机基础知识 | 计网 | 状态检测防火墙(Stateful Firewall)
  • 给公司做网站销售怎样啦中国建设银行演示网站
  • RSA加密从原理到实践:Java后端与Vue前端全栈案例解析
  • [VoiceRAG] 前端实时通信 | useRealTime钩子
  • Typora 配置 PicGo 使用 Gitee 图床实现图片自动上传(Mac 详细教程)
  • 安装elk
  • RNN-seq2seq 英译法案例
  • 房地产 网站 案例电商网站建设与运营方向
  • 2025年企微SCRM工具核心功能深度测评:微盛AI·企微管家领跑赛道
  • Deepwiki AI技术揭秘 - 系统架构分析篇
  • 做斗图的网站html5 手机网站 教程
  • Flink面试题及详细答案100道(61-80)- 时间与窗口
  • Git 报错:fatal: update_ref failed for ref ‘ORIG_HEAD‘ 解决记录
  • 关于域名和主机论坛的网站北京实创装修公司官网
  • Apache Spark 上手指南(基于 Spark 3.5.0 稳定版)
  • COA学习,Chain of Agents
  • winform本地上位机-ModbusRTC1.上位机控制台与数据监控(数据监控架构思维与图表系列)
  • 如何建立“长期主义+短期收益”并存的商业闭环?
  • 敏捷管理之看板方法:可视化管理的流程设计与优化技巧
  • Linux学习笔记--查询_唤醒方式读取输入数据
  • 信道编码定理和信道编码逆定理
  • 订餐网站开发流程wordpress显示运行时间
  • ubuntu 24.04 FFmpeg编译 带Nvidia 加速记录
  • 关于springboot定时任务和websocket的思考