详解代理型RAG与MCP服务器集成
检索增强型生成(RAG)将语言模型与外部知识检索相结合,让模型的回答基于最新的事实,而不仅仅是其训练数据呢。
RAG(高级别)
在 RAG 流程中,用户查询用于搜索知识库(通常通过向量数据库中的嵌入来实现),并将检索到的最相关文档“增强”到模型的提示中,以帮助生成事实性的回答呢。
这减少了幻觉现象,并且允许在回答中使用特定领域的或私有的数据呢。
然而,传统的 RAG 存在局限性呢:它通常只查询单一数据源,并且只进行一次检索,所以如果初始结果不佳或者查询措辞奇怪,答案就会受影响呢。
系统并没有内置的机制来推理如何检索到更好的信息,或者在需要时使用额外的工具呢。
代理型 RAG
代理型 RAG 弥补了这些不足,通过在 RAG 循环中引入一个 AI 代理 呢。在一个代理型 RAG 系统中,检索和生成组件由一个智能代理来协调,这个代理能够规划多步骤查询,使用各种工具,并且根据查询和中间结果调整其策略呢。换句话说,“