当前位置：首页 > news >正文

langchain框架中各种Agent（LLMSingleAgent ReactAgent Plan-and-Execute Agent）原理方式对比

news 2025/10/8 15:13:42

在LangChain框架中，LLMSingleActionAgent与ReAct Agent及其他Agent类型在内部原理上存在显著差异，主要体现在推理机制、行动策略、动态性等方面。以下结合实例进行详细说明：

LLMSingleActionAgent是LangChain中基于单步操作的Agent实现，其核心逻辑是通过LLMChain和输出解析器（OutputParser）决定下一步动作。

结构：
- LLMChain：负责生成AgentAction或AgentFinish，通过提示模板（PromptTemplate）指导语言模型输出结果。
- 输出解析器：将LLM的输出解析为具体动作（如调用工具或终止任务）。
- 停止序列：当LLM生成特定字符串（如stop=["\n观察:"）时，停止生成。
特点：
- 静态决策：仅根据当前状态决定下一步动作，不记录历史上下文。
- 单步操作：每次仅执行一个动作，例如调用工具或返回最终答案。
- 示例：若任务是“查找玫瑰的市场价格并加价15%”，LLMSingleActionAgent可能直接调用搜索引擎工具获取价格，但无法动态调整策略（如发现数据不足时重新搜索）。

ReAct（Reasoning + Acting）框架通过交替推理与行动实现复杂任务处理，其核心是动态调整策略。

结构：
- 推理阶段：生成推理轨迹（如“玫瑰当前价格=？→ 加价15%后价格=？”），通过工具描述（tool_description）选择合适工具。
- 行动阶段：调用外部工具（如Google搜索）获取数据，补充到推理中。
- 协同机制：推理结果指导行动，行动结果反馈到推理中，形成闭环。
特点：
- 动态决策：根据推理结果动态选择工具，例如发现搜索结果不一致时，可重新调用工具验证。
- 可解释性：通过推理轨迹展示思考过程，提升任务透明度。
- 示例：在“玫瑰价格计算”任务中，ReAct Agent会先推理需要价格数据，调用搜索引擎获取当前价格，再计算加价后价格。若搜索结果不一致，可重新调用工具修正数据。

维度	LLMSingleActionAgent	ReAct Agent	Zero-shot ReAct	Conversational ReAct	Plan-and-Execute
推理机制	静态推理（仅当前状态）	动态推理（结合历史与工具）	静态推理（零样本）	动态推理（结合记忆）	预先规划推理步骤
行动策略	单步调用工具或返回结果	交替推理与行动，动态调整工具	直接调用工具	结合记忆优化工具选择	预先规划工具顺序
动态性	无动态调整能力	支持动态调整（如重新搜索）	无动态调整	支持动态调整（如修正历史数据）	无动态调整
适用场景	简单任务（如翻译、生成）	复杂任务（如多步骤推理、数据验证）	零样本任务	多轮对话任务	结构化任务

任务：计算“玫瑰当前市场价格并加价15%”。

LLMSingleActionAgent：
1. 调用搜索引擎工具获取玫瑰价格（假设返回$100）。
2. 直接计算$100 × 1.15 = $115，返回结果。
  问题：若搜索结果不一致，无法动态修正。
ReAct Agent：
1. 推理：“需要玫瑰当前价格”→调用搜索引擎。
2. 收到$100后，计算加价→返回$115。
3. 若搜索结果不一致，可重新调用工具修正数据。
Plan-and-Execute Agent：
1. 预先规划步骤：“搜索价格→计算加价”。
2. 顺序执行，无法动态调整。