当前位置: 首页 > news >正文

ReAct与PlanReAct的定义及区别

ReAct与PlanReAct的定义及区别(基于文献《BMW Agents - A Framework for Task Automation Through Multi-Agent Collaboration.pdf》)

一、核心定义(文献3.3.1节)

1. ReAct

ReAct是一种迭代式提示策略,核心是通过“Thought(思考)-Action(行动)-Observation(观察)”的循环,引导大语言模型(LLMs)结合外部工具解决任务,实现“推理与行动的协同”。

  • Thought阶段:LLM分析当前任务目标,思考“下一步该做什么”(如“需要调用语义搜索工具获取部门销售数据”);
  • Action阶段:LLM以JSON格式定义“选择的工具”及“工具所需参数”(如指定“语义搜索工具”,参数为“部门编号:001,时间范围:2024-01至2024-06”);
  • Observation阶段:工具执行Action后返回结果(如搜索到的销售数据),该结果以“User Message”形式反馈给LLM,作为下一轮循环的输入;
  • 终止逻辑:当LLM判断任务完成时,会生成预设的“终止序列”,框架检测到该序列后停止迭代,输出最终结果。

ReAct的核心价值是让LLM摆脱“纯文本推理”局限,通过工具调用与外部世界交互,适用于需要获取实时/私有数据的任务(如文献5.1节“问答系统调用语义搜索工具”)。

2. PlanReAct

PlanReAct是文献基于ReAct改进的增强型迭代提示策略,在ReAct的“Thought-Action-Observation”循环基础上,新增“Planning(规划)步骤”,形成“Plan(规划)-Thought(思考)-Action(行动)-Observation(观察)”的迭代序列。

  • 新增的Planning阶段:LLM在每一轮循环中,先明确“当前步骤的具体小计划”(如“先验证已获取的销售数据是否完整,若不完整则补充调用数据库工具”),再进入后续思考与行动环节;
  • 核心定位:PlanReAct并非替代文献3.1.1节的Planner Agent(规划智能体),而是与Planner Agent协同——Planner Agent负责将用户复杂指令分解为“任务DAG(有向无环图)”,PlanReAct则负责对DAG中“仍较复杂的单个子任务”进一步细化执行步骤。

例如,Planner Agent将“生成部门销售报告”分解为“收集数据→计算同比→生成图表”,若“收集数据”需调用多个数据库,PlanReAct会在每一轮循环中规划“先调用A数据库查销量,再调用B数据库查成本”,确保子任务有序执行。

二、核心区别(从“步骤设计”“功能定位”“适用场景”三维度对比)

对比维度ReActPlanReAct
迭代步骤序列固定为“Thought-Action-Observation”,无规划步骤新增“Planning”步骤,序列为“Plan-Thought-Action-Observation”
任务分解能力无显式任务分解逻辑,依赖LLM自发判断下一步行动具备显式“子任务规划”能力,可细化单个复杂子任务的执行步骤
与Planner Agent的关系独立于Planner Agent,无法利用DAG中的任务依赖信息与Planner Agent协同,基于DAG中的子任务进一步规划执行细节
适用场景适用于“步骤简单、工具调用逻辑直接”的任务(如单轮语义搜索、简单文档纠错)适用于“子任务仍复杂、需多轮工具调用”的任务(如多数据库数据整合、复杂代码开发中的步骤规划)

三、文献中的协同逻辑

文献明确指出,PlanReAct是ReAct的“补充而非替代”,二者在框架中形成“分层协作”:

  1. 首先,Planner Agent将用户复杂指令分解为“任务DAG”(如“生成销售报告”→“收集数据→计算指标→生成图表→撰写报告”);
  2. 若DAG中的子任务(如“收集数据”)较简单,执行该任务的智能体(如BMW Assistant Agent)采用ReAct策略,直接通过“思考-行动-观察”调用工具完成;
  3. 若子任务(如“计算指标”需先清洗数据、再计算同比/环比、最后验证数据合理性)较复杂,智能体则采用PlanReAct策略,通过“规划-思考-行动-观察”的循环,逐步细化执行步骤,确保任务准确完成。

这种设计既保留了ReAct在简单任务中的高效性,又通过PlanReAct提升了复杂任务的执行可靠性,符合框架“模块化、适配多样化任务”的核心目标。

http://www.dtcms.com/a/407106.html

相关文章:

  • 网站 廉政建设 板块中装建设官网
  • 63.[前端开发-Vue3]Day05-非父子通信-声明周期-refs-混合-额外补充
  • 用CodeBuddy Code CLI构建现代化Vue待办事项应用:从零到部署的完整实战
  • wordpress手机端菜单广州网站优化方案
  • PostgreSQL表分区简单介绍和操作方法
  • 建设网站费用评估浙江省特种作业证查询官网
  • Charles在安全测试中的应用,接口漏洞验证与敏感数据检测
  • NAT、代理服务与内网穿透详解
  • 为什么有时候 reCAPTCHA 通过率偏低,常见原因有哪些
  • 外出也能随时 SSH 访问内网 Linux,ZeroNews 提供公网域名直达
  • 基于vue的咖啡销售系统28zz1(程序 + 源码 + 数据库 + 调试部署 + 开发环境配置),配套论文文档字数达万字以上,文末可获取,系统界面展示置于文末
  • LoadBalancer完整学习笔记:简介、原理与自定义
  • 网站建设英文怎么说洛阳php网站开发
  • 图片转文字(PDF转word,图片转word等)
  • 网站维护一年多少费北京网站建设培训
  • 让风恒定:在 unordered 的荒原上种下一棵常数级的树
  • 图书网站建设实训总结前端培训心得
  • 【Spring Cloud Alibaba】Seata(一)
  • 仓颉编程语言的stdx包介绍及使用
  • 长沙网站制作方法wordpress获得所有分类
  • 无限空间 网站网站新闻页面无法翻页
  • 民族团结 网站建设wordpress底部版权插件
  • Markdown转PDF工程化实现含图片支持与样式控制
  • Linux下安装Kafka 3.9.1
  • kafka vs rocketmq
  • 1.DHCP服务器
  • 河南网站备案代理苏州专业网站建设公司
  • 电商网站seo公司网页怎么做成网站
  • 与TCP相比,UDP有什么优缺点?
  • 从0到1制作一个go语言服务器 (一) 配置