当前位置: 首页 > news >正文

Agent简介

在大模型语境下,Agent(智能体) 是指基于大模型驱动,具备自主理解目标、规划步骤、调用工具、执行任务,并能根据反馈持续优化的智能系统。

它突破了传统大模型 “单次问答” 的局限,能像 “助手” 一样主动完成复杂、多步骤的任务(比如写报告、做旅行规划、数据分析等),核心特征是自主性(无需人类步步干预)、动态性(根据环境 / 反馈调整行为)和目标导向(聚焦最终任务结果)

Agent的核心特征是“自主性”。它不仅仅是回答问题,而是驱动行动。

Agent 的工作逻辑可概括为 “感知 - 规划(决策) - 执行 - 反思” 的循环;

Agent的工作流程:

  1. 感知(理解阶段)
    即理解用户的意图,把握用户真实意图
    感知能力可以是
文本理解:理解用户的自然语言指令
数据分析:解读结构化和非结构化数据
网络感知:浏览和理解网页内容
多模态感知:处理图像、音频等多种信息形式
  1. 规划阶段(决策)
    将大目标分解为可执行的子任务,明确步骤顺序和优先级。
    其中包括
目标分解:将复杂目标拆分为可执行的子任务
路径规划:确定最优的执行顺序和方法
推理判断:基于已知信息进行逻辑推理
优先级排序:决定任务的重要性和紧急程度
  1. 执行阶段(执行)
    针对子任务,自主决定是否需要调用外部工具(工具是 Agent 延伸能力的关键)
    执行能力可以让Agent从"顾问"变成"执行者"
    行动能力一般包括
工具调用:使用搜索引擎、计算器、API等外部工具
内容生成:创建文本、图像、代码等内容
系统交互:与操作系统、应用程序交互
持续执行:长时间、多步骤任务的连贯执行
等等
  1. 监控阶段(整合评估)
    接收工具返回的结果,通过大模型理解并整合。若结果不满足子任务需求,则触发 “重新调用工具” 或 “调整工具类型”。
    检查当前进度与目标的差距,判断是否需要修正策略。然后再次循环。
    有时甚至会有多轮迭代;

  2. 总结阶段
    整合结果,以适当形式呈现给用户

Agent的工作流程要用到的技术或关键词:

  1. 提示工程(Prompt Engineering):设计指令模板(如 “请将任务拆解为 3-5 个步骤,说明优先级”)引导大模型生成结构化规划;
  2. 思维链(Chain of Thought, CoT): 这也是一种提示工程,称为思维链提示, 其目的是让AI像人类一样 “逐步思考”提升规划合理性。例如: 在指令中加入 “请先分析步骤,再给出答案” 的引导,强制 AI 暴露思考过程,避免直接输出错误结论(尤其适用于数学题、逻辑题、因果分析)。
  3. 短期记忆(Working Memory):存储当前会话的上下文(如用户最新需求、已完成的子任务、工具返回的临时结果),通常依赖大模型的上下文窗口;
  4. 长期记忆(Long-term Memory):存储历史任务经验、用户偏好、通用知识(如 “某工具的调用限制”),长期记忆常用外部记忆系统,如: RAG系统,mem0等

常用的Agent开发框架

  1. LangChain/LangGraph
    他们非专为 Agent 设计,但提供了构建 Agent 的核心组件(如工具调用、记忆、链管理),灵活性高,适合定制化开发。
用 LangChain 的场景:
简单任务(如单轮工具调用、固定模板生成)、快速验证想法(借助其丰富的工具集成和开箱即用的 Agent 模板)、不需要复杂流程迭代的场景。用 LangGraph 的场景:
复杂 Agent 闭环(如 “感知 - 规划 - 执行 - 反思” 循环)、多步骤依赖任务(如 “调研→写作→评审→修改”)、多 Agent 协作(如拆分角色为 “数据 Agent”“写作 Agent”,通过节点通信协作)。实际开发中,两者常结合使用 —— 用 LangChain 提供的工具集(如Tool类、ChatOpenAI模型接口)作为 “组件库”,用 LangGraph 搭建复杂的流程控制逻辑(如状态管理、节点流转),实现 “组件复用 + 灵活流程” 的组合。
  1. AutoGen和AutoGPT
维度AutoGenAutoGPT
核心能力多 Agent 协作、人类介入、动态分工单 Agent 自主、目标驱动、自我迭代
优势场景复杂多角色任务、需人类干预的任务简单单目标任务、纯自动化演示
局限性需设计角色分工,配置稍复杂复杂任务易低效或出错

选择建议

  • 若任务需要多专业角色配合(如跨部门项目)或人类中途决策(如方案评审),选 AutoGen;

  • 若任务简单、单目标(如信息整理)或需要快速演示自主能力,选 AutoGPT;

  • 复杂且无需人类介入的任务,更建议结合 LangGraph 等框架(兼顾流程灵活性和自主性)。

一些低代码Agent平台: MaxKB coze Dify(推荐) FastGPT N8N

http://www.dtcms.com/a/550430.html

相关文章:

  • window系统如何用快捷键输入一段文字
  • 手机中有那些常用的5G频段
  • LeetCode:72. 超级次方
  • 网站模板怎么用软件开发流程流程图
  • 东莞seo网站排名wordpress 图片切换插件
  • Algorithm Refinement: ε-Greedy Policy|算法改进:ε-贪婪策略
  • 数学分析简明教程——1.3
  • 请将网站首页底部的备案号网站内容架构拓扑怎么做
  • Flutter---个人信息(2)---实现修改昵称
  • 深入解析 TCP 协议:从细节到实践的全方位解读
  • 题解:P12603 RuShiA(特殊情况下的 RSA 爆破)
  • 营销型网站建设和平台建设网站排行榜查询
  • 【代码】CF915E Physical Education Lessons [动态开点线段树]
  • 打造全新QAgent WeTest AI业务新上线
  • 虚拟主机怎么弄网站网站seo规范
  • 【技术经验】--如何和 Cursor 高效协作
  • 建网上商城的第三方网站哪个好17网站一起做网店潮汕
  • 關於概率部分,準備的三部曲
  • 新人做网站盈利北京小程序 app开发公司
  • 东莞网站设计智能 乐云践新网站开发 所有权
  • 在service方法中已经catch异常,Transactional失效怎么办
  • 服务平台网站设计门户网官网
  • 在线自助下单网站班级空间网站建设作用
  • Polarctf 写shell
  • 中建建筑网站机械设计师网课
  • 学习笔记一:基本术语
  • ssh网站开发的书籍织梦茶叶网站模板
  • 求网站建设详细过程网络规划设计师是高级职称吗
  • 【Linux权限 (二)】Linux权限机制深度解析:umask如何决定默认权限与粘滞位的妙用
  • 基于 Flask + APScheduler + MySQL 的自动报表系统设计