当前位置: 首页 > news >正文

【大模型】Agent之:从Prompt到Context的演进之路

Agent框架演进之路

  • 1、引言
  • 2、Agent核心概念与架构演进
    • 2.1. Agent的本质:目标驱动的智能体
    • 2.2. 架构演进:从单点交互到系统协同
  • 3、从Prompt Engineering到Context Engineering:范式的必然转移
    • 3.1 Context Engineering 的核心概念与目标
      • 3.1.1. 上下文的组成与结构
    • 3.1.2. 上下文生命周期管理
      • 3.1.3. 核心目标
    • 3.2. Prompt Engineering的局限性
    • 3.3. Context Engineering的革命性突破
  • 4、RAG:Context Engineering的基石技术
    • 4.1. RAG的核心原理
    • 4.2. RAG在Context工程中的关键作用
    • 4.3 超越 RAG:Context Engineering 的广阔外延
  • 5、总结

1、引言

小屌丝:鱼哥,国庆假期去哪啊?
小鱼:哪也不去啊
小屌丝:哎呦呦 ~ 哎呦呦~
小鱼:饭菜很热?
小屌丝:不热啊,温度正好
小鱼:我还以为这饭菜热,烫到你嘴呢。
小屌丝:那倒没有
小鱼:没有,你哎呦呦啥?
小屌丝:你这十一期间哪也不去,我很是意外,不是你的性格
小鱼:人嘛~ 总是要陪陪家人的嘛
小屌丝:呀~ 鱼哥,你变了
小鱼:你指的是我的颜值吗?
小屌丝:看图
在这里插入图片描述

小屌丝:鱼哥, 你别真走啊
小鱼:堂堂七尺男儿,岂能…
小屌丝:… 这不是闹着玩嘛,
小鱼:说吧,有啥事?
小屌丝:嘿嘿,就是, 待会泡澡啊
小鱼:条件是啥?
小屌丝:嘿嘿,还的是鱼哥, 给俺讲一讲 智能体啊
小鱼:工具、记忆…
小屌丝:打住, 鱼哥,我想听 Context
小鱼:… 先泡澡
小屌丝:先讲智能体,这样放松的时间长…
小鱼:…

2、Agent核心概念与架构演进

2.1. Agent的本质:目标驱动的智能体

Agent是以LLM为“大脑”的自主系统,具备四大核心能力:

  • 感知:通过多模态输入理解环境;
  • 规划:分解复杂任务为可执行子目标;
  • 记忆:存储短期上下文与长期知识;
  • 行动:调用工具完成闭环操作。

在这里插入图片描述

2.2. 架构演进:从单点交互到系统协同

  • 传统Prompt Engineering依赖静态指令(如Few-Shot示例),但面临四大瓶颈:

    • 脆弱性:措辞微调导致输出剧变;
    • 扩展性差:难以应对高并发复杂任务;
    • 无状态性:无法维持长程记忆;
    • 用户负担重:需手动构建完整上下文。
  • Context Engineering则构建动态信息环境,通过三层上下文协同驱动Agent:

    • 指令上下文:行为规则与示例(如System Prompt);
    • 知识上下文:RAG外挂私有知识库;
    • 操作上下文:工具调用与环境反馈。

3、从Prompt Engineering到Context Engineering:范式的必然转移

3.1 Context Engineering 的核心概念与目标

Context Engineering 是一个系统工程,它围绕着如何高效、精准地管理智能体的“工作记忆”。其核心概念包括:

3.1.1. 上下文的组成与结构

一个工程化良好的上下文不再是对话历史的简单堆砌,而是高度结构化的信息块:

  • 系统指令:智能体的“宪法”,定义了其核心身份、行为准则和最高目标。这部分通常相对稳定。

  • 对话历史:最近的几轮问答,维持对话的连贯性。需要智能修剪,防止冗余。

  • 检索到的记忆:从长期记忆(向量数据库)中检索到的、与当前任务最相关的知识片段。

  • 工具描述与结果:可用的工具列表,以及当前循环中已执行工具的行动和观察结果。

  • 内部思考链:智能体自己的推理过程(Thought:),这对于多步任务至关重要。

3.1.2. 上下文生命周期管理

这是 Context Engineering 的工程核心,目标是在有限的上下文窗口内,实现信息价值的最大化。

  • 注入

    • 策略:如何将不同的信息块组合、排序?系统指令放开头还是结尾?工具描述是全部注入还是按需注入?
    • 模板化:使用清晰的结构化模板(如 XML 标签、 Markdown 标题)来帮助模型理解上下文的不同部分。
  • 压缩

    • 摘要:当对话历史过长时,智能体可以自动触发一个“摘要”工具,将过去的漫长对话总结成一段精炼的要点,并用这个摘要替代原始历史。
    • 过滤:剔除无关紧要的寒暄、重复信息或错误信息。
  • 刷新与淘汰

    • 建立规则,确保上下文中最相关、最即时的信息始终可用,而陈旧信息被适时移出。
  • 持久化

    • 决定哪些信息需要存入长期记忆(向量数据库),并为其打上合适的元数据标签,便于未来检索。

在这里插入图片描述

3.1.3. 核心目标

Context Engineering 的所有努力都指向以下几个核心目标:

  • 最大化认知效能:让智能体在有限的注意力(上下文窗口)内,做出最明智的决策和行动。这类似于为一位专家提供最精炼、最相关的简报。
  • 维持状态与连贯性:使智能体能够执行跨越长时间跨度的复杂项目,记住用户偏好、项目背景和之前的决策。
  • 降低幻觉与错误:通过注入精准的外部知识(RAG)和清晰的工具结果,将模型的输出“锚定”在事实和数据的坚实基础之上。
  • 实现可预测的自治:一个结构良好、信息充足的上下文,是智能体能够稳定、可靠地进行多步推理和自主行动的前提。

3.2. Prompt Engineering的局限性

Prompt Engineering如同“对讲机式”交互,其核心问题在于:

  • 无状态性:每次对话独立,无法积累历史信息。例如在银行场景中,用户每次办理房贷都需重复姓名、收入等基础信息。
  • 静态指令:依赖人工设计的固定模板,难以适应动态任务。如要求AI“用专业语气写千字报告”,但无法持续跟踪项目进展。
  • 上下文衰减:当对话轮次增加,模型会“忘记”早期关键信息。如分析50页报告时,AI在后期对话中遗忘核心数据甚至自相矛盾。

3.3. Context Engineering的革命性突破

Context Engineering通过构建“动态记忆系统”实现范式升级:

  • 情境化交互:AI能理解用户身份、历史行为及任务背景。例如智能客服直接回应:“张先生,您昨天购买的手机预计今日下午3点送达”。
  • 多源信息整合:上下文不仅来自用户输入,还包括工具调用结果、外部知识库及长期记忆。例如Agent在分析法律文件时,同步检索案例库并调用合同解析工具。
  • 目标导向进化:Agent通过持续复述目标(如“待办事项列表”)避免任务偏离,实现“自然语言注意力偏置”。
  • Karpathy的类比:若LLM是CPU,上下文窗口是RAM,则Context Engineering是决定“哪些信息进入RAM”的操作系统级调度机制。
维度Prompt EngineeringContext Engineering
交互模式单轮静态指令多轮动态上下文流
知识管理依赖模型内置知识外挂知识库+实时检索
任务执行预定义流程自主规划+工具链调用
可靠性高波动性系统化容错与反思机制

4、RAG:Context Engineering的基石技术

4.1. RAG的核心原理

检索增强生成(RAG)通过“检索-生成”双引擎解决LLM的知识边界问题:

  • 检索层:将用户问题编码为向量,从知识库中匹配Top-K相关片段。例如在医疗问答中,从病例库检索相似症状描述。
  • 生成层:将检索结果与问题融合,生成精准答案。如结合法规条文与用户需求,输出定制化合同条款。

4.2. RAG在Context工程中的关键作用

  • 突破记忆瓶颈:将企业知识库(如百万级文档)压缩为可检索的向量索引,避免上下文溢出。
  • 动态知识注入:实时更新外部数据。例如金融Agent在分析市场趋势时,自动抓取最新财报并生成策略建议。
  • 工具调用优化:RAG-MCP框架通过检索筛选工具描述,使工具选择准确率提升200%(从13.62%升至43.13%),并减少50%的Token消耗。
    在这里插入图片描述

4.3 超越 RAG:Context Engineering 的广阔外延

RAG 是重要的基石,但 Context Engineering 的范畴远不止于此。

  • 多模态上下文:未来的智能体上下文将不只有文本,还包括图像、音频、视频甚至传感器数据。如何为模型构建和理解多模态上下文是一个巨大挑战。
  • 记忆架构设计:如何设计短期、长期记忆的存储与检索策略?记忆应该如何分类(如事实记忆、程序记忆、情感记忆)?这直接决定了智能体的“个性”和“能力”。
  • 上下文感知的 Orchestration:高级的编排框架(如 CrewAI, AutoGen)能够根据任务类型,动态地为不同的智能体分配合适的上下文,实现高效的协同工作。
  • 工具使用的上下文化:智能体不仅使用工具,还会根据上下文学习工具的用法,甚至记录成功的工具使用模式,形成“经验”。

5、总结

回顾整个演进历程,其核心思想是:

  • 从静态到动态:Prompt 从一个静态的指令,变成了一个动态生成、不断丰富的 Context 的“种子”。
  • 从无状态到有状态:Agent 通过记忆模块拥有了状态,能够进行持续的、复杂的交互。
  • 从封闭到开放:通过工具,Agent 的能力不再受限于模型参数内的知识,可以与真实世界进行交互。
  • 从单一到协同:从单个“通才”智能体,发展到多个“专家”智能体分工协作的系统。

我是小鱼

  • CSDN 博客专家
  • AIGC 技术MVP专家
  • 阿里云 专家博主
  • 51CTO博客专家
  • 企业认证金牌面试官
  • 多个名企认证&特邀讲师等
  • 名企签约职场面试培训、职场规划师
  • 多个国内主流技术社区的认证专家博主
  • 多款主流产品(阿里云等)评测一等奖获得者

关注小鱼,学习【人工智能与大模型】最新最全的领域知识。

http://www.dtcms.com/a/434258.html

相关文章:

  • Docker 搭建 Nginx 并启用 HTTPS 具体部署流程
  • 【代码随想录day 34】 力扣 62.不同路径
  • 点击app图标进入网站怎么做小程序软件开发制作
  • 【Rust GUI开发入门】编写一个本地音乐播放器(15. 记录运行日志)
  • Rust模式匹配详解
  • 石家庄做网站建设公司安徽省建设厅网站职称申报
  • gitlab-runner 再次实践中理解和学习
  • C++之stack等容器适配器(上)实战篇
  • JavaWeb零基础学习Day1——HTMLCSS
  • Starting again-01
  • 如何做网站链接使用朝阳seo建站
  • Nivo 用React打造精美数据可视化的开源利器
  • 【iOS安全】iPhone X iOS 16.7.11 (20H360) Palera1n MacOS版 越狱教程
  • 【连载4】数据库热点更新场景调优策略
  • 深入解析HarmonyOS ArkTS:从语法特性到实战应用
  • 小杰深度学习(five)——正则化、神经网络的过拟合解决方案
  • 网页网站开发大概多少钱网站设计公司 深圳龙华
  • 门户网站是什么意思?网站建设哈尔滨app开发2
  • 《吃透 C++ vector:从基础使用到核心接口实战指南》
  • wordpress上传到哪里什么网站利于优化
  • [Web网页] 零基础入门 HTML
  • Nimble:让SwiftObjective-C测试变得更优雅的匹配库
  • HTML——1px问题
  • 【C++项目】基于微服务的即使通信系统
  • wordpress企业站模板建协官网
  • 【办公类-115-04】20250920职称资料上传03——压缩课题结题报告PDF的大小(控制在200MB以内)
  • Python - 100天从新手到大师:第二十七天Python操作PDF文件
  • 做网站一般长宽多少如何线上推广引流
  • C++20 协程:在 AI 推理引擎中的深度应用
  • 如何做游戏推广seo整站优化