【大模型】Agent之:从Prompt到Context的演进之路
Agent框架演进之路
- 1、引言
- 2、Agent核心概念与架构演进
- 2.1. Agent的本质:目标驱动的智能体
- 2.2. 架构演进:从单点交互到系统协同
- 3、从Prompt Engineering到Context Engineering:范式的必然转移
- 3.1 Context Engineering 的核心概念与目标
- 3.1.1. 上下文的组成与结构
- 3.1.2. 上下文生命周期管理
- 3.1.3. 核心目标
- 3.2. Prompt Engineering的局限性
- 3.3. Context Engineering的革命性突破
- 4、RAG:Context Engineering的基石技术
- 4.1. RAG的核心原理
- 4.2. RAG在Context工程中的关键作用
- 4.3 超越 RAG:Context Engineering 的广阔外延
- 5、总结
1、引言
小屌丝:鱼哥,国庆假期去哪啊?
小鱼:哪也不去啊
小屌丝:哎呦呦 ~ 哎呦呦~
小鱼:饭菜很热?
小屌丝:不热啊,温度正好
小鱼:我还以为这饭菜热,烫到你嘴呢。
小屌丝:那倒没有
小鱼:没有,你哎呦呦啥?
小屌丝:你这十一期间哪也不去,我很是意外,不是你的性格
小鱼:人嘛~ 总是要陪陪家人的嘛
小屌丝:呀~ 鱼哥,你变了
小鱼:你指的是我的颜值吗?
小屌丝:看图
小屌丝:鱼哥, 你别真走啊
小鱼:堂堂七尺男儿,岂能…
小屌丝:… 这不是闹着玩嘛,
小鱼:说吧,有啥事?
小屌丝:嘿嘿,就是, 待会泡澡啊
小鱼:条件是啥?
小屌丝:嘿嘿,还的是鱼哥, 给俺讲一讲 智能体啊
小鱼:工具、记忆…
小屌丝:打住, 鱼哥,我想听 Context
小鱼:… 先泡澡
小屌丝:先讲智能体,这样放松的时间长…
小鱼:…
2、Agent核心概念与架构演进
2.1. Agent的本质:目标驱动的智能体
Agent是以LLM为“大脑”的自主系统,具备四大核心能力:
- 感知:通过多模态输入理解环境;
- 规划:分解复杂任务为可执行子目标;
- 记忆:存储短期上下文与长期知识;
- 行动:调用工具完成闭环操作。
2.2. 架构演进:从单点交互到系统协同
-
传统Prompt Engineering依赖静态指令(如Few-Shot示例),但面临四大瓶颈:
- 脆弱性:措辞微调导致输出剧变;
- 扩展性差:难以应对高并发复杂任务;
- 无状态性:无法维持长程记忆;
- 用户负担重:需手动构建完整上下文。
-
Context Engineering则构建动态信息环境,通过三层上下文协同驱动Agent:
- 指令上下文:行为规则与示例(如System Prompt);
- 知识上下文:RAG外挂私有知识库;
- 操作上下文:工具调用与环境反馈。
3、从Prompt Engineering到Context Engineering:范式的必然转移
3.1 Context Engineering 的核心概念与目标
Context Engineering 是一个系统工程,它围绕着如何高效、精准地管理智能体的“工作记忆”。其核心概念包括:
3.1.1. 上下文的组成与结构
一个工程化良好的上下文不再是对话历史的简单堆砌,而是高度结构化的信息块:
-
系统指令:智能体的“宪法”,定义了其核心身份、行为准则和最高目标。这部分通常相对稳定。
-
对话历史:最近的几轮问答,维持对话的连贯性。需要智能修剪,防止冗余。
-
检索到的记忆:从长期记忆(向量数据库)中检索到的、与当前任务最相关的知识片段。
-
工具描述与结果:可用的工具列表,以及当前循环中已执行工具的行动和观察结果。
-
内部思考链:智能体自己的推理过程(Thought:),这对于多步任务至关重要。
3.1.2. 上下文生命周期管理
这是 Context Engineering 的工程核心,目标是在有限的上下文窗口内,实现信息价值的最大化。
-
注入:
- 策略:如何将不同的信息块组合、排序?系统指令放开头还是结尾?工具描述是全部注入还是按需注入?
- 模板化:使用清晰的结构化模板(如 XML 标签、 Markdown 标题)来帮助模型理解上下文的不同部分。
-
压缩:
- 摘要:当对话历史过长时,智能体可以自动触发一个“摘要”工具,将过去的漫长对话总结成一段精炼的要点,并用这个摘要替代原始历史。
- 过滤:剔除无关紧要的寒暄、重复信息或错误信息。
-
刷新与淘汰:
- 建立规则,确保上下文中最相关、最即时的信息始终可用,而陈旧信息被适时移出。
-
持久化:
- 决定哪些信息需要存入长期记忆(向量数据库),并为其打上合适的元数据标签,便于未来检索。
3.1.3. 核心目标
Context Engineering 的所有努力都指向以下几个核心目标:
- 最大化认知效能:让智能体在有限的注意力(上下文窗口)内,做出最明智的决策和行动。这类似于为一位专家提供最精炼、最相关的简报。
- 维持状态与连贯性:使智能体能够执行跨越长时间跨度的复杂项目,记住用户偏好、项目背景和之前的决策。
- 降低幻觉与错误:通过注入精准的外部知识(RAG)和清晰的工具结果,将模型的输出“锚定”在事实和数据的坚实基础之上。
- 实现可预测的自治:一个结构良好、信息充足的上下文,是智能体能够稳定、可靠地进行多步推理和自主行动的前提。
3.2. Prompt Engineering的局限性
Prompt Engineering如同“对讲机式”交互,其核心问题在于:
- 无状态性:每次对话独立,无法积累历史信息。例如在银行场景中,用户每次办理房贷都需重复姓名、收入等基础信息。
- 静态指令:依赖人工设计的固定模板,难以适应动态任务。如要求AI“用专业语气写千字报告”,但无法持续跟踪项目进展。
- 上下文衰减:当对话轮次增加,模型会“忘记”早期关键信息。如分析50页报告时,AI在后期对话中遗忘核心数据甚至自相矛盾。
3.3. Context Engineering的革命性突破
Context Engineering通过构建“动态记忆系统”实现范式升级:
- 情境化交互:AI能理解用户身份、历史行为及任务背景。例如智能客服直接回应:“张先生,您昨天购买的手机预计今日下午3点送达”。
- 多源信息整合:上下文不仅来自用户输入,还包括工具调用结果、外部知识库及长期记忆。例如Agent在分析法律文件时,同步检索案例库并调用合同解析工具。
- 目标导向进化:Agent通过持续复述目标(如“待办事项列表”)避免任务偏离,实现“自然语言注意力偏置”。
- Karpathy的类比:若LLM是CPU,上下文窗口是RAM,则Context Engineering是决定“哪些信息进入RAM”的操作系统级调度机制。
维度 | Prompt Engineering | Context Engineering |
---|---|---|
交互模式 | 单轮静态指令 | 多轮动态上下文流 |
知识管理 | 依赖模型内置知识 | 外挂知识库+实时检索 |
任务执行 | 预定义流程 | 自主规划+工具链调用 |
可靠性 | 高波动性 | 系统化容错与反思机制 |
4、RAG:Context Engineering的基石技术
4.1. RAG的核心原理
检索增强生成(RAG)通过“检索-生成”双引擎解决LLM的知识边界问题:
- 检索层:将用户问题编码为向量,从知识库中匹配Top-K相关片段。例如在医疗问答中,从病例库检索相似症状描述。
- 生成层:将检索结果与问题融合,生成精准答案。如结合法规条文与用户需求,输出定制化合同条款。
4.2. RAG在Context工程中的关键作用
- 突破记忆瓶颈:将企业知识库(如百万级文档)压缩为可检索的向量索引,避免上下文溢出。
- 动态知识注入:实时更新外部数据。例如金融Agent在分析市场趋势时,自动抓取最新财报并生成策略建议。
- 工具调用优化:RAG-MCP框架通过检索筛选工具描述,使工具选择准确率提升200%(从13.62%升至43.13%),并减少50%的Token消耗。
4.3 超越 RAG:Context Engineering 的广阔外延
RAG 是重要的基石,但 Context Engineering 的范畴远不止于此。
- 多模态上下文:未来的智能体上下文将不只有文本,还包括图像、音频、视频甚至传感器数据。如何为模型构建和理解多模态上下文是一个巨大挑战。
- 记忆架构设计:如何设计短期、长期记忆的存储与检索策略?记忆应该如何分类(如事实记忆、程序记忆、情感记忆)?这直接决定了智能体的“个性”和“能力”。
- 上下文感知的 Orchestration:高级的编排框架(如 CrewAI, AutoGen)能够根据任务类型,动态地为不同的智能体分配合适的上下文,实现高效的协同工作。
- 工具使用的上下文化:智能体不仅使用工具,还会根据上下文学习工具的用法,甚至记录成功的工具使用模式,形成“经验”。
5、总结
回顾整个演进历程,其核心思想是:
- 从静态到动态:Prompt 从一个静态的指令,变成了一个动态生成、不断丰富的 Context 的“种子”。
- 从无状态到有状态:Agent 通过记忆模块拥有了状态,能够进行持续的、复杂的交互。
- 从封闭到开放:通过工具,Agent 的能力不再受限于模型参数内的知识,可以与真实世界进行交互。
- 从单一到协同:从单个“通才”智能体,发展到多个“专家”智能体分工协作的系统。
我是小鱼:
- CSDN 博客专家;
- AIGC 技术MVP专家;
- 阿里云 专家博主;
- 51CTO博客专家;
- 企业认证金牌面试官;
- 多个名企认证&特邀讲师等;
- 名企签约职场面试培训、职场规划师;
- 多个国内主流技术社区的认证专家博主;
- 多款主流产品(阿里云等)评测一等奖获得者;
关注小鱼,学习【人工智能与大模型】最新最全的领域知识。