当前位置：首页 > news >正文

【大模型】Agent之：从Prompt到Context的演进之路

news 2025/10/3 5:30:11

Agent框架演进之路

1、引言
2、Agent核心概念与架构演进
- 2.1. Agent的本质：目标驱动的智能体
- 2.2. 架构演进：从单点交互到系统协同
3、从Prompt Engineering到Context Engineering：范式的必然转移
- 3.1 Context Engineering 的核心概念与目标
- - 3.1.1. 上下文的组成与结构
- 3.1.2. 上下文生命周期管理
- - 3.1.3. 核心目标
- 3.2. Prompt Engineering的局限性
- 3.3. Context Engineering的革命性突破
4、RAG：Context Engineering的基石技术
- 4.1. RAG的核心原理
- 4.2. RAG在Context工程中的关键作用
- 4.3 超越 RAG：Context Engineering 的广阔外延
5、总结

1、引言

小屌丝：鱼哥，国庆假期去哪啊？
小鱼：哪也不去啊
小屌丝：哎呦呦 ~ 哎呦呦~
小鱼：饭菜很热？
小屌丝：不热啊，温度正好
小鱼：我还以为这饭菜热，烫到你嘴呢。
小屌丝：那倒没有
小鱼：没有，你哎呦呦啥？
小屌丝：你这十一期间哪也不去，我很是意外，不是你的性格
小鱼：人嘛~ 总是要陪陪家人的嘛
小屌丝：呀~ 鱼哥，你变了
小鱼：你指的是我的颜值吗？
小屌丝：看图
在这里插入图片描述

小屌丝：鱼哥，你别真走啊
小鱼：堂堂七尺男儿，岂能…
小屌丝：… 这不是闹着玩嘛，
小鱼：说吧，有啥事？
小屌丝：嘿嘿，就是，待会泡澡啊
小鱼：条件是啥？
小屌丝：嘿嘿，还的是鱼哥，给俺讲一讲智能体啊
小鱼：工具、记忆…
小屌丝：打住，鱼哥，我想听 Context
小鱼：… 先泡澡
小屌丝：先讲智能体，这样放松的时间长…
小鱼：…

2、Agent核心概念与架构演进

2.1. Agent的本质：目标驱动的智能体

Agent是以LLM为“大脑”的自主系统，具备四大核心能力：

感知：通过多模态输入理解环境；
规划：分解复杂任务为可执行子目标；
记忆：存储短期上下文与长期知识；
行动：调用工具完成闭环操作。

在这里插入图片描述

2.2. 架构演进：从单点交互到系统协同

传统Prompt Engineering依赖静态指令（如Few-Shot示例），但面临四大瓶颈：
- 脆弱性：措辞微调导致输出剧变；
- 扩展性差：难以应对高并发复杂任务；
- 无状态性：无法维持长程记忆；
- 用户负担重：需手动构建完整上下文。
Context Engineering则构建动态信息环境，通过三层上下文协同驱动Agent：
- 指令上下文：行为规则与示例（如System Prompt）；
- 知识上下文：RAG外挂私有知识库；
- 操作上下文：工具调用与环境反馈。

3、从Prompt Engineering到Context Engineering：范式的必然转移

3.1 Context Engineering 的核心概念与目标

Context Engineering 是一个系统工程，它围绕着如何高效、精准地管理智能体的“工作记忆”。其核心概念包括：

3.1.1. 上下文的组成与结构

一个工程化良好的上下文不再是对话历史的简单堆砌，而是高度结构化的信息块：

系统指令：智能体的“宪法”，定义了其核心身份、行为准则和最高目标。这部分通常相对稳定。
对话历史：最近的几轮问答，维持对话的连贯性。需要智能修剪，防止冗余。
检索到的记忆：从长期记忆（向量数据库）中检索到的、与当前任务最相关的知识片段。
工具描述与结果：可用的工具列表，以及当前循环中已执行工具的行动和观察结果。
内部思考链：智能体自己的推理过程（Thought:），这对于多步任务至关重要。

3.1.2. 上下文生命周期管理

这是 Context Engineering 的工程核心，目标是在有限的上下文窗口内，实现信息价值的最大化。

注入：
- 策略：如何将不同的信息块组合、排序？系统指令放开头还是结尾？工具描述是全部注入还是按需注入？
- 模板化：使用清晰的结构化模板（如 XML 标签、 Markdown 标题）来帮助模型理解上下文的不同部分。
压缩：
- 摘要：当对话历史过长时，智能体可以自动触发一个“摘要”工具，将过去的漫长对话总结成一段精炼的要点，并用这个摘要替代原始历史。
- 过滤：剔除无关紧要的寒暄、重复信息或错误信息。
刷新与淘汰：
- 建立规则，确保上下文中最相关、最即时的信息始终可用，而陈旧信息被适时移出。
持久化：
- 决定哪些信息需要存入长期记忆（向量数据库），并为其打上合适的元数据标签，便于未来检索。

在这里插入图片描述

3.1.3. 核心目标

Context Engineering 的所有努力都指向以下几个核心目标：

最大化认知效能：让智能体在有限的注意力（上下文窗口）内，做出最明智的决策和行动。这类似于为一位专家提供最精炼、最相关的简报。
维持状态与连贯性：使智能体能够执行跨越长时间跨度的复杂项目，记住用户偏好、项目背景和之前的决策。
降低幻觉与错误：通过注入精准的外部知识（RAG）和清晰的工具结果，将模型的输出“锚定”在事实和数据的坚实基础之上。
实现可预测的自治：一个结构良好、信息充足的上下文，是智能体能够稳定、可靠地进行多步推理和自主行动的前提。

3.2. Prompt Engineering的局限性

Prompt Engineering如同“对讲机式”交互，其核心问题在于：

无状态性：每次对话独立，无法积累历史信息。例如在银行场景中，用户每次办理房贷都需重复姓名、收入等基础信息。
静态指令：依赖人工设计的固定模板，难以适应动态任务。如要求AI“用专业语气写千字报告”，但无法持续跟踪项目进展。
上下文衰减：当对话轮次增加，模型会“忘记”早期关键信息。如分析50页报告时，AI在后期对话中遗忘核心数据甚至自相矛盾。

3.3. Context Engineering的革命性突破

Context Engineering通过构建“动态记忆系统”实现范式升级：

情境化交互：AI能理解用户身份、历史行为及任务背景。例如智能客服直接回应：“张先生，您昨天购买的手机预计今日下午3点送达”。
多源信息整合：上下文不仅来自用户输入，还包括工具调用结果、外部知识库及长期记忆。例如Agent在分析法律文件时，同步检索案例库并调用合同解析工具。
目标导向进化：Agent通过持续复述目标（如“待办事项列表”）避免任务偏离，实现“自然语言注意力偏置”。
Karpathy的类比：若LLM是CPU，上下文窗口是RAM，则Context Engineering是决定“哪些信息进入RAM”的操作系统级调度机制。

维度	Prompt Engineering	Context Engineering
交互模式	单轮静态指令	多轮动态上下文流
知识管理	依赖模型内置知识	外挂知识库+实时检索
任务执行	预定义流程	自主规划+工具链调用
可靠性	高波动性	系统化容错与反思机制

4、RAG：Context Engineering的基石技术

4.1. RAG的核心原理

检索增强生成（RAG）通过“检索-生成”双引擎解决LLM的知识边界问题：

检索层：将用户问题编码为向量，从知识库中匹配Top-K相关片段。例如在医疗问答中，从病例库检索相似症状描述。
生成层：将检索结果与问题融合，生成精准答案。如结合法规条文与用户需求，输出定制化合同条款。

4.2. RAG在Context工程中的关键作用

突破记忆瓶颈：将企业知识库（如百万级文档）压缩为可检索的向量索引，避免上下文溢出。
动态知识注入：实时更新外部数据。例如金融Agent在分析市场趋势时，自动抓取最新财报并生成策略建议。
工具调用优化：RAG-MCP框架通过检索筛选工具描述，使工具选择准确率提升200%（从13.62%升至43.13%），并减少50%的Token消耗。

4.3 超越 RAG：Context Engineering 的广阔外延

RAG 是重要的基石，但 Context Engineering 的范畴远不止于此。

多模态上下文：未来的智能体上下文将不只有文本，还包括图像、音频、视频甚至传感器数据。如何为模型构建和理解多模态上下文是一个巨大挑战。
记忆架构设计：如何设计短期、长期记忆的存储与检索策略？记忆应该如何分类（如事实记忆、程序记忆、情感记忆）？这直接决定了智能体的“个性”和“能力”。
上下文感知的 Orchestration：高级的编排框架（如 CrewAI, AutoGen）能够根据任务类型，动态地为不同的智能体分配合适的上下文，实现高效的协同工作。
工具使用的上下文化：智能体不仅使用工具，还会根据上下文学习工具的用法，甚至记录成功的工具使用模式，形成“经验”。