ACE会成为下一代上下文工程技术吗?
- 论文题目:《Agentic Context Engineering: Evolving Contexts for Self-Improving Language Models》(智能体上下文工程:自我改进语言模型的演化上下文)
- 论文链接:https://arxiv.org/pdf/2510.04618
ACE会成为下一代上下文工程技术吗?ACE(智能体上下文工程)是一个新框架,通过将上下文视为不断演化的、结构化的知识累积空间,击败了当前最先进的优化器如GEPA。
什么是ACE?
ACE将上下文视为一个演化的空间,而非静态提示词。它不是重写整个上下文,而是将其管理为离散、结构化项目的集合(策略、代码片段、错误处理器),这些项目会根据性能反馈随时间逐步累积、优化和组织。
ACE vs. GEPA(当前最优方案)
GEPA(遗传-帕累托)是一种流行方法,使用进化算法迭代重写和优化提示词以追求简洁性和整体性能,但它可能遭受"简洁性偏差"和"上下文坍缩"问题,抹去复杂领域任务所需的具体、详细的启发式规则。
ACE构建全面的上下文。它优先保留详细的领域洞察,并使用非LLM逻辑来管理上下文增长,确保艰难学习到的约束和边缘案例策略得以保留,而不是被概括掉。
工作原理:
1️⃣ 三个组件:生成器(解决任务)、反思器(分析结果)和策展人(管理上下文)。
2️⃣ 生成器使用当前上下文尝试任务,创建推理轨迹和环境反馈(如代码执行结果)。
3️⃣ 反思器提供反馈以提取具体洞察,识别成功策略或错误根源。
4️⃣ 策展人将这些合成为结构化的、逐项列出的"增量"条目(对知识要点的具体添加或编辑)。
5️⃣ 以编程方式将这些增量更新合并到上下文中,确保上下文为下一个任务逐步增长和优化。
发现:
💡 GEPA优化简洁提示词,ACE优先考虑全面、详细的上下文。
📈 ACE在智能体基准测试上比基线方法高出+10.6%,在复杂金融推理上高出+8.6%。
📚 ACE的增量"增量"更新方法与重写完整提示词的方法相比,平均减少了86.9%的适应延迟。
📝 生成器、反思器和策展人的提示词是论文附录的一部分。