当前位置：首页 > news >正文

ACE会成为下一代上下文工程技术吗？

news 2025/10/14 8:22:26

论文题目：《Agentic Context Engineering: Evolving Contexts for Self-Improving Language Models》（智能体上下文工程：自我改进语言模型的演化上下文）
论文链接：https://arxiv.org/pdf/2510.04618

ACE会成为下一代上下文工程技术吗？ACE（智能体上下文工程）是一个新框架，通过将上下文视为不断演化的、结构化的知识累积空间，击败了当前最先进的优化器如GEPA。

什么是ACE？
ACE将上下文视为一个演化的空间，而非静态提示词。它不是重写整个上下文，而是将其管理为离散、结构化项目的集合（策略、代码片段、错误处理器），这些项目会根据性能反馈随时间逐步累积、优化和组织。

ACE vs. GEPA（当前最优方案）
GEPA（遗传-帕累托）是一种流行方法，使用进化算法迭代重写和优化提示词以追求简洁性和整体性能，但它可能遭受"简洁性偏差"和"上下文坍缩"问题，抹去复杂领域任务所需的具体、详细的启发式规则。

ACE构建全面的上下文。它优先保留详细的领域洞察，并使用非LLM逻辑来管理上下文增长，确保艰难学习到的约束和边缘案例策略得以保留，而不是被概括掉。

工作原理：

1️⃣ 三个组件：生成器（解决任务）、反思器（分析结果）和策展人（管理上下文）。

2️⃣ 生成器使用当前上下文尝试任务，创建推理轨迹和环境反馈（如代码执行结果）。

3️⃣ 反思器提供反馈以提取具体洞察，识别成功策略或错误根源。

4️⃣ 策展人将这些合成为结构化的、逐项列出的"增量"条目（对知识要点的具体添加或编辑）。

5️⃣ 以编程方式将这些增量更新合并到上下文中，确保上下文为下一个任务逐步增长和优化。

发现：
💡 GEPA优化简洁提示词，ACE优先考虑全面、详细的上下文。

📈 ACE在智能体基准测试上比基线方法高出+10.6%，在复杂金融推理上高出+8.6%。

📚 ACE的增量"增量"更新方法与重写完整提示词的方法相比，平均减少了86.9%的适应延迟。

📝 生成器、反思器和策展人的提示词是论文附录的一部分。