大模型——长文拆解上下文工程落地策略与实践
大模型——长文拆解上下文工程落地策略与实践
把 200 k token塞满很容易,让模型在长上下文仍能够大海捞针却很难。Anthropic 在29号的官方长文里系统梳理了"上下文工程"(Context Engineering)这一新兴方向。本文将其进行技术拆解与压缩,务必让你快速掌握上下文工程。
1. 提示词工程的尽头是上下文工程
提示词工程主要关注的是怎么写,而上下文工程关注的则是给什么。Anthropic认为上下文工程是提示词工程的自然演化:当 Agent 运行多轮、系统指令、工具、MCP、外部数据、消息历史记录不断涌入时,根据大海捞针的测试,随着上下文窗口中Token数量的增加,模型准确回忆该上下文信息的能力会下降。
因此,我们需要制定策略来管理整个上下文状态,所以问题也就从如何写一条好提示升级为如何在每一轮只让模型看到最小充分信息集——这就是上下文工程的新战场。
2. 有效上下文工程剖析
提示应清晰、简洁且直接,避免过度复杂的 if-else 逻辑或假设共