当前位置：首页 > news >正文

上下文工程（context engineering）学习笔记

news 2025/10/23 10:12:06

当我们使用LLM出现性能不佳时，一般可能原因有两种，一种是模型能力局限： 基座模型自身的能力不足，需要对模型本身进行优化。第二种是上下文信息缺失： 模型没有接收到生成高质量回复所需的恰当上下文。现在基础模型的智能已经表现优越，这时模型输出不及预期的原因更多指向第二种。即我们没有实现有效的上下文工程，导致模型缺失了一些解决问题的关键信息。而Context Engineering就是针对其提出的一个概念，也是最近一个比较火的概念，下面是对其学习总结笔记，具体如下：

（1）是什么

Context Engineering（上下文工程）这一概念最初由 Tobi Lütke 与 Andrej Karpathy 在推特中提出，其核心在于：通过精心设计与组织上下文信息，使任务在大型语言模型（LLM）中具备合理可解的条件。具体而言，上下文工程被定义为一种兼具艺术性与科学性的实践，强调在工业级 LLM 应用中，如何精准地向上下文窗口中填充恰到好处的信息，从而为模型的下一步推理提供有效支持。其目标不仅是提供“全部”上下文，更在于提供“恰当”的上下文——在有限窗口内实现信息密度与逻辑完整性的平衡。