当前位置：首页 > news >正文

聊聊AI大模型的上下文工程（Context Engineering）

news 2025/7/12 8:37:02

聊聊AI上下文工程

上下文工程（Context Engineering）技术简介

核心定义

“上下文工程是一门精细的艺术与科学——其本质是在每个Agent执行步骤中，将恰到好处的信息精准填充至上下文窗口。”
—— Andrej Karpathy（前特斯拉AI总监）

技术类比

计算机系统	LLM Agent系统
CPU	大语言模型（LLM）
RAM	上下文窗口（Context Window）
操作系统调度	上下文工程策略

为什么需要上下文工程？

Agent在长任务执行中面临三大核心挑战：
⚠️ 上下文污染（幻觉信息混入）
⚠️ 上下文过载（超10万token后性能骤降）
⚠️ 工具混淆（>30个工具时准确率下降70%）

案例：Anthropic实验显示，多Agent系统通过上下文隔离使研究任务准确率提升90.2%

四大核心策略框架

🔧 1. 写入策略（Write）

场景：保存中间结果避免污染主上下文
技术实现：

动态草稿本：LangGraph的State对象持久化会话状态

# LangGraph状态对象示例
state = {"scratchpad": "当前计划步骤：1.检索用户历史 2.验证策略合规性"}

长期记忆：Reflexion架构的自我反思记忆机制

ChatGPT实践：自动生成跨会话的用户偏好记忆

🎯 2. 选择策略（Select）

突破点：动态装载关键信息
关键技术：

工具动态装载：RAG筛选相关工具描述

# RAG工具选择（工具数>30时准确率↑3倍）
relevant_tools = vector_db.search("支付API", top_k=3)

记忆精准召回：Embedding+知识图谱双索引

Claude Code实践：CLAUDE.md文件固化高频指令

🗜️ 3. 压缩策略（Compress）

临界值：上下文达窗口95%时自动触发
最佳实践：

技术	压缩率	适用场景
递归摘要（Recursive）	70%	长对话历史
Provence修剪器	85%	问答场景
结构化提取	90%	合同/代码等文档处理

🛡️ 4. 隔离策略（Isolate）

架构革新：

多Agent沙箱：HuggingFace的CodeAgent架构

HuggingFace的CodeAgent架构

状态隔离：LangGraph字段级上下文控制

优势：隔离高风险操作，阻止92%的提示注入攻击

LangGraph工程实践

🛠️ 全链路支持方案

策略	实现方式	性能增益
写入控制	`Checkpoint`持久化机制	减少40%重复推理
动态选择	`BigTool`语义工具检索库	工具选择速度↑77%
智能压缩	消息列表自动摘要API	Token消耗↓65%
沙箱隔离	E2B/Pyodide安全执行环境	错误率↓58%

📊 效能监控方案

# LangSmith监控示例（关键指标）
metrics = {"context_utilization": "92%", "tool_call_success": "98%","hallucination_rate": "0.7%"
}

行业应用启示

金融合规场景
Anthropic航空客服系统：
- 结合think工具+政策提示模板
- 合规检查准确率↑54%

代码Agent设计
Windsurf最佳实践：

1. AST语义代码分块  
2. 知识图谱索引  
3. 动态重排上下文

医疗诊断Agent
关键创新：
- DICOM影像隔离沙箱处理
- 诊断依据动态装载机制

核心结论

✅ 上下文≠内存垃圾场：精准度 > 信息量
✅ 动态优于静态：实时装载击败全量加载
✅ 隔离创造价值：多Agent架构提升上限

“未来3年，上下文工程能力将成为Agent开发者的核心竞争力” - LangChain CTO

立即行动：

用LangSmith分析上下文瓶颈
在关键节点实施Write-Select-Compress-Isolate四步策略
优先测试工具动态装载与沙箱隔离

文档版本：v2.1 | 基于LangChain技术白皮书（2025）
注：保留英文术语便于跨团队协作，关键概念附技术实现参考

参考

https://blog.langchain.com/context-engineering-for-agents/

更多技术干货欢迎关注微信公众号“风雨同舟的AI笔记”~

【转载须知】：转载请注明原文出处及作者信息

查看全文

http://www.dtcms.com/a/274218.html

linux网络编程之单reactor模型（一）

渗透测试之木马后门实验

笔记 | 理解C/汇编中的数组元素访问

UNIX 域套接字实现本地进程间通信

【React Native】样式、网络请求和Loading

Hadoop 用户入门指南：驾驭大数据的力量

【React Native】原生组件

Dify 1.5.0，1.5.1，1.6.0 新特性

小旺AI截图×英特尔强强联合：AIPC生态开启智能生产力新纪元

C++设计秘籍：为什么所有参数都需类型转换时，非成员函数才是王道？

基于强化学习的智能推荐系统优化实践

继续Java的jpackage模块打包Linux可执行程序（包含第三方非模块化包）

4G Cat.1 时代，如何选对 DTU？

IoC 是如何为 Spring 的其他核心功能（如 AOP、事务管理）提供基础支持的

openpilot：为您的汽车插上智能驾驶的翅膀

CV目标检测中的LetterBox操作

Swift 解 LeetCode 324：一步步实现摆动排序 II，掌握数组重排的节奏感

使用自然语言体验对话式MySQL数据库运维

Claude Code：完爆 Cursor 的编程体验

UI前端大数据处理新趋势：基于边缘计算的数据处理与响应

炎热工厂救援：算法打造安全壁垒

对S32K144做的BMS安装快速开发Simulink库及BMS例程介绍

【SpringBoot】整合MyBatis+Postgresql

ROS1学习第三弹

uniApp实战五：自定义组件实现便捷选择

MyBatis缓存穿透深度解析：从原理到实战解决方案

Selenium 自动化实战技巧【selenium】

frame 与新窗口切换操作【selenium 】

【JMeter】调试方法

Conda 安装与配置详解及常见问题解决