当前位置：首页 > news >正文

大模型 Agent 中的通用 MCP 机制详解

news 2025/7/18 11:45:57

1. 引言

大模型（Large Language Model，LLM）技术的迅猛发展催生了一类全新的应用范式：LLM Agent（大模型 Agent）。简单来说，Agent 是基于大模型的自治智能体，它不仅能理解和生成自然语言，还能通过调用工具与环境交互，从而自主地完成复杂任务。ChatGPT 的出现让人们看到了大模型强大的对话能力，但最初它仍局限于一问一答的模式。随着需求的提高，人们希望大模型能够动手做事，例如执行链式推理、多步骤操作、调用外部 API 或工具处理现实任务。这种背景下，涌现出了 AutoGPT、BabyAGI 等自主 Agent 项目，引发了一波 Agent 热潮。值得一提的是，OpenAI 应用研究员翁丽莲（Lilian Weng）曾将 Agent 定义为“大模型 + 记忆 + 规划 + 工具使用”的结合体，这一观点强调了仅有 LLM 还远远不够，必须赋予模型记忆能力、规划决策能力并能调用外部工具才能胜任复杂任务【注】。在国内，也出现了如 Manus 等大模型 Agent 尝试项目，尽管有的昙花一现，但 Agent 无疑被视作让大模型真正干实事的关键方向。

然而，要让大模型真正成为“能干活”的智能代理，单靠一个模型的顺序文本生成远远不够。传统的

查看全文

http://www.dtcms.com/a/216498.html