一文读懂 MCP!
这应该是全网讲解 MCP 标准最清晰的一篇文章!
最近 MCP 确实很火,但我发现网上大多数文章都是在将 MCP 是什么,但没有将 MCP 真正解决的是什么问题?为什么会诞生 MCP?在 MCP 之前是什么现状?
而我习惯从一个事物发展的衍化角度看一个新东西,于是,我仔细查阅了 Claude 发布的 MCP 官方文档,理解了这是个什么东西。
其实 MCP 的概念很简单:就是提供了一个标准化约定,让 AI 能够调用三方提供的 “内部” 数据或能力。
上面这个解释,可能看着有点迷惑,什么是 “内部”?这个我先卖个关子,稍后再详细解释。
我们先来看看 AI 发展的历程。
AI发展的第一阶段:纯模型能力
最初的 AI 大模型,也就是 GPT 类大模型提供的服务,完全依赖于模型本身的能力。
也就是说,你只是在和模型对话,而 模型能提供哪些能力,完全取决于它内部训练的数据。
比如:
- 如果模型支持中文,那它就能提供中文能力。
- 如果模型训练了几十种国家语言,那它就能支持这些语言。
- 如果模型里有《红楼梦》这本书,那你就可以通过模型了解 《红楼梦》 的内容。
所以,在最初阶段,模型本身的知识范围和逻辑推导能力,都是由模型自身决定的。
无论是数学能力还是语言能力,都依赖于模型的训练,也就是所谓的 “炼丹”。
这也是 AI 大模型的初始阶段,是 ChatGPT、Claude、DeepSeek 和 GPT 系列模型发展的第一步。
但是,仅仅依靠模型自身的能力,能满足用户日益增长的需求吗?
AI发展的第二阶段:AI+搜索
随着AI的发展,我们发现仅仅依靠模型本身的能力已经无法满足需求。
我们往往需要获取一些实质性的信息,比如:
- 今天的新闻
- 最近的天气预报
- 最近发生的一些事件
而模型训练的数据,都是历史数据,无法回答这种最近、实时性信息获取的问题。
这时,就需要借助搜索引擎来获取实时信息,并希望 AI 能够自动帮我们检索和整理这些信息。
于是,AI 平台开发了 AI 增强版,也就是第二阶段的 “AI+搜索”。
这个增强版带来的能力是,AI 可以自动结合搜索引擎搜索到的资料,并将其转化为上下文的知识储备。
也就是说,AI 具备了实时搜索数据的能力,这些数据可以作为上下文和知识背景。这样一来,AI 就不再局限于回答 2023年5月之前 或 2024年6月之前 的数据问题。
然而,实现这一步后,我们仍然面临一些问题。
因为搜索引擎上的所有信息都来自于各种网站、新闻媒体、博客等,这些信息的获取取决于 AI 使用的搜索引擎和搜索逻辑。
但搜索引擎获取的内容最大的限制在于,搜索引擎只能搜索到世界上公开的信息,而这些信息我称之为 “外部数据”。
那么,什么是"内部数据"?它与"外部数据"有什么区别?
内部数据与外部数据
说到这里,你应该对我前面提到的 “内部数据” 有了初步的感觉。没错,内部数据是区别于搜索引擎搜索到的外部公开数据。
外部数据,是通过搜索引擎能获取的公开在互联网上的信息;而内部数据,则是组织化、个人化、私有化的内容。
那么,内部数据具体体现在哪些方面呢?举个例子:
- 一个公司自己的资料库、信息库。
- 公司内部整理的产品问答、售后问答等 QA 资料。
- 个人的知识笔记、思想感悟等。
这些内容并未公开发布到网上,而是存储在个公司文件、人磁盘或私有空间里。这些数据的特点是 私有的,内部的。
那么,如何借助 AI 来利用这些内部数据呢?这就引出了 AI 发展的第三个阶段。
AI 发展的第三阶段:文档嵌入
通过 文档嵌入 方式,可以将自己拥有的内部资料嵌入进 AI,借助 AI 方便地查阅内部资料。AI 可以基于这些数据进行问答和交互。
然而,这里又会出现一个问题:这些内部数据只有数据拥有者才有权力使用,就算数据主人上传了内部数据到 AI 平台,但没有数据主人的授权,其他人也无法使用这些数据。
所以产生的新问题是,其他人想用这些数据和信息时,该怎么办呢?
获取他人的内部数据
内部数据通常掌握在他人手中,他们不太可能将自己公司私有数据分享给你,如果你想要获取这些数据,通常需要 支付一定的费用来购买相关服务,比如咨询服务或数据服务。
这些服务提供商本质上是将他们内部的私有信息进行逻辑化处理,打包成服务后出售给第三方。所以,当你想要获取他人的信息时,通常需要通过他们提供的服务来实现。
而 AI 平台的目标,是让你在使用 AI 时,能够尽可能获取到你想要的所有信息,实现通用型人工智能的宏大理想。
为了帮助你获取到其他人或组织的内部信息,AI 平台虽然不可能直接侵入公司服务器或个人磁盘去偷取或抢夺数据,但他们提出了一个概念,也就是我们今天要讨论的主题 —— MCP。
这个概念提出的本质需求在于,AI 大模型平台,需要尽可能多的人将自己的内部数据和服务分享出来。
那么,MCP 究竟是如何实现这一目标的呢?
MCP:连接AI与内部数据的桥梁
目前,许多公司已经在提供数据服务和咨询服务。
这些企业虽然在官网上公开了公司概况等基本信息,但他们的核心资产——包括内部数据、内部资料、整体思维方式以及结构化处理能力都被打包在付费服务中。因此,在公开网络上,你是无法获取这些内容的。
而 AI 公司提出的 MCP 标准,为这些咨询公司和数据服务公司提供了一个新思路,他们可以基于 MCP 标准,开发专门针对 AI 的服务。
当这些服务被开发出来后,注册到 AI 大模型平台,就变成了 MCP 服务,AI 就能通过 MCP 标准调用这些服务。这样一来,当用户想要查询或利用这些数据时,就能自然而然地获取到所需信息。
当然,今后用户通过 AI 使用这些数据,大概率还是需要支付相应费用的。毕竟,这些信息和数据资源属于他人所有。
AI 平台的目标是让用户获取数据过程更加便捷,同时培养用户通过 AI 对话来使用数据资源的习惯。
至于具体的付费方式,以及如何确保资源的持续使用,目前还没有一个明确的约定,但这肯定是未来 AI 应用发展和商业化的一个很重要的方式。
那么,除了方便调用他人提供的内部数据服务,MCP 服务还能为 AI 带来哪些新的能力?
MCP:赋予 AI 执行能力
除了内部数据,AI 的下一阶段是什么呢?
还是回到我们所说的 AI 平台的宏大愿景 —— 打造通用型人工智能。即 AI 平台不仅希望在信息层面有所突破,更希望在执行层面实现更多功能。
比如:
- 像某手机可以用 AI 帮我们订咖啡。
- 像 Manus 一样,能够根据指令自动执行一系列执行任务。
这些执行能力完全依赖大模型是不太现实的。
因为在执行层面,不同场景的动作种类实在太多。
以当前 AI 大模型平台发展的方向,如果投入大量资源去开发和训练这些细枝末节的执行动作,大模型会变得千奇百怪。
那么,AI 平台如何实现这些从信息到执行动作的 “最后一公里” 呢?
答案同样是 MCP。
MCP 服务可以是信息层面的,也可以是动作层面的。
比如集成了端侧的AI Agent、 RPA 和 爬虫 等 MCP 服务。
通过调用这些服务,AI 只需要做决策和发出调用指令,就能够实现各种实际的动作执行能力。
例如,发送邮件。
在之前,AI 仅能够帮你生成邮件内容,但仍然需要你复制到邮件客户端,再输入收件人,然后点击发送。
但基于 MCP 服务提供的邮件发送能力,你只需要给 AI 提供邮件收件人和大致的内容信息,AI 就能帮你完成邮件润色、优化以及发送动作的全部任务。
随着这样的 MCP 服务越来越多,AI 平台就不仅能在信息层面提供帮助和决策支持,还能在执行层面实现更多功能,真正迈向通用型人工智能的愿景。
总结:MCP 的本质与未来
所以,MCP 是什么?相信你已经有了答案。
MCP,本质上是一种标准化协议,它定义了 AI 大模型客户端与各种三方服务进行交互的方式。
MCP 服务,也就是遵守了 MCP 标准提供的三方服务,AI 平台能够识别并调用。
通过 MCP 服务,AI 不仅能获取更多的知识和信息,还能执行更多的具体动作任务。
这种协议和标准的出现,标志着 AI 正在从单纯的信息提供者,逐步转变为能够理解、获取和执行的综合性助手。
未来,随着更多服务提供商加入 MCP 生态,AI 的能力将会进一步扩展,为用户提供更加全面和便捷的服务体验。
你是否已经开始思考,MCP 会如何改变你的工作和生活?
它会为哪些行业带来颠覆性的变革?
作为 AI 用户,我们又该如何适应这种变化,并从中获益?
也欢迎你在评论中发表自己的想法。