当前位置: 首页 > news >正文

一文读懂 MCP!

这应该是全网讲解 MCP 标准最清晰的一篇文章!

最近 MCP 确实很火,但我发现网上大多数文章都是在将 MCP 是什么,但没有将 MCP 真正解决的是什么问题?为什么会诞生 MCP?在 MCP 之前是什么现状?

而我习惯从一个事物发展的衍化角度看一个新东西,于是,我仔细查阅了 Claude 发布的 MCP 官方文档,理解了这是个什么东西。

其实 MCP 的概念很简单:就是提供了一个标准化约定,让 AI 能够调用三方提供的 “内部” 数据或能力

上面这个解释,可能看着有点迷惑,什么是 “内部”?这个我先卖个关子,稍后再详细解释。

我们先来看看 AI 发展的历程。

AI发展的第一阶段:纯模型能力

最初的 AI 大模型,也就是 GPT 类大模型提供的服务,完全依赖于模型本身的能力。

也就是说,你只是在和模型对话,而 模型能提供哪些能力,完全取决于它内部训练的数据

比如:

  • 如果模型支持中文,那它就能提供中文能力。
  • 如果模型训练了几十种国家语言,那它就能支持这些语言。
  • 如果模型里有《红楼梦》这本书,那你就可以通过模型了解 《红楼梦》 的内容。

所以,在最初阶段,模型本身的知识范围和逻辑推导能力,都是由模型自身决定的

无论是数学能力还是语言能力,都依赖于模型的训练,也就是所谓的 “炼丹”。

这也是 AI 大模型的初始阶段,是 ChatGPT、Claude、DeepSeek 和 GPT 系列模型发展的第一步。

但是,仅仅依靠模型自身的能力,能满足用户日益增长的需求吗?

AI发展的第二阶段:AI+搜索

随着AI的发展,我们发现仅仅依靠模型本身的能力已经无法满足需求。

我们往往需要获取一些实质性的信息,比如:

  • 今天的新闻
  • 最近的天气预报
  • 最近发生的一些事件

而模型训练的数据,都是历史数据,无法回答这种最近、实时性信息获取的问题。

这时,就需要借助搜索引擎来获取实时信息,并希望 AI 能够自动帮我们检索和整理这些信息。

于是,AI 平台开发了 AI 增强版,也就是第二阶段的 “AI+搜索”。

这个增强版带来的能力是,AI 可以自动结合搜索引擎搜索到的资料,并将其转化为上下文的知识储备

也就是说,AI 具备了实时搜索数据的能力,这些数据可以作为上下文和知识背景。这样一来,AI 就不再局限于回答 2023年5月之前 或 2024年6月之前 的数据问题。

然而,实现这一步后,我们仍然面临一些问题。

因为搜索引擎上的所有信息都来自于各种网站、新闻媒体、博客等,这些信息的获取取决于 AI 使用的搜索引擎和搜索逻辑。

但搜索引擎获取的内容最大的限制在于,搜索引擎只能搜索到世界上公开的信息,而这些信息我称之为 “外部数据”。

那么,什么是"内部数据"?它与"外部数据"有什么区别?

内部数据与外部数据

说到这里,你应该对我前面提到的 “内部数据” 有了初步的感觉。没错,内部数据是区别于搜索引擎搜索到的外部公开数据。

外部数据,是通过搜索引擎能获取的公开在互联网上的信息;而内部数据,则是组织化、个人化、私有化的内容。

那么,内部数据具体体现在哪些方面呢?举个例子:

  • 一个公司自己的资料库、信息库。
  • 公司内部整理的产品问答、售后问答等 QA 资料。
  • 个人的知识笔记、思想感悟等。

这些内容并未公开发布到网上,而是存储在个公司文件、人磁盘或私有空间里。这些数据的特点是 私有的,内部的

那么,如何借助 AI 来利用这些内部数据呢?这就引出了 AI 发展的第三个阶段。

AI 发展的第三阶段:文档嵌入

通过 文档嵌入 方式,可以将自己拥有的内部资料嵌入进 AI,借助 AI 方便地查阅内部资料。AI 可以基于这些数据进行问答和交互。

然而,这里又会出现一个问题:这些内部数据只有数据拥有者才有权力使用,就算数据主人上传了内部数据到 AI 平台,但没有数据主人的授权,其他人也无法使用这些数据。

在这里插入图片描述

所以产生的新问题是,其他人想用这些数据和信息时,该怎么办呢?

获取他人的内部数据

内部数据通常掌握在他人手中,他们不太可能将自己公司私有数据分享给你,如果你想要获取这些数据,通常需要 支付一定的费用来购买相关服务,比如咨询服务或数据服务。

这些服务提供商本质上是将他们内部的私有信息进行逻辑化处理,打包成服务后出售给第三方。所以,当你想要获取他人的信息时,通常需要通过他们提供的服务来实现。

AI 平台的目标,是让你在使用 AI 时,能够尽可能获取到你想要的所有信息,实现通用型人工智能的宏大理想。

为了帮助你获取到其他人或组织的内部信息,AI 平台虽然不可能直接侵入公司服务器或个人磁盘去偷取或抢夺数据,但他们提出了一个概念,也就是我们今天要讨论的主题 —— MCP

这个概念提出的本质需求在于,AI 大模型平台,需要尽可能多的人将自己的内部数据和服务分享出来。

那么,MCP 究竟是如何实现这一目标的呢?

MCP:连接AI与内部数据的桥梁

目前,许多公司已经在提供数据服务和咨询服务。

这些企业虽然在官网上公开了公司概况等基本信息,但他们的核心资产——包括内部数据、内部资料、整体思维方式以及结构化处理能力都被打包在付费服务中。因此,在公开网络上,你是无法获取这些内容的。

而 AI 公司提出的 MCP 标准,为这些咨询公司和数据服务公司提供了一个新思路,他们可以基于 MCP 标准,开发专门针对 AI 的服务

当这些服务被开发出来后,注册到 AI 大模型平台,就变成了 MCP 服务,AI 就能通过 MCP 标准调用这些服务。这样一来,当用户想要查询或利用这些数据时,就能自然而然地获取到所需信息。

当然,今后用户通过 AI 使用这些数据,大概率还是需要支付相应费用的。毕竟,这些信息和数据资源属于他人所有。

AI 平台的目标是让用户获取数据过程更加便捷,同时培养用户通过 AI 对话来使用数据资源的习惯

至于具体的付费方式,以及如何确保资源的持续使用,目前还没有一个明确的约定,但这肯定是未来 AI 应用发展和商业化的一个很重要的方式。

在这里插入图片描述

那么,除了方便调用他人提供的内部数据服务,MCP 服务还能为 AI 带来哪些新的能力?

MCP:赋予 AI 执行能力

除了内部数据,AI 的下一阶段是什么呢?

还是回到我们所说的 AI 平台的宏大愿景 —— 打造通用型人工智能。即 AI 平台不仅希望在信息层面有所突破,更希望在执行层面实现更多功能。

比如:

  • 像某手机可以用 AI 帮我们订咖啡。
  • 像 Manus 一样,能够根据指令自动执行一系列执行任务。

这些执行能力完全依赖大模型是不太现实的。

因为在执行层面,不同场景的动作种类实在太多。

以当前 AI 大模型平台发展的方向,如果投入大量资源去开发和训练这些细枝末节的执行动作,大模型会变得千奇百怪。

那么,AI 平台如何实现这些从信息到执行动作的 “最后一公里” 呢?

答案同样是 MCP

MCP 服务可以是信息层面的,也可以是动作层面的。

比如集成了端侧的AI Agent、 RPA 和 爬虫 等 MCP 服务。

通过调用这些服务,AI 只需要做决策和发出调用指令,就能够实现各种实际的动作执行能力。

例如,发送邮件。
在之前,AI 仅能够帮你生成邮件内容,但仍然需要你复制到邮件客户端,再输入收件人,然后点击发送。
但基于 MCP 服务提供的邮件发送能力,你只需要给 AI 提供邮件收件人和大致的内容信息,AI 就能帮你完成邮件润色、优化以及发送动作的全部任务。

随着这样的 MCP 服务越来越多,AI 平台就不仅能在信息层面提供帮助和决策支持,还能在执行层面实现更多功能,真正迈向通用型人工智能的愿景

在这里插入图片描述

总结:MCP 的本质与未来

所以,MCP 是什么?相信你已经有了答案。

MCP,本质上是一种标准化协议,它定义了 AI 大模型客户端与各种三方服务进行交互的方式

MCP 服务,也就是遵守了 MCP 标准提供的三方服务,AI 平台能够识别并调用。

通过 MCP 服务,AI 不仅能获取更多的知识和信息,还能执行更多的具体动作任务。

这种协议和标准的出现,标志着 AI 正在从单纯的信息提供者,逐步转变为能够理解、获取和执行的综合性助手。

未来,随着更多服务提供商加入 MCP 生态,AI 的能力将会进一步扩展,为用户提供更加全面和便捷的服务体验。

你是否已经开始思考,MCP 会如何改变你的工作和生活?
它会为哪些行业带来颠覆性的变革?
作为 AI 用户,我们又该如何适应这种变化,并从中获益?

也欢迎你在评论中发表自己的想法。

http://www.dtcms.com/a/113573.html

相关文章:

  • chromadb
  • Swift 扩展
  • 微服务架构与中台的关系
  • 高通camx ThreadManager
  • 【 <二> 丹方改良:Spring 时代的 JavaWeb】之 Spring Boot 的未来:从微服务到云原生的演进
  • Hyperlane框架:下一代高性能Rust Web框架 [特殊字符]
  • 学习笔记,DbContext context 对象是保存了所有用户对象吗
  • ring语言,使用vscode编辑器
  • AtCoder Beginner Contest 399 D,F 题解
  • 对迭代器模式的理解
  • Arduino示例代码讲解:Knock Sensor 敲击感知器
  • 每日一题(小白)模拟娱乐篇14
  • BN测试和训练时有什么不同, 在测试时怎么使用?
  • 【C++项目】从零实现RPC框架「四」:业务层实现与项目使用
  • 【51单片机】2-7【I/O口】点亮数码管
  • 线程池的工作原理
  • 线代[12]|《高等几何》陈绍菱(1984.9)(文末有对三大空间的分析及一个合格数学系毕业生的要求)
  • Python 语法学习 1(类比 java 学习)-附Python 中 self
  • 前端用用jsonp的方式解决跨域问题
  • [ICLR 2025]Biologically Plausible Brain Graph Transformer
  • Reids 的io并发模型
  • 程序化广告行业(60/89):算法优化与DSP系统实例解析
  • Linux系统程序设计:从入门到高级Day03
  • 第八章:流量治理_《凤凰架构:构建可靠的大型分布式系统》
  • DDPM 做了什么
  • 2007-2019年各省地方财政其他支出数据
  • 格式工厂怎样插入内置音频文件
  • 硬件工程师面试问题(五):蓝牙面试问题与详解
  • 在响应式网页的开发中使用固定布局、流式布局、弹性布局哪种更好
  • vllm作为服务启动,无需额外编写sh文件,一步到位【Ubuntu】