当前位置: 首页 > news >正文

【翻译、转载】MCP 核心架构


核心架构

了解 MCP 如何连接客户端、服务器和 LLM

模型上下文协议 (MCP) 构建在一个灵活、可扩展的架构之上,能够实现 LLM 应用程序与集成之间的无缝通信。本文档涵盖了核心的架构组件和概念。

概述
MCP 遵循客户端-服务器 (client-server) 架构,其中:

  • 宿主 (Host) 是发起连接的 LLM 应用程序(如 Claude 桌面版或 IDE)。
  • 客户端 (Client) 在宿主应用程序内部与服务器保持 1:1 连接。
  • 服务器 (Server) 向客户端提供上下文、工具和提示 (prompts)。

在这里插入图片描述

宿主 (Host)
服务器进程 (Server Process)
MCP 客户端
传输层
MCP 服务器

核心组件

协议层
协议层处理消息帧、请求/响应关联以及高级通信模式。

[Python]

class Session(BaseSession[RequestT, NotificationT, ResultT]):async def send_request(self,request: RequestT,result_type: type[Result]) -> Result:"""Send request and wait for response. Raises McpError if response contains error."""# Request handling implementationasync def send_notification(self,notification: NotificationT) -> None:"""Send one-way notification that doesn't expect response."""# Notification handling implementationasync def _received_request(self,responder: RequestResponder[ReceiveRequestT, ResultT]) -> None:"""Handle incoming request from other side."""# Request handling implementationasync def _received_notification(self,notification: ReceiveNotificationT) -> None:"""Handle incoming notification from other side."""# Notification handling implementation

关键类包括:

  • Protocol (协议)
  • Client (客户端)
  • Server (服务器)

传输层
传输层处理客户端和服务器之间的实际通信。MCP 支持多种传输机制:

  • Stdio 传输
    • 使用标准输入/输出 (standard input/output) 进行通信。
    • 非常适合本地进程。
  • 带 SSE 的 HTTP 传输
    • 使用服务器发送事件 (Server-Sent Events, SSE) 处理服务器到客户端的消息。
    • 使用 HTTP POST 处理客户端到服务器的消息。

所有传输都使用 JSON-RPC 2.0 来交换消息。有关模型上下文协议消息格式的详细信息,请参阅规范文档。

消息类型
MCP 有以下主要的消息类型:

  • 请求 (Request) 期望从对方获得响应:
interface Request {method: string; // 方法名params?: { ... }; // 参数 (可选)
}
  • 结果 (Result) 是对请求的成功响应:
interface Result {[key: string]: unknown; // 任意键值对
}
  • 错误 (Error) 表明请求失败:
interface Error {code: number; // 错误代码message: string; // 错误消息data?: unknown; // 额外数据 (可选)
}
  • 通知 (Notification) 是不期望响应的单向消息:
interface Notification {method: string; // 方法名params?: { ... }; // 参数 (可选)
}

连接生命周期

1. 初始化
[时序图]
在这里插入图片描述

服务器 客户端 initialize 请求 (协议版本, 能力) initialize 响应 (协议版本, 能力) initialized 通知 (确认) 连接准备就绪 服务器 客户端
  • 客户端发送包含协议版本和能力的 initialize 请求。
  • 服务器以其协议版本和能力进行响应。
  • 客户端发送 initialized 通知作为确认。
  • 开始正常的消息交换。

2. 消息交换
初始化后,支持以下模式:

  • 请求-响应 (Request-Response):客户端或服务器发送请求,另一方响应。
  • 通知 (Notification):任意一方发送单向消息。

3. 终止
任意一方都可以终止连接:

  • 通过 close() 进行干净关闭。
  • 传输断开。
  • 错误条件。

错误处理
MCP 定义了这些标准错误代码:

enum ErrorCode {// 标准 JSON-RPC 错误代码ParseError = -32700,       // 解析错误InvalidRequest = -32600,   // 无效请求MethodNotFound = -32601,   // 方法未找到InvalidParams = -32602,    // 无效参数InternalError = -32603     // 内部错误
}

SDK 和应用程序可以定义自己的高于 -32000 的错误代码。

错误通过以下方式传播:

  • 对请求的错误响应。
  • 传输上的错误事件。
  • 协议级别的错误处理程序。

实现示例
这是一个实现 MCP 服务器的基本示例:

[Python]

import asyncio
import mcp.types as types
from mcp.server import Server
from mcp.server.stdio import stdio_serverapp = Server("example-server")@app.list_resources()
async def list_resources() -> list[types.Resource]:return [types.Resource(uri="example://resource",name="Example Resource")]async def main():async with stdio_server() as streams:await app.run(streams[0],streams[1],app.create_initialization_options())if __name__ == "__main__":asyncio.run(main())

最佳实践

传输选择

  • 本地通信
    • 对于本地进程,使用 stdio 传输。
    • 对于同一台机器上的通信效率高。
    • 进程管理简单。
  • 远程通信
    • 对于需要 HTTP 兼容性的场景,使用 SSE。
    • 考虑安全影响,包括身份验证和授权。

消息处理

  • 请求处理
    • 彻底验证输入。
    • 使用类型安全的模式 (schema)。
    • 优雅地处理错误。
    • 实现超时机制。
  • 进度报告
    • 对长时间操作使用进度令牌 (progress tokens)。
    • 增量报告进度。
    • 在已知总进度时包含该信息。
  • 错误管理
    • 使用适当的错误代码。
    • 包含有用的错误消息。
    • 在出错时清理资源。

安全注意事项

  • 传输安全
    • 对远程连接使用 TLS。
    • 验证连接来源。
    • 在需要时实施身份验证。
  • 消息验证
    • 验证所有传入消息。
    • 净化输入内容 (Sanitize inputs)。
    • 检查消息大小限制。
    • 验证 JSON-RPC 格式。
  • 资源保护
    • 实施访问控制。
    • 验证资源路径。
    • 监控资源使用情况。
    • 对请求进行速率限制。
  • 错误处理 (安全方面)
    • 不要泄露敏感信息。
    • 记录与安全相关的错误。
    • 实施正确的清理操作。
    • 处理拒绝服务 (DoS) 场景。

调试与监控

  • 日志记录
    • 记录协议事件。
    • 跟踪消息流。
    • 监控性能。
    • 记录错误。
  • 诊断
    • 实施健康检查。
    • 监控连接状态。
    • 跟踪资源使用情况。
    • 进行性能分析 (Profile)。
  • 测试
    • 测试不同的传输方式。
    • 验证错误处理。
    • 检查边缘情况。
    • 对服务器进行负载测试。

相关文章:

  • 黑马商城(七)MQ高级
  • 【操作系统】哲学家进餐问题
  • 赋予网页健壮的灵魂 —— TypeScript(下)
  • ST-LINKV2仿真器下载
  • 基于 AI 的人像修复与编辑技术:CompleteMe 系统的研究与应用
  • 驱动开发硬核特训 · Day 27(下篇):深入掌握 Common Clock Framework 架构与实战开发
  • 如何使用责任链模式优雅实现功能(滴滴司机、家政服务、请假审批等)
  • Python 库 petrel_client.client 浅入浅出
  • Python爬虫(17)反爬攻防战:随机请求头实战指南(fake_useragent库深度解析)
  • python:如何计算皮尔森相关系数
  • 商场防损部绩效考核制度与管理方法
  • Spring MVC常见注解详解
  • JAVA组织/岗位拉取多段时间属性到一张表上时,时间段分隔问题
  • C语言 指针(5)
  • 不定长滑动窗口(求最短/最小)
  • 【quantity】11 体积单位模块(volume.rs)
  • Kubernetes(k8s)学习笔记(五)--部署Ingress实现域名访问和负载均衡
  • C++23 std::tuple与其他元组式对象的兼容 (P2165R4)
  • 每天五分钟深度学习框架PyTorch:基于Dataset封装自定义数据集
  • 用哈希表封装出unordered_set/_map
  • 我驻旧金山总领事馆:黄石公园车祸中受伤同胞伤情稳定
  • “特朗普效应”下澳大利亚执政工党赢得大选,年轻选民担忧房价
  • “彩虹滑道”项目两男童相撞飞跌出去,景区:工作人员误判导致
  • 辛涛任山东第一医科大学副校长,曾为“博士服务团”成员
  • 山西太原一小区发生爆炸,太原:进一步深刻汲取教训
  • 讲武谈兵|朝鲜“崔贤”号驱逐舰下水,朝版“宙斯盾”战力如何?