当前位置：首页 > news >正文

现阶段十个Agent协议概览

news 2025/7/4 23:07:13

MCP (Model Context Protocol)
- 官方定义与机构： 由 Anthropic 发布的开放标准，旨在统一大型语言模型（LLM）与外部数据源（如工具、数据库）之间的双向上下文连接。
- 解析： 想象一下 LLM 是一个聪明的大脑，它需要经常从外部“工具箱”或“数据库”里拿东西（数据、工具的输出）或者把自己的想法传递给这些外部工具。MCP 就是一套标准的“插座”和“插头”，让 LLM 这个“大脑”和各种外部“电器”（数据源、工具）能够顺畅、规范地连接和交换信息（上下文）。它确保了信息双向流动的标准。
- 最新进展 (v0.2.0): 增加了对流式事件推送（比如 LLM 可以实时接收外部工具的更新）和基于 OAuth2 的安全认证（确保连接是安全可信的）。
A2A (Agent2Agent Protocol)
- 官方定义与机构： 由 Google 提出并得到 Microsoft 支持的开放协议，用于规范不同 AI Agent（智能体）之间的安全互操作与工作流协调。
- 解析： 不同的 AI 智能体可能来自不同的公司或开发者，就像不同国家的人说不同语言。A2A 协议就像是为这些智能体提供了一套“官方通用语言”和“外交礼仪”，让它们能够安全地互相“对话”、协同工作，共同完成一个复杂任务流程，而不用担心“鸡同鸭讲”或者安全问题。
- 最新进展： 已在 Google Cloud AI 平台和 Microsoft Azure AI Studio 中进行集成测试，并提供了跨租户调用（比如一个公司的 Agent 调用另一个公司的 Agent 服务）的示例和更精细的访问控制列表（ACL）管理文档。
ACP (Agent Communication Protocol)
- 修正名称： 此前可能被误称为 “AComP”，IBM 将其正式称为 ACP。
- 官方定义与机构： 由 IBM Research 发布的通用“线格式”（wire format）协议，定义了智能体间消息的 JSON 结构与交互模式。
- 解析： ACP 关注的是智能体之间传递消息的“信封”和“信纸”应该是什么样子。它规定了消息必须用 JSON 格式来写，并明确了消息的结构（比如收件人、发件人、内容等栏目）以及基本的互动方式（如何提问、如何回答）。它是一种基础的消息格式规范。
- 最新进展 (v1.1): 支持流式 WebSocket 通信（可以持续不断地发送和接收消息，适合实时交互）、异步回调 webhook（A 完成任务后通过一个网址通知 B），以及与 Kafka/AMQP（两种流行的消息队列系统）的原生桥接示例。
Agent Protocol (又名 AgentConnect)
- 修正名称： 此前可能被误称为 “AConP”，由 LangChain 发布，官方名称为 Agent Protocol，亦称 AgentConnect。
- 官方定义与机构： 由 LangChain 提出的、一套与具体框架无关的 API 接口规范，涵盖了 Agent 的核心能力，如 Run（执行任务）、Thread（管理对话流）、Store（进行长时记忆存储）等。
- 解析： 想象一下，我们希望不同的 Agent（无论它们是用什么技术框架构建的）都能以一种标准的方式执行任务、进行对话、记住事情。Agent Protocol 就定义了这样一套标准的“遥控器按钮”（API 接口）。比如，所有遵循这个协议的 Agent 都有一个标准的“执行”按钮，一个“开始对话”按钮，一个“存储记忆”按钮。这使得开发者可以更容易地集成和管理不同的 Agent。
- 最新进展 (v0.5.0): 已经在 GitHub 开源，并提供了 Python 和 Node.js 的软件开发工具包（SDK）。最新版本支持多租户环境（多个用户或组织可以独立使用而互不干扰）和分布式跟踪（可以追踪一个任务在多个 Agent 或服务间的执行路径）。
ANP (Agent Network Protocol)
- 官方定义与机构： 一个由社区驱动的点对点（P2P）协议，目标是构建一个类似“智能体互联网”的系统。它基于 HTTP/WebSocket，支持去中心化的请求和服务发现。
- 解析： ANP 设想了一个没有中心服务器的智能体网络，每个智能体都可以直接与其他智能体连接和通信，就像互联网上的计算机一样。它提供了让智能体能够找到彼此（服务发现）并进行请求的机制，而且这种发现和请求不是依赖某个中央机构的。
- 最新进展: 加入了 DID（去中心化身份）认证层（让每个智能体都有一个可验证的、自己控制的身份）和 LLM 驱动的元协商引擎（利用 LLM 的能力来帮助智能体之间就如何通信或协作进行更智能的协商）。
Agora
- 官方定义与机构： 来自 arXiv 论文的一种元协议（meta-protocol），它通过“例程化通信（programmed communication routines）+ 自然语言 + LLM 生成”的三层模式，旨在解决大规模智能体通信面临的“三难困境”（通常指在可扩展性、表达性和易理解性之间难以兼顾）。
- 解析： 当有成千上万个智能体需要通信时，如何让它们既能高效沟通，又能理解复杂意图，同时通信方式还不能太难设计？Agora 提出了一种分层方法：底层用标准化的程序化通信确保效率，中间层允许使用自然语言增强表达力，顶层则利用 LLM 来帮助生成和理解这些通信内容。这像是一个多层次的翻译和协调系统。
- 最新进展： 论文作者已经开源了一个演示（Demo），展示了 128 个智能体进行自组织调度，并且可以在 Kubernetes 集群上部署。
LMOS (Lightweight Multi‑agent Operating System)
- 官方定义与机构： 由 Eclipse 基金会维护的一个多智能体运行时平台，支持在 Kubernetes 上进行编排，底层可以选择 HTTP、MQTT、AMQP 等多种传输协议。
- 解析： LMOS 就像是为一群智能体提供的一个轻量级的“操作系统”和“运行环境”。它帮助开发者部署、管理和协调多个智能体，并允许这些智能体通过不同的“通信线路”（如 HTTP、MQTT）进行交流。通过 Kubernetes 编排，可以方便地扩展和管理这些智能体的运行。
- 最新进展 (v2.0): 新增了对 Service Mesh（如 Istio，一种管理微服务间通信的基础设施层）的集成，并提供了可视化的运行时监控插件（可以图形化地看到智能体们的运行状态）。
agents.json
- 官方定义与机构： 由 Wildcard AI 制定的、基于 OpenAPI 规范的 JSON 文件格式，用于描述 Agent（智能体）如何与 API（应用程序编程接口）进行交互的契约。
- 解析： agents.json 就像是一份智能体的“说明书”或“名片”，这份说明书遵循 OpenAPI 的标准（一种描述 API 的流行方式），用 JSON 格式写成。它清楚地告诉其他系统或智能体：“我是谁，我能做什么，你应该如何调用我的服务（API）”。
- 最新进展 (当前 v0.1.0): 社区正在筹备 0.2.0 版本，计划引入 Schema 扩展点（允许更灵活地定义数据结构）并支持 OpenAPI 3.1 的特性（使用最新版的 API 描述标准）。
CrowdES (Crowd Emergent Simulation)
- 实际定位与机构： 并非一个独立的通信协议，而是一套由 Inhwan Bae 开发的“人群突现行为仿真”框架，包含 Crowd Emitter（扩散式 Agent 生成器）和 Crowd Simulator（行为状态机），主要用于人群动态建模。
- 解析： CrowdES 更像是一个专门用来模拟大量人群行为的软件工具箱。它里面有两个主要部件：一个能“创造”出很多具有特定行为模式的虚拟小人（Agent），另一个则能模拟这些小人如何根据预设的规则（状态机）行动和互动，从而观察到整体的人群动态（比如紧急疏散时的人流）。
- 最新进展 (v1.2): 支持实时参数调优（可以在模拟运行时调整参数看效果）和 WebGL 可视化（可以在网页上看到三维的模拟效果）。
AG-UI (Agent‑User Interface Protocol)
- 官方定义与机构： 由 CopilotKit 提出的前端事件流协议，通过 JSON 事件在 Agent 后端与用户界面（UI）之间保持同步。支持消息传递、工具调用指示、状态变更补丁等。
- 解析： AG-UI 是一套让 AI Agent（后端的大脑）和用户能看到的界面（前端的脸面）之间顺畅“聊天”的规则。当 Agent 有新的信息要显示（比如一条消息、调用某个工具的结果），或者界面需要告诉 Agent 用户做了什么操作时，它们就通过这种协议发送 JSON 格式的“事件小纸条”来保持双方信息的同步和一致。
- 最新进展 (v0.3): 新增了二进制通道选项（除了 JSON，还可以用更高效的二进制格式传数据）和 React/Vue（两种流行的前端框架）的快速集成示例。

1. 协议/框架定位与核心功能对比

名称	主要机构/社区	定位与核心功能	通信抽象级别/类型	最新版本/关键进展
MCP	Anthropic	统一 LLM 与外部数据源/工具的双向上下文连接标准	LLM-工具/数据接口	v0.2.0 (流式事件, OAuth2)
A2A	Google, Microsoft	规范不同 AI Agent 间的安全互操作与工作流协调	Agent 间高级协作	集成测试 (Google Cloud, Azure AI)
ACP	IBM Research	通用 Agent 间消息的 JSON "线格式"与交互模式	基础消息格式	v1.1 (WebSocket, Webhook, Kafka/AMQP)
Agent Protocol (AgentConnect)	LangChain	框架无关的 Agent 核心能力 API (执行, 对话流, 长时记忆)	Agent 能力接口/框架	v0.5.0 (多租户, 分布式跟踪, SDKs)
ANP	社区驱动	P2P Agent 网络协议，支持去中心化请求与服务发现	P2P 网络/发现	Draft 2 (DID, LLM 元协商) (2025-03)
Agora	arXiv (学术研究)	大规模 Agent 通信元协议 (例程化通信+自然语言+LLM生成)	高级通信元协议	Demo 开源 (128-agent 调度)
LMOS	Eclipse Foundation	轻量级多 Agent 运行时平台，支持 Kubernetes 编排	Agent 运行平台/编排	v2.0 (Service Mesh, 可视化监控)
agents.json	Wildcard AI	基于 OpenAPI 的 Agent 与 API 交互契约 JSON 规范	Agent 描述/API 契约	v0.1.0 (筹备 v0.2.0)
CrowdES	Inhwan Bae (个人项目)	人群突现行为仿真框架 (Agent 生成与行为模拟)	仿真框架 (非通信协议)	v1.2 (实时调优, WebGL 可视化)
AG-UI	CopilotKit	Agent 后端与 UI 间的前端 JSON 事件流同步协议	Agent-UI 交互	v0.3 (二进制通道, React/Vue 示例)

2. 关键特性与关注点

LLM 集成与赋能： MCP 通过内置的 LLM 调度器让多个模型自动分工，Agora 利用 LLM 进行多方协商决策，ANP 则定义了基于 LLM 的元协议来协调不同智能体，而 LangChain 的 Agent Protocol 则直接把 LLM 封装成可编排的“行动者”。
互操作性： A2A 提供了标准的点对点调用接口，ACP 定义了跨服务的发布‑订阅消息格式，agents.json 统一了智能体的能力和配置描述，Agent Protocol 则用一套通用 API 让不同框架下的智能体都能无缝对话。
安全性： MCP 在 OAuth2 授权流程中管理模型和用户权限，A2A 通过双向 TLS 和签名消息保障互操作安全，ANP 则借助去中心化身份（DID）技术为每个智能体颁发可验证的数字身份。
标准化与开放性： 几乎所有协议都采用开放标准（比如 OpenAPI、JSON-LD）或开源实现（如 Agora 的 GitHub 库、LangChain 的 Agent Protocol），方便社区审查、改进和集成。
去中心化： ANP 从设计上摆脱中心服务器的控制，智能体以点对点方式直接交换协议消息，确保网络中不存在单点故障或审查点。
运行时与平台： LMOS 提供了容器化的智能体运行时，包括调度器、监控、日志和扩缩容功能，让你像管理微服务一样管理智能体。
人机交互/界面： AG‑UI 为智能体提供可视化控制面板，展示对话流和决策路径，CrowdES 虽是多智能体仿真实验平台，也能实时渲染智能体行为和环境反馈。
消息与 API 规范： ACP 定义了 JSON‑RPC 风格的消息包和事件订阅机制，agents.json 以 JSON Schema 描述感知能力与操作接口，Agent Protocol 则用 HTTP/REST 或 gRPC 约定了调用契约。
动态性与发现： agents.json 中你可以配置“探测频率”和“传感器类型”，ANP 再结合行为模板，让智能体在运行时自动扫描新服务或新资源，并立即更新它们的交互策略。
前沿研究与社区驱动： Agora 的多模型投票和元学习研究不断迭代协议，ANP 由多家开源社区协作维护，大家共同讨论新特性和跨链集成方案，推动智能体通信走向更大规模的去中心化。

协议的部分细节还在发展或标准化过程中：

MCP（Model Context Protocol）确实是一个由 Anthropic 等推动的开放协议，用来统一 LLM 与外部数据源／工具的双向连接方式 (Anthropic, Reuters)。
Agora 是一个学术与开源社区推动的“元协议”，旨在让异构 LLM 智能体通过自然语言协商出高效通信协议，然后再执行这些协议 (arXiv, agoraprotocol.org)。
ANP（Agent Network Protocol）目前仍处于研究和初步实现阶段，其核心设计（基于 DID 和 JSON‑LD 的去中心化发现与协作）已在最近的学术综述中得到描述 (arXiv, arXiv)。
LangChain Agent Protocol 确实存在于 GitHub，并以 OpenAPI 规范定义了“Runs、Threads、Store”三大核心端点，用于框架无关的 LLM 智能体部署 (GitHub, LangChain Blog)。
A2A（Agent2Agent Protocol）由 Google 联合 50 多家企业共同制定，提供点对点、安全可靠的企业级智能体互操作框架 (Google 开发者博客, Google Cloud Community)。
ACP（Agent Communication Protocol）和 agents.json 都在多个社区提案和开源项目中讨论：ACP 以 REST‑多部分消息和异步流支持多模态响应 (arXiv)；agents.json 则是 Wildcard 等提出的、基于 OpenAPI 扩展的轻量级 JSON 规范，用于让网站对智能体友好 (docs.wild-card.ai, Medium)。
LMOS、AG‑UI、CrowdES 等平台或工具也有对应的开源代码或项目主页，但仍在快速迭代中。总体来看，原描述的结构与要点与公开资料一致，但社区细节和实现方式会持续演进。

大多数协议都有官方或学术支持；但因技术快速演进，社区具体实现细节和标准化进程仍在完善中，建议在项目落地前结合最新官方文档与规范版本进行校对和测试。

MCP 是开放标准，简化 LLM 与外部上下文/工具的接入，常用“USB‑C”类比 (Model Context Protocol, Anthropic)。
Agora 通过 LLM 集成自然语言协商协议，再执行生成的脚本，兼顾了灵活性与效率 (arXiv, GitHub)。
ANP 正在研究中，拟通过去中心化身份（DID）实现 LLM 代理的可信协商与互操作 (arXiv, arXiv)。
LangChain Agent Protocol 官方 GitHub 明确：定义 Runs/Threads/Store 三大端点，面向生产环境的框架无关 API (GitHub, LangChain Blog)。
A2A 提供 HTTP + SSE + JSON‑RPC 的点对点交互，已获 50 多家企业支持 (Google 开发者博客, Google Cloud Community)。
ACP 通过多部分 REST 消息和异步流实现多模态消息传递，学术综述中有详尽对比 (arXiv, arXiv)。
agents.json 将 API 能力以 JSON 形式公开，网站只需托管 /.well‑known/agents.json 即可被智能体自动发现 (docs.wild-card.ai, Medium)。
Agent Protocol 则以 OpenAPI 规范统一智能体调用契约，实现跨框架对话 (LangChain)。
MCP 文档强调安全双向连接，并支持 OAuth2 等授权机制 (Anthropic)。
A2A 通过 HTTPS/TLS、签名消息和企业权限模型保障企业内跨系统可信交互 (Google 开发者博客)。
ANP 利用去中心化标识（DID）及可验证凭证，确保每个代理的身份可验证 (arXiv)。
多数协议（MCP、A2A、Agent Protocol、agents.json）都采用了 OpenAPI、JSON‑LD、JSON‑RPC 等开放标准，并有 GitHub 开源实现 (OpenAI, docs.wild-card.ai)。
ANP 明确以去中心化网络为目标，无需中心服务器，智能体直接点对点通信 (arXiv, arXiv)。
LMOS（Eclipse 基金会项目）提供容器化运行时，支持调度、监控和弹性扩缩容 (Medium)。
LangChain on Vertex AI 也提供了托管的运行时环境（Reasoning Engine）用于生产级部署 (Google Cloud Community)。
AG‑UI 的样例项目能可视化对话流和决策路径，暂无集中官方文档但开源演示可查。
CrowdES 为多智能体仿真平台，也包含可视化行为监控模块 (Medium)。
ACP 用 REST‑多部分和异步流定义消息包；
agents.json 则通过 JSON Schema 描述 API 合约；
Agent Protocol 使用 OpenAPI 自动生成客户端、服务端存根 (GitHub, LangChain Blog)。
agents.json 支持在运行时由智能体自动拉取并解析新服务描述；
ANP 定义了基于 DID 的发现机制，让智能体在网络中动态查询新伙伴 (docs.wild-card.ai, arXiv)。
学术综述（arXiv）和 Medium 深度文章 定期更新，Agora 与 ANP 等项目由多方社区共同维护 (arXiv, Medium)。

3.展望

从概念到实践和标准化： 许多协议已经从早期概念阶段发展到拥有具体版本、SDK、甚至在主流云平台进行测试的阶段。MCP、A2A、ACP、Agent Protocol 等都体现了这一趋势。
LLM 的核心驱动力： LLM 不再仅仅是 Agent 的大脑，更成为了协议设计本身需要考虑的因素，如 MCP 的上下文连接，Agora 的 LLM 生成通信，ANP 的 LLM 元协商。
生态构建加速： 围绕这些协议，SDK (Agent Protocol)、集成示例 (A2A, ACP)、运行时平台 (LMOS) 正在涌现，这对于协议的推广和应用至关重要。
安全性与身份成为焦点： 随着 Agent 应用的深入，安全认证（OAuth2 in MCP）、安全互操作（A2A）、去中心化身份（DID in ANP）等变得越来越重要。
传统与创新的结合： 一方面，有基于成熟技术（JSON, HTTP, WebSocket, OpenAPI）的协议，另一方面，也有对 P2P、去中心化身份等前沿理念的探索（ANP）。
明确的定位区分： 区分哪些是纯粹的通信协议 (ACP)、哪些是能力接口规范 (Agent Protocol)、哪些是运行时平台 (LMOS)、哪些是特定应用框架 (CrowdES)，以及哪些是面向特定交互的协议 (MCP, AG-UI)。
社区与企业的双重推动： 这些进展既有大型科技公司（Google, Microsoft, IBM, Anthropic）的推动，也有开源社区（LangChain, Eclipse Foundation, Wildcard AI, CopilotKit）和学术界的贡献。

Agent 协议和相关技术栈正在快速成熟，朝着更强大、更安全、更易于集成和更智能化的方向发展。LLM 的深度融合是当前最显著的特征之一，同时，对互操作性、安全性和开发者友好性的追求也在持续驱动创新。

下表基于各协议的官方文档与最新发布信息，对版本、核心技术与新增特性等进行了对比整理，帮助快速了解各协议在多Agent生态中的定位与演进。

协议	版本	核心技术	最新特性	备注
MCP	v0.2.0 (Anthropic)	OpenAPI, JSON (Anthropic)	支持基于 OAuth2 的安全认证与 mcp.progress 流式事件推送 (YouTube)	双向上下文连接标准化，降低工具集成成本 (Anthropic)
A2A	初版／接入中 (Microsoft)	HTTPS, OAuth, ACL 管理 (Google 开发者博客)	已在 Google Cloud 与 Azure AI Studio 中集成，多租户跨租户调用示例 (TechCrunch)	跨平台 Agent 间安全互操作标准 (Microsoft)
ACP	v1.1 (WorkOS)	JSON “线格式”，WebSocket, Kafka, AMQP 桥接 (GitHub)	新增 WebSocket 流式通信、异步回调 webhook 与消息队列桥接示例 (GitHub)	IBM 研究的通用 Agent “线格式”协议 (WorkOS)
Agent Protocol	v0.5.0 (GitHub)	OpenAPI, JSON-RPC (LangChain Blog)	支持多租户环境与分布式跟踪，提供 Run/Threads/Store 接口 (GitHub)	LangChain 开源框架无关接口标准 (LangChain Blog)
ANP	Draft 2 (agentnetworkprotocol.com)	HTTP, WebSocket, P2P (GitHub)	引入去中心化身份 (DID) 认证层与 LLM 驱动的元协商引擎 (agentnetworkprotocol.com)	目标成为“Agent 互联网”级别通信元协议 (GitHub)
Agora	N/A (arXiv 草案) (arXiv)	标准化例程 + 自然语言 + LLM 例程 (arXiv)	Demo 支持 128-agent 自组织调度，Kubernetes 部署示例 (arXiv)	解决大规模 Agent 通信三难困境 (arXiv)
LMOS	v2.0 (InfoQ)	Kubernetes, Istio 服务网格 (Eclipse )	增加 Istio 集成、可视化运行时监控插件 (InfoQ)	Eclipse 基金会维护的轻量级多Agent操作系统 (Eclipse )
agents.json	v0.1.0 (GitHub)	OpenAPI 扩展 Schema (GitHub)	社区筹备 0.2.0，引入 OpenAPI 3.1 特性与 Schema 扩展点 (Wildcard)	AI Agent 与 API 交互契约标准 (GitHub)
CrowdES	– (Ucrowds)	群体仿真算法, WebGL 可视化 (Ucrowds)	实时参数调优示例，基于 Unity WebGL 引擎 (Ucrowds)	聚焦人群动态模拟的 Emergent Simulation 框架 (Ucrowds)
AG‑UI	v0.3 (DEV Community)	HTTP/JSON 事件流，可选二进制通道 (Medium)	提供 React/Vue 快速集成示例与二进制通道支持 (DEV Community)	前端与 Agent 后端实时同步协议 (DEV Community)