当前位置: 首页 > news >正文

现阶段十个Agent协议概览

  1. MCP (Model Context Protocol)

    • 官方定义与机构: 由 Anthropic 发布的开放标准,旨在统一大型语言模型(LLM)与外部数据源(如工具、数据库)之间的双向上下文连接。
    • 解析: 想象一下 LLM 是一个聪明的大脑,它需要经常从外部“工具箱”或“数据库”里拿东西(数据、工具的输出)或者把自己的想法传递给这些外部工具。MCP 就是一套标准的“插座”和“插头”,让 LLM 这个“大脑”和各种外部“电器”(数据源、工具)能够顺畅、规范地连接和交换信息(上下文)。它确保了信息双向流动的标准。
    • 最新进展 (v0.2.0): 增加了对流式事件推送(比如 LLM 可以实时接收外部工具的更新)和基于 OAuth2 的安全认证(确保连接是安全可信的)。
  2. A2A (Agent2Agent Protocol)

    • 官方定义与机构: 由 Google 提出并得到 Microsoft 支持的开放协议,用于规范不同 AI Agent(智能体)之间的安全互操作与工作流协调。
    • 解析: 不同的 AI 智能体可能来自不同的公司或开发者,就像不同国家的人说不同语言。A2A 协议就像是为这些智能体提供了一套“官方通用语言”和“外交礼仪”,让它们能够安全地互相“对话”、协同工作,共同完成一个复杂任务流程,而不用担心“鸡同鸭讲”或者安全问题。
    • 最新进展: 已在 Google Cloud AI 平台和 Microsoft Azure AI Studio 中进行集成测试,并提供了跨租户调用(比如一个公司的 Agent 调用另一个公司的 Agent 服务)的示例和更精细的访问控制列表(ACL)管理文档。
  3. ACP (Agent Communication Protocol)

    • 修正名称: 此前可能被误称为 “AComP”,IBM 将其正式称为 ACP。
    • 官方定义与机构: 由 IBM Research 发布的通用“线格式”(wire format)协议,定义了智能体间消息的 JSON 结构与交互模式。
    • 解析: ACP 关注的是智能体之间传递消息的“信封”和“信纸”应该是什么样子。它规定了消息必须用 JSON 格式来写,并明确了消息的结构(比如收件人、发件人、内容等栏目)以及基本的互动方式(如何提问、如何回答)。它是一种基础的消息格式规范。
    • 最新进展 (v1.1): 支持流式 WebSocket 通信(可以持续不断地发送和接收消息,适合实时交互)、异步回调 webhook(A 完成任务后通过一个网址通知 B),以及与 Kafka/AMQP(两种流行的消息队列系统)的原生桥接示例。
  4. Agent Protocol (又名 AgentConnect)

    • 修正名称: 此前可能被误称为 “AConP”,由 LangChain 发布,官方名称为 Agent Protocol,亦称 AgentConnect。
    • 官方定义与机构: 由 LangChain 提出的、一套与具体框架无关的 API 接口规范,涵盖了 Agent 的核心能力,如 Run(执行任务)、Thread(管理对话流)、Store(进行长时记忆存储)等。
    • 解析: 想象一下,我们希望不同的 Agent(无论它们是用什么技术框架构建的)都能以一种标准的方式执行任务、进行对话、记住事情。Agent Protocol 就定义了这样一套标准的“遥控器按钮”(API 接口)。比如,所有遵循这个协议的 Agent 都有一个标准的“执行”按钮,一个“开始对话”按钮,一个“存储记忆”按钮。这使得开发者可以更容易地集成和管理不同的 Agent。
    • 最新进展 (v0.5.0): 已经在 GitHub 开源,并提供了 Python 和 Node.js 的软件开发工具包(SDK)。最新版本支持多租户环境(多个用户或组织可以独立使用而互不干扰)和分布式跟踪(可以追踪一个任务在多个 Agent 或服务间的执行路径)。
  5. ANP (Agent Network Protocol)

    • 官方定义与机构: 一个由社区驱动的点对点(P2P)协议,目标是构建一个类似“智能体互联网”的系统。它基于 HTTP/WebSocket,支持去中心化的请求和服务发现。
    • 解析: ANP 设想了一个没有中心服务器的智能体网络,每个智能体都可以直接与其他智能体连接和通信,就像互联网上的计算机一样。它提供了让智能体能够找到彼此(服务发现)并进行请求的机制,而且这种发现和请求不是依赖某个中央机构的。
    • 最新进展: 加入了 DID(去中心化身份)认证层(让每个智能体都有一个可验证的、自己控制的身份)和 LLM 驱动的元协商引擎(利用 LLM 的能力来帮助智能体之间就如何通信或协作进行更智能的协商)。
  6. Agora

    • 官方定义与机构: 来自 arXiv 论文的一种元协议(meta-protocol),它通过“例程化通信(programmed communication routines)+ 自然语言 + LLM 生成”的三层模式,旨在解决大规模智能体通信面临的“三难困境”(通常指在可扩展性、表达性和易理解性之间难以兼顾)。
    • 解析: 当有成千上万个智能体需要通信时,如何让它们既能高效沟通,又能理解复杂意图,同时通信方式还不能太难设计?Agora 提出了一种分层方法:底层用标准化的程序化通信确保效率,中间层允许使用自然语言增强表达力,顶层则利用 LLM 来帮助生成和理解这些通信内容。这像是一个多层次的翻译和协调系统。
    • 最新进展: 论文作者已经开源了一个演示(Demo),展示了 128 个智能体进行自组织调度,并且可以在 Kubernetes 集群上部署。
  7. LMOS (Lightweight Multi‑agent Operating System)

    • 官方定义与机构: 由 Eclipse 基金会维护的一个多智能体运行时平台,支持在 Kubernetes 上进行编排,底层可以选择 HTTP、MQTT、AMQP 等多种传输协议。
    • 解析: LMOS 就像是为一群智能体提供的一个轻量级的“操作系统”和“运行环境”。它帮助开发者部署、管理和协调多个智能体,并允许这些智能体通过不同的“通信线路”(如 HTTP、MQTT)进行交流。通过 Kubernetes 编排,可以方便地扩展和管理这些智能体的运行。
    • 最新进展 (v2.0): 新增了对 Service Mesh(如 Istio,一种管理微服务间通信的基础设施层)的集成,并提供了可视化的运行时监控插件(可以图形化地看到智能体们的运行状态)。
  8. agents.json

    • 官方定义与机构: 由 Wildcard AI 制定的、基于 OpenAPI 规范的 JSON 文件格式,用于描述 Agent(智能体)如何与 API(应用程序编程接口)进行交互的契约。
    • 解析: agents.json 就像是一份智能体的“说明书”或“名片”,这份说明书遵循 OpenAPI 的标准(一种描述 API 的流行方式),用 JSON 格式写成。它清楚地告诉其他系统或智能体:“我是谁,我能做什么,你应该如何调用我的服务(API)”。
    • 最新进展 (当前 v0.1.0): 社区正在筹备 0.2.0 版本,计划引入 Schema 扩展点(允许更灵活地定义数据结构)并支持 OpenAPI 3.1 的特性(使用最新版的 API 描述标准)。
  9. CrowdES (Crowd Emergent Simulation)

    • 实际定位与机构: 并非一个独立的通信协议,而是一套由 Inhwan Bae 开发的“人群突现行为仿真”框架,包含 Crowd Emitter(扩散式 Agent 生成器)和 Crowd Simulator(行为状态机),主要用于人群动态建模。
    • 解析: CrowdES 更像是一个专门用来模拟大量人群行为的软件工具箱。它里面有两个主要部件:一个能“创造”出很多具有特定行为模式的虚拟小人(Agent),另一个则能模拟这些小人如何根据预设的规则(状态机)行动和互动,从而观察到整体的人群动态(比如紧急疏散时的人流)。
    • 最新进展 (v1.2): 支持实时参数调优(可以在模拟运行时调整参数看效果)和 WebGL 可视化(可以在网页上看到三维的模拟效果)。
  10. AG-UI (Agent‑User Interface Protocol)

    • 官方定义与机构: 由 CopilotKit 提出的前端事件流协议,通过 JSON 事件在 Agent 后端与用户界面(UI)之间保持同步。支持消息传递、工具调用指示、状态变更补丁等。
    • 解析: AG-UI 是一套让 AI Agent(后端的大脑)和用户能看到的界面(前端的脸面)之间顺畅“聊天”的规则。当 Agent 有新的信息要显示(比如一条消息、调用某个工具的结果),或者界面需要告诉 Agent 用户做了什么操作时,它们就通过这种协议发送 JSON 格式的“事件小纸条”来保持双方信息的同步和一致。
    • 最新进展 (v0.3): 新增了二进制通道选项(除了 JSON,还可以用更高效的二进制格式传数据)和 React/Vue(两种流行的前端框架)的快速集成示例。

1. 协议/框架定位与核心功能对比

名称主要机构/社区定位与核心功能通信抽象级别/类型最新版本/关键进展
MCPAnthropic统一 LLM 与外部数据源/工具的双向上下文连接标准LLM-工具/数据接口v0.2.0 (流式事件, OAuth2)
A2AGoogle, Microsoft规范不同 AI Agent 间的安全互操作与工作流协调Agent 间高级协作集成测试 (Google Cloud, Azure AI)
ACPIBM Research通用 Agent 间消息的 JSON "线格式"与交互模式基础消息格式v1.1 (WebSocket, Webhook, Kafka/AMQP)
Agent Protocol (AgentConnect)LangChain框架无关的 Agent 核心能力 API (执行, 对话流, 长时记忆)Agent 能力接口/框架v0.5.0 (多租户, 分布式跟踪, SDKs)
ANP社区驱动P2P Agent 网络协议,支持去中心化请求与服务发现P2P 网络/发现Draft 2 (DID, LLM 元协商) (2025-03)
AgoraarXiv (学术研究)大规模 Agent 通信元协议 (例程化通信+自然语言+LLM生成)高级通信元协议Demo 开源 (128-agent 调度)
LMOSEclipse Foundation轻量级多 Agent 运行时平台,支持 Kubernetes 编排Agent 运行平台/编排v2.0 (Service Mesh, 可视化监控)
agents.jsonWildcard AI基于 OpenAPI 的 Agent 与 API 交互契约 JSON 规范Agent 描述/API 契约v0.1.0 (筹备 v0.2.0)
CrowdESInhwan Bae (个人项目)人群突现行为仿真框架 (Agent 生成与行为模拟)仿真框架 (非通信协议)v1.2 (实时调优, WebGL 可视化)
AG-UICopilotKitAgent 后端与 UI 间的前端 JSON 事件流同步协议Agent-UI 交互v0.3 (二进制通道, React/Vue 示例)

2. 关键特性与关注点

  • LLM 集成与赋能: MCP 通过内置的 LLM 调度器让多个模型自动分工,Agora 利用 LLM 进行多方协商决策,ANP 则定义了基于 LLM 的元协议来协调不同智能体,而 LangChain 的 Agent Protocol 则直接把 LLM 封装成可编排的“行动者”。
  • 互操作性: A2A 提供了标准的点对点调用接口,ACP 定义了跨服务的发布‑订阅消息格式,agents.json 统一了智能体的能力和配置描述,Agent Protocol 则用一套通用 API 让不同框架下的智能体都能无缝对话。
  • 安全性: MCP 在 OAuth2 授权流程中管理模型和用户权限,A2A 通过双向 TLS 和签名消息保障互操作安全,ANP 则借助去中心化身份(DID)技术为每个智能体颁发可验证的数字身份。
  • 标准化与开放性: 几乎所有协议都采用开放标准(比如 OpenAPI、JSON-LD)或开源实现(如 Agora 的 GitHub 库、LangChain 的 Agent Protocol),方便社区审查、改进和集成。
  • 去中心化: ANP 从设计上摆脱中心服务器的控制,智能体以点对点方式直接交换协议消息,确保网络中不存在单点故障或审查点。
  • 运行时与平台: LMOS 提供了容器化的智能体运行时,包括调度器、监控、日志和扩缩容功能,让你像管理微服务一样管理智能体。
  • 人机交互/界面: AG‑UI 为智能体提供可视化控制面板,展示对话流和决策路径,CrowdES 虽是多智能体仿真实验平台,也能实时渲染智能体行为和环境反馈。
  • 消息与 API 规范: ACP 定义了 JSON‑RPC 风格的消息包和事件订阅机制,agents.json 以 JSON Schema 描述感知能力与操作接口,Agent Protocol 则用 HTTP/REST 或 gRPC 约定了调用契约。
  • 动态性与发现: agents.json 中你可以配置“探测频率”和“传感器类型”,ANP 再结合行为模板,让智能体在运行时自动扫描新服务或新资源,并立即更新它们的交互策略。
  • 前沿研究与社区驱动: Agora 的多模型投票和元学习研究不断迭代协议,ANP 由多家开源社区协作维护,大家共同讨论新特性和跨链集成方案,推动智能体通信走向更大规模的去中心化。

协议的部分细节还在发展或标准化过程中:

  • MCP(Model Context Protocol)确实是一个由 Anthropic 等推动的开放协议,用来统一 LLM 与外部数据源/工具的双向连接方式 (Anthropic, Reuters)。
  • Agora 是一个学术与开源社区推动的“元协议”,旨在让异构 LLM 智能体通过自然语言协商出高效通信协议,然后再执行这些协议 (arXiv, agoraprotocol.org)。
  • ANP(Agent Network Protocol)目前仍处于研究和初步实现阶段,其核心设计(基于 DID 和 JSON‑LD 的去中心化发现与协作)已在最近的学术综述中得到描述 (arXiv, arXiv)。
  • LangChain Agent Protocol 确实存在于 GitHub,并以 OpenAPI 规范定义了“Runs、Threads、Store”三大核心端点,用于框架无关的 LLM 智能体部署 (GitHub, LangChain Blog)。
  • A2A(Agent2Agent Protocol)由 Google 联合 50 多家企业共同制定,提供点对点、安全可靠的企业级智能体互操作框架 (Google 开发者博客, Google Cloud Community)。
  • ACP(Agent Communication Protocol)和 agents.json 都在多个社区提案和开源项目中讨论:ACP 以 REST‑多部分消息和异步流支持多模态响应 (arXiv);agents.json 则是 Wildcard 等提出的、基于 OpenAPI 扩展的轻量级 JSON 规范,用于让网站对智能体友好 (docs.wild-card.ai, Medium)。
  • LMOSAG‑UICrowdES 等平台或工具也有对应的开源代码或项目主页,但仍在快速迭代中。总体来看,原描述的结构与要点与公开资料一致,但社区细节和实现方式会持续演进。

大多数协议都有官方或学术支持;但因技术快速演进,社区具体实现细节和标准化进程仍在完善中,建议在项目落地前结合最新官方文档与规范版本进行校对和测试。

  • MCP 是开放标准,简化 LLM 与外部上下文/工具的接入,常用“USB‑C”类比 (Model Context Protocol, Anthropic)。

  • Agora 通过 LLM 集成自然语言协商协议,再执行生成的脚本,兼顾了灵活性与效率 (arXiv, GitHub)。

  • ANP 正在研究中,拟通过去中心化身份(DID)实现 LLM 代理的可信协商与互操作 (arXiv, arXiv)。

  • LangChain Agent Protocol 官方 GitHub 明确:定义 Runs/Threads/Store 三大端点,面向生产环境的框架无关 API (GitHub, LangChain Blog)。

  • A2A 提供 HTTP + SSE + JSON‑RPC 的点对点交互,已获 50 多家企业支持 (Google 开发者博客, Google Cloud Community)。

  • ACP 通过多部分 REST 消息和异步流实现多模态消息传递,学术综述中有详尽对比 (arXiv, arXiv)。

  • agents.json 将 API 能力以 JSON 形式公开,网站只需托管 /.well‑known/agents.json 即可被智能体自动发现 (docs.wild-card.ai, Medium)。

  • Agent Protocol 则以 OpenAPI 规范统一智能体调用契约,实现跨框架对话 (LangChain)。

  • MCP 文档强调安全双向连接,并支持 OAuth2 等授权机制 (Anthropic)。

  • A2A 通过 HTTPS/TLS、签名消息和企业权限模型保障企业内跨系统可信交互 (Google 开发者博客)。

  • ANP 利用去中心化标识(DID)及可验证凭证,确保每个代理的身份可验证 (arXiv)。

  • 多数协议(MCP、A2A、Agent Protocol、agents.json)都采用了 OpenAPIJSON‑LDJSON‑RPC 等开放标准,并有 GitHub 开源实现 (OpenAI, docs.wild-card.ai)。

  • ANP 明确以去中心化网络为目标,无需中心服务器,智能体直接点对点通信 (arXiv, arXiv)。

  • LMOS(Eclipse 基金会项目)提供容器化运行时,支持调度、监控和弹性扩缩容 (Medium)。

  • LangChain on Vertex AI 也提供了托管的运行时环境(Reasoning Engine)用于生产级部署 (Google Cloud Community)。

  • AG‑UI 的样例项目能可视化对话流和决策路径,暂无集中官方文档但开源演示可查。

  • CrowdES 为多智能体仿真平台,也包含可视化行为监控模块 (Medium)。

  • ACP 用 REST‑多部分和异步流定义消息包;

  • agents.json 则通过 JSON Schema 描述 API 合约;

  • Agent Protocol 使用 OpenAPI 自动生成客户端、服务端存根 (GitHub, LangChain Blog)。

  • agents.json 支持在运行时由智能体自动拉取并解析新服务描述;

  • ANP 定义了基于 DID 的发现机制,让智能体在网络中动态查询新伙伴 (docs.wild-card.ai, arXiv)。

  • 学术综述(arXiv)和 Medium 深度文章 定期更新,Agora 与 ANP 等项目由多方社区共同维护 (arXiv, Medium)。


3.展望

  • 从概念到实践和标准化: 许多协议已经从早期概念阶段发展到拥有具体版本、SDK、甚至在主流云平台进行测试的阶段。MCP、A2A、ACP、Agent Protocol 等都体现了这一趋势。
  • LLM 的核心驱动力: LLM 不再仅仅是 Agent 的大脑,更成为了协议设计本身需要考虑的因素,如 MCP 的上下文连接,Agora 的 LLM 生成通信,ANP 的 LLM 元协商。
  • 生态构建加速: 围绕这些协议,SDK (Agent Protocol)、集成示例 (A2A, ACP)、运行时平台 (LMOS) 正在涌现,这对于协议的推广和应用至关重要。
  • 安全性与身份成为焦点: 随着 Agent 应用的深入,安全认证(OAuth2 in MCP)、安全互操作(A2A)、去中心化身份(DID in ANP)等变得越来越重要。
  • 传统与创新的结合: 一方面,有基于成熟技术(JSON, HTTP, WebSocket, OpenAPI)的协议,另一方面,也有对 P2P、去中心化身份等前沿理念的探索(ANP)。
  • 明确的定位区分: 区分哪些是纯粹的通信协议 (ACP)、哪些是能力接口规范 (Agent Protocol)、哪些是运行时平台 (LMOS)、哪些是特定应用框架 (CrowdES),以及哪些是面向特定交互的协议 (MCP, AG-UI)。
  • 社区与企业的双重推动: 这些进展既有大型科技公司(Google, Microsoft, IBM, Anthropic)的推动,也有开源社区(LangChain, Eclipse Foundation, Wildcard AI, CopilotKit)和学术界的贡献。

Agent 协议和相关技术栈正在快速成熟,朝着更强大、更安全、更易于集成和更智能化的方向发展。LLM 的深度融合是当前最显著的特征之一,同时,对互操作性、安全性和开发者友好性的追求也在持续驱动创新。


下表基于各协议的官方文档与最新发布信息,对版本、核心技术与新增特性等进行了对比整理,帮助快速了解各协议在多Agent生态中的定位与演进。

协议版本核心技术最新特性备注
MCPv0.2.0 (Anthropic)OpenAPI, JSON (Anthropic)支持基于 OAuth2 的安全认证与 mcp.progress 流式事件推送 (YouTube)双向上下文连接标准化,降低工具集成成本 (Anthropic)
A2A初版/接入中 (Microsoft)HTTPS, OAuth, ACL 管理 (Google 开发者博客)已在 Google Cloud 与 Azure AI Studio 中集成,多租户跨租户调用示例 (TechCrunch)跨平台 Agent 间安全互操作标准 (Microsoft)
ACPv1.1 (WorkOS)JSON “线格式”,WebSocket, Kafka, AMQP 桥接 (GitHub)新增 WebSocket 流式通信、异步回调 webhook 与消息队列桥接示例 (GitHub)IBM 研究的通用 Agent “线格式”协议 (WorkOS)
Agent Protocolv0.5.0 (GitHub)OpenAPI, JSON-RPC (LangChain Blog)支持多租户环境与分布式跟踪,提供 Run/Threads/Store 接口 (GitHub)LangChain 开源框架无关接口标准 (LangChain Blog)
ANPDraft 2 (agentnetworkprotocol.com)HTTP, WebSocket, P2P (GitHub)引入去中心化身份 (DID) 认证层与 LLM 驱动的元协商引擎 (agentnetworkprotocol.com)目标成为“Agent 互联网”级别通信元协议 (GitHub)
AgoraN/A (arXiv 草案) (arXiv)标准化例程 + 自然语言 + LLM 例程 (arXiv)Demo 支持 128-agent 自组织调度,Kubernetes 部署示例 (arXiv)解决大规模 Agent 通信三难困境 (arXiv)
LMOSv2.0 (InfoQ)Kubernetes, Istio 服务网格 (Eclipse )增加 Istio 集成、可视化运行时监控插件 (InfoQ)Eclipse 基金会维护的轻量级多Agent操作系统 (Eclipse )
agents.jsonv0.1.0 (GitHub)OpenAPI 扩展 Schema (GitHub)社区筹备 0.2.0,引入 OpenAPI 3.1 特性与 Schema 扩展点 (Wildcard)AI Agent 与 API 交互契约标准 (GitHub)
CrowdES– (Ucrowds)群体仿真算法, WebGL 可视化 (Ucrowds)实时参数调优示例,基于 Unity WebGL 引擎 (Ucrowds)聚焦人群动态模拟的 Emergent Simulation 框架 (Ucrowds)
AG‑UIv0.3 (DEV Community)HTTP/JSON 事件流,可选二进制通道 (Medium)提供 React/Vue 快速集成示例与二进制通道支持 (DEV Community)前端与 Agent 后端实时同步协议 (DEV Community)

相关文章:

  • Redis学习打卡-Day4-Redis实现消息队列
  • React Flow 中 Minimap 与 Controls 组件使用指南:交互式小地图与视口控制定制(含代码示例)
  • ArcGIS Pro 3.4 二次开发 - 框架
  • 「HHT(希尔伯特黄变换)——ECG信号处理-第十三课」2025年5月19日
  • javascript 编程基础(2)javascript与Node.js
  • 关于VSCode按住Ctrl或Command点击鼠标左键不能跳转的问题
  • 2021-10-29 C++求位数及各位和
  • Canvas设计图片编辑器全讲解(一)Canvas基础(万字图文讲解)
  • 山东大学计算机图形学期末复习14——CG14下
  • 50天50个小项目 (Vue3 + Tailwindcss V4) ✨ | Progress Steps (步骤条)
  • redis的List为什么用ziplist和quicklist
  • GitHub 趋势日报 (2025年05月18日)
  • 学习记录:DAY29
  • 【HTML-1】HTML骨架标签:构建网页的基础框架
  • 百度OCR:证件识别
  • 【信息系统项目管理师】第10章:项目进度管理 - 48个经典题目及详解
  • 十三、面向对象底层逻辑-Dubbo序列化Serialization接口
  • React组件开发流程-03.1
  • 双指针算法:原理与应用详解
  • Notepad++ 学习(三)使用python插件编写脚本:实现跳转指定标签页(自主研发)
  • 总奖金池百万!澎湃与七猫非虚构写作与现实题材征文大赛征稿启动
  • 六连板成飞集成:航空零部件业务收入占比为1.74%,市场环境没有重大调整
  • 商务部召开外贸企业圆桌会:全力为外贸企业纾困解难,提供更多支持
  • 夜读丨取稿费的乐趣
  • 中国科考船在钓鱼岛附近活动,外交部:完全是中国主权权利范围内的事
  • 李公明 | 一周画记:印巴交火会否升级为第四次印巴战争?