微软全新开源的Agentic Web网络项目:NLWeb,到底是什么 ?
目录
1、背景
2、NLWeb是什么?
3、NLWeb是如何工作的?
3.1 技术原理
3.2 对发布者的价值
3.3 核心团队与合作伙伴
4、快速入门指南
5、延伸阅读
Agentic:Agent的形容词,Agentic指系统由大型语言模型(LLM)或其他自治系统驱动的自主程度。
NLWeb:Natural Language Web(自然语言网络)的缩写,该项目旨在简化网站自然语言交互界面开发,轻松将任意网站转化为具备 AI 功能的智能应用平台。
1、背景
2025年5月20日,微软Build大会上,CEO Satya Nadella展示了如何构建开放的智能代理网络的(agentic web),目标是帮助每一位开发者构建能够赋能全球各地的人们和组织的应用程序和Agents。整体宣布了5个大事件(其中4个与Agent相关):
-
Coding agent:我们将GitHub Copilot从“配对程序员”升级为“同行程序员”。现在,您拥有一个直接集成在GitHub中的完整编程智能代理。您可以为它分配任务——无论是修复漏洞、开发新功能,还是持续的代码维护。它将自主完成这些任务。
-
Copilot调优:Copilot现在可以学习您公司独特的语气和语言风格。这主要是将您作为公司所拥有的专业知识进一步放大,以便每个人都能使用。
-
Agent factory:Foundry是用于构建应用程序和智能代理的完整应用平台。我们正在增加对Grok、Hugging Face、Meta、Mistral等更多模型的支持。此外还包括:Azure AI搜索中的智能代理检索功能、Foundry智能代理服务以及与Copilot Studio的集成等。
-
NLWeb:是一个新的开放项目, 在代理网络中扮演着与 HTML 类似的角色,旨在简化网站的自然语言界面的创建,从而使任何网站易于将任何网站变成AI-Power的应用程序。
-
微软发现(Microsoft Discovery):企业代理平台,将整个技术栈整合在一起,以加快科学发现的速度。发现工具使用Agents生成想法、模拟结果并进行学习。一个很好的例子是这种有希望成为冷却剂的候选物质,它不依赖于持久性化学品(科学家研究领域范畴)。
2、NLWeb是什么?
为网站构建会话界面是很困难的,NLWeb 试图让网站更容易做到这一点。
「NLWeb 允许用户使用自然语言与任何网站进行交互。我们可以把它想象成智能体化 web 世界的 HTML。」
NLWeb 是由微软开发的一个开放项目,旨在让网站能够轻松地使用其选择的模型和自有数据创建丰富的自然语言界面。目标是让 NLWeb成为将网站高效转化为 AI 应用的最快捷、最简便的方法,让用户能够像使用 AI 助手或 Copilot 一样,直接使用自然语言查询网站内容。
由于 NLWeb 原生支持 MCP,因此人类和智能体可以使用相同的自然语言 API。MCP 是一种新兴的协议,用于聊天机器人和 AI 助手与工具交互。每个 NLWeb 实例本身也是一个 MCP 服务器,它支持一个核心方法 ask,该方法用于以自然语言的方式向网站提出问题。返回的响应利用了 schema.org,这是一个广泛使用的描述 Web 数据的词汇表。
简单来说,MCP 与 NLWeb 的关系就像 Http 与 HTML 的关系一样。作为一个开放协议和相关开源工具的集合,NLWeb 主要目标是为 AI Web 构建一个基础层 —— 就像 HTML 彻底革新了文档共享一样。
一直以来,开发能够用自然语言与应用程序乃至整个计算机世界进行自由对话的智能体一直是 AI 革命的核心。然而,当前大多数新型交互都被 ChatGPT、Claude 甚至必应等产品垄断。这些机器人汲取海量知识却不产生实质价值。而 NLWeb 相比传统搜索要便宜得多,且使用起来非常方便,仅需几行代码、任选 AI 模型(OpenAI 、DeepSeek、Gemini、Anthropic、Inception 等),并输入特定数据,NLWeb 就能为用户提供对话式交互界面(即一个文本框加提交按钮)。
比如:Eventbrite公司(美国一个活动管理和在线票务平台),面相用户的搜索场景,基于NLWeb升级前后的交互对比。
升级前:传统搜索交互
-
构建传统搜索引擎,按条件搜索。
升级后:NLWEB自然语言交互
-
自然语言输入:I'm in Seattle for a tech conference. Are there any geeky events I might enjoy?(译:我在西雅图参加一个技术会议。有什么我可能喜欢的极客活动吗?)
还有很多类似的场景,比如零售商可以使用 NLWeb 创建一个聊天机器人,帮助用户选择特定行程的服装;而烹饪网站则可以使用它来构建一个根据菜谱推荐合适菜肴的智能体。
回想以前,研究者为了建立一个网络搜索索引,需要爬取整个网络并创建一个包含它的索引。这对于搜索引擎和相关网站来说都是昂贵的。但有了 NLWeb 后,事情就变得简单了,比如你可能只需要获取一个 RSS 源,然后把它放到一个矢量数据库中,就可以运行了。此外,NLWeb 还可以调用廉价模型,而且整个过程快速且简便。
RSS 源是一种基于XML格式的数据源,用于发布和订阅网站内容的更新。通过RSS 源,用户可以方便地获取最新信息,而无需频繁访问网站。RSS应用在国外已经非常普遍,从个人博客(Blog)栏目、企业站点到世界级的门户都提供基于RSS的服务。
3、NLWeb是如何工作的?
微软的目标是将人工智能改变人们搜索方式的优势直接带到网站本身。正如 HTML 的出现让几乎任何人都能轻松创建网站一样,微软希望 NLWeb 能够让任何网络发布者都能轻松地为其网站打造智能、自然的语言体验。NLWeb 可以在智能体网络中扮演与 HTML 类似的角色,它允许用户以更丰富的语义方式直接与 Web 内容进行交互。
随着智能体网络的持续增长,NLWeb 将赋能网络发布者,使其能够按照自己的意愿参与其中,确保他们的网站能够随时进行互动、交易,并被其他智能体发现(如果他们选择的话)。
3.1 技术原理
NLWeb通过整合以下要素实现自然语言交互:
-
结构化数据支持:在实现方面,NLWeb 利用 Schema.org、RSS 等半结构化格式以及网站已发布的其他数据,并将它们与 LLM 驱动的工具相结合,创建可供人类和 AI 智能体使用的自然语言界面。
-
LLM增强:NLWeb 系统通过整合来自底层 LLM 的外部知识(例如将地理洞察叠加到餐厅查询中)来增强这些结构化数据,从而提供更丰富的用户体验。
-
技术中立架构:作为一个开放项目,NLWeb 的技术无关性很强。它支持所有主流操作系统(Windows、MacOS、Linux),并允许开发者选择最符合自身需求的组件,同时支持所有主流模型和矢量数据库。
-
代理兼容性:提供人类与AI代理均可使用的统一接口。
3.2 对发布者的价值
-
降低AI应用门槛:如同HTML简化网站建设,NLWeb让自然语言交互部署变得简单
-
参与智能体经济:通过MCP协议自主控制网站内容在智能体网络中的可见性与交互方式
-
数据主权保障:发布者完全掌控使用的模型、数据存储及服务扩展方式
3.3 核心团队与合作伙伴
-
技术领袖:由RSS、RDF和Schema.org标准的创建者R.V. Guha主导开发
-
早期采用者:芝加哥公共媒体、Eventbrite、Shopify、Tripadvisor等已部署测试
-
技术生态伙伴:包括Milvus、Qdrant等向量数据库开发商
4、快速入门指南
访问NLWeb GitHub仓库获取:
-
核心服务代码:处理自然语言查询的轻量级服务框架
-
连接器套件:主流模型(如GPT-4、Claude)和向量数据库的预置接口
-
数据工具包:支持Schema.org、JSONL、RSS等格式的数据注入工具
-
前端模板:包含Web服务器前端及简易查询界面的开箱即用方案
5、延伸阅读
【完整版】微软Build 2025主题演讲 | 萨提亚·纳德拉_哔哩哔哩_bilibili
GitHub - microsoft/NLWeb: Natural Language Web
https://news.microsoft.com/build-2025-book-of-news/zh/#main
https://news.microsoft.com/source/features/company-news/introducing-nlweb-bringing-conversational-interfaces-directly-to-the-web/