微软宣布的五大重要事项|AI日报0520
微软宣布的五大重要事项
在 Build 大会上,微软向大家展示了微软如何构建开放的智能体网络。它正在重塑技术栈的每一层,微软的目标是帮助每一位开发者构建能够赋能世界各地的人们和组织的应用与智能体。消息来源 详细了解
以下是微软宣布的五大重要事项:
-
编码智能体 (Coding agent):我们正将 GitHub Copilot 从“结对程序员”(pair programmer)提升为“同行程序员”(peer programmer)。您现在拥有一个完整的编码智能体,直接内置于 GitHub 之中。您可以给它分配任务——无论是修复错误、开发新功能,还是进行持续的代码维护。它都能够自主完成这些任务。
-
Copilot 调优 (Copilot Tuning):Copilot 现在可以学习贵公司的独特语气和语言风格。其核心在于获取贵公司所拥有的专业知识,并将其进一步放大,以便每个人都能利用。
-
智能体工厂 (Agent factory):Foundry 是一个用于构建应用和智能体的完整应用平台。我们正在增加对来自 Grok、Hugging Face、Meta、Mistral 等更多模型的支持。此外还包括:Azure AI Search 中的智能体检索功能、Foundry 智能体服务、与 Copilot Studio的 集成等等。我们还确保您已在使用的身份认证、管理和安全工具现在都将能够支持智能体。美国国家橄榄球联盟(NFL)已经结合我们的数据栈,使用 Foundry 来运作其最近的联合训练营(Combine)。
-
NLWeb:这是一个新的开放项目,它允许您使用自然语言与任何网站进行交互。您可以将其理解为智能体网络的HTML。
-
Microsoft Discovery:我们正在整合完整的技术栈,以帮助加速科学研究本身。Discovery 利用智能体来产生想法、模拟结果并进行学习。一个很好的例子是发现了一种极具前景的冷却剂候选材料,它不依赖于“永久性化学品”(forever chemicals)。
VS Code:开源 AI Editor
VSCode 宣布计划致力于将 VS Code 打造成为一个开源 AI 编辑器。我们坚信,AI 开发应当秉持 VS Code 的核心原则:开放、协作、社区驱动。让我们携手共创软件开发的未来。消息来源 英文全文
全文如下:
我们坚信,代码编辑器的未来应当是开放的,并由 AI 赋能。在过去的十年里,VS Code 一直是 GitHub 上最成功的开源项目之一。我们由衷感谢充满活力的贡献者和用户社区,正是因为 VS Code 的开源特性,他们选择了我们。随着 AI 日益成为 VS Code 开发者体验的核心,我们致力于坚守我们最初的开发原则:开放、协作、社区驱动。
我们将以 MIT 许可证开源 GitHub Copilot Chat 扩展中的代码,然后审慎地将该扩展的相关组件重构到 VS Code 核心之中。这是我们致力于将 VS Code 打造成开源 AI 编辑器的下一步,也是顺理成章的一步。这反映出 AI 赋能的工具已成为我们编写代码方式的核心;同时也再次印证了我们的信念——在开放中工作能为用户带来更好的产品,并培育一个多元化的扩展生态系统。
为何选择现在开源?
在过去的几个月里,我们观察到 AI 开发领域发生了一些转变,这些转变促使我们将 VS Code 中的 AI 开发从闭源转向开源:
- 大型语言模型已取得显著进步,降低了对“独门秘诀”式提示工程策略的需求。
- 目前,AI 交互中最受欢迎且行之有效的用户体验 (UX) 方案在各类编辑器中已变得普遍。我们希望通过将这些通用的 UI 元素置于一个稳定、开放的代码库中,使社区能够对其进行改进和构建。
- 一个由开源 AI 工具和 VS Code 扩展组成的生态系统已经涌现。我们希望让这些扩展开发者能够更轻松地构建、调试和测试他们的扩展。目前,如果无法访问 Copilot Chat 扩展的源代码,这项工作尤其具有挑战性。
- 我们收到了许多关于 AI 编辑器收集数据的问题。开源 Copilot Chat 扩展将使您能够看到我们收集的数据,从而提高透明度。
- 恶意行为者正越来越多地将 AI 开发工具作为攻击目标。在 VS Code 作为开源软件的整个历史中,社区提出的 issue 和 PR (Pull Request) 帮助我们迅速发现并修复了安全问题。
下一步计划
在接下来的几周内,我们将致力于开源 GitHub Copilot Chat 扩展中的代码,并将 AI 功能从该扩展重构到 VS Code 核心中。我们的核心优先事项保持不变:提供卓越的性能、强大的可扩展性以及直观、美观的用户界面。
当社区围绕一个稳定、共享的基础进行构建时,开源才能发挥其最大效能。因此,我们的目标是使贡献 AI 功能像贡献 VS Code 的任何其他部分一样简单。大型语言模型的随机性使得测试 AI 功能和提示词变更尤具挑战性。为简化这一过程,我们也将开源我们的提示测试基础设施,以确保社区提交的 PR 能够构建并通过测试。
一如既往,您可以关注我们的迭代计划,我们将在其中提供关于这项工作的更多信息。我们也会持续更新我们的常见问题解答 (FAQ),以回应社区提出的问题。在我们努力实现这一愿景的过程中,我们欢迎您的反馈。
我们非常激动能以开源 AI 编辑器的身份,共同塑造开发的未来——也希望您能加入我们,一同踏上这场在开放中构建的旅程。
编码愉快!
VS Code 团队
其他重大消息
-
GitHub Copilot 现已内置编码智能体,直接集成到你与开发者日常协作的平台 GitHub 之中。当然,你也可以通过 VS Code 访问它。当你向 Copilot 分配一个或多个 issue 后,它会以一个 👀 表情符号回应,并利用 GitHub Actions 启动一个安全沙箱。该智能体会克隆代码仓库,配置环境,并利用由 GitHub 代码搜索赋能的 RAG (检索增强生成) 技术来分析代码库。此编码智能体可以使用由你配置的本地工具和 MCP 服务器。消息来源
-
视频分析 AI 智能体时代已然来临。🎥 从工厂到智慧城市,像和硕 (Pegatron)、Linker Vision、VAST Data 及西门子 (Siemens) 这样的企业,正利用生成式 AI 实现对海量视频数据的大规模观察、搜索与总结。NVIDIA 视频搜索与内容提炼 AI 蓝图现已发布,赋能各行各业部署视频分析 AI 智能体。消息来源 深入了解
-
哔哩哔哩开源目前最强大的动漫视频生成模型 Index‑AniSora,本项目是哔哩哔哩献给二次元世界的礼物。它支持一键生成多种动漫风格的视频镜头,包括番剧片段、国创动画、漫画改编、VTuber 内容、动画 PV、鬼畜(MAD)等!项目地址 论文地址
-
腾讯宣布,QQ 浏览器正式推出 QBot,全面升级成为 AI 浏览器,基于腾讯混元大模型 + DeepSeek 模型主打 AI 搜索、AI 浏览、AI 办公、AI 学习、AI 写作 5 大能力。消息来源
-
腾讯混元图像 2.0 模型正式发布,AI 图像生成进入“毫秒级”时代。模型主要有两大特点:实时生图、超写实画质。消息来源 体验地址
-
Meta 发布全新的、用于分子化学的密度泛函理论数据集 OMol25(Open Molecules 2025)以及 Meta 的通用原子模型 (UMA) —— 一种机器学习原子间势 (interatomic potential)。这些工具将加速分子和材料的发现,为创新和产生深远影响开启新的可能性。OMol25 是目前针对生物分子、金属配合物和电解质的最大且最多样化的高精度量子化学计算数据集。UMA 基于超过300亿个原子数据进行训练,以提供更准确的预测,并增进对分子行为的理解。消息来源 论文及数据集
-
微软研究院推出 Magentic-UI,这是一款以人为中心的 AI 智能体开源研究原型,旨在与用户协同工作,通过 Web 浏览器实时完成复杂的、基于Web的任务。Magentic-UI 现已通过 Azure AI Foundry Labs 提供。消息来源 深入了解
-
英伟达与微软携手加速智能体 AI 创新,覆盖从云端到 PC 的全场景。Microsoft Discovery 将集成英伟达 ALCHEMI NIM™ 微服务——该微服务能够优化化学模拟的 AI 推理,通过属性预测和候选材料推荐来加速材料科学研究。该平台还将集成英伟达 BioNeMo™ NIM 微服务,利用预训练 AI 工作流来加速药物发现的 AI 模型开发。这些集成将为研究人员提供加速性能,助力其更快地取得科学发现。消息来源 深入了解