当前位置: 首页 > news >正文

微软正在公开测试其首个完全自主训练的大语言模型——MAI-1-preview

  每周跟踪AI热点新闻动向和震撼发展 想要探索生成式人工智能的前沿进展吗?订阅我们的简报,深入解析最新的技术突破、实际应用案例和未来的趋势。与全球数同行一同,从行业内部的深度分析和实用指南中受益。不要错过这个机会,成为AI领域的领跑者。点击订阅,与未来同行! 订阅:https://rengongzhineng.io/

2025年8月28日,多家媒体报道,微软正在公开测试其首个完全自主训练的大语言模型——MAI-1-preview。这一举措不仅意味着微软试图减少对OpenAI的依赖,也可能加剧两家公司之间的竞争。

微软AI部门首席执行官Mustafa Suleyman表示,MAI-1-preview是公司从头到尾独立训练完成的首个基础模型。目前,该模型已在LMArena网站上对外开放测试,用户可以在平台上进行评估。微软还发布了开发者申请表,允许有兴趣的团队申请提前体验。公司计划未来几周将该模型逐步应用到Copilot的部分文本场景中,以便通过用户反馈不断优化。

长期以来,微软的Bing搜索引擎、Windows 11操作系统以及其他核心产品,主要依赖OpenAI的模型来驱动AI功能。微软本身也是OpenAI的最大投资方之一,已累计投入逾130亿美元,同时为OpenAI提供云计算基础设施支持。然而,在微软2024年的年度报告中,OpenAI已被列入竞争对手名单,与亚马逊、苹果、谷歌和Meta并列。与此同时,OpenAI也在逐渐拓展合作伙伴,近期开始依赖CoreWeave、Google和Oracle等公司提供的算力,以应对ChatGPT每周覆盖7亿用户的庞大需求。

在LMArena的排名中,MAI-1-preview在文本任务上位列第13,落后于Anthropic、DeepSeek、Google、Mistral、OpenAI和xAI的模型。不过微软强调,该模型训练依托了约15,000块Nvidia H100 GPU,并已配备运行中的Nvidia GB200芯片集群。Suleyman在社交平台X上表示,公司对未来有着宏大的规划,包括模型的进一步提升、算力的扩展以及通过微软产品触达数十亿用户的愿景。

在推出MAI-1-preview之前,微软曾发布过一系列小型开源语言模型Phi。但此次的新模型,被视为微软真正意义上的首个完全自主基础模型。值得注意的是,Suleyman本人曾是Google收购的AI研究公司DeepMind的联合创始人,后来创立了Inflection AI,并在2024年率领大部分团队成员加盟微软。这一背景,使得微软AI团队在近几个月迅速扩张,其中包括约二十名来自DeepMind的专家。

这一动作显示,微软一方面仍与OpenAI保持深度战略合作关系,另一方面也在加快自研模型的步伐,力图在未来的AI竞争中掌握更大主动权。

http://www.dtcms.com/a/356824.html

相关文章:

  • week5-[二维数组]翻转
  • 【性能优化】Unity 渲染优化全解析:Draw Call、Batch、SetPass 与批处理技术
  • 整理python接口自动化相关——10、自动考虑点(待续)
  • 动态规划--Day02--爬楼梯--2466. 统计构造好字符串的方案数,2533. 好二进制字符串的数量,2266. 统计打字方案数
  • 匠心传承,古韵新生——记木雕名家龙巍的艺术人生
  • v-model与v-bind区别
  • 吴恩达机器学习作业五:神经网络正向传播
  • Python Imaging Library (PIL) 全面指南:PIL基础入门-图像合成与处理技巧
  • 基于 Python asyncio 和币安 WebSocket 打造高频加密货币预警机器人
  • TypeScript: Reflect.ownKeys 操作(针对 Symbol)
  • Lenovo C225 一体机拆机维修教程
  • 2025牛客暑期多校训练营4 G Ghost in the Parentheses 题解记录
  • LoRA三种不同训练流程在配置和保存权重的差异(64)
  • 《Shell 大道:筑基篇(下)—— 流控筑根基,数据任驱驰》
  • shell学习笔记-实战:创建、运行与变量操作
  • Python Imaging Library (PIL) 全面指南:PIL基础入门-构建简易图像编辑器
  • matlab利用模糊算法控制PID参数实现模糊控制
  • LabVIEW实现跨 VI 簇按钮控制功能
  • 2026届大数据毕业设计选题推荐-基于Python的出行路线规划与推荐系统 爬虫数据可视化分析
  • 如何为在线医疗问诊小程序实现音视频通话功能?
  • Spring Boot整合MyBatis Plus实现多维度数据权限控制
  • Day17_【机器学习—在线数据集 鸢尾花案例】
  • Java面试实战:Spring Boot微服务在电商场景的技术深度解析
  • Scikit-learn Python机器学习 - Scikit-learn介绍
  • Dify1.8.0更新,Docker 无法拉取镜像怎么破?
  • 【大模型13】 视觉大模型与多模态
  • 部署2.516.2版本的jenkins,同时适配jdk8
  • 【ACP】2025-最新-疑难题解析-9
  • 技术速递|新手指南:如何在 Foundry Local 中使用自定义模型
  • 趣味学Rust基础篇(控制流程)