当前位置: 首页 > news >正文

AI日报 · 2025年5月12日|OpenAI 更新「Supervised Fine‑Tuning」文档与 API 示范

在这里插入图片描述

1、OpenAI 更新「Supervised Fine‑Tuning」文档与 API 示范

OpenAI 今日在开发者官网发布新版 《Supervised Fine‑Tuning 指南》,首次将 o3、o4‑mini 等最新「Reasoning Models」纳入示例,并补充了批量数据验证、梯度累积、余弦退火学习率等进阶实践。在这里插入图片描述

官方同时给出完整的 Python SDK 样例,演示如何一次性上传数万条 JSONL 训练集并在训练中实时监控损失曲线。指南强调 “微调仅影响行为,不会提升基础推理上限”,因此推荐配合 RFT 进行二阶段调优。文档还新增了 早停机制、训练中断续跑模型/数据分离计费 政策说明:微调阶段仅按 GPU‑秒计费,推理阶段则按“基础模型费 + 细化权重存储费”双计价,以降低部署门槛。这意味着企业可在保障数据私有化的同时,以更低成本在私域落地专属模型。[1]

2、OpenAI 与微软重新谈判战略合作,为潜在 IPO 做准备

据 Reuters 报道,OpenAI 正与长期战略伙伴微软就股权与算力条款展开新一轮“高强度”谈判,目标是在 不削弱 Azure 深度绑定的前提下,为未来公开募股扫清监管与治理障碍在这里插入图片描述

消息称双方正在讨论把微软 2019 年先后投入的股权份额部分转换为 长期模型使用权,并放宽“OpenAI 独家使用 Azure”条款,以容纳多云部署需求。多名接近交易的知情人士透露,OpenAI 自 4 月起已就 公益信托结构 咨询监管机构,计划在维持非营利基金会控制权的同时,允许 for‑profit 主体引入更灵活的外部资本。微软与 OpenAI 均拒绝置评,但业内普遍解读为「超级算力换长期分红」的典型互惠模式。[2]

3、Anthropic 紧急修复 Claude 3.7 Sonnet 大规模 5xx 错误

Anthropic 状态页显示,北京时间今日 16:19 起 Claude 3.7 Sonnet 出现大幅请求失败,官方在 15 分钟内确认故障源自「模型路由规则冲突」,并紧急回滚至前一版本推理栈。期间企业 API 延迟拉长至 12 秒以上,约 6% 请求返回 5xx。17 时左右修复完成,官方随后发布 RCA 草案,承诺未来 “实验路由仅在沙箱环境推进,避免生产链回退”。这是 Claude 3 系列本月第二次高优级别事故,凸显多版本滚动上线带来的风控挑战。[3]

4、Google 启动「AI for Energy 加速器」开放申请,聚焦欧洲与以色列能源转型

Google 官方博客宣布,Google for Startups 在这里插入图片描述
Accelerator:AI for Energy
(欧洲 & 以色列)正式开放申请。

该 12 周免股权项目为能源垂直 AI 创企提供 云算力、Gemini API 额度、AI/ML 架构辅导 及高层导师对接。Google 指出,欧洲电网现代化、负荷灵活性与工业节能需求迫切,需要 AI 优化调度和预测算法。首批合作伙伴包括 Engie、Siemens Smart Grid 与 E‑ON,入选团队还将接受 Google Cloud 可持续计算团队一对一辅导。申请截止 6 月 30 日,9 月启动线上线下混合营。[4]

5、DeepMind 播客新集聚焦「AI 驱动精准医疗」

Google DeepMind 在官方 X 账号发布播客新集《AI and the Future of Health》,由高级研究主管 Joelle Barral 解析多模态病理分析、自监督蛋白质折叠模型到 临床决策支持系统 的最新进展。节目透露 DeepMind 正与英国 NHS 扩大 AlphaFold‑3 肿瘤变异预测服务 的临床验证,并计划在 6 月公布联合数据集开放策略。DeepMind 指出,未来重点是 安全可追溯的医用 AI,包括模型更新审计链和差分隐私数据汇总。[5]

6、Gemini API 当日多区降级,开发者社区集中反馈

Google AI Developers 论坛与相关 Reddit 频道今晨(UTC 06:59)发布「Gemini Major Degradation」公告:由于后端容量调度异常,Gemini 2.5 及 Flash 模型在美东、美西两区可用率跌至 40% 以下,图像生成功能几乎不可用。Google 团队称已临时关闭大模型缓存重建任务,预计 2 小时内恢复。开发者吐槽 “缓存命中率波动”“RAG 上下文截断” 问题仍在持续。事件再次暴露大规模推理服务的细粒度容量管理难点。[6]

7、Honor 400 系列率先集成 Google Veo 2 图像转视频模型

《The Verge》今日报道,Honor 将在 5 月 22 日发布的 Honor 400/400 Pro 手机上预装 Google Veo 2 图像转视频模型,领先 Gem­ini 终端侧正式开放。用户可在相册直接将静态照片生成 5 秒 MP4 动画,前两个月每日 10 条免费额度。官方演示显示,Veo 2 在 人物与宠物 简单场景中效果逼真,但复杂运动画面仍存畸变。Honor 表示后续可能启用 Google 订阅计费,与 Gem­ini Advanced 订阅打通。[7]

8、NVIDIA 在 Automate 2025 分享「数字孪生 + 人形机器人」工厂蓝图

在底特律 Automate 2025 开幕主论坛上,NVIDIA 产业数字孪生总监 Heiko Wenczel 介绍 Omniverse™ 与 Isaac SIM 如何 批量训练协作型人形机器人,并用 AI‑驱动仿真优化工厂物流。NVIDIA 展示了与 Foxconn 的联合 PoC:通过 OpenUSD 资产和 RTX 加速光追,将生产线规划周期从数月压缩到两周,并用 RL‑trained 机器人手臂实现 16% 节拍提升。官方称今年下半年将开放 Factory Blueprint 参考流程,助力中型制造商快速落地。 [8]

9、TensorStax 完成 500 万美元种子轮,主攻确定性 AI 数据管道

数据工程自动化平台 TensorStax 宣布获 Glasswing Ventures 领投 500 万美元种子轮,专注以 “确定性 AI Agent” 技术简化 ETL 数据编排。公司提出「可验证推理 DAG」框架,通过对 LLM 生成步骤引入类型系统与单元测试,使数据管道 可回放、可审计且零随机漂移。融资将用于扩充 Rust‑based 引擎与湖仓型向量索引,并与 Databricks、Snowflake 推出深度集成插件。[9]

10、Six Five Summit 公布「AI Unleashed 2025」议程,聚焦 Agentic AI

科技媒体 Six Five Media 发布年度 Six Five Summit 议程,本届主题为 “AI Unleashed 2025”,6 月 16‑19 日线上举行。会议将设「Agentic AI 架构」「物理 AI 与机器人」「AI‑First 云原生」三大主论坛,已确认演讲者包括 NVIDIA CEO Jensen Huang、Anthropic CTO Jared Kaplan 及 OpenAI CFO Sarah Friar。组委会表示将发布《Agentic AI 能源效率白皮书》并直播多家厂商 Demo 对决,展示多智能体在 RAG、自动软件修复、工业数字孪生等场景的最新落地进展。[10]

结尾语

以上为今日重点 AI 新闻,欢迎关注后续更新。

参考资料

[1] https://platform.openai.com/docs/guides/supervised-fine-tuning

[2] https://www.reuters.com/business/openai-negotiates-with-microsoft-unlock-new-funding-future-ipo-ft-reports-2025-05-11

[3] https://status.anthropic.com/history
[4] https://blog.google/outreach-initiatives/entrepreneurs/startups-powering-the-future-of-energy-in-europe-israel
[5] https://x.com/GoogleDeepMind/status/1920819179940110642

[6] https://www.reddit.com/r/Bard/comments/1kknxtg/gemini_major_degradation

[7] https://www.theverge.com/news/664812/google-honor-ai-image-to-video-gemini

[8] https://www.nvidia.com/en-us/events/automate-conference
[9] https://www.globenewswire.com/news-release/2025/05/12/3078960/0/en/TensorStax-Raises-5M-to-Build-Deterministic-AI-Agents-for-Data-Engineers.html
[10] https://www.globenewswire.com/news-release/2025/05/12/3079104/0/en/The-Six-Five-Summit-AI-Unleashed-2025-Explores-the-Future-of-Artificial-Intelligence.html

相关文章:

  • Ubuntu源码版comfyui的安装
  • 二、HAL库的命名规则详解
  • Edge浏览器打开PDF文件显示空白(每次需要等上一会)
  • Docker-配置私有仓库(Harbor)
  • Kubernetes控制平面组件:Kubelet详解(一):API接口层介绍
  • 【CF】Day57——Codeforces Round 955 (Div. 2, with prizes from NEAR!) BCD
  • 图形化编程如何从工具迭代到生态重构?
  • 腾讯怎样基于DeepSeek搭建企业应用?怎样私有化部署满血版DS?直播:腾讯云X DeepSeek!
  • URP - 深度贴花效果实现
  • 高并发场景下的BI架构设计:衡石分布式查询引擎与缓存分级策略
  • 特伦斯折叠重锤电钢琴:年轻音乐人释放音乐自由的新选择
  • 编写一个处理txt的loader插件,适用于wbepack
  • 配置Hadoop集群环境准备
  • STM32核心机制解析:重映射、时间片与系统定时器实战——从理论到呼吸灯开发
  • 深度 |国产操作系统“破茧而出”:鸿蒙电脑填补自主生态空白
  • linux CUDA与CUDNN安装教程
  • 2025年渗透测试面试题总结-渗透测试红队面试七(题目+回答)
  • Linux 上安装RabbitMQ
  • HNUST软件测试B考前最终复习
  • 重构金融数智化产业版图:中电金信“链主”之道
  • 缺字危机:一本书背后有多少“不存在”的汉字?
  • 《新时代的中国国家安全》白皮书(全文)
  • 苹果或将于2027年推出由玻璃制成的曲面iPhone
  • 2025年度十大IP!IP SH荣膺文化综合类TOP10
  • 淡马锡辟谣:淡马锡和太白投资未在中国销售任何投资产品或金融工具
  • 著名军旅作家、文艺评论家周政保逝世,享年77岁