当前位置: 首页 > news >正文

2025年7月24日·AI今日头条

1. OpenAI 凌晨突袭发布 GPT-4o-Realtime
北京时间 02:13,OpenAI 在 X 平台无预告上线 GPT-4o-Realtime。该版本采用全双工语音架构,用户可随时打断模型,首 token 延迟稳定在 180 ms 以内;音频采样率 48 kHz 立体声,API 单价与现有 GPT-4o 持平。官方同步公布首批生态伙伴:WhatsApp 将在两周内灰度集成,滴滴国际版计划于下周面向墨西哥用户开放“打车对话助手”。


2. 谷歌开源 Gemini-Screen-2B,端侧屏幕理解新纪录
DeepMind 今日将 Gemini-Screen-2B 权重上传至 Hugging Face。该模型仅 2B 参数,却在 Screen2Words 基准拿下 91.3 新高,比上一代 8B 模型提高 4.7 pt。配合 Android 15 的 On-Device AI Service,Pixel 9 可离线运行,典型场景功耗 200 mW,连续 30 分钟屏幕问答不掉帧。


3. 英伟达 DGX-GB200-NVL576 机柜交付,万亿参数训练只需 10 天
英伟达今日正式接受 DGX-GB200-NVL576 订单,单机柜塞进 576 张 Blackwell GPU,FP8 峰值 11.5 EFLOPS。官方基准显示,在 1.2 TB/s NVLink 互联下,1T 参数的 dense 模型训练时间从 90 天压缩到 10 天。消息透露首台设备已运抵“某北美自动驾驶巨头”,业界普遍指向特斯拉 Dojo 2 的混合扩容。


4. Mistral Large-3-200B-MoE 公测,欧洲本土机房 GDPR 合规
法国 Mistral 宣布 Large-3-200B-MoE 进入公测,支持 32 种语言、256 k 上下文窗口。官方在 MMLU-Global 上取得 89.7 分,首次在非英语子任务全面超越 GPT-4o。推理服务托管于巴黎数据中心,符合 GDPR 全流程加密;定价 0.8 美元 / 1M tokens,比 GPT-4o 便宜 42%。


5. 字节跳动发布 Doubao-Vision-7B,15 秒 1080p 视频生成成本 0.3 元
豆包团队今日上线 Doubao-Vision-7B,主打 1080p 15 秒短视频生成。官方披露在自建 20 万条中文短视频测试集上 FID 8.2,比 Runway Gen-3 低 30%。火山引擎同步开放 API,标清 1 秒 4 帧场景下单次推理 0.3 元,抖音创作者工具将在下周灰度内嵌。


6. 苹果 visionOS 2.1 带来“空间计算版 Siri”,无唤醒词也能对话
苹果凌晨推送 visionOS 2.1 Beta,推出空间计算专用 Siri。系统利用头显内外 12 枚摄像头实时捕捉眼动与手势,无需“Hey Siri”即可语音交互;离线词表压缩到 1.1 GB,实测厨房油污场景下仍能隔空翻菜谱。苹果称这是“首个人机共生 OS 更新”。


7. AWS SageMaker HyperPod-2 降价 35%,支持 Spot 竞价训练
亚马逊云科技今日宣布 HyperPod-2 训练集群价格下调 35%,并开放 Spot 实例竞价,最高可节省 70% 费用。新增 Checkpoint-as-a-Service 把断点续训时间从 15 分钟缩短到 40 秒,现场演示在 10 000 卡集群上人工拔掉 100 根网线仍零丢步。


8. 《大模型安全基线 2.0》正式发布,幻觉率写入强制指标
中国信通院联合 30 家厂商今日发布《大模型安全基线 2.0》,首次把“幻觉率”列为强制红线:面向公众的对话场景单轮幻觉率不得高于 5%,金融、医疗场景不得高于 1%。未通过测评的模型将于 10 月 1 日起被各大应用商店强制下架。


9. 三星 3 nm AI 推理芯片“Chiron-1”量产,功耗仅 75 W
三星电子今日宣布全球首款 3 nm AI 推理芯片 Chiron-1 量产,采用 GAA 晶体管与 32 Gb HBM4 封装,单卡 INT8 算力 1.2 PetaOPS,典型功耗 75 W。Naver Cloud 与 Kakao Brain 成为首批客户,计划 8 月在首尔可用区上线,专攻韩语大模型推理。


10. Anthropic 发布 Claude-3.5-Sonnet-Code-1TB,单卡读 500 万行源码
Anthropic 今日推出 Claude-3.5-Sonnet-Code-1TB,将上下文扩展到 1 TB,可一次性读取 500 万行 Linux 内核源码。内部基准显示,跨文件调用链问答延迟稳定在 5 秒以内。目前仅向企业 Pro 级用户开放,月费 2 万美元起。

http://www.dtcms.com/a/298787.html

相关文章:

  • KNN算法:从原理到实战全解析
  • Execel文档批量替换标签实现方案
  • day33:零基础学嵌入式之网络——TCP并发服务器
  • 基于javaweb的医院挂号系统
  • 动态规划解析:以最小花费爬楼梯为例
  • 纸板留声机:用ESP32和NFC打造会唱歌的复古装置
  • SeaweedFS深度解析(四):裸金属单机部署之配置文件启动master服务
  • IMU的精度对无人机姿态控制意味着什么?
  • [特殊字符] 第9篇:《SQL高阶 SELECT 技巧:DISTINCT、ORDER BY、LIMIT 全家桶》
  • ComfyUI中运行Wan 2.1工作流,电影级视频,兼容Mac, Windows
  • java微操
  • NLP验证自动化脚本优化
  • 硬核接线图+配置步骤:远程IO模块接入PLC全流程详解
  • 前端开发 Vue 状态优化
  • 多场景通用车辆计数算法助力暑期交通管理
  • Java从入门到精通!第十四天,重点!(反射)
  • 20250725-day22
  • Ivanti Endpoint Manager Mobile 远程命令执行漏洞复现(CVE-2025-4427)
  • 壁纸管理 API 文档
  • 测试实时性内核参数配置
  • 如何阅读字节码文件
  • Arrays 工具类详解
  • 在线事务型的业务、实时分析类业务、离线处理类型的业务
  • C语言————原码 补码 反码 (超绝详细解释)
  • 【循环语句,求100内能被6整除的和】
  • 群晖 File Station:集中浏览与管理 NAS 文件的工具
  • 60个Java与Spring核心知识点详解
  • [Java恶补day46] 整理模板·考点九【二叉树最近公共祖先】
  • 跨境电商流量密码:自养号测评采购技术,低成本撬动高转化
  • agent含义、起源、定义、分类、应用场景以及未来趋势