AI一周事件(2025年9月3日-9月8日)
(以下借助 DeepSeek-R1和ChatGPT-5辅助整理)
一、AI 模型与算法进展
1. 类脑脉冲大模型“瞬悉 1.0”问世( 2025-09-09 凌晨)
事件:中国科学院自动化研究所李国齐、徐波团队与沐曦MetaX联合推出类脑脉冲大模型“瞬悉 1.0” (SpikingBrain-1.0),实现了国产 GPU(沐曦 MetaX C550)平台上的全流程训练与推理。该模型提出“基于内生复杂性”的非 Transformer 架构,首次在理论上建立脉冲神经元内生动力学与线性注意力模型的联系,并开源了 7B 模型,开放了 76B 测试版本及技术报告。
技术亮点:
-
训练高效:仅用约 2% 主流大模型预训练数据,即可匹配多个语言理解任务表现;
-
推理速度提升显著:在 1,000,000 Token 长文本下,7B 模型首 token 时延比 Transformer 快 26.5 倍;4,000,000 Token 时,超过 100 倍提升,并实现超长序列近恒定时延。
-
体系化工程能力:团队构建了 Triton 算子库、模型并行策略、集群通信原语等完整训练与推理框架,推动国产自主可控模型生态建设。
-
适应超长场景:面向法律、医疗文档、多智能体模拟、分子动力学等超长序列任务具有显著效率优势。
观点:这是中国在模型架构创新与算力国产化融合上的重要突破。该模型不仅为突破 Transformer 在超长序列处理上的限制提供了新路径,也为低功耗、可解释性更强的新型大模型方向奠定了基础。接下来需关注其在更多下游任务中的泛化表现、模型开源后的社区生态接受度,以及后续类脑芯片的设计衔接。
二、AI 芯片与算力进展
1. 中科曙光联合产业链发布 AI 计算开放架构(2025-09-05)
事件:中科曙光与 20 多家产业链企业在重庆联合发布中国首个 AI 计算开放架构,推出 AI 超集群系统,目标是推动“算、存、网、电、冷、管、软”全链条集群协同创新,打破算力瓶颈。
观点:推动从“单点突破”向“整体集群”的转型,有利于提升集群算力效率并构建自主算力生态。但关键在于生态平台是否能被主流软件厂商及工具链广泛采纳,标准化速度决定其普惠效果。
2. OpenAI 与 Broadcom(博通)合作推进自研 AI 芯片(2025-09-05)
事件:OpenAI 正与博通合作设计 AI 芯片,预计 2026 年交付量产,旨在满足自身算力需求并减少对英伟达依赖。博通披露已有约 100 亿美元订单来自该项目。
观点:定制芯片极可能成为大型 AI 实验室的趋势,能在能耗、延迟等方面实现高度优化。这将推动算力供应链多元化,但仍需关注硬件生产能力与软件生态是否匹配。
3. SiFive 发布第二代 RISC-V Intelligence™ 系列(2025-09-08)
事件:SiFive 发布基于 RISC-V 的第二代 Intelligence™ IP(X160 Gen2、X180 Gen2),面向汽车、工业及 AIoT 等边缘场景,强调向量/标量 AI 处理能力提升。
观点:RISC-V 在可定制与开放性方面对 Arm 构成差异化竞争。边缘 AI 对低功耗与改造能力强的架构尤为适合,生态完备度将决定工业落地速度。
4. 特斯拉 AI5 自研芯片完成设计评审(2025-09-08)
事件:马斯克透露,特斯拉自研的 AI5 芯片已完成设计评审,称其在参数规模约 2,500 亿以下模型的推理性能与功耗效率方面具有“史诗级”表现。
观点:专用推理芯片可贴合自动驾驶与边缘需求,但其影响力将取决于量产后生态兼容与工程应用能力,如支持主流模型格式与推理框架。
三、AI 应用落地与产业化
1. AI 展会:2025 世界智能产业博览会(重庆,2025-9-05 至 08)
事件:智博会在重庆如期举办,展出 AI + 智能网联新能源汽车、数字城市、智能机器人、智慧居家等多个应用板块,600+ 企业参展,3000+ 创新产品亮相。
观点:展会是产业融合窗口,体现了 AI 技术从研发向工程应用的转化态势。观察焦点在于“样机向成品”及“试点向商业部署”的路径推进,尤其智能网联汽车领域的生态协作成熟度。
2. OpenAI 为 ChatGPT 推出家长/监护人控制功能(2025-09-03 前后)
事件:OpenAI 为 ChatGPT 引入家长/监护人控制功能,以应对未成年人内容风险与安全考量。
观点:产品安全机制已成为模型商业化中不可绕开的一步。这类用户端治理功能的未来关键,是如何在安全与体验之间取得平衡,并保证模型能力不被过度削弱。
四、产业生态与合规动态
1. Anthropic 与作者集体诉讼达成和解(2025-09-05)
事件:Anthropic 同意支付约 15 亿美元与作者团体就训练数据版权诉讼达成和解。
观点:数据合规成本透明化趋势显著。模型开发者必须把版权授权与数据治理成本纳入开发预算与风险评估中。
2. Microsoft 与 Nebius 签署大型 GPU 基础设施协议(2025-09-08)
事件:Microsoft 与 Nebius 签订约 174 亿美元(最高可能至 194 亿美元)GPU 采购/租赁合约,覆盖未来 5 年大规模算力需求。
观点:大规模算力采购合约表明云端算力资源供给模式向长期定制化迈进。这类合作可减少短期资本支出,但可能带来长期供应与锁定风险。
总结
-
模型创新层面,“瞬悉 1.0”标志着中国在突破 Transformer 架构瓶颈与低成本超长序列处理方向上的重要尝试。
-
算力供应多元化阵营正在形成——从国产开放架构、定制芯片到大型基地设施合作,生态正走向多极化。
-
产品安全与合规正随用户增长而被重视——从家长控制功能到版权合规事例,产业必须同步能力与责任构建。
-
产业化步入快车道,展会展示与大单签约双轨推进落地进程,显示工程化成熟正在加速。
引文
-
类脑脉冲大模型“瞬悉1.0”成功研发
-
类脑脉冲大模型“瞬悉1.0”问世(科学网)
-
全球首款类脑脉冲大模型“瞬悉1.0”问世
-
中国团队发布类脑脉冲大模型“瞬悉”实现全流程国产化
-
中国首个AI计算开放架构在重庆发布
-
国产AI算力“破冰”:国内首个开放架构发布
-
特斯拉自研芯片进展顺利AI5芯片将成“史诗级”产品
-
一顿饭,三件事:能源、算力、落地|白宫晚宴给AI产业的硬指标
-
人工智能点亮精彩未来——2025世界智能产业博览会扫描
-
China unveils brain-inspired AI that could redefine efficiency
-
Anthropic 同意支付 15 亿美元以和解作者集体诉讼
-
Nebius 与 Microsoft 达成 174 亿美元 AI 基础设施合约