当前位置：首页 > news >正文

AI一周事件（2025年9月3日-9月8日）

news 2025/9/10 6:19:31

（以下借助 DeepSeek-R1和ChatGPT-5辅助整理）

一、AI 模型与算法进展

1. 类脑脉冲大模型“瞬悉 1.0”问世（ 2025-09-09 凌晨）

事件：中国科学院自动化研究所李国齐、徐波团队与沐曦MetaX联合推出类脑脉冲大模型“瞬悉 1.0” (SpikingBrain-1.0)，实现了国产 GPU（沐曦 MetaX C550）平台上的全流程训练与推理。该模型提出“基于内生复杂性”的非 Transformer 架构，首次在理论上建立脉冲神经元内生动力学与线性注意力模型的联系，并开源了 7B 模型，开放了 76B 测试版本及技术报告。
技术亮点：

训练高效：仅用约 2% 主流大模型预训练数据，即可匹配多个语言理解任务表现；
推理速度提升显著：在 1,000,000 Token 长文本下，7B 模型首 token 时延比 Transformer 快 26.5 倍；4,000,000 Token 时，超过 100 倍提升，并实现超长序列近恒定时延。
体系化工程能力：团队构建了 Triton 算子库、模型并行策略、集群通信原语等完整训练与推理框架，推动国产自主可控模型生态建设。
适应超长场景：面向法律、医疗文档、多智能体模拟、分子动力学等超长序列任务具有显著效率优势。

观点：这是中国在模型架构创新与算力国产化融合上的重要突破。该模型不仅为突破 Transformer 在超长序列处理上的限制提供了新路径，也为低功耗、可解释性更强的新型大模型方向奠定了基础。接下来需关注其在更多下游任务中的泛化表现、模型开源后的社区生态接受度，以及后续类脑芯片的设计衔接。

二、AI 芯片与算力进展

1. 中科曙光联合产业链发布 AI 计算开放架构（2025-09-05）

事件：中科曙光与 20 多家产业链企业在重庆联合发布中国首个 AI 计算开放架构，推出 AI 超集群系统，目标是推动“算、存、网、电、冷、管、软”全链条集群协同创新，打破算力瓶颈。
观点：推动从“单点突破”向“整体集群”的转型，有利于提升集群算力效率并构建自主算力生态。但关键在于生态平台是否能被主流软件厂商及工具链广泛采纳，标准化速度决定其普惠效果。

2. OpenAI 与 Broadcom（博通）合作推进自研 AI 芯片（2025-09-05）

事件：OpenAI 正与博通合作设计 AI 芯片，预计 2026 年交付量产，旨在满足自身算力需求并减少对英伟达依赖。博通披露已有约 100 亿美元订单来自该项目。
观点：定制芯片极可能成为大型 AI 实验室的趋势，能在能耗、延迟等方面实现高度优化。这将推动算力供应链多元化，但仍需关注硬件生产能力与软件生态是否匹配。

3. SiFive 发布第二代 RISC-V Intelligence™ 系列（2025-09-08）

事件：SiFive 发布基于 RISC-V 的第二代 Intelligence™ IP（X160 Gen2、X180 Gen2），面向汽车、工业及 AIoT 等边缘场景，强调向量/标量 AI 处理能力提升。
观点：RISC-V 在可定制与开放性方面对 Arm 构成差异化竞争。边缘 AI 对低功耗与改造能力强的架构尤为适合，生态完备度将决定工业落地速度。

4. 特斯拉 AI5 自研芯片完成设计评审（2025-09-08）

事件：马斯克透露，特斯拉自研的 AI5 芯片已完成设计评审，称其在参数规模约 2,500 亿以下模型的推理性能与功耗效率方面具有“史诗级”表现。
观点：专用推理芯片可贴合自动驾驶与边缘需求，但其影响力将取决于量产后生态兼容与工程应用能力，如支持主流模型格式与推理框架。

三、AI 应用落地与产业化

1. AI 展会：2025 世界智能产业博览会（重庆，2025-9-05 至 08）

事件：智博会在重庆如期举办，展出 AI + 智能网联新能源汽车、数字城市、智能机器人、智慧居家等多个应用板块，600+ 企业参展，3000+ 创新产品亮相。
观点：展会是产业融合窗口，体现了 AI 技术从研发向工程应用的转化态势。观察焦点在于“样机向成品”及“试点向商业部署”的路径推进，尤其智能网联汽车领域的生态协作成熟度。