【深度学习新浪潮】由Sora-2上线观察AI视频生成模型的研发进展(2025.10)
OpenAI于2025年9月30日正式发布了Sora 2,这款新一代AI视频生成模型实现了音画同步、物理模拟和多镜头控制三大核心突破,标志着AI视频创作进入了"GPT-3.5时刻"。作为算法工程师,您应该重点关注其多模态融合架构、物理引擎集成和时空一致性优化等技术创新。目前Sora 2仅支持网页端(sora.com)和iOS应用,需邀请码才能使用,国内用户可通过加入等待名单获取访问权限。若暂时无法使用Sora 2,可考虑国内的可灵AI、通义万相2.5等替代品,它们同样支持音画同步,且已对国内用户开放。
Sora 2的关键信息与核心升级
Sora 2相比第一代模型实现了全方位的技术突破,主要升级点集中在以下几个方面:
升级维度 | 具体提升 | 用户体验变化 |
---|---|---|
音画同步 | 首次实现视频与音频的原生同步生成 | 生成的视频自带环境音效、对话和动作声音,无需后期配音 |
物理模拟 | 精确模拟重力、流体、刚体碰撞等物理规律 | 篮球投不中会从篮板反弹,布料自然下垂,水花飞溅符合流体力学 |