OpenAI Sora 2重磅发布:AI视频生成进入“GPT-3.5时刻”
一场关于视频创作的革命正在悄然来临,OpenAI再次以技术突破引领风潮。
北京时间10月1日,OpenAI正式推出了新一代视频生成模型Sora 2及同名社交应用,这一被官方称为“视频领域的GPT-3.5时刻”的技术突破,正在重新定义AI视频创作的边界。
与此同时,斯坦福大学科学家成功利用AI生成了功能性病毒基因组,加州大学洛杉矶分校研究团队则开发出了基于光学的图像生成模型,将AI推向绿色计算的新范式。多项突破性进展在短时间内集中涌现,预示着人工智能技术正迎来新一轮爆发期。
1 Sora 2的技术突破:从“玩具”到“工具”的质变
如果说今年2月发布的初代Sora是视频生成领域的“GPT-1时刻”,那么Sora 2的发布则标志着这一技术正式进入了实用化阶段。此次更新不是简单的迭代,而是在物理模拟、连贯性和可控性等方面实现了跨越式发展。
1.1 物理引擎的质的飞跃
Sora 2最引人注目的进步在于其对物理世界的准确模拟。与以往AI视频中常见的“反物理”现象相比,Sora 2生成的视频已经能够准确遵循真实的力学规律。
从官方演示示例来看,篮球不再像以往那样强行“瞬移”进篮筐,而是会有打板弹开甚至投丢的真实运动轨迹。
更令人印象深刻的是,Sora 2能够处理极其复杂的物理交互场景。例如,在一段“桨板后空翻”的视频中,人物动作、水花溅射和桨板浮动之间的物理互动自然流畅,完美演绎了浮力与刚性动态。
这种物理模拟能力的提升,使得Sora 2能够胜任甚至被称为“AI体操界的图灵测试”的复杂场景生成。
1.2 多镜头连贯性与视觉一致性
长视频生成一直是AI领域的巨大挑战,而Sora 2在这一领域取得了显著进展。它特别强调了“世界状态连续性”——当角色