Sora 2:视频AI的“ChatGPT时刻”来了!
一、OpenAI 在10月1日发布了新一代视频生成模型——Sora 2。
和第一代相比,Sora 2 进步巨大:不仅视频更真实、更符合物理规律,还能同步生成对话和音效!
它已经升级成“音视频同步生成模型”,能听懂复杂指令,把现实元素直接做到视频里。
用 OpenAI 自己的话说:Sora 1 像是视频生成的“GPT-1”,而 Sora 2 直接跳到了“GPT-3.5 时刻”!
同时推出的还有一个全新的短视频 App,整个平台的内容全部由 AI 生成。
你只要录一段自己的视频和语音完成认证,就能体验“Cameo(客串)”功能——一键把自己放进AI生成的场景里!
App 界面类似抖音,推荐算法会根据你的兴趣推送内容,还可以自己调整内容顺序。
目前只有iOS版,先开放美国和加拿大,后面会扩展到更多地区。现在需要邀请码才能注册,成功注册的人会拿到四个邀请码分享给朋友。
二、真实体验:物理逼真 + 会推理 + 带音效,太像真的了!
- 动作真实流畅
-
Sora 2 对物理世界的模拟非常强,运动、力学、甚至身体动作都极其自然。
比如官方展示的花样滑冰视频,运动员跳跃旋转非常流畅,毫无AI生硬感:
多人场景也很出色,比如打棒球——球的飞行轨迹真实,击球声和画面完全同步(背景音里居然还有中文!)。
我们只让它模拟击球,它却连球飞出去后的轨迹都模拟出来了,说明它真的“懂”物理!
还有F1赛车、战争场面这种大场景也驾驭得不错:
当然它还不完美,比如跳伞场景里降落伞打开前后有点不一致,体操、做饭场景中人物动作偶尔也不太自然。
主持人
- 创意内容随便玩
-
Sora 2 能生成特别有创意的内容,比如“孙悟空大战二郎神”:
- 甚至还能模拟游戏画面——比如RPG打怪场景,怪物的血条会随着被攻击减少,超有游戏真实感!
-
暗区蛋糕
- 现实人物直接“注入”视频
-
你可以在生成视频时直接选择真人形象,比如OpenAI 的CEO Sam Altman。现在网上已经有很多用他做的搞笑视频了:
-
模拟交互和代码能力惊人
Sora 2 不仅能生成视频,还能模拟软件界面!
比如让它模拟ChatGPT的对话界面,它不但预测回答内容,还配了键盘声和AI语音!
它甚至能模拟浏览器渲染HTML代码——下图上面是真实浏览器效果,下面是Sora 2 只凭代码提示词生成的效果,几乎一样:
- 社交APP:AI版抖音
-
Sora App 的界面神似抖音,但所有视频都是AI生成的。
你除了能浏览动态,还能用“Cameo”功能把自己或朋友放进视频里。
为了保护肖像权,你可以随时撤销自己的形象使用权限或删除视频。
三、总结:
Sora 2 在真实性、多镜头控制、音画同步等方面跨越了一大步,彻底改变了视频创作的方式!
加上Sora App推出“AI版抖音”+“真人客串”功能,很可能重新定义未来的社交玩法。
亮点整理:
-
真实感强+可控性高:动作流畅,支持复杂镜头。
-
音效逼真:能生成人声、环境音,真正实现音视频同步。
-
社交新玩法:用Cameo功能把自己植入视频,有趣又吸睛
留言“邀请码”,获得Sora2 注册资格!