OpenAI推出o3-Pro模型
OpenAI宣布了两个重大更新。首先,o3模型的价格降低了80%。其次,他们发布了一个名为o3-pro的新模型。
o3-pro目前是OpenAI最先进的多模态模型,具有深度推理能力。它逐步解决问题,使其能够在编程、数学、科学、视觉感知等众多领域中更可靠地执行任务。
我知道OpenAI在模型命名方面很糟糕。如果你对o3与GPT-4.x系列或GPT-4o的区别感到困惑,那你并不孤单。以下是一个快速总结,帮助理解这个混乱的情况:
-
GPT-4.x: 没有高级推理能力的多模态模型。支持文本和图像。
-
GPT-4o: “o"代表"omni”(全能)。这个模型处理文本、图像和音频。
-
o3和o3-pro: 具有推理能力的多模态模型。这些是"思考"模型,主要基于文本,对图像支持有限。
这些推理模型可以智能地使用和组合ChatGPT中的每个工具。这包括搜索网络、使用Python分析上传的文件和数据、对视觉输入进行推理,甚至在某些情况下生成图像。
与o3模型相比,o3-pro使用更多计算资源来更努力地思考并提供始终更好的答案。
什么是o3-pro?
要理解o3-pro,你真的必须理解OpenAI的o3模型在幕后做什么,因为o3-pro简单来说就是给o3更多时间和更多计算资源来更努力地思考。
o系列模型是OpenAI专注于推理的产品线。它们与旧的GPT系列的训练方式不同。OpenAI不仅仅在互联网文本上进行预训练,还通过大规模强化学习(RL)来训练o3。其理念是:你可以教会模型不仅仅是重复信息,而是逐步推理解决问题。
作为开发者,有一点真的引起了我的注意。
在o3的开发过程中,OpenAI注意到强化学习显示出与GPT预训练中看到的相同的*“更多计算=更好性能”*缩放规律。换句话说,如果你给模型更多的计算预算并让它推理更长时间,性能会持续提升,甚至超出他们的预期。
他们使用强化学习技术重新追踪缩放路径,在训练和推理中投入了一个数量级更多的计算资源。结果,o3在你让它思考得越多时就变得越聪明。
我认为这是一个关键洞察,因为它解释了为什么o3-pro存在。它不是一个单独的架构。它是o3,但每个请求都运行着更大的计算和推理预算。相同的缩放定律适用——给它更多时间和计算资源,你就能得到更好的答案。
OpenAI甚至验证了在与o1相等的延迟和成本下,