划时代的技术飞跃:OpenAI DevDay 2025 全面深度解读
2025年10月6日,OpenAI在旧金山芳草地(Fort Mason)举办了第三届年度开发者大会(DevDay 2025)。OpenAI的首席执行官兼创始人山姆·奥特曼(Sam Altman)以主题演讲拉开序幕,强调此次大会的宗旨是“推动未来发展”和“让使用AI进行构建变得更容易”。
本次大会不仅公布了全新的AI模型,还展示了如何在几分钟内构建AI代理(agents)。奥特曼在演讲中感谢了在场的所有开发者,称赞他们是“推动未来前进的人”。他指出,从想法到产品从未如此迅速。
以下是对本次大会四大核心创新领域的详细介绍及深度洞察。
一、 ChatGPT中的应用(Apps in ChatGPT)
OpenAI宣布,将向开发者开放ChatGPT内部,用于构建真正的应用程序。这一举措旨在实现新一代的应用:它们将是可互动、自适应和个性化的,用户可以直接在ChatGPT内部与之对话。
关键发布与洞察
- Apps SDK 发布: 开发者工具包 Apps SDK 正式推出预览版。它允许开发者完全控制后端逻辑和前端UI,并且基于开放标准MCP构建。
- 巨大的分发潜力: 任何使用Apps SDK构建应用的开发者,都有机会触达数亿的ChatGPT用户。奥特曼希望这将极大地帮助开发者快速扩展产品。
- 商业化未来: 未来,OpenAI将支持多种货币化方式,包括推出新的“代理商务协议”(agentic commerce protocol),允许用户在ChatGPT内部进行即时结账(instant checkout)。
实时演示亮点
通过现场演示,我们看到应用如何无缝集成到对话中:
- Coursera: 用户可以直接在ChatGPT中启动Coursera应用,搜索课程,并观看视频。最关键的是,Apps SDK提供API将应用中的上下文反馈给ChatGPT,确保模型了解用户正在互动的内容。例如,当视频播放时,用户可以随时提问,ChatGPT能够根据视频的当前内容进行解释。
- Canva: 用户可以在ChatGPT中头脑风暴商业想法(例如狗步行服务),然后直接要求Canva根据对话内容生成海报或演示文稿(Pitch Deck)。
- Zillow: 演示了房产搜索功能,用户可以通过对话筛选条件(如三卧室、带院子、靠近狗公园),并能在全屏模式下查看地图和房源细节。
深度洞察: 推出Apps SDK并支持原生应用,标志着ChatGPT正从一个聊天机器人平台向一个功能强大的操作系统级应用商店演进。通过提供流量入口和未来的即时商务协议,OpenAI正在为开发者提供一个直接面向消费者的巨大商业生态。
二、 构建代理(Building Agents)
奥特曼指出,AI已从“你可以问任何东西的系统”发展到“你可以要求为你做任何事情的系统”(即代理软件)。然而,尽管代理(agents)潜力巨大,但很少有真正投入生产并被大规模使用的。
AgentKit 发布
为解决这一难题,OpenAI推出了 AgentKit,这是一套完整的构建模块,旨在帮助开发者更快、更轻松地从“想法到代理”。AgentKit集成了构建、部署和优化代理工作流所需的一切。
核心功能模块:
- Agent Builder: 这是一个可视化画布(WYSIWYG工作流创建器),可用于设计逻辑步骤、测试流程和交付创意。
- ChatKit: 一个简单的嵌入式聊天界面,开发者可以自定义品牌和工作流,轻松将其引入自己的应用中。
- Evals for Agents: 专注于测量代理性能的新功能,包括轨迹评分(trace grading)、数据集评估、自动提示词优化,甚至可以直接在OpenAI平台上对外部模型运行评估。
- Guardrails(护栏): 提供安全保障,例如防止泄露个人身份信息(PII)。
应用案例与演示
- 零售业应用(Albertsons): Albertsons使用AgentKit构建了一个代理,帮助门店经理实时处理复杂决策。例如,当冰淇淋销量意外下降时,代理可以分析季节性、历史趋势和外部因素,并立即给出调整陈列或投放本地广告的建议。
- 客户服务(HubSpot): HubSpot利用AgentKit改进了其AI工具Breeze的响应质量,使其能够整合知识库、查找地方政策,并提供多种方案。
- 现场演示(Christina Huang): 平台体验团队的Christina Huang在不到8分钟内,使用Agent Builder和ChatKit快速构建并部署了一个名为“Ask Froggie”的DevDay信息代理,展示了从原型到生产的惊人速度。
深度洞察: AgentKit的推出是OpenAI致力于工业化和生产化AI代理的关键一步。通过提供可视化构建器、可嵌入UI和强大的评估工具,OpenAI极大地降低了构建可靠、可信赖的复杂代理的门槛。
三、 编写软件的未来(The Future of Software)
奥特曼表示,我们正在进入一个改变软件编写方式的新时代。他分享了一个鼓舞人心的故事:一位89岁的日本退休人员在ChatGPT的帮助下自学编程,为老年用户创建了11款iPhone应用。
Codex 正式发布与升级
Codex是OpenAI的云端软件工程代理。此次大会宣布Codex已正式脱离研究预览阶段,进入通用版本(GA)。
- GPT-5 Codex模型: Codex现在运行在全新的GPT-5 Codex模型上。该模型专为Codex和代理编程训练,擅长代码重构和代码审查,并且能够根据任务的复杂性动态调整其思考时间。
- 惊人的增长和内部效率: 自8月初以来,Codex的每日消息量(开发人员与Codex进行的任务和对话数量)已增长了10倍。在OpenAI内部,几乎所有新代码都是由Codex用户编写的 。工程师每周完成的拉取请求(pull requests)增加了70%,几乎每个OpenAI的PR都经过Codex审查。
- 企业级功能: 新功能集旨在提高工程团队的效率:
- Slack集成: 允许用户直接在Slack频道或讨论串中标记Codex,它会自动获取上下文并完成任务。
- Codex SDK: 允许用户在团队自己的工作流中扩展和自动化Codex。
- 新的管理工具: 包括环境控制、监控、分析和仪表板等,以帮助企业更好地管理Codex。
- 企业成功案例: 思科(Cisco)在其整个工程组织中推广Codex后,将代码审查时间减少了50%,并将平均项目时间从数周缩短至数天。
实时编程演示的魔力
OpenAI开发者体验负责人Romain Huet展示了如何利用Codex和新API将周围的物体转化为可运行的软件 。他演示了以下功能,而没有手动编写一行代码:
- 设备控制: 通过Codex CLI创建了一个控制面板来控制舞台上方的Sony FR7摄像机。
- 多模态输入: 要求Codex连接Xbox无线手柄来控制摄像机,Codex自动判断使用摇杆进行控制是最佳方案。
- 实时语音控制: 集成了实时API(Real-Time API)和MCP服务器,通过语音指令控制场馆的灯光系统,实现了灯光变色等动态效果。
- Codex SDK的未来: 最令人兴奋的是,通过语音代理调用Codex SDK,在运行时实时重新编程应用。例如,在演示中途,他通过语音指令要求Codex生成一个以大会参与者为主角的电影片尾字幕(credits overlay),Codex立即编辑了React应用中的代码,并实现了实时热重载。
深度洞察: Codex的飞速发展和GA标志着软件开发的民主化。GPT-5 Codex模型及其对上下文的深度理解(agentic behavior),使得复杂任务(如学习30年前的协议)变得自动化。Codex SDK的推出则预示着软件工程的未来是即时、动态和由意图驱动的,代码将由AI按需生成和修改。
四、 模型和API更新
OpenAI为所有开发者带来了重要的新模型更新。
- GPT-5 Pro API: GPT-5 Pro现已面向所有开发者开放API访问。它是OpenAI迄今为止发布的“最智能的模型” ,特别适用于需要高准确性和深度推理的困难任务和专业领域,如金融、法律和医疗保健。
- GPT Real-Time Mini: 一款更小的语音模型,现已加入API。它比两个月前发布的先进语音模型便宜70%,但保持了相同的语音质量和表现力。奥特曼认为,语音将成为人们与AI互动的主要方式之一。
- Sora 2 API 预览版: 视频生成模型Sora 2首次以API预览版的形式发布,将造福于电影制作人、设计师、游戏开发者和教育工作者等创作者。
- 高度可控: 允许用户提供详细指令,精确控制视频长度、宽高比和分辨率,并轻松混合重组视频。
- 丰富音景: 不仅生成语音,还包括丰富的音景、环境音频以及与视觉内容同步的逼真效果。
- 合作案例: 玩具公司美泰(Mattel)正在使用Sora 2 API,将设计师的早期产品草图快速转化为可分享、可操作的视频概念。
深度洞察: 模型API的开放使OpenAI继续保持在AI能力前沿的地位。GPT-5 Pro专注于深度推理,解决高价值的复杂商业问题 。Real-Time Mini则通过大幅降低成本,加速了语音交互的普及 。而Sora 2在可控性和声音同步方面的突破,意味着视频生成不再是简单的文本到视频,而是面向专业制作流程的工具。
总结与未来展望
奥特曼在总结中重申了OpenAI致力于成为新时代构建者的优秀平台。
他强调,过去构建软件需要数月甚至数年,而现在只需几分钟 。开发者不再需要庞大的团队,只需要一个好主意,就能以前所未有的速度将其变为现实 。OpenAI的最终目标是确保AI造福全人类,而这离不开所有开发者的共同努力。
这次DevDay的四大创新——Apps SDK、AgentKit、Codex的GA以及新模型的发布——共同构建了一个更加成熟、更具生产力的AI开发生态系统。这些工具不仅让构建更快,而且更具信心和可控性 。
此外,当日早些时候,奥特曼还与AMD CEO苏姿丰宣布了一项重大合作:OpenAI承诺在未来五年内购买6吉瓦(GW)的AMD Instinct GPU芯片,以支持其AI计算基础设施,加速聊天机器人等应用的推理功能。这一数十亿美元的交易,为OpenAI未来的超大规模计算需求奠定了坚实基础。
OpenAI DevDay 2025清晰地描绘了AI从“玩具”到“构建工具”的转变,预示着一个由意图驱动、人人皆可创造的软件新纪元已然来临。
原始视频:https://www.youtube.com/live/hS1YqcewH0c?si=zKXs7CieYUI5vltM
中英文字幕:
OpenAI DevDay 2025:萨姆·奥特曼(Sam Altman)开幕主题演讲