当前位置：首页 > news >正文

GPT-5-Codex 正式发布：迈向真正的“自主编程”时代

news 2025/9/18 7:12:46

在 Anthropic Claude 近期遭遇争议的同时，OpenAI 推出了其编程领域的王牌产品——GPT-5-Codex。这并非简单的模型升级，而是基于 GPT-5 专为“自主编程”（Autonomous Programming）场景深度优化的专用版本，标志着 AI 编程辅助工具正向“AI 程序员”进化。

一、核心能力：不止于辅助，重在自主

GPT-5-Codex 的核心升级聚焦于真实软件工程场景的端到端解决能力。

长时自主工作流：
- 模拟程序员工作： 能够像一名真正的程序员一样，连续工作超过 7 小时，独立处理复杂项目。
- 完整交付： 在此期间，它能自主进行迭代、修复 Bug、运行测试，并最终交付一个完整可用的解决方案。
动态思考能力（Dynamic Thinking）：
- 智能资源分配： 模型能根据任务复杂度动态调整处理时间与计算资源，真正做到“好钢用在刀刃上”。
- 数据表现：
  - 简单任务（底部10%）： 响应速度极快，比 GPT-5 少用 93.7% 的计算资源。
  - 复杂任务（顶部10%）： 投入约 2 倍 的时间进行深度推理、代码编辑和测试，确保高质量交付。
全平台无缝体验：
- 跨平台支持： 覆盖终端（CLI）、IDE、网页及移动端，提供一致的编程体验。
- 云端同步： 已整合进 ChatGPT 账号体系，支持本地与云端环境的无缝切换与协作。

二、性能与评测：补齐短板，实力彰显

OpenAI 在此次发布中，正面回应了此前的评测质疑。

全面的 SWE-bench 评测： 修复了之前被 Anthropic 指出的问题，现已在全部 500 个 SWE-bench Verified 任务上报告结果，证明了其强大的代码生成与修复能力。
大规模代码重构： 评测涵盖 Python、Go、OCaml 等多种语言。在一个来自 Gitea 的真实案例中，Codex 成功完成了一项修改 232 个文件、涉及 3541 行代码 的大型重构任务。

三、关键应用场景与工具链升级

代码审查（Code Review）：
- 在 OpenAI 内部，Codex 已被用于审查大部分 Pull Request，每天能发现数百个问题，其效率和准确性有时甚至超过人工审查。
前端开发支持：
- 视觉理解： 能直接读取截图和设计稿来理解需求，并检查开发进度，将工作成果可视化展示。
全新 Codex CLI 与 IDE 插件：
- Codex CLI： 围绕自主编程流程重构，支持附加图片（截图、架构图）、通过待办清单跟踪进度，并简化了三种审批模式（只读、自动、完全访问）。
- IDE 插件： 支持 VS Code、Cursor 等主流编辑器，允许用户无缝预览本地修改、与 Codex 协作，并在云端与本地环境间流畅切换。
云端基础设施与安全：
- 高效执行： 通过容器缓存，将任务的中位完成时间缩短了 90%。
- 自动环境配置： 能自动扫描并执行初始化脚本（如 pip install）来按需安装依赖。
- 安全沙箱： 默认在沙箱环境中运行且禁用网络访问，以防范恶意操作和提示注入风险。开发者可根据需求自定义安全策略。

四、如何体验（国内推荐）

API 开放： OpenAI 计划很快向 API key 开发者开放 GPT-5-Codex。
国内快速通道： 国内用户可通过 小镜 AI 开放平台 抢先体验。该平台集成了包括 GPT-5-Codex、Gemini 2.5 Pro、Claude 3.7 Sonnet 在内的全球顶尖模型。其优势在于：
- 网络友好： 在国内网络环境下响应速度快，无需特殊网络配置。
- 多端适配： 界面简洁，完美适配手机与电脑。