当前位置: 首页 > news >正文

ChatGPT 5的编程能力宣传言过其实

2025年的8月7日,OpenAI 正式向全球揭开了GPT-5的神秘面纱,瞬间在 AI 领域乃至整个科技圈引发了轩然大波。OpenAI对GPT-5的宣传可谓不遗余力,将其描绘成一款具有颠覆性变革的 AI 产品,尤其在编程能力方面,给出了诸多令人瞩目的描述 。

图片

OpenAI声称,GPT-5堪称他们有史以来最为强大的编码模型。在复杂的前端生成任务中,它能够仅凭用户给出的一个简单提示,便迅速创建出美观且响应式极佳的网站、应用程序以及游戏。

我也在今天第一时间测试了一下GPT-5的具体编程能力。从结果来看,GPT-5的实际编程能力仍然不如Claude,甚至不如DeepSeek R1的最新版本。

我们首先用以下提示词要求GPT-5, Claude和DeepSeek的网页版生成一个html: 

“使用HTML设计一个类似Outlook的界面,可以通过cdn使用开源的css和字体,Javacript等。保持界面美观”

以下为这三个大模型生成的网页。

GPT-5:

图片

Claude:

图片

DeepSeek R1:

图片

从功能上来讲,基本上这三个大模型生成的网页功能覆盖都比较类似。也都是响应式布局。但是在具体呈现上来说,GPT-5就显得简陋得多。

实际上在我对网页Javascript功能也试了一下就发现,GPT-5生成的网页上,除了邮件标题可以点击以外,其他地方几乎都不能点击。而Claude和DeepSeek生成的网页,文件夹,切换邮件时候都是有内容变化的效果的。这也从侧面反映了GPT-5在思考编程问题时思考不够全面。

之后我用Cursor和Roo Code(因为Cursor中的DeepSeek不是官网版本,所以用Roo Code + DeepSeek API key的方式)测试了一下它们对复杂Agentic AI编程的支持。提示词为:

“设计一个Agentic AI程序,可以根据用户的自然语言输入,针对一个或者多个文件夹下的文件,进行敏感数据处理,以便可以和隐私法规(如GDPR)相符合。要求:1,用户可以随时中断Agent的工作,也可以在中断后通过自然语言譬如“继续以前的工作”以继续进行;2,考虑到需要处理的文件数目和大模型Token限制,Agent应该把工作规划为不同阶段以完成所有工作;3,文件可能有不同语言,判断文件中使用的主要语言,考虑可能需要适用哪些国家的隐私法规要求,进而根据不同的规则进行修改;4,如果用户有使用自然语言输入的特殊要求,应该加以满足;5,使用Python。规划并生成相关的REST服务,用户通过网页执行各种操作。”

当然这个程序代码量比较大,具体我也就不把生成的内容贴出来了。但是结果仍然是Claude和DeepSeek优于GPT-5。大家也可以自己试一下。

GPT, Gemini和Grok都是很善于宣传的,每次新模型出来都宣称自己是最强的。但是实际上大家在编程时还是继续用Claude(国内就是各种基于DeepSeek的AI)。甚至你在编码时会发现,Claude Sonnet就已经足够打败它们了,都不需要使用Claude Opus。这就是现在大模型引擎的魔幻现实。

http://www.dtcms.com/a/322975.html

相关文章:

  • 97-基于Python的大众点评数据分析预测系统
  • 七、《Serverless架构:按毫秒计费的成本革命》--从新浪AI推理平台50%效能提升看无服务器本质
  • 数据结构——优先级队列(PriorityQueue):一文解决 Top K 问题!
  • 可视化大屏 SDK 数据结构设计:从拖拽组件到最终渲染的全链路
  • 2025-08-09 李沐深度学习13——经典卷积神经网络 (1)
  • 嵌入式知识日常问题记录及用法总结(一)
  • C++2024 年一级
  • Vue3 学习教程,从入门到精通,Vue 3 + Tailwind CSS 全面知识点与案例详解(31)
  • buuctf:inndy_echo、actf_2019_babystack
  • 花生4CL基因家族鉴定及对干旱与盐胁迫响应分析--文献精读157
  • 【AI论文】种子扩散模型:一种具备高速推理能力的大规模扩散语言模型
  • 智慧农业-无人机视角庄稼倒伏农作物倒伏识别分割数据集labelme格式541张1类别
  • C语言指针完全指南:从入门到精通
  • Selenium使用超全指南
  • OpenCV图像裁剪与 ROI 操作
  • 全志刷机工具:PhoenixSuit-全志芯片处理器-刷机工具安装包及最详细使用教程指南
  • Python day39
  • Web3: 用ERC-1400革新公司股权激励
  • 【原创】基于 Flask 的简单文件收集器
  • 【33】C#实战篇——点击按钮弹出指定路径对话框,选择指定类型文件;;;文件过滤器显示指定的一种文件,几种类型文件 同时显示
  • Pytest中实现自动生成测试用例脚本代码
  • 扩散LLM推理新范式:打破生成长度限制,实现动态自适应调节
  • 在ubuntu服务器下安装cuda和cudnn(笔记)
  • ImageJ 实用技巧:通过 Overlay 实现图像透明标记的完整教程
  • NTP /Chrony 网络时间协议
  • 当配置项只支持传入数字,即无法指定单位为rem,需要rem转px
  • 本地连接跳板机
  • 【Windows】成批复制某个特定的文件
  • 《算法导论》第 13 章 - 红黑树
  • 基于Dify实现对Excel的数据分析--动态配置图表