产品评测 7月前 • 171 阅读 • 0 评论

最新实测GPT-5-Codex：前端能力碾压，复杂项目轻松搞定，Claude可以扔了!

作者头像

AI中国

AI技术专栏作家 | 发布了 246 篇文章

昨天OpenAI正式发布了GPT-5-Codex，一个专门为Codex编码智能体研发的GPT-5版本。

在看了全球网友实测效果后，基本结论就是可以告别Claude Code，放下Cursor，直接来拥抱Codex了！

为了验证网友们的说法和GPT-5-Codex的真实能力，我们全面的测评了一下。

确实这次OpenAI没有再喊「狼来了」，实测很多项目的效果都比较惊艳，比如一键秒出像素风格的小游戏。

或者，制作一个页面来展示强化学习里最经典的实验环境之一目标是让小车左右移动，同时保持杆子竖直不倒。

还可以几分钟秒出一个贪吃蛇游戏。

甚至，你可以给坤哥制作一个火柴人动画。

你只需要上传一张经典的图片～

不过这个确实有点为难GPT-5-Codex了。

下面这张比较完美的还原了图片场景，但是动作识别错误，也不符合实际物理情形。

这张虽然动作符合，但是缺少一点精髓。。。

最后的效果就是这样子啦，等GPT-5-Codex再练习两年半应该就能完美生成了。

这次GPT-5-Codex的前端能力确实得到了非常大的提升。

随手制作一个记录每日AI精选新闻的网站。

Btw，有网友感叹，现在这个阶段，对于最前沿的程序员来，技术迭代的速度非常迅猛！

实际上，他们都不写代码了！

只是对Codex智能体大喊大叫（发号施令）就行，AI做一切！

而且，在GPT-5-Codex上线后，OpenAI发现需求实在过于猛了点！

运行速度竟然比预期的慢了2倍，现在OpenAI的研究员已经确认，重新补上GPU，算力再次起飞。

由此可见，确实好用，大家才会「疯狂使用」！

GPT-5-Codex实测

首先简单介绍下实测使用的方法，Codex官方提供了多种方式。

你可以使用npm安装在终端，也可以用扩展的形式在Cursor、VS Code等使用。

这次我们实测使用终端方式和Cursor中扩展的方式。

像素风游戏

在OpenAI Developers的官方账号上，给出了几个示例，我们就拿这些示例做一次测试。

首先是，「制作一个像素风游戏，让我可以四处走动、与村民交谈，并捕捉野外昆虫。」

以下是OpenAI给出的效果。

而下面是我们实测的效果。

「制作一个像素风游戏，让我可以四处走动、与村民交谈，并捕捉野外昆虫。」

玩起来还是很丝滑的。

手稿直出

还可以将手画的草稿，直接制作成一个网页。

这个效果还是很不错的，毕竟只有一张图和简单的提示。

「以这张图片为灵感，在此创建一个简单的 HTML 页面 aiera.html，包含所有资源/JavaScript 和内容，以实现该网络应用的展示版本。宜人的动画和响应式设计会很棒，但不要弄得太花哨」。

复杂项目

直接使用OpenAI开发者账号的草图，将这个图片制作为一个复杂的项目。

刚开始GPT-5-Codex给了一个和上面草图类似的HTML页面，所以我要求它使用nextjs框架重新制作。

最终的效果如下图所示，还是很好的还原了UI设计稿的页面布局。

在实测中也想感叹，自从有了AI智能体以后，写代码真的就是「大喊大叫」。

比如在实测GPT-5-Codex时，可以后台同步开启N个项目测试，这次ChatGPT给Plus和Pro用户的量还是很大方的。

贪吃蛇游戏

这次Codex提供的终端体验也非常棒，比如制作一个贪吃蛇游戏。

效果如下，Codex还是严格按照要求实现了。

飞行器

使用GPT-5-Codex也测试经典的「飞行器从火星飞往地球」的动画演示，整体GPT-5-Codex表现还行，能够让飞行器飞行。

当然这个模型并不是完美的。

我们在实测中发现，GPT-5-Codex生成的页面UI经常出现「堆叠」的情况，这个也得到了网友们的佐证。

这些都是小瑕疵，更重要的是：

当Claude Code还在偷给模型降智的时候，OpenAI为了实现更好的编程能力，专门给Codex更新了为编程场景特别优化的GPT-5-Codex，高下立判！

这次还是要支持奥特曼的！

彩蛋

而且GPT-5-Codex出来后不久，Grok 4宣布在AGI基准测试中取得了突破！

马斯克今天突然发帖说，他觉得Grok 5有可能实现通用人工智能，让我们拭目以待。

也许谷歌的Gemini 3和马斯克的Grok 5年底前就会给我们一个惊喜。

并且还有网友爆料Codex的提示词现已泄露，快来一探究竟吧！

参考资料：

https://x.com/ItsTKai/status/1968060790625419634

https://x.com/tszzl/status/1967821096545382858

文章来自于微信公众号 “新智元”，作者 “新智元”

作者头像

AI前线

专注人工智能前沿技术报道，深入解析AI发展趋势与应用场景

246篇文章 1.2M阅读 56.3k粉丝

评论 (128)

用户头像

AI爱好者

2小时前

这个更新太令人期待了！视频分析功能将极大扩展AI的应用场景，特别是在教育和内容创作领域。

用户头像

开发者小明

昨天

有没有人测试过新的API响应速度？我们正在开发一个实时视频分析应用，非常关注性能表现。

作者头像

AI前线作者

12小时前

我们测试的平均响应时间在300ms左右，比上一代快了很多，适合实时应用场景。

用户头像

科技观察家

3天前

GPT-4的视频处理能力已经接近专业级水平，这可能会对内容审核、视频编辑等行业产生颠覆性影响。期待看到更多创新应用！

推荐文章

“消费动机MVP模型”仅用42元就能锁定“价值主张PMF”

“消费动机MVP模型”仅用42元就能锁定“价值主张PMF”

5月前 • 产品评测

体验了一周 ChatGPT 浏览器，我还是把 Chrome 装了回来

体验了一周 ChatGPT 浏览器，我还是把 Chrome 装了回来

5月前 • 产品评测

一手实测Qwen-3 Max Thinking, 我觉得一般

一手实测Qwen-3 Max Thinking, 我觉得一般

5月前 • 产品评测

开发者生产力“平替”？MiniMax M2全面测评：代码、速度与迁移成本

开发者生产力“平替”？MiniMax M2全面测评：代码、速度与迁移成本

5月前 • 产品评测

速抢（2核2G）77元/年香港免备案服务器

速抢（2核2G）77元/年香港免备案服务器

0秒前 • 产品评测

谁是最强编程大模型？横向对比GPT-5、GPT-5 Codex、Claude Sonnet 4.5、Gemini 2.5 Pro

谁是最强编程大模型？横向对比GPT-5、GPT-5 Codex、Claude Sonnet 4.5、Gemini 2.5 Pro

6月前 • 产品评测

小米第三款车YU9多张实车谍照曝光；微软开售WinXP限量版拖鞋，约570元；配备M5芯片的苹果新品或本月发布 | 极客头条

小米第三款车YU9多张实车谍照曝光；微软开售WinXP限量版拖鞋，约570元；配备M5芯片的苹果新品或本月发布 | 极客头条

6月前 • 产品评测

Figure三代机器人发布：洗衣洗碗家务全包！网友：非人形没有出路

Figure三代机器人发布：洗衣洗碗家务全包！网友：非人形没有出路

6月前 • 产品评测

热门标签

ChatGPT分析乐队创·问从容V2.0 ai动画生成 AI写作教程香港特区政府发现《Awake》全流程管理办公软件

热门作者

作者头像

AI前沿

2.4k 粉丝

作者头像

机器学习实验室

1.8k 粉丝

作者头像

AI创业圈

3.1k 粉丝