karminski-牙医 25-08-08 07:55
微博认证:AI博主

GPT-5-Thingking 写代码测试速报!

本次测试中既有3个项目,两个是使用Three.js 实现的动画, 大象牙膏+喷彩带, 一个是使用 Python+Pygame 实现的动画杯子里倒水.

其中 python 代码表现是稳定的, 6次生成的结果很一致, 并且没有出现任何错误.

但是 Three.js 的前端演示有很严重的问题, 两个前端测试项目它没有一次成功, 生成的代码都有错误, 我都是使用 Claude-sonnet-4 修了一下或者几下才成功运行的. 错误类型包括js库的引用问题, 它貌似是不会写 importmap 的, 以及很离谱的错误, 如果前端代码超过了600行, 它变量的初始化甚至出现了问题, 这个太不应该了. 只有小模型才会出现这种上下文长度不够才会导致的问题.

当然也有好的点, 它的审美是在线的, 画的这个3D的三角烧瓶是我这些测试中最美观最逼真的. 然而, 它不会喷发... (动画演示是泡沫从瓶口喷发出来)

目前水平来看, 结论如下:

Claude Opus 4.1 > Gemini-2.5-Pro > GPT-5-Thinking

我的建议是, 写写简单的单页前端界面可以, 复杂的 Web 应用还是谨慎为妙.

#ai创造营##ai生活指南##GPT-5# http://t.cn/A6svqPZl

发布于 北京