GPT-5-Thingking 写代码测试速报!
本次测试中既有3个项目,两个是使用Three.js 实现的动画, 大象牙膏+喷彩带, 一个是使用 Python+Pygame 实现的动画杯子里倒水.
其中 python 代码表现是稳定的, 6次生成的结果很一致, 并且没有出现任何错误.
但是 Three.js 的前端演示有很严重的问题, 两个前端测试项目它没有一次成功, 生成的代码都有错误, 我都是使用 Claude-sonnet-4 修了一下或者几下才成功运行的. 错误类型包括js库的引用问题, 它貌似是不会写 importmap 的, 以及很离谱的错误, 如果前端代码超过了600行, 它变量的初始化甚至出现了问题, 这个太不应该了. 只有小模型才会出现这种上下文长度不够才会导致的问题.
当然也有好的点, 它的审美是在线的, 画的这个3D的三角烧瓶是我这些测试中最美观最逼真的. 然而, 它不会喷发... (动画演示是泡沫从瓶口喷发出来)
目前水平来看, 结论如下:
Claude Opus 4.1 > Gemini-2.5-Pro > GPT-5-Thinking
我的建议是, 写写简单的单页前端界面可以, 复杂的 Web 应用还是谨慎为妙.
#ai创造营##ai生活指南##GPT-5# http://t.cn/A6svqPZl
发布于 北京
