智谱新出的 GLM-5.1 非常好用,我自己实测一下,结果出奇的好。
我一直想做一个内容付费的个人博客网站,带前后端、数据库、文章发布、付费解锁、后台管理,全套功能。这种项目说难不难,但环节多、链路长,自己从零撸的话怎么也得两三周。
GLM-5.1 刚好主打"长程任务"能力,我就拿这个项目来测。需求都是用大白话写的,没有技术文档,就告诉它"我要一个程序员极简风的博客,支持专栏标签、Markdown 编辑器、内容锁定和付费解锁"。
结果 GLM-5.1 上来没急着写代码,先花两分钟输出了一份完整的技术方案,前端 Next.js,后端 Node.js,数据库 SQLite,项目结构和实施步骤都列好了。这个起手式就跟其他模型不一样,其他模型基本上来就啪啪啪写代码,写到一半发现架构不对再推翻重来。
然后我就坐旁边看它干活,睡了个午觉起来,活干完了。28 分钟,一次性跑通。只不过界面太素了,一点不满意之外,所以,又让它调用 front-design skill 重新设计,出来的效果很极客,CLI 风格的光标动画,黑白灰配色,所以,我准备过两天直接买服务器部署上线。
中间也发现了一个 bug,长文发布后只显示一半。我把问题扔给 GLM-5.1,它先按我的猜测查数据库字段,发现没问题,就自己开始排查路由、前端渲染,最后定位到是付费解锁逻辑的问题。5 分钟修好,全程没问我。
同样的需求跟 Opus 4.6 和 K2.5 做了对比。K2.5 单步代码没问题,但十几步之后上下文记忆就开始衰减,前后字段对不上,得手动修五六个地方,像个聪明的应届生,你得盯着。Opus 4.6 很稳,跟 GLM-5.1 基本一个水平线。但关键区别在价格,Opus 4.6 跑完这个项目要花几十美元,GLM-5.1 通过 Coding Plan 用,成本低了一个数量级。
所以,我的感悟就是:以前用 AI 写代码像带实习生,你是项目经理,得盯着它一步步做。现在用 GLM-5.1,你是甲方,它是那个能独立交付的资深工程师。1 个小时 vs 两三周,这个效率差距已经不是"提效"能概括的了。
具体实测请看这篇文章:
http://t.cn/AXIJ1YQC
#How I AI##科技先锋官#
