GLM 5.2 还差得远:高分低能。前面我那个IDL编译器经过 DeepSeek V4 Pro + MiniMax M3十个多小时的工作,结果最基本的东西都是一塌糊涂。这还只是个依样画葫芦的项目,仅仅是将 Yacc换成 Bison,C++ 升级。DeekSeek + MiniMax M3 的活,经过 GPT 5.5一扫,两分钟就 纠正了其中关键错误,剩下一些繁琐的工作,它说需要时间,我也就暂时搁置干其它事情去了。今天看到网络称 Z.AI 的 GLM 5.2 拳打 Fable 5、脚踢 KIMI 2.7, 于是充值了20 美金,让它完成剩下的活。须知,这活已经经过三个AI的手,被 GPT 5.5 完成关键部分,Parser 以及语义分析都已经正确,而且前面的AI还留下了说明文档。剩下只需要照猫画虎完成代码生成,基本属于不需要脑筋的事 --- 而且有之前的例子可以比对,看看你生成的代码跟以前的是否不同。我期待它在10分钟内干完。GLM 5.2 花了大约 17美金的工作量(中间我还指导了几次),说是干完了,还增添了几个测试,完美通过。本来我想点赞,结果运行一看,生成的代码牛唇不对马嘴--是照抄网络类似代码,说明它根本没搞清楚基本的东西,而是根据背书的东西想当然生成,典型的中国式高分低能,不会变通的脑子。尽管我这Compiler语法也好,生成逻辑都是书上没有的, 但那么多例子摆在那啊。而此时我余额还剩3.61 美元,于是让它别再乱想,依样画葫芦都不会吗?(用中文说的)。有原来的程序代码、有示范、有样本,照着做。它倒是没有反嘴,继续工作。我还指望它能在剩下的余额完成工作,结果又是一堆 C++ 代码编译错误之类。直到余额花完,它还没有折腾出东西。
怎么说呢?国内的这些模型不能光看评测考分,要看实际工作能力。高分低能是中国教育的通病,书上没有的就不知怎么办了。国模水平看来只能做书上已经有的题目。DeepSeek 是真便宜,怎么用 好像都用不完--这一点至少实惠,干些低技术活够了。而 GLM 5.2 价格并不特别便宜(4美元一百万token输出),按照这个价格,它输出了几百万个Token。其效能估计只有GPT 5.5 的二十分之一。这20美金也就算我替大家交个学费 -- 我看花20美金找个印度程序员估计也把这活干完了。
补充:我把活交给 GPT 5.5 (LOW), 它扫了一眼,只花了 4分钟零11秒,修改了四个文件,增加了100多行代码,就完美完成了工作。GPT 月费 20美金。一般我是用 HIGH 进行设计,Low 进行码农工作。按这个对比,GLM 5.2 的效能只有 GPT的百分之一 --- 更关键的是 GPT 让你心情愉快、觉得靠得住,而国模让你焦虑。GPT厉害的地方在于,它似乎并没有思考多少,就准确找到了问题所在,以外科手术的精确度进行了修改;而GLM 每次都是大量阅读、长篇思考。这令人想起小时候听到的一个民间传说:当年特斯拉被一公司请去修理一台电机,他仔细听了一会,在某处画了一条线,说在这里线路如何调整一下即可;依法果然修好了,特斯拉收费1万美金;对方嘀咕道,画条线就要一万,这也太贵了;特斯拉答到,画条线收费一美金,知道线画在哪,9999。
#AI#
