岳东晓：GLM 5.2高分低能

GLM 5.2 还差得远：高分低能。前面我那个IDL编译器经过 DeepSeek V4 Pro + MiniMax M3十个多小时的工作，结果最基本的东西都是一塌糊涂。这还只是个依样画葫芦的项目，仅仅是将 Yacc换成 Bison，C++ 升级。DeekSeek + MiniMax M3 的活，经过 GPT 5.5一扫，两分钟就纠正了其中关键错误，剩下一些繁琐的工作，它说需要时间，我也就暂时搁置干其它事情去了。今天看到网络称 Z.AI 的 GLM 5.2 拳打 Fable 5、脚踢 KIMI 2.7, 于是充值了20 美金，让它完成剩下的活。须知，这活已经经过三个AI的手，被 GPT 5.5 完成关键部分，Parser 以及语义分析都已经正确，而且前面的AI还留下了说明文档。剩下只需要照猫画虎完成代码生成，基本属于不需要脑筋的事 --- 而且有之前的例子可以比对，看看你生成的代码跟以前的是否不同。我期待它在10分钟内干完。GLM 5.2 花了大约 17美金的工作量（中间我还指导了几次），说是干完了，还增添了几个测试，完美通过。本来我想点赞，结果运行一看，生成的代码牛唇不对马嘴--是照抄网络类似代码，说明它根本没搞清楚基本的东西，而是根据背书的东西想当然生成，典型的中国式高分低能，不会变通的脑子。尽管我这Compiler语法也好，生成逻辑都是书上没有的，但那么多例子摆在那啊。而此时我余额还剩3.61 美元，于是让它别再乱想，依样画葫芦都不会吗？（用中文说的）。有原来的程序代码、有示范、有样本，照着做。它倒是没有反嘴，继续工作。我还指望它能在剩下的余额完成工作，结果又是一堆 C++ 代码编译错误之类。直到余额花完，它还没有折腾出东西。

怎么说呢？国内的这些模型不能光看评测考分，要看实际工作能力。高分低能是中国教育的通病，书上没有的就不知怎么办了。国模水平看来只能做书上已经有的题目。DeepSeek 是真便宜，怎么用好像都用不完--这一点至少实惠，干些低技术活够了。而 GLM 5.2 价格并不特别便宜（4美元一百万token输出），按照这个价格，它输出了几百万个Token。其效能估计只有GPT 5.5 的二十分之一。这20美金也就算我替大家交个学费 -- 我看花20美金找个印度程序员估计也把这活干完了。

补充：我把活交给 GPT 5.5 (LOW), 它扫了一眼，只花了 4分钟零11秒，修改了四个文件，增加了100多行代码，就完美完成了工作。GPT 月费 20美金。一般我是用 HIGH 进行设计，Low 进行码农工作。按这个对比，GLM 5.2 的效能只有 GPT的百分之一 --- 更关键的是 GPT 让你心情愉快、觉得靠得住，而国模让你焦虑。GPT厉害的地方在于，它似乎并没有思考多少，就准确找到了问题所在，以外科手术的精确度进行了修改；而GLM 每次都是大量阅读、长篇思考。这令人想起小时候听到的一个民间传说：当年特斯拉被一公司请去修理一台电机，他仔细听了一会，在某处画了一条线，说在这里线路如何调整一下即可；依法果然修好了，特斯拉收费1万美金；对方嘀咕道，画条线就要一万，这也太贵了；特斯拉答到，画条线收费一美金，知道线画在哪，9999。

#AI#

发布于美国