挨踢牛魔王
26-06-17 10:20 微博认证:科技博主

智谱的GLM 5.2开源了。
根据官方评估,其能力大致介于Claude Opus 4.7和Claude Opus 4.8之间。
那就是相差不大了。

然后我就找GLM5.2的参数,发现模型卡里面没有。
开源的时候,连总参数,激活参数都不说,写的太敷衍了。
查了一下是744B,而Claude Opus 4.8肯定远远高于1T,可能是5T的模型。

那这么说,在编码和智能体方面,744B完全可以容纳这些知识点。
参数的规模小这么多,却能做到几乎同等能力,说明智谱有独特的训练方法。

也就是说1T以及以上一点的模型,来做编码、支撑智能体,完全是够用的。
在这个参数范围内,国产模型是强项,那么后面会有不少模型追上来。
anthropic的地位并不稳固。

官方项目说明如下:
扎实的 100 万上下文:稳定支持长程工作的 100 万 token 上下文
灵活投入的高级编码能力:更强的编码能力,支持多种推理投入级别,以平衡性能与延迟
改进的架构:我们提出了 IndexShare,在每四个稀疏注意力层之间复用相同的索引器,在 100 万上下文长度下将每个 token 的 FLOPs 降低 2.9 倍。我们还改进了 GLM-5.2 的 MTP 层以支持推测解码,使接受长度最多提升 20%
完全开源:采用 MIT 开源许可证——无地域限制,技术访问无国界。

模型:www.modelscope.cn/models/ZhipuAI/GLM-5.2/summary

发布于 江苏