零重力瓦力
26-06-17 18:14 微博认证:AI博主

没想到 GLM-5.2 这么牛!

它有多能打?在Artificial Analysis 上,GLM-5.2 拿了 51 分,稳坐全球开源模型第一,跟 Claude Opus 4.8 基本一个水平。这个分数意味着,国产开源模型已经和世界顶级商业模型已经达到了一个层级。

写代码和搞设计是它的强项。在靠真人盲投打分的 Code Arena(专测前端代码),仅次于刚刚被下架的 Claude Fable 5,名列第二。在设计加代码的 DesignArena,更是超过 Claude Fbable 5 登顶第一!硬核软件工程基准 FrontierSWE 上也排到全球第三。从切图、做界面到真刀真枪写工程代码,它都在第一梯队。

具体强在哪里?

能记住 100 万字的上下文,是 GLM-5.1 的五倍。塞一整个项目代码库进去都不在话下,这对长时间、多步骤的编程任务太关键了。

有两档 "思考力度" 。要冲极限就用 max,想省钱省时间就用 high,后者只掉几个点的表现,token 消耗却能砍一半,日常完全够用。

而且,它依然便宜得离谱。同样的活,成本能做到 GPT-5.5 的六分之一。

#GLM5.2##模型测评##AI技术[超话]#

发布于 上海