新智元 25-12-24 14:37
微博认证:新智元官方微博

2025年底智谱压轴了,还是一炮双响!

一份招股书冲刺「大模型第一股」,紧跟着发布了最新一代开源大模型GLM-4.7!

经过一年的狂飙突进后,智谱用一场资本和科技完美共振的盛宴收官了。

GLM-4.7这次以「Coding」能力提升为核心定位,直接对标全球顶尖编程模型Claude Sonnet 4.5,在多个权威榜单上不仅拿下了开源第一,更实现了国产模型对硅谷顶尖闭源模型的贴身肉搏。

这一战绩在Vals Index上体现得淋漓尽致。

作为一个不仅考量代码能力,还加权了金融、法律等高价值复杂任务的权威榜单,Vals Index向来被视为大模型「经济价值」的风向标。

GLM-4.7在这里出道即巅峰,直接空降开源模型第一名!

这意味着,在一个不论出身、只论实力的竞技场里,它把一众知名的欧美开源模型甩在了身后,证明了开源模型在处理高难度、高价值任务上,已经具备了替代闭源巨头的实力。

而在更能反映开发者真实体感的Design Arena中,GLM-4.7的表现则更具戏剧性。

由开发者盲测投票得出的胜率(Win Rate)和Elo评分中,GLM-4.7高居第二,紧紧咬住了谷歌的Gemini 3 Pro Preview,甚至超过了Claude Opus 4.5和GPT-5.2。

与此同时,在代码竞技场WebDev中,GLM-4.7更是直接斩获开源第一,跻身全球第六。

高耸的柱状图不只是数字,它是全球开发者用脚投票的结果:在高强度的实战对比中,人们更愿意使用GLM-4.7。

这标志着国产模型终于跨越了从「能用」到「好用」、从「参数对齐」到「体验对齐」的那道天堑。

在2025年的大部分时间里,Anthropic的Claude系列,特别是Claude Opus 4.5,一直被全球开发者奉为「编程之神」。

但是GLM-4.7的发布,选择了正面硬刚Claude,对这波操作最开心的,莫过于大洋彼岸的硅谷程序员们了。

他们一觉醒来惊喜地发现:中国开源界又「送温暖」了! 这次不仅有现成的新模型可以「套壳」,性能还强得离谱。

这大概就是2025年AI圈魔幻的乐子:美国的编程工具,都等着中国发模型。