斌叔OKmath 26-04-03 08:26
微博认证:橙旭园CEO 教育博主

谷歌刚刚发布了 GEMMA 4,而我正在用 2x H200 测试英伟达和阿里巴巴的旗舰显卡。真是绝佳的时机。

这款 31B 思维模型在 Elo 评分中击败了 Qwen 122B 和 DeepSeek v3.2。26B 版本只有 4B 处于活跃状态,而且可以装进手机里。

现在快凌晨两点了,我刚发布了英伟达的《章鱼入侵者》测试结果。Qwen 的结果正在加载中。不过这个结果会立即加入发布队列。

如果你已经运行过了,请在下方留言告诉我你的数据。模型、量化指标、硬件、推理引擎、tok/s。我想在真正上手之前先看看它的表现。

发布于 北京