大模型五月暗流涌动

Simon Willison刚发了篇"五分钟看懂大模型近半年进展"，我帮你浓缩成一分钟：

四月是神仙打架月——Claude Opus 4.7、GPT-5.5、DeepSeek V4、Kimi K2.6、小米MiMo V2.5 Pro，五家实验室同月把模型干到50分以上。排行榜直接挤爆。

五月画风突变，没人急着发新模型了。但底下暗流涌动：SubQ搞了个不是Transformer的架构，原生12M上下文窗口，成本只有前沿模型的五分之一；Zyphra出了个8B参数的ZAYA1，只激活760M参数就能打平GPT-5-High，还是全程在AMD显卡上训的。

阿里也没闲着，Qwen3.7预览版悄悄上线Arena，文本国产第一。

最让我感慨的是Claude的增速——日活同比涨了1040%。一年前还在讨论"Claude能不能用"，现在企业级需求已经把它推到这个量级了。

大模型的竞争已经不是谁参数多了，而是谁能在对的架构上用更少的算力做更多的事。

#大模型##AI##Claude##GPT5##创作活力分#

发布于北京