Simon Willison刚发了篇"五分钟看懂大模型近半年进展",我帮你浓缩成一分钟:
四月是神仙打架月——Claude Opus 4.7、GPT-5.5、DeepSeek V4、Kimi K2.6、小米MiMo V2.5 Pro,五家实验室同月把模型干到50分以上。排行榜直接挤爆。
五月画风突变,没人急着发新模型了。但底下暗流涌动:SubQ搞了个不是Transformer的架构,原生12M上下文窗口,成本只有前沿模型的五分之一;Zyphra出了个8B参数的ZAYA1,只激活760M参数就能打平GPT-5-High,还是全程在AMD显卡上训的。
阿里也没闲着,Qwen3.7预览版悄悄上线Arena,文本国产第一。
最让我感慨的是Claude的增速——日活同比涨了1040%。一年前还在讨论"Claude能不能用",现在企业级需求已经把它推到这个量级了。
大模型的竞争已经不是谁参数多了,而是谁能在对的架构上用更少的算力做更多的事。
#大模型##AI##Claude##GPT5##创作活力分#
发布于 北京
