两个万亿里程碑

聊聊今天国产AI的两个“万亿”里程碑。今天发生了两件事。

在Claude疯狂封号的背景之下，格外的眉清目秀。

第一件事，美团正式发布了LongCat-2.0，1.6万亿参数，全流程在5万张国产算力卡上完成训练和推理，英伟达含量为零，这是目前公开信息里，第一个在纯国产算力集群上从零跑通的万亿参数大模型。

同一天，寒武纪涨了将近8%，突破历史新高，总市值正式突破1万亿人民币，成为科创板历史上第一家万亿市值公司。

一个万亿，是国产算力训出来国产模型参数的万亿。
一个万亿，是二级市场给国产算力估值的万亿。
它们在同一天撞到了一起，再叠加上Claude疯了一样封号的背景，我觉得这个时间点有一种奇妙的历史感。

很多人可能已经忘了，就在两三年前，国产芯片能不能训大模型这件事，还是一个让整个行业焦虑到失眠的问题。

那时候，A100、H100这些高端GPU直接断供中国，行业里弥漫着一种非常真实的恐慌，连国产芯片好不好用都来不及讨论了，大家脑子里只有一个问题，没有英伟达的卡，我们还能不能继续做AI。

然后，过了三年。

这三年里发生了太多事情，华为昇腾、寒武纪、摩尔线程、沐曦等等，这些名字从概念终于变成了真正能开始做AI的硬件，这个过程有多痛苦，可能只有在里面的人知道了。

DeepSeek V4原本计划年初发布，为了适配国产算力硬是推迟了好几个月。

不过即使是DeepSeek V4，正式发布的时候，也只做到了推理侧适配国产算力，训练阶段还有英伟达的影子。

但今天，我觉得这是一个阶段的里程碑，美团把这训练这层最难的事给啃下来了，5万张国产卡，从零开始预训练。

堆出了一个1.6万亿参数的MoE模型，而且是100万上下文，这个应该也是值得鼓掌的。

这其中的难点，也自不必说了。

模型能力坦诚的讲，离顶级模型还是一些的差距，我简单测试了一下，纯Agent和Coding能力，大概在Claude Opus 4.6左右的水平，没到顶尖水平，但依然值得我给出最高的赞誉。

因为，一年以后呢，我们是不是可以凭借国产算力，真的做出真正一线的顶级模型呢？

这两个万亿叠在一起，终于构成了一个完整的循环。
模型侧证明国产芯片是能训万亿参数的前沿模型的，芯片侧证明这个市场大到足以撑起万亿市值。
供给创造了需求，需求反哺了供给。

所以我才说，今天这个时间点有一种历史感。

我希望，未来有一天，我们可以不再受制于人，不用再怕被封号、再战战兢兢。
我们每一个用户，也都能享受到最顶级模型的智能平权。

会有这一天的。
一定会的。

#AI[超话]##how i ai#

发布于北京