数字生命卡兹克
26-06-30 23:19 微博认证:AI博主

聊聊今天国产AI的两个“万亿”里程碑。今天发生了两件事。

在Claude疯狂封号的背景之下,格外的眉清目秀。

第一件事,美团正式发布了LongCat-2.0,1.6万亿参数,全流程在5万张国产算力卡上完成训练和推理,英伟达含量为零,这是目前公开信息里,第一个在纯国产算力集群上从零跑通的万亿参数大模型。

同一天,寒武纪涨了将近8%,突破历史新高,总市值正式突破1万亿人民币,成为科创板历史上第一家万亿市值公司。

一个万亿,是国产算力训出来国产模型参数的万亿。
一个万亿,是二级市场给国产算力估值的万亿。
它们在同一天撞到了一起,再叠加上Claude疯了一样封号的背景,我觉得这个时间点有一种奇妙的历史感。

很多人可能已经忘了,就在两三年前,国产芯片能不能训大模型这件事,还是一个让整个行业焦虑到失眠的问题。

那时候,A100、H100这些高端GPU直接断供中国,行业里弥漫着一种非常真实的恐慌,连国产芯片好不好用都来不及讨论了,大家脑子里只有一个问题,没有英伟达的卡,我们还能不能继续做AI。

然后,过了三年。

这三年里发生了太多事情,华为昇腾、寒武纪、摩尔线程、沐曦等等,这些名字从概念终于变成了真正能开始做AI的硬件,这个过程有多痛苦,可能只有在里面的人知道了。

DeepSeek V4原本计划年初发布,为了适配国产算力硬是推迟了好几个月。

不过即使是DeepSeek V4,正式发布的时候,也只做到了推理侧适配国产算力,训练阶段还有英伟达的影子。

但今天,我觉得这是一个阶段的里程碑,美团把这训练这层最难的事给啃下来了,5万张国产卡,从零开始预训练。

堆出了一个1.6万亿参数的MoE模型,而且是100万上下文,这个应该也是值得鼓掌的。

这其中的难点,也自不必说了。

模型能力坦诚的讲,离顶级模型还是一些的差距,我简单测试了一下,纯Agent和Coding能力,大概在Claude Opus 4.6左右的水平,没到顶尖水平,但依然值得我给出最高的赞誉。

因为,一年以后呢,我们是不是可以凭借国产算力,真的做出真正一线的顶级模型呢?

这两个万亿叠在一起,终于构成了一个完整的循环。
模型侧证明国产芯片是能训万亿参数的前沿模型的,芯片侧证明这个市场大到足以撑起万亿市值。
供给创造了需求,需求反哺了供给。

所以我才说,今天这个时间点有一种历史感。

我希望,未来有一天,我们可以不再受制于人,不用再怕被封号、再战战兢兢。
我们每一个用户,也都能享受到最顶级模型的智能平权。

会有这一天的。
一定会的。

#AI[超话]##how i ai#

发布于 北京