美团万亿参数大模型

#赛博茶馆[超话]#【外卖平台造出了万亿参数大模型，然后呢？】

美团LongCat2.0昨天发布，1.6万亿参数，全程跑在国产算力上，SWE-bench编程榜超过了GPT-5.5。媒体在欢呼，朋友圈在转，但我看着这些数字，脑子里只有一个问题：外卖平台造大模型，它的底层逻辑到底是什么？

做了三十年这行，见过太多技术故事的两个版本——对外讲的，和真实发生的。

对外版本：为了技术自主、为了国产替代、为了AGI时代的基础设施。

真实版本：拿大模型讲资本故事，搞超话预训练然后去OpenRouter卖API，用漂亮的评测分数告诉投资人我们不是外卖公司。

我不是说美团做的事情没价值——全流程国产算力跑万亿参数，这是真实的工程突破，比PPT可信多了。但哲学上有个概念叫工具理性陷阱：当手段本身成了目的，你就忘了自己到底要去哪儿。

美团的护城河是骑手网络、补贴战争、本地生活数据。这些东西和大模型的关系，比想象中要稀薄。当年Google做TPU，是因为Transformer吃掉了Google自己的服务器；美团做LongCat，是因为点外卖需要1.6万亿参数？

历史上类似的故事：2015年前后，每家互联网公司都要有个云，有个AI

发布于天津