来去之间
26-07-01 08:00 微博认证:移动互联网分析师

#赛博茶馆[超话]#【外卖平台造出了万亿参数大模型,然后呢?】

美团LongCat2.0昨天发布,1.6万亿参数,全程跑在国产算力上,SWE-bench编程榜超过了GPT-5.5。媒体在欢呼,朋友圈在转,但我看着这些数字,脑子里只有一个问题:外卖平台造大模型,它的底层逻辑到底是什么?

做了三十年这行,见过太多技术故事的两个版本——对外讲的,和真实发生的。

对外版本:为了技术自主、为了国产替代、为了AGI时代的基础设施。

真实版本:拿大模型讲资本故事,搞超话预训练然后去OpenRouter卖API,用漂亮的评测分数告诉投资人我们不是外卖公司。

我不是说美团做的事情没价值——全流程国产算力跑万亿参数,这是真实的工程突破,比PPT可信多了。但哲学上有个概念叫工具理性陷阱:当手段本身成了目的,你就忘了自己到底要去哪儿。

美团的护城河是骑手网络、补贴战争、本地生活数据。这些东西和大模型的关系,比想象中要稀薄。当年Google做TPU,是因为Transformer吃掉了Google自己的服务器;美团做LongCat,是因为点外卖需要1.6万亿参数?

历史上类似的故事:2015年前后,每家互联网公司都要有个云,有个AI

发布于 天津