小马甲不小
26-06-09 11:40 微博认证:汽车博主

里程碑式的产业突破:小米mimo把万亿参数 MoE 旗舰模型的生成速度,从行业普遍的68–192 tokens/s直接拉到1000+ tokens/s(峰值 1200),而且跑在普通 8 卡 GPU 服务器上,不是定制芯片。

速度追上需求、成本砸穿门槛、体验抹平等待,AI 真正进入 “即时智能” 时代。 ​

发布于 四川