小米 MiMo 团队负责人罗福莉:
全球算力跟不上 Agent 时代的 Token 消耗,出路不是更便宜的 Token,而是更省 Token 的框架和更高效的模型共同进化。
一个技术细节:
OpenClaw 的上下文管理做得非常糟糕。一个用户请求会触发多轮低价值的工具调用,每次都带着超过 10 万 Token 的长上下文窗口,实际请求次数是 Claude Code 自身框架的好几倍。换算成 API 价格,真实成本可能是订阅价的几十倍。
罗福莉提了两个观点:
第一,短期阵痛反而是好事。第三方框架被迫走 API 付费后,成本压力会倒逼它们改进上下文管理、提高 prompt 缓存命中率、减少无效 Token 消耗。
第二,呼吁其他大模型公司不要在没想清楚定价模型之前盲目打价格战。低价卖 Token 的同时对第三方框架大开门户,看着对用户友好,实际是个陷阱,Anthropic 刚从这个坑里爬出来。
发布于 美国
