楚团长聊聊天
26-06-24 12:46 微博认证:财经博主

摩根大通资管的2026年6月报告,蛮有意思的

第一,前沿大模型公司的资本开支太重,必须找办法回收成本。
OpenAI、Anthropic、Microsoft 这些公司背后都有巨大的算力、数据中心、芯片和推理成本。过去那种“每月几十美元包月随便用”的模式,对高强度企业用户来说并不经济。所以它们正在把定价方式推向更像云服务的模式:按 token、按调用、按实际使用量收费。

第二,token 价格上涨已经开始发生。
OpenAI 从 GPT-5.4 到 GPT-5.5 价格翻倍;Microsoft 提高 Copilot 价格,同时削减内部 Claude Code 授权;Opus、Sonnet、Gemini、GPT 等不同模型的 token 价格都有数倍上涨。Anthropic 的企业定价也体现了这个方向:座席费只买“入口”,真正的使用量还要按 token 另算。

这里的关键不是某一家涨价,而是商业模式变了:AI 不再是一个便宜的 SaaS 订阅,而越来越像电力、云计算、带宽——谁用得多,谁付得多。

第三,企业会开始“模型分层使用”。
不是所有任务都需要最贵的前沿模型。企业会逐渐把任务拆开:复杂推理、战略判断、最高价值工作仍然交给 Claude、GPT、Gemini 这类闭源前沿模型;但大量客服、摘要、代码辅助、数据处理、内部问答、文档生成等任务,可以迁移到更便宜的开放模型。

企业为了避免前沿模型 token 涨价,可能会迁移到更便宜的开源模型或开放权重模型。

第四,已有一些迁移案例。
Lindy AI 说自己把整个 AI 服务从 Claude 迁到 DeepSeek,节省了数百万美元,性能还更好。Coinbase 的 Brian Armstrong 也说,一年内 80% 的工作负载会跑在便宜 99% 的模型上。这些例子说明,企业并不是单纯追求“最强模型”,而是在追求“够用且便宜”。这背后其实是一个很重要的判断:AI 模型会从“能力竞赛”进入“性价比竞赛”。

第五,中国开放模型正在吃到这波红利。
OpenRouter 上中国模型的 API 调用量明显上升。到 2026 年 4 月,最好的中国开放权重模型,比如 Qwen、DeepSeek V4、Kimi,已经在 Elo 评分上接近闭源前沿模型,但每 token 成本低 10 到 50 倍。
这个判断的含义很大:如果模型能力差距缩小,而价格差距巨大,那么企业就有强烈动力把大量中低难度任务转到中国开源模型上。

第六,Agent 框架会进一步放大便宜模型的价值。
Claude Code、OpenCode 这类 agent harness,可以通过记忆、工具调用、安全边界、编排层等方式,把模型能力“组织起来”。也就是说,一个便宜模型如果配上好的工程系统,输出质量可能会显著提升。

这意味着企业不一定非要买最贵的模型本体。未来竞争不只是模型本身,还包括模型路由、工具链、agent 框架和工程编排。

第七,结论仍然保持谨慎:趋势明确,但证据还不完全充分。
现在还处在 AI 周期早期,开放模型 adoption 的趋势还不好精确衡量,证据是 mixed 的。左图显示 token 支出/价格指数出现波动,有人认为这是企业迁移到便宜模型的证据,也有人认为可能只是前沿模型推理效率提高导致成本下降。

前沿模型会越来越贵,企业会越来越精细地分配模型使用场景。最贵的模型只用于最难、最关键的任务;大量普通任务会迁移到更便宜的开放模型。中国开放模型因为性能接近、成本低很多,正在成为这轮迁移的重要受益者。

发布于 美国