摩根大通谈AI涨价

摩根大通资管的2026年6月报告，蛮有意思的

第一，前沿大模型公司的资本开支太重，必须找办法回收成本。
OpenAI、Anthropic、Microsoft 这些公司背后都有巨大的算力、数据中心、芯片和推理成本。过去那种“每月几十美元包月随便用”的模式，对高强度企业用户来说并不经济。所以它们正在把定价方式推向更像云服务的模式：按 token、按调用、按实际使用量收费。

第二，token 价格上涨已经开始发生。
OpenAI 从 GPT-5.4 到 GPT-5.5 价格翻倍；Microsoft 提高 Copilot 价格，同时削减内部 Claude Code 授权；Opus、Sonnet、Gemini、GPT 等不同模型的 token 价格都有数倍上涨。Anthropic 的企业定价也体现了这个方向：座席费只买“入口”，真正的使用量还要按 token 另算。

这里的关键不是某一家涨价，而是商业模式变了：AI 不再是一个便宜的 SaaS 订阅，而越来越像电力、云计算、带宽——谁用得多，谁付得多。

第三，企业会开始“模型分层使用”。
不是所有任务都需要最贵的前沿模型。企业会逐渐把任务拆开：复杂推理、战略判断、最高价值工作仍然交给 Claude、GPT、Gemini 这类闭源前沿模型；但大量客服、摘要、代码辅助、数据处理、内部问答、文档生成等任务，可以迁移到更便宜的开放模型。

企业为了避免前沿模型 token 涨价，可能会迁移到更便宜的开源模型或开放权重模型。

第四，已有一些迁移案例。
Lindy AI 说自己把整个 AI 服务从 Claude 迁到 DeepSeek，节省了数百万美元，性能还更好。Coinbase 的 Brian Armstrong 也说，一年内 80% 的工作负载会跑在便宜 99% 的模型上。这些例子说明，企业并不是单纯追求“最强模型”，而是在追求“够用且便宜”。这背后其实是一个很重要的判断：AI 模型会从“能力竞赛”进入“性价比竞赛”。

第五，中国开放模型正在吃到这波红利。
OpenRouter 上中国模型的 API 调用量明显上升。到 2026 年 4 月，最好的中国开放权重模型，比如 Qwen、DeepSeek V4、Kimi，已经在 Elo 评分上接近闭源前沿模型，但每 token 成本低 10 到 50 倍。
这个判断的含义很大：如果模型能力差距缩小，而价格差距巨大，那么企业就有强烈动力把大量中低难度任务转到中国开源模型上。

第六，Agent 框架会进一步放大便宜模型的价值。
Claude Code、OpenCode 这类 agent harness，可以通过记忆、工具调用、安全边界、编排层等方式，把模型能力“组织起来”。也就是说，一个便宜模型如果配上好的工程系统，输出质量可能会显著提升。

这意味着企业不一定非要买最贵的模型本体。未来竞争不只是模型本身，还包括模型路由、工具链、agent 框架和工程编排。

第七，结论仍然保持谨慎：趋势明确，但证据还不完全充分。
现在还处在 AI 周期早期，开放模型 adoption 的趋势还不好精确衡量，证据是 mixed 的。左图显示 token 支出/价格指数出现波动，有人认为这是企业迁移到便宜模型的证据，也有人认为可能只是前沿模型推理效率提高导致成本下降。

前沿模型会越来越贵，企业会越来越精细地分配模型使用场景。最贵的模型只用于最难、最关键的任务；大量普通任务会迁移到更便宜的开放模型。中国开放模型因为性能接近、成本低很多，正在成为这轮迁移的重要受益者。

发布于美国