用户月付200美元AI半小时耗尽额度

【当你每月花200美元，AI却在30分钟内把额度烧光】

Anthropic 最新旗舰模型 Opus 4.6 正在制造一场用户信任危机。

Reddit 上大量付费用户集体反映：同样的编程工作流，Opus 4.5 时代能撑三四个小时的额度，换到 4.6 之后，三十分钟就见底了。有人甚至一条提示词发出去，还没收到任何输出，额度就已经归零。月付200美元的顶级订阅用户，周二就把一周的配额烧完，剩下的日子只能干等。

问题的根源并不复杂：Opus 4.6 天生话多。

它引入了高、中、低三档“思考力度”设置，默认是最高档。高档模式下，模型会启动冗长的递归推理链，光是“想”就能消耗掉惊人的 token。有用户记录到，一个中等复杂度的任务，模型在高档思考模式下独自推理了17分钟，一口气吃掉了43%的会话额度。而同样的任务，低档模式4分钟就能搞定，只消耗6%。

更要命的是 Agent Teams 功能。多个智能体同时运行时，它们之间的“闲聊”会以惊人的速度吞噬 token。一位用户开了三个智能体协作，一个中等任务就烧掉了至少50美元的额度。

社区里出现了一个有趣的分裂。少数用户声称自己同时开十几个智能体跑了好几个小时，额度才用了一半，认为“如果你烧得这么快，说明你的用法有问题”。但这种声音被绝大多数人的真实体验淹没了。一个合理的解释是：精心设计过提示词结构、严格限定任务范围的用户确实能控制消耗，但这恰恰暴露了产品设计的矛盾。你买一个更聪明的模型，本来就是为了把复杂任务交给它，结果却要花更多精力去“管理”它的思考过程，这笔账怎么算都不划算。

一个更深层的悖论浮出水面：模型越聪明，用户越穷。Opus 4.6 确实在调试和复杂推理上比 4.5 更强，很多人承认它能一次解决以前需要反复迭代两三次的问题。但这种能力提升的代价是 token 消耗翻倍甚至更多。能力的进步被定价机制吃掉了，用户感受到的不是升级，而是降级。

社区自发形成的最佳实践很说明问题：日常工作用 Opus 4.5，只有真正卡住了才切到 4.6 救急。这基本等于说，新旗舰模型的最佳使用方式是尽量不用它。

与此同时，不少人开始转向 OpenAI 的 Codex 5.3。多位用户反馈 Codex 在编程能力上已经接近甚至持平 Opus，而额度明显更宽裕。有人说“三天用 Codex 完成的工作量，超过了一个月的 Opus”。这话可能有夸张成分，但方向性的信号很清晰。

Anthropic 的 Opus 团队在官方博客里展示过他们自己用 Claude 写代码的工作流，看起来行云流水。社区里有人一针见血地指出：他们是全世界唯一不用担心 token 额度的团队。任何人试图复制他们的工作方式，一小时内就会撞墙。

当产品的最佳实践是“少用它”，当付费用户的日常是盯着用量仪表盘而不是专注写代码，问题就不再是技术层面的了。这是一个商业模式的信号：在 AI 能力快速提升的时代，如何让用户真正享受到能力提升的红利，而不是被更精细的计量方式反噬，是每一家 AI 公司都必须面对的命题。

reddit.com/r/ClaudeAI/comments/1r1cfha/is_anyone_else_burning_through_opus_46_limits_10x

发布于北京