爱可可-爱生活 26-02-12 08:01
微博认证:AI博主 2025微博新锐新知博主

【当你每月花200美元,AI却在30分钟内把额度烧光】

Anthropic 最新旗舰模型 Opus 4.6 正在制造一场用户信任危机。

Reddit 上大量付费用户集体反映:同样的编程工作流,Opus 4.5 时代能撑三四个小时的额度,换到 4.6 之后,三十分钟就见底了。有人甚至一条提示词发出去,还没收到任何输出,额度就已经归零。月付200美元的顶级订阅用户,周二就把一周的配额烧完,剩下的日子只能干等。

问题的根源并不复杂:Opus 4.6 天生话多。

它引入了高、中、低三档“思考力度”设置,默认是最高档。高档模式下,模型会启动冗长的递归推理链,光是“想”就能消耗掉惊人的 token。有用户记录到,一个中等复杂度的任务,模型在高档思考模式下独自推理了17分钟,一口气吃掉了43%的会话额度。而同样的任务,低档模式4分钟就能搞定,只消耗6%。

更要命的是 Agent Teams 功能。多个智能体同时运行时,它们之间的“闲聊”会以惊人的速度吞噬 token。一位用户开了三个智能体协作,一个中等任务就烧掉了至少50美元的额度。

社区里出现了一个有趣的分裂。少数用户声称自己同时开十几个智能体跑了好几个小时,额度才用了一半,认为“如果你烧得这么快,说明你的用法有问题”。但这种声音被绝大多数人的真实体验淹没了。一个合理的解释是:精心设计过提示词结构、严格限定任务范围的用户确实能控制消耗,但这恰恰暴露了产品设计的矛盾。你买一个更聪明的模型,本来就是为了把复杂任务交给它,结果却要花更多精力去“管理”它的思考过程,这笔账怎么算都不划算。

一个更深层的悖论浮出水面:模型越聪明,用户越穷。Opus 4.6 确实在调试和复杂推理上比 4.5 更强,很多人承认它能一次解决以前需要反复迭代两三次的问题。但这种能力提升的代价是 token 消耗翻倍甚至更多。能力的进步被定价机制吃掉了,用户感受到的不是升级,而是降级。

社区自发形成的最佳实践很说明问题:日常工作用 Opus 4.5,只有真正卡住了才切到 4.6 救急。这基本等于说,新旗舰模型的最佳使用方式是尽量不用它。

与此同时,不少人开始转向 OpenAI 的 Codex 5.3。多位用户反馈 Codex 在编程能力上已经接近甚至持平 Opus,而额度明显更宽裕。有人说“三天用 Codex 完成的工作量,超过了一个月的 Opus”。这话可能有夸张成分,但方向性的信号很清晰。

Anthropic 的 Opus 团队在官方博客里展示过他们自己用 Claude 写代码的工作流,看起来行云流水。社区里有人一针见血地指出:他们是全世界唯一不用担心 token 额度的团队。任何人试图复制他们的工作方式,一小时内就会撞墙。

当产品的最佳实践是“少用它”,当付费用户的日常是盯着用量仪表盘而不是专注写代码,问题就不再是技术层面的了。这是一个商业模式的信号:在 AI 能力快速提升的时代,如何让用户真正享受到能力提升的红利,而不是被更精细的计量方式反噬,是每一家 AI 公司都必须面对的命题。

reddit.com/r/ClaudeAI/comments/1r1cfha/is_anyone_else_burning_through_opus_46_limits_10x

发布于 北京