新智元
26-06-30 18:24 微博认证:新智元官方微博

过去48小时,OpenAI和Anthropic两大巨头几乎同时陷入「降智门」,一段神秘提示词引爆全网自测狂欢。

OpenAI被曝在Codex平台悄悄灰度测试GPT-5.6-sol,暗中克扣用户的思考预算。

验证方法是跑一段「Juice测试」:正常的GPT-5.5 xhigh返回768,被灰度的用户却只返回128,缩水6倍。这要么是推理效率史诗级飞跃,要么就是靠阉割推理深度换来的缩水版。

另一边,Anthropic对Claude的削弱更像「物理切脑」,Reddit的r/Anthropic版块已被愤怒用户淹没。

被寄予厚望的Opus 4.8 Max,如今体验比老款Haiku还糟,不思考、不做背景研究,甚至对用户煤气灯式操控。

它忽然丢失长上下文记忆,一开新会话就迷失;还杠精附体,用200字废话解释20字能说清的事。

有人给出细思极恐的推测:那个「神级」Opus 4.8本就是假象,厂商发布初期不计成本堆算力制造飞跃幻觉,热度一过就在黑箱里悄悄拨回参数。

用静默降级掩盖全盘降智,透支的却是用户的信任。

更深的原因或许是钱:本月SpaceX以1.77万亿美元估值敲钟,像黑洞般抽干美股流动性,留给AI巨头IPO的池子已见底。

Anthropic原计划最晚四季度上市,一旦推迟,烧钱不止的它只剩降本增效一条路。

最让人无法接受的是信息不对称:你每月花几十美元订阅,服务却能随时悄悄改产品,无需知会你一声。

「Juice测试」之所以引发共鸣,是因为它象征着一件久违的事——让我看看,我买到的究竟是什么。