差评君实测Fable 5

#实测Claude Fable 5# Anthropic终于把他们那个，强到不敢公开、强到怕引起恐慌的新模型，给放出来了——与 Mythos 5同级别的大模型 Claude Fable 5。这俩模型区别不大，看跑分两个模型也直接共用了一块表格，表现全面碾压同行。

唯一的区别，可能就是在安全性上了。Anthropic 一直担心有人拿 Mythos 搞网络破坏，于是就给 Fable 5 做了点安全限制。一旦发现你拿它搞事，就会自动切换成能力更弱的 Opus 模型。约等于是让你开法拉利，但你要是敢踩一脚油门超速，后台自动给你换成哈啰电单车。

Fable 5 在视觉能力和长线记忆这两点上表现相当优异。就比如它可以直接通过屏幕识别的方式，花费了整整五十个小时，通关了《宝可梦火红》的游戏全流程。不敢想象这背后花了多少 Token。甚至让它去玩杀戮尖塔，见到 Boss 的概率也要比 Opus 4.8 高出三倍。

咱们拿同样一段提示词出来，让 Fable 5 和 GPT 5.5 一起跑了下。
（编写一个 Python 程序，展示一个球在旋转的六边形内弹跳，六边形中只有五边是墙壁，其中一边是可通过的，小球碰到墙壁的时候自动分裂成两个，或者是穿过可通过的边界掉落到地图外面，球的运动轨迹应受到重力的影响，并且必须真实地反弹到旋转的墙壁上。在界面的左下角显示总共生成的小球数量，当所有小球都掉落到界面外面的时候，游戏结束，玩家可以重新开始游戏。）

相比之下，CodeX 做出来的界面更加花里胡哨一些。但是 CodeX 自作聪明的给小球生成的总数加了上限，再一次游戏中，累计生成了220个小球后，就会让小球不再分裂。这就导致这些小球很快都会掉光，游戏直接 GameOver。（图5）

而 Claude Fable 5 这边做的则是稳妥的多了，同样是为了防止程序卡死，Fable 5 这边限制的是屏幕里“当前小球” 的数量。当小球掉下去后就会自动重新生成，让游戏继续进行。（图6）其他更大更复杂的案例，得等差评君明天再试试了。（才不是问了这么几个问题，5小时额度就给用完了）

整体体验下来，差评君发现对于 Fable 来说，最大的问题可能还是出在它的成本上。Anthropic 又来给大家玩文字游戏了。在6月22日之前，你可以通过你的 Claude 订阅来用 Fable 5。6月22日之后，直接转变成按量付费的模式了，用多少充多少，没有一点优惠，和买 API 的价格一样。等到哪天服务器压力没那么大了，才会再给订阅用户用上不额外花钱的 Fable 5。。。

Anthropic 之所以收费敢这么嚣张，或许是新模型确实给了他们很大的自信。也希望，Anthropic 的模型真有他们口中的那么强，真有那么在意安全吧。对了，Anthropic 已经出牌了，下个回合，是不是该到 OpenAI 和 Google了？

发布于浙江