#实测Claude Fable 5# Anthropic终于把他们那个,强到不敢公开、强到怕引起恐慌的新模型,给放出来了——与 Mythos 5同级别的大模型 Claude Fable 5。这俩模型区别不大,看跑分两个模型也直接共用了一块表格,表现全面碾压同行。
唯一的区别,可能就是在安全性上了。Anthropic 一直担心有人拿 Mythos 搞网络破坏,于是就给 Fable 5 做了点安全限制。一旦发现你拿它搞事,就会自动切换成能力更弱的 Opus 模型。约等于是让你开法拉利,但你要是敢踩一脚油门超速,后台自动给你换成哈啰电单车。
Fable 5 在视觉能力和长线记忆这两点上表现相当优异。就比如它可以直接通过屏幕识别的方式,花费了整整五十个小时,通关了《宝可梦 火红》的游戏全流程。不敢想象这背后花了多少 Token。甚至让它去玩杀戮尖塔,见到 Boss 的概率也要比 Opus 4.8 高出三倍。
咱们拿同样一段提示词出来,让 Fable 5 和 GPT 5.5 一起跑了下。
(编写一个 Python 程序,展示一个球在旋转的六边形内弹跳,六边形中只有五边是墙壁,其中一边是可通过的,小球碰到墙壁的时候自动分裂成两个,或者是穿过可通过的边界掉落到地图外面,球的运动轨迹应受到重力的影响,并且必须真实地反弹到旋转的墙壁上。在界面的左下角显示总共生成的小球数量,当所有小球都掉落到界面外面的时候,游戏结束,玩家可以重新开始游戏。)
相比之下,CodeX 做出来的界面更加花里胡哨一些。但是 CodeX 自作聪明的给小球生成的总数加了上限,再一次游戏中,累计生成了220个小球后,就会让小球不再分裂。这就导致这些小球很快都会掉光,游戏直接 GameOver。(图5)
而 Claude Fable 5 这边做的则是稳妥的多了,同样是为了防止程序卡死,Fable 5 这边限制的是屏幕里“当前小球” 的数量。当小球掉下去后就会自动重新生成,让游戏继续进行。(图6)其他更大更复杂的案例,得等差评君明天再试试了。(才不是问了这么几个问题,5小时额度就给用完了)
整体体验下来,差评君发现对于 Fable 来说,最大的问题可能还是出在它的成本上。Anthropic 又来给大家玩文字游戏了。在6月22日之前,你可以通过你的 Claude 订阅来用 Fable 5。6月22日之后, 直接转变成按量付费的模式了,用多少充多少,没有一点优惠,和买 API 的价格一样。等到哪天服务器压力没那么大了,才会再给订阅用户用上不额外花钱的 Fable 5。。。
Anthropic 之所以收费敢这么嚣张,或许是新模型确实给了他们很大的自信。也希望,Anthropic 的模型真有他们口中的那么强,真有那么在意安全吧。对了,Anthropic 已经出牌了,下个回合,是不是该到 OpenAI 和 Google了?
