【Claude最强新模型发布,一个神话,一个寓言】
当地时间 6 月 9 日,Anthropic 推出了两款模型 Claude Fable 5 与 Claude Mythos 5。它们来自同一底层模型,但开放方式不同:Fable 5 是面向普通用户、开发者和企业客户的公开版本;Mythos 5 则只开放给少数受信任的网络防御者、关键基础设施提供商和研究者。
从性能来看,Fable 5 几乎全面刷新了 Anthropic 此前的公开模型纪录,在软件工程、金融知识分析、多模态视觉及科学推理等基准测试中均逼近行业顶尖水平(SOTA)。最显著的提升在于处理长时序、高复杂度的现实任务,不仅能自主搞定大规模代码库的迁移、通过截图直接还原 Web 应用,甚至能通过纯视觉输入玩《宝可梦火红版》,或构建复杂的 3D 模拟。此外,其长上下文记忆能力也得以升级,支持数百万 Token 的高专注度输入,并能借助笔记机制来优化最终的输出质量。
在知识工作场景中,Fable 5 更像一个能长时间跟进任务的分析助手。它可以处理复杂文档、解读图表、做根因分析,也能参与金融交易分析、预期价值计算等高难度工作。
Mythos 5 的重点则在更受控的高价值场景。Anthropic 展示了它在蛋白质设计、分子生物学假设生成、基因组学研究中的潜力:例如将部分药物设计流程加速约 10 倍,在 14 个蛋白靶点中产出 9 个强候选;科学家盲测中,约 80% 的时间更偏好 Mythos 5 生成的研究假设。
两款模型价格相同,每百万输入 token 10 美元,每百万输出 token 50 美元,不到 Claude Mythos Preview 价格的一半。
不过,这次发布最值得关注的,是 Anthropic 对安全边界的处理。由于该架构在网络安全和生物学领域的能力很强,Anthropic 为公开版 Fable 5 部署了一套动态安全分类器。一旦系统检测到涉及网络攻击、生化风险或模型蒸馏等高危查询,不会像以前那样直接报错拒绝,而是会自动无缝切换到 Claude Opus 4.8 来生成回答。Anthropic 称,超过 95% 的会话不会触发回退,但也承认可能出现误判,后续会继续降低误报。
对于开发者和企业来说,Fable 5 毫无疑问是一款强悍的工具,尤其适合承接长期、复杂的工程与研究项目。但在涉及敏感或边界模糊的领域时,企业仍需结合 Opus 的退路机制或引入人工干预。
这次发布,Anthropic 没有只谈“更强”,而是把“更强之后如何开放”摆到了台前。Fable 5 和 Mythos 5 的差别,正是下一代 AI 模型绕不开的问题:能力已经够强,关键是如何让它进入真实世界。
#Anthropic# #Claude#
注:图片由 AI 辅助生成。
