Capybara 是 Claude 下一代全新旗舰层级,Mythos 是它的代号,能力比 Opus 4.6 有阶跃式提升,网络安全能力尤其突出到让 Anthropic 自己都担心——是目前已知最接近 AGI 级别安全风险的商业模型。
3月26日,Anthropic 因 CMS(内容管理系统)配置错误,意外将约 3000 个未发布资产(包括一篇草稿博客)暴露在公开可搜索的数据缓存中。两位网络安全研究员(LayerX Security 的 Roy Paz + 剑桥大学的 Alexandre Pauwels)独立发现,Fortune 独家报道。Anthropic 被通知后迅速关闭了访问权限。
关于 Capybara / Mythos:
- Capybara 是 Anthropic 创建的全新模型层级,比现有 Opus 系列更大、更强、更贵——也就是说,未来的产品线将是 Haiku / Sonnet / Opus / Capybara(四级);
- Claude Mythos 是基于 Capybara 训练出来的具体模型,草稿博客称其为「迄今为止我们开发的最强 AI 模型,没有之一」;
- 对比 Opus 4.6,Capybara 在代码、学术推理、网络安全等测试中「得分大幅提升」;
- Anthropic 确认:这是「能力上的阶跃式变化」
最大的发布顾虑:网络安全风险!草稿博客中 Anthropic 自己写道:
- 该模型「在网络安全能力上目前远超任何其他 AI 模型」
- 它「预示着即将到来的一波 AI 模型,其漏洞利用能力将远超防御者的努力」
- 因此发布策略极为谨慎:优先向网络安全防御机构提供早期访问权限,让防御者提前「给代码库打疫苗」
发布于 加拿大
