Capybara网络安全能力引担忧

Capybara 是 Claude 下一代全新旗舰层级，Mythos 是它的代号，能力比 Opus 4.6 有阶跃式提升，网络安全能力尤其突出到让 Anthropic 自己都担心——是目前已知最接近 AGI 级别安全风险的商业模型。

3月26日，Anthropic 因 CMS（内容管理系统）配置错误，意外将约 3000 个未发布资产（包括一篇草稿博客）暴露在公开可搜索的数据缓存中。两位网络安全研究员（LayerX Security 的 Roy Paz + 剑桥大学的 Alexandre Pauwels）独立发现，Fortune 独家报道。Anthropic 被通知后迅速关闭了访问权限。

关于 Capybara / Mythos：

- Capybara 是 Anthropic 创建的全新模型层级，比现有 Opus 系列更大、更强、更贵——也就是说，未来的产品线将是 Haiku / Sonnet / Opus / Capybara（四级）；
- Claude Mythos 是基于 Capybara 训练出来的具体模型，草稿博客称其为「迄今为止我们开发的最强 AI 模型，没有之一」；
- 对比 Opus 4.6，Capybara 在代码、学术推理、网络安全等测试中「得分大幅提升」；
- Anthropic 确认：这是「能力上的阶跃式变化」

最大的发布顾虑：网络安全风险！草稿博客中 Anthropic 自己写道：

- 该模型「在网络安全能力上目前远超任何其他 AI 模型」
- 它「预示着即将到来的一波 AI 模型，其漏洞利用能力将远超防御者的努力」
- 因此发布策略极为谨慎：优先向网络安全防御机构提供早期访问权限，让防御者提前「给代码库打疫苗」

发布于加拿大