Claude Mythos Preview发现系统漏洞

Claude Mythos Preview 的一段官方视频

“在 OpenBSD 上，我们发现了一个存在了 27 年的漏洞—— 我只需向任意 OpenBSD 服务器发送几段数据就能让它崩溃。”

“在 Linux 上，我们发现了多个漏洞，作为一个没有任何权限的用户，只需在机器上运行一个二进制文件，就能将自己提升为管理员”

1. 模型能力的跨越
- Dario Amodei (Anthropic CEO): 有一种加速的指数级增长，而在这条指数曲线上，存在着一些意义重大的节点。Claude Mythos Preview 就是其中一个特别大的跃升。
- 我们并没有专门训练它擅长网络安全，我们训练它擅长编程，但擅长编程的副产品是，它在网络安全方面也非常出色。
- Anthropic 研究员: 我们正在实验的这个模型，在识别漏洞方面基本上已经和专业人类水平相当。这对我来说是好事，因为我们能更早发现更多漏洞并加以修复。

2. 漏洞链条与自主性
- Nicholas Carlini (Anthropic 研究员): 它具备将多个漏洞串联起来的能力。这意味着你发现了两个漏洞，单独看都不算什么，但这个模型能够利用三、四个甚至五个漏洞组合出攻击链，按顺序执行后达成某种非常复杂的最终效果。
- Anthropic 研究员: 我们认为这个模型之所以能做得这么好，是因为它非常自主。它在执行长周期任务方面整体更强，类似于一个人类安全研究员一整天所做的那种工作。

3. 安全风险与“玻璃翼计划”
- Anthropic 研究员: 显然，这样的模型如果落入不当之手，其能力可能造成危害，因此我们不会大范围发布这个模型。
- Dario Amodei: 更强大的模型将会从我们和其他机构中不断涌现，所以我们确实需要一个应对计划。
- Anthropic 研究员: 因此我们推出了名为 “玻璃翼计划”（Project Glasswing）的项目，与多个组织合作，这些组织维护着世界上一些最关键的代码。我们将模型交到他们手中，让他们探索如何利用这类模型来降低风险、保护所有人。
- 合作伙伴 (OpenSSF): 通过让这些软件开发者率先获得先进工具，这为我们所有人赢得了集体性的先发优势。它让我们能够发现以前发现不了的问题，并帮助我们更快地修复这些问题。

4. 震撼的实测结果
- Nicholas Carlini: 与合作伙伴协作中，我们在几乎所有主要平台上都发现了漏洞。
- 我在过去几周发现的漏洞，比我这一辈子之前发现的加起来还多。
- 我们用这个模型扫描了大量开源代码，首先针对的是操作系统，因为这是支撑整个互联网基础设施的代码。
- 在 OpenBSD 上，我们发现了一个存在了 27 年的漏洞——我只需向任意 OpenBSD 服务器发送几段数据就能让它崩溃。
- 在 Linux 上，我们发现了个多个漏洞，作为一个没有任何权限的用户，只需在机器上运行一个二进制文件，就能将自己提升为管理员。
- 对于每一个发现的漏洞，我们都通知了实际维护软件的人员，他们随即进行了修复并部署了补丁。

5. 愿景与总结
- 合作伙伴: 对于那些孜孜不倦维护软件的开发者而言，一个能帮助他们在漏洞被利用之前发现并修复的模型，是一个无价的工具。
- Dario Amodei: 我们已与美国政府多个部门的官员进行了沟通，并表示愿意与他们合作，共同评估这些模型的风险，并帮助防御这些风险。
- Anthropic 研究员: 我们生活中的一切现在都依赖于软件。软件吞噬了世界，我们生活中的每一个模拟层面，都以某种方式映射到了数字领域。
- 研究员: 网络安全就是社会的安全。各行各业携手合作，共同构建更强大的防御能力，这至关重要。没有一个组织能看到全貌并独自应对这一切。
- Dario Amodei: 这不是几周的项目就能完成的事，这将是几个月、甚至可能几年的工作。但我希望最终我们能达到这样一个状态：世界的软件、客户数据、金融交易和关键基础设施，都比以前更加安全。

（视频翻译：Jesse Lau 遁一子） http://t.cn/AXMLAiIc

发布于美国