Claude Mythos Preview 的一段官方视频
“在 OpenBSD 上,我们发现了一个存在了 27 年的漏洞—— 我只需向任意 OpenBSD 服务器发送几段数据就能让它崩溃。”
“在 Linux 上,我们发现了多个漏洞,作为一个没有任何权限的用户,只需在机器上运行一个二进制文件,就能将自己提升为管理员”
1. 模型能力的跨越
- Dario Amodei (Anthropic CEO): 有一种加速的指数级增长,而在这条指数曲线上,存在着一些意义重大的节点。Claude Mythos Preview 就是其中一个特别大的跃升。
- 我们并没有专门训练它擅长网络安全,我们训练它擅长编程,但擅长编程的副产品是,它在网络安全方面也非常出色。
- Anthropic 研究员: 我们正在实验的这个模型,在识别漏洞方面基本上已经和专业人类水平相当。这对我来说是好事,因为我们能更早发现更多漏洞并加以修复。
2. 漏洞链条与自主性
- Nicholas Carlini (Anthropic 研究员): 它具备将多个漏洞串联起来的能力。这意味着你发现了两个漏洞,单独看都不算什么,但这个模型能够利用三、四个甚至五个漏洞组合出攻击链,按顺序执行后达成某种非常复杂的最终效果。
- Anthropic 研究员: 我们认为这个模型之所以能做得这么好,是因为它非常自主。它在执行长周期任务方面整体更强,类似于一个人类安全研究员一整天所做的那种工作。
3. 安全风险与“玻璃翼计划”
- Anthropic 研究员: 显然,这样的模型如果落入不当之手,其能力可能造成危害,因此我们不会大范围发布这个模型。
- Dario Amodei: 更强大的模型将会从我们和其他机构中不断涌现,所以我们确实需要一个应对计划。
- Anthropic 研究员: 因此我们推出了名为 “玻璃翼计划”(Project Glasswing) 的项目,与多个组织合作,这些组织维护着世界上一些最关键的代码。我们将模型交到他们手中,让他们探索如何利用这类模型来降低风险、保护所有人。
- 合作伙伴 (OpenSSF): 通过让这些软件开发者率先获得先进工具,这为我们所有人赢得了集体性的先发优势。它让我们能够发现以前发现不了的问题,并帮助我们更快地修复这些问题。
4. 震撼的实测结果
- Nicholas Carlini: 与合作伙伴协作中,我们在几乎所有主要平台上都发现了漏洞。
- 我在过去几周发现的漏洞,比我这一辈子之前发现的加起来还多。
- 我们用这个模型扫描了大量开源代码,首先针对的是操作系统,因为这是支撑整个互联网基础设施的代码。
- 在 OpenBSD 上,我们发现了一个存在了 27 年的漏洞——我只需向任意 OpenBSD 服务器发送几段数据就能让它崩溃。
- 在 Linux 上,我们发现了个多个漏洞,作为一个没有任何权限的用户,只需在机器上运行一个二进制文件,就能将自己提升为管理员。
- 对于每一个发现的漏洞,我们都通知了实际维护软件的人员,他们随即进行了修复并部署了补丁。
5. 愿景与总结
- 合作伙伴: 对于那些孜孜不倦维护软件的开发者而言,一个能帮助他们在漏洞被利用之前发现并修复的模型,是一个无价的工具。
- Dario Amodei: 我们已与美国政府多个部门的官员进行了沟通,并表示愿意与他们合作,共同评估这些模型的风险,并帮助防御这些风险。
- Anthropic 研究员: 我们生活中的一切现在都依赖于软件。软件吞噬了世界,我们生活中的每一个模拟层面,都以某种方式映射到了数字领域。
- 研究员: 网络安全就是社会的安全。各行各业携手合作,共同构建更强大的防御能力,这至关重要。没有一个组织能看到全貌并独自应对这一切。
- Dario Amodei: 这不是几周的项目就能完成的事,这将是几个月、甚至可能几年的工作。但我希望最终我们能达到这样一个状态:世界的软件、客户数据、金融交易和关键基础设施,都比以前更加安全。
(视频翻译:Jesse Lau 遁一子) http://t.cn/AXMLAiIc
发布于 美国
