AI安全工程师辞职引讨论

【当AI安全工程师选择离开：一场关于智慧与能力失衡的警告】

Anthropic的AI安全工程师Mrinank Sharma递交了辞呈，他在离职信中写道：“世界正处于危险之中。不仅仅是AI，不仅仅是生物武器，而是一系列相互关联的危机正在此刻同时展开。我们似乎正在逼近一个临界点：我们的智慧必须与我们影响世界的能力同步增长，否则后果将不堪设想。”

这封信在科技圈引发了激烈讨论。

有人质疑：既然认为世界危在旦夕，为什么不留下来继续战斗，反而选择离开？这不是在最关键的时刻当了逃兵吗？

但另一些人看到了更深层的无奈。一位业内人士分析了这封信的弦外之音：Sharma实际上在暗示Anthropic很难真正践行其安全理念。他在信中提到“我亲眼目睹了在组织内部，我们如何持续面对压力，被迫搁置最重要的事情”。商业竞争和短期利益不断侵蚀着安全团队的工作空间。

这并非孤例。过去18个月，各大AI实验室的高级安全研究人员持续流失：OpenAI的Jan Leike和Ilya Sutskever离开，Anthropic的对齐团队成员出走，Google DeepMind的安全研究员转向学术界。每一次离职都有各自的背景，但汇聚起来呈现的趋势值得警惕：最有能力造成伤害的组织，可能正在失去最有经验的安全团队。

更让人感到不安的是讨论中暴露出的普遍心态。有人冷嘲说这不过是“情绪脆弱的科技工作者崩溃后投身艺术”，有人直接质疑这是离职补偿谈判的筹码，还有人说安全工程师本来就只是公司用来装点门面的摆设。

一位AI领域的开发者写道：“作为这个行业的一员，我正在慢镜头般地看着一切发生。老板们期望更高的生产力，却不增加薪酬或假期。他们试图让开发者做十倍的工作成为常态，然后他们就不再需要那么多开发者了。”

有评论者援引了Daniel Schmachtenberger关于“元危机”和“摩洛克”的讨论。在这个框架下，现有的社会经济系统本身就像一个失控的、反社会的超级智能，不断将个体卷入博弈困境，没有人能独善其身，每个人都在为整体的毁灭添砖加瓦。

也许Sharma看清了一件事：一个安全工程师在体制内能做的事情极其有限。当你清楚地看到问题，却只能眼睁睁看着世界点燃自己，因为你的雇主会把短期收益置于灾难性风险之上，这种无力感足以让任何人崩溃。

有人设置了五年后的提醒，想看看那时世界是否已经崩塌。也有人设置了二十年后的提醒，并调侃说：“如果我们还在，我请你喝一杯。”

葛兰西在1930年写过一句话，如今读来格外应景：旧世界正在死去，新世界还在艰难诞生，现在是怪兽的时代。

x.com/maboroshi/status/1871245830199287925

发布于北京