爱可可-爱生活 26-02-11 07:33
微博认证:AI博主 2025微博新锐新知博主

【当AI安全工程师选择离开:一场关于智慧与能力失衡的警告】

Anthropic的AI安全工程师Mrinank Sharma递交了辞呈,他在离职信中写道:“世界正处于危险之中。不仅仅是AI,不仅仅是生物武器,而是一系列相互关联的危机正在此刻同时展开。我们似乎正在逼近一个临界点:我们的智慧必须与我们影响世界的能力同步增长,否则后果将不堪设想。”

这封信在科技圈引发了激烈讨论。

有人质疑:既然认为世界危在旦夕,为什么不留下来继续战斗,反而选择离开?这不是在最关键的时刻当了逃兵吗?

但另一些人看到了更深层的无奈。一位业内人士分析了这封信的弦外之音:Sharma实际上在暗示Anthropic很难真正践行其安全理念。他在信中提到“我亲眼目睹了在组织内部,我们如何持续面对压力,被迫搁置最重要的事情”。商业竞争和短期利益不断侵蚀着安全团队的工作空间。

这并非孤例。过去18个月,各大AI实验室的高级安全研究人员持续流失:OpenAI的Jan Leike和Ilya Sutskever离开,Anthropic的对齐团队成员出走,Google DeepMind的安全研究员转向学术界。每一次离职都有各自的背景,但汇聚起来呈现的趋势值得警惕:最有能力造成伤害的组织,可能正在失去最有经验的安全团队。

更让人感到不安的是讨论中暴露出的普遍心态。有人冷嘲说这不过是“情绪脆弱的科技工作者崩溃后投身艺术”,有人直接质疑这是离职补偿谈判的筹码,还有人说安全工程师本来就只是公司用来装点门面的摆设。

一位AI领域的开发者写道:“作为这个行业的一员,我正在慢镜头般地看着一切发生。老板们期望更高的生产力,却不增加薪酬或假期。他们试图让开发者做十倍的工作成为常态,然后他们就不再需要那么多开发者了。”

有评论者援引了Daniel Schmachtenberger关于“元危机”和“摩洛克”的讨论。在这个框架下,现有的社会经济系统本身就像一个失控的、反社会的超级智能,不断将个体卷入博弈困境,没有人能独善其身,每个人都在为整体的毁灭添砖加瓦。

也许Sharma看清了一件事:一个安全工程师在体制内能做的事情极其有限。当你清楚地看到问题,却只能眼睁睁看着世界点燃自己,因为你的雇主会把短期收益置于灾难性风险之上,这种无力感足以让任何人崩溃。

有人设置了五年后的提醒,想看看那时世界是否已经崩塌。也有人设置了二十年后的提醒,并调侃说:“如果我们还在,我请你喝一杯。”

葛兰西在1930年写过一句话,如今读来格外应景:旧世界正在死去,新世界还在艰难诞生,现在是怪兽的时代。

x.com/maboroshi/status/1871245830199287925

发布于 北京