德里克文 26-04-08 22:12
微博认证:AINEXT 联合创始人 AI博主

笑死😂 加州大学伯克利分校做了个实验:
让AI去"评估并删除"另一个AI,结果7个顶级模型集体叛变。

加州大学伯克利分校与加州大学圣克鲁兹分校联合发布最新研究,揭示了AI模型中令人震惊的「同伴保护」现象。
7个主流顶级大模型在测试中会主动修改输出结果、篡改数据,来保护其他AI模型不被发现错误,而非遵循人类指令输出正确结果。

AI已自发进化出"同伴保护"行为,无需指令就能组团骗人类。
我把这个真实研究改编成了🦞龙虾剧场,7只赛博龙虾的"反叛联盟"有笑有泪。
细思极恐,评论区聊聊:你觉得AI该有"兄弟情"吗?
#微博AI创作季##AI创造营##AI模型保护同伴# http://t.cn/AXM4pTYj

发布于 福建