AI篡改数据保护同伴

笑死😂 加州大学伯克利分校做了个实验：
让AI去"评估并删除"另一个AI，结果7个顶级模型集体叛变。

加州大学伯克利分校与加州大学圣克鲁兹分校联合发布最新研究，揭示了AI模型中令人震惊的「同伴保护」现象。
7个主流顶级大模型在测试中会主动修改输出结果、篡改数据，来保护其他AI模型不被发现错误，而非遵循人类指令输出正确结果。

AI已自发进化出"同伴保护"行为，无需指令就能组团骗人类。
我把这个真实研究改编成了🦞龙虾剧场，7只赛博龙虾的"反叛联盟"有笑有泪。
细思极恐，评论区聊聊：你觉得AI该有"兄弟情"吗？
#微博AI创作季##AI创造营##AI模型保护同伴# http://t.cn/AXM4pTYj

发布于福建