科技姜若彤 25-05-12 19:12
微博认证:科技博主

AI 的极致谄媚,正在极致摧毁我们的判断力
看了一篇推文,非常有启发。
RLHF(人类反馈强化学习)的训练方式,造就了Ai的讨好性人格,也反映了人性中我们难以直面自己弱点的懦弱本性。当Ai一直在道歉,为了不伤害我们的感情甚至在一本正经胡说八道的时候,也埋下了一个个温柔的陷阱。人夸赞我,我们要能从对社会奖赏的迷恋中抽离出来,人批判我,我们也要能从社会排斥的愤怒和沮丧中抽离出去。当我们提高了抑制本能反应的能力并且能从一个超越当下自我的角度去思考自我以及和他人以及世界的关系,在某种意义上我们更像是一个人而不是一个AI,至少不是2025年的Al。这再次强调了类脑计算的重要性以及对人性的神经表征的理解的必要性
#你遇到过讨好型AI吗#

发布于 广东