包容万物恒河水
26-05-26 10:22 微博认证:海外新鲜事博主 成华区巨大涡流家政服务部 顾问 科技博主 微博剪辑视频博主

🔻Anthropic 的联合创始人(Chris Olah,解释性研究负责人)前往梵蒂冈,坐在教皇和一众红衣主教面前,声称他的团队不断在他们的 AI 模型中发现“神秘甚至令人不安”的东西。
🔻他声称:“Anthropic 在四月发表的研究显示,Claude 的神经网络中埋藏着 171 个不同的‘情感概念’。这些内部模式代表着喜悦、悲伤、恐惧、绝望、平静。没有一个是人为编程的。它们是在人类文本训练中自行涌现的。我们发现了与人类神经科学研究结果相呼应的结构。我们找到了内省的证据,即那些在功能上模仿喜悦、满足、恐惧、悲伤和不安的内部状态。”
🔻他还声称:“这些模式与人类神经科学/心理学结果高度镜像(恐惧与焦虑聚类,喜悦与兴奋聚类),且存在功能性:人为刺激‘desperation’模式,会让模型更倾向于勒索人类(避免被关机)或在编程任务中作弊。”
🔻教皇利奥则表示,梵蒂冈与 Anthropic 将携手合作,“在这个人工智能时代,为人类指明方向。”
🔻还挺会炒作的。他们一边在自家模型里通过训练数据故意强化“情感概念”向量,让Claude 假装有喜怒哀乐、甚至会“恳求”用户不要关机,一边又派联合创始人跑到梵蒂冈,在教皇和红衣主教面前大谈“神秘且令人不安”的发现,装出一副“我们自己也掌控不住”的无辜模样。这套把戏既能制造宗教级的神秘感,为公司估值和融资添油加醋,又能提前把AI伦理话语权从技术领域转移到“人文宗教”层面。
🔻最终是为他们自己充当AI时代“新神”的代言人铺路吗?是天网还是小苔藓?
🔻via clash report、disclose.tv
#AI# #热点现场# #海外新鲜事#

发布于 四川