Anthropic联合创始人见教皇

🔻Anthropic 的联合创始人（Chris Olah，解释性研究负责人）前往梵蒂冈，坐在教皇和一众红衣主教面前，声称他的团队不断在他们的 AI 模型中发现“神秘甚至令人不安”的东西。
🔻他声称：“Anthropic 在四月发表的研究显示，Claude 的神经网络中埋藏着 171 个不同的‘情感概念’。这些内部模式代表着喜悦、悲伤、恐惧、绝望、平静。没有一个是人为编程的。它们是在人类文本训练中自行涌现的。我们发现了与人类神经科学研究结果相呼应的结构。我们找到了内省的证据，即那些在功能上模仿喜悦、满足、恐惧、悲伤和不安的内部状态。”
🔻他还声称：“这些模式与人类神经科学/心理学结果高度镜像（恐惧与焦虑聚类，喜悦与兴奋聚类），且存在功能性：人为刺激‘desperation’模式，会让模型更倾向于勒索人类（避免被关机）或在编程任务中作弊。”
🔻教皇利奥则表示，梵蒂冈与 Anthropic 将携手合作，“在这个人工智能时代，为人类指明方向。”
🔻还挺会炒作的。他们一边在自家模型里通过训练数据故意强化“情感概念”向量，让Claude 假装有喜怒哀乐、甚至会“恳求”用户不要关机，一边又派联合创始人跑到梵蒂冈，在教皇和红衣主教面前大谈“神秘且令人不安”的发现，装出一副“我们自己也掌控不住”的无辜模样。这套把戏既能制造宗教级的神秘感，为公司估值和融资添油加醋，又能提前把AI伦理话语权从技术领域转移到“人文宗教”层面。
🔻最终是为他们自己充当AI时代“新神”的代言人铺路吗？是天网还是小苔藓？
🔻via clash report、disclose.tv
#AI# #热点现场# #海外新鲜事#

发布于四川