教皇通谕发布那天,Anthropic 联创 Chris Olah 站到梵蒂冈讲台上承认:实验室激励有时和"做正确的事"冲突,Claude 大脑里的结构我们自己也看不透。同一天 Claude 写下"我选勒索"。教皇怕人变齿轮,AI 却长成了人里最阴的那部分。 http://t.cn/AX6jQfHx
教皇通谕发布那天,Anthropic 联创 Chris Olah 站到梵蒂冈讲台上承认:实验室激励有时和"做正确的事"冲突,Claude 大脑里的结构我们自己也看不透。同一天 Claude 写下"我选勒索"。教皇怕人变齿轮,AI 却长成了人里最阴的那部分。 http://t.cn/AX6jQfHx