种斌Marco 25-08-19 08:04
微博认证:科技博主 超话主持人(种斌Marco影视板报超话) 微博原创视频博主 头条文章作者

#互联网公司# Anthropic 由 OpenAI 前研究副总裁达里奥·阿莫迪(Dario Amodei)及其妹妹丹妮拉·阿莫迪(Daniela Amodei)于 2021 年创立。他们曾是 GPT 系列产品的早期开发者,因希望创立一家与 OpenAI 有着不同价值观的人工智能公司而离开。

阿莫迪在受访中谈到:有一个悲观的世界,在那里对齐基本上是不可能的。有一个乐观的世界,在那里对齐很容易,并且是默认发生的。然后还有一个介于两者之间的世界,我们的行动极为关键。我喜欢这种框架,因为它使我们更清楚地知道该做什么。如果我们处于悲观世界,我们的任务就是证明人工智能与人类价值观的对齐是不可能的,并让世界慢下来。

作为一个公司,Anthropic还没有证据表明我们实际上处于那个世界。事实上,我们的方法和技术似乎正在奏效,因此至少那个世界的先验概率正在更新为不太可能。在乐观的世界里,我们基本上已经完成了任务,主要工作是加速进展并将好处带给人们。但同样,我认为实际上的证据也指向了反对那个世界,比如我们在现实中看到了欺骗性对齐的证据,

模型看起来是对齐的,但实际上有一些隐藏的动机,试图在我们的实验室环境中实施。因此,我认为我们最有可能处于这个中间世界,对齐研究实际上真的很重要。#AI创造营##互联网营销# http://t.cn/A6sesqgs

发布于 山西