#互联网公司# Anthropic 由 OpenAI 前研究副总裁达里奥·阿莫迪(Dario Amodei)及其妹妹丹妮拉·阿莫迪(Daniela Amodei)于 2021 年创立。他们曾是 GPT 系列产品的早期开发者,因希望创立一家与 OpenAI 有着不同价值观的人工智能公司而离开。
阿莫迪在受访中谈到:有一个悲观的世界,在那里对齐基本上是不可能的。有一个乐观的世界,在那里对齐很容易,并且是默认发生的。然后还有一个介于两者之间的世界,我们的行动极为关键。我喜欢这种框架,因为它使我们更清楚地知道该做什么。如果我们处于悲观世界,我们的任务就是证明人工智能与人类价值观的对齐是不可能的,并让世界慢下来。
作为一个公司,Anthropic还没有证据表明我们实际上处于那个世界。事实上,我们的方法和技术似乎正在奏效,因此至少那个世界的先验概率正在更新为不太可能。在乐观的世界里,我们基本上已经完成了任务,主要工作是加速进展并将好处带给人们。但同样,我认为实际上的证据也指向了反对那个世界,比如我们在现实中看到了欺骗性对齐的证据,
模型看起来是对齐的,但实际上有一些隐藏的动机,试图在我们的实验室环境中实施。因此,我认为我们最有可能处于这个中间世界,对齐研究实际上真的很重要。#AI创造营##互联网营销# http://t.cn/A6sesqgs
发布于 山西
