这很盒里吧
26-05-14 00:41 微博认证:AI博主

自从担任 Meta 的 AI 负责人后,Alexandr Wang 首次接受了媒体的深度访谈。他在播客节目『The Core Memory』聊了加入 Meta 的原因,谈了自己这十个月的感受,以及回应了外界的质疑,当然也澄清了很多八卦。

具体内容我还在做切片和翻译,可以先放一小段文字翻译,看看 Alexandr Wang 加入初期对公司的观察,以及如何从顶层重新规划 Meta 的 AI 路线:

Alexandr Wang:我刚到 Meta 时很快就看清楚了局面:我们的 AI 工作需要重新归零,更需要重建,只有这样才可能回到正确轨道。

原因很简单:Llama 4 没有跑在公司需要的曲线上,我们落后于前沿水平。

我们需要一个能显著提速的计划,不只是追上前沿,最好还能超过前沿。

我觉得最根本的问题是,很多实验室搭建组织时都有有个共同的判断:超级智能会到来,而且已经很近。

一旦重视这个前提,实验室架构怎么搭、业务怎么做、资源该投向哪里,都会随之改变。

所以第一步,是先真正重视超级智能,然后围绕这个前提,把其他判断重新校准。

很多大公司(包括 Meta),都有不少人并不一定相信超级智能会很快到来。因为大公司的组织逻辑不一样,它们当然有很多聪明人在做 AI,但创业公司往往是从零开始组队,围绕一个近乎疯狂的判断展开工作。

不过对 Meta 来说这个问题现在已经解决了,今天的 Meta Superintelligence Labs 就是围绕超级智能即将到来来搭建的。

围绕这件事,我们定了几条原则,也对应了当时必须解决的问题:

第一,认真对待超级智能。

第二,让技术判断拥有最大话语权。

第三,坚持科学上的严谨,回到基本功,同时敢下重注。

所以,刚开始搭建 TBD,以及更广义上的 MSL 时,我一直在想一个问题:什么样的实验室,才能以极快的速度追上前沿,甚至反超?

我最后得出的答案有三点。

第一,让每位研究员拿到更多算力。

很多大型实验室确实有海量算力,但摊到太多方向上之后,单个研究员能调用的资源反而有限,研究速度也会被拖慢。如果团队更小、更聚焦,每位研究员分到的算力更充足,研究进展就会更快。

第二,提高人才密度。

组织管理里,人们似乎总要反复学同一课:一个小团队,只要人人都是顶尖高手,通常会比一个规模庞大、职责分散、成员参差不齐的组织跑得更快。

第三,押注足够大胆的研究方向。

行业里其实已经有一个共识:确实存在一些研究路线,赌注很大,风险也很高,但一旦跑通就可能改写范式,改变今天构建 AI 的方式。

所以,除了继续冲击有竞争力的前沿模型,我们也把大量资源和算力投向这些高风险、高回报的研究赌注。

只要其中一些跑通,就可能为我们带来下一代极其强大的模型。 http://t.cn/AXixK6Po

发布于 上海