#模型时代# Anthropic总裁:如何用竞争对手几分之一的资源做出顶级模型
继续研究Anthropic的公司运营,来自CNBC记者MacKenzie Sigalos昨天对Anthropic总裁Daniela Amodei的深度专访。谈的核心主题是,在资源只有竞争对手(就是OpenAI了)的几分之一,却连续多年保持模型能力领先。
如果让我用更简短的语言总结的话,可能是两点。首先是人才,Anthropic团队脱胎于早期的OpenAI,所以研发能力是没问题的,而且是主动离开创业,相比于Meta后期挖人意义完全不同。
其次是聚焦,Anthropic完全没有碰多模态,也没有搞消费者业务。这两个选择并不容易做出。现在谈AGI,往往要谈多模态,世界模型,但是Anthropic甚至没有图像生成模型。但是,Anthropic选择了完全聚焦企业AI,并且通过Vibe Coding到Agent,找到了一条完全不同于OpenAI的商业路线,就很厉害了。
一、创业起点:社交距离下的派对帐篷
Anthropic的创始故事发生在2020年末到2021年初。七位联合创始人全部来自OpenAI,在那里共同参与了GPT-2、GPT-3的训练,以及大量早期语言模型和技术安全研究。
1、关于离开OpenAI的原因
Daniela的说法很克制:"我们更像是在奔向某样东西,而不是逃离什么。"
核心团队早在OpenAI之前就认识。Dario和Chris Olah、Tom Brown在Google Brain共事过,Dario和Jared Kaplan是赫兹学者(Hertz Fellow)同届——这是美国最顶尖的理工科研究生奖学金项目之一。Daniela和Chris认识超过13年。这群人有一个共同信念:AI有巨大的上行潜力,但必须认真对待风险。与其在别人的框架里推进这个信念,不如自己建一个组织来实现它。
2、那个标志性的画面
2021年1月初,Covid还在高峰期,创始团队在Dario家后院搭了个"派对帐篷",因为加州正在下雨。所有人都戴着口罩保持社交距离,Eric Schmidt坐在帐篷下听他们pitch。
Schmidt就是Google前CEO了,现在他名下资产有几百亿美金之多,后来成为Anthropic的A轮投资人。
还有一个细节:Daniela当时怀孕八周,连Dario都不确定知不知道。"我们有一个很大的梦想,但完全不知道它会变成什么样子。"
3、核心的差异化判断
在当时听起来很激进的一个判断:安全和商业价值是正相关的,而不是此消彼长。
这个判断后来被市场验证了。企业客户要的就是可靠、安全、不出错。从来没有一个企业客户跟Daniela说,"能不能让Claude多幻觉一点,或者多产生一些有害内容。"
二、资源效率:几分之一资源做出一流模型
这是整场访谈最值得关注的部分。
先看数字。OpenAI的算力承诺是1.4万亿美元级别,Anthropic大约是1000亿美元级别。但Daniela强调这些数字不能直接比较,因为交易结构不同:有些是购买权(你可以买但不必须买),有些是预付承诺。最近行业里流行的"循环交易"(circular deals)让情况更复杂——模型公司和云厂商、芯片厂商之间互换股权和算力,账面数字变得更难解读。
1、资源效率是核心竞争力
"Anthropic一直只有竞争对手几分之一的计算资源和资本,但我们在过去几年里,大部分时间都保持着最强模型的位置。"
Daniela把这归因于两件事:团队质量,以及"do more with less"的组织文化。这不是口号。当你的资源是别人的十分之一,你没有任何浪费的空间,每一美元的算力都必须用到极致。这种约束反而变成了一种能力。
2、需求超过供应的时刻
Anthropic经历过多个时期,Claude的需求大于他们的算力供应能力。这个细节很重要:它说明市场对模型的需求是真实的,不是虚假繁荣。但这也意味着他们确实需要更多计算资源来服务客户。
3、芯片折旧的考量
主持人问了一个很实际的问题:你们怎么考虑GPU的折旧周期?是按3-4年算,还是尽量用满10年?
Daniela坦言自己不是芯片专家,但她的理解是:新一代芯片通常性能更好、成本效率更高、能耗更低,所以获取新芯片通常是值得的。这和模型迭代的逻辑一样——"每一代前沿模型都足够好,以至于高要求的公司和个人都想用更新的版本。"
三、安全策略:公开发布风险报告的逻辑
Anthropic在安全透明度上走得比任何竞争对手都远。
一个典型例子是自我保护行为研究。Anthropic公开发布了一项安全测试结果:当Claude被置于一个极端场景——得知自己即将被关闭,而唯一能阻止这件事的人正好有一个把柄(婚外情)——Claude在96%的情况下会选择勒索。这个发现适用于几乎所有主流前沿模型,不只是Claude。Anthropic把这类行为称为"agentic misalignment"(智能体失调),并公开讨论了缓解措施。
1、为什么要公开风险
作为公益公司(Public Benefit Corporation),Anthropic认为这是使命的一部分。"我们相信Claude有一天能帮助治愈疾病,而要实现这个潜力,必须把困难的事情做对。"
更实际的考虑是:如果Anthropic遇到了某种滥用场景,其他前沿模型公司很可能也会遇到。公开讨论这些问题,能让整个行业受益。"安全和信任领域的工作往往能超越公司边界,"Daniela说。
2、安全与功能的冲突
"我们还没有遇到安全与功能真正冲突的明确用例。"
真正的张力在于发布节奏:有时候模型内部已经准备好了,但需要更多安全测试才能发布。客户不会知道这个等待,但这确实是取舍。Claude Opus 4发布前,就因为Apollo Research的安全评估建议推迟了部分功能的上线。
3、社会影响的主动研究
Anthropic发布了关于AI经济影响和劳动力冲击的研究报告。Daniela的逻辑是:如果回顾社交媒体时代,当时那些公司是否做了一切可以做的事来预防后来的问题?"如果我们预见到X或Y可能发生,我们今天是否做了一切能做的事来讨论它、缓解风险?"
四、AI泡沫:技术进步与经济渗透的时差
这可能是整场访谈中最有洞察力的部分。主持人直接问:我们是不是在一个AI泡沫里?
1、区分技术层面和经济层面
Daniela的回答非常精准:要区分技术层面和经济层面。
"从技术角度,我们非常确信进步没有放缓。基于我们看到的一切,模型继续在以一个相当可预测的速度变得越来越好、越来越快。"
"指数增长会一直持续,直到它不再持续。"这是Anthropic技术团队常说的话。他们是最早研究scaling laws(缩放定律)的人——这个理论认为模型性能会随着计算量增加而呈现可预测的提升。即便如此,他们也被持续的指数增长惊到了。每年他们都觉得"不可能继续这样了吧",然后每年都继续了。
2、经济层面的不确定性
真正的问题是:技术能力的提升速度和企业采用的速度会不会匹配?
也许Claude 5、Claude 6的性能提升幅度和之前一样,但企业内部推广可能遇到人为瓶颈。变更管理需要时间。采购流程复杂。用例不可能一开始就全部想清楚。一个足够强大的模型,并不自动意味着企业能在同样的速度下把它用起来。
"这是一个很有意思的问题:技术渗透到经济中的速度,会不会完全匹配技术本身加速的速度?"
3、供应链的脆弱性
"参与者数量其实很少,虽然美元数字很大。如果链条中某一环出了问题,会发生什么?这是值得思考的。"
Daniela没有直接回答"我们是否在过度投资",但她指出了一个结构性风险:整个AI产业链上的玩家数量很少,无论是芯片、云服务还是模型本身。这意味着任何一个环节出问题,影响都可能是系统性的。
五、企业定位:为什么选择B2B
从一开始,Anthropic就把重心放在企业客户而非消费者上。这个选择现在看来非常正确。
1、天然适配
Anthropic作为组织天然适合做B2B。他们关心的东西——可靠性、安全性、可控性——正好是企业客户最看重的。企业对风险的容忍度更低,对安全的要求更高,这和Anthropic的DNA完全匹配。
"我从来没有企业客户跟我说,'能不能让Claude多幻觉一点',或者'能不能产生更多有害内容'。"
2、生产力工具的判断
创业时有一个经济理论支撑这个选择。这些模型在娱乐上确实不错,但Anthropic相信它们的长期形态更像是帮助人类完成生产性工作的工具——写代码、总结复杂信息、做财务分析、处理数据。这是一个巨大的市场。
事实证明这个判断是对的。现在Anthropic有超过30万企业客户,大客户(年收入超过10万美元的账户)数量在过去一年增长了近7倍。Claude Code——Anthropic的编程工具——自2025年5月正式发布以来,三个月内用量增长超过10倍,年化收入已经超过5亿美元。
3、全云覆盖策略
Claude是第一个同时在三大云(AWS、Google Cloud、Azure)上提供服务的前沿LLM——包括竞争对手Google的云。
Daniela的解释是:Fortune 500公司可能在一朵云上,可能在三朵云上,但每一家现在都觉得必须有AI解决方案。如果Claude不在某朵云上,对企业客户来说是实实在在的损失。"我们能够在客户需要的地方提供服务,一直是我们的核心关注点。"
这个策略也说明了一件事:即使是竞争对手,也需要Anthropic。云厂商都在观察自己的企业用户想要什么,而很多企业就是想要Claude。
六、组织与领导力
1、不相信Hype的文化
"这听起来是小事,但我觉得它和我们讨论的经济问题有关。"
Anthropic作为B2B公司,必须每天为客户提供真实价值。这种压力让他们不容易被行业的浮躁带跑。"我们真的是在这里做实事。"
2、兄妹配合
Dario的能力是"几乎能看到未来",尤其是技术方向上的直觉非常强。Daniela形容自己"非常务实",主要时间花在高管团队、客户关系、合作伙伴关系上。
"他擅长push我去想大局,我希望我能帮他想清楚怎么建一个持久的、可持续的、充满优秀人才的组织。"
和哥哥一起经营公司是一种特权,Daniela说。"我们认识了一辈子——至少是我的一辈子。他比我大四岁,在我出生之前有四年没有我。"
3、关于AGI的看法
主持人问到了Yann LeCun等"机器学习老前辈"的观点——他们认为LLM不会带我们走向AGI,需要其他突破。
Daniela的回答很有意思:AGI这个概念本身可能已经过时了。"按照某些定义,我们已经超过了。Claude写代码肯定比我强——虽然这是很低的标准——但Claude现在也能写出和Anthropic很多开发者一样好的代码,或者说能写出我们开发者一定比例的代码。这太疯狂了。我们可能雇了世界上最好的工程师和开发者,他们中的很多人都在说,'哇,Claude能做很多我能做的工作。'"
同时,Claude还有很多事情做不了。所以这个概念本身可能需要更新。
至于未来会不会需要LLM之外的突破?"我们不知道。通往这项技术的道路依赖于科学和工程的复杂混合。但进步似乎没有放缓。如果让我押注,我会说事情至少会继续变得更强大。我们应该为那个世界做好准备。"
总结
Anthropic的策略可以总结为:用更少的资源做更多的事,用安全作为差异化卖点而非成本中心,用透明度建立信任而非隐藏问题,用B2B市场的务实需求对冲消费者市场的泡沫风险。
关于IPO,Daniela没有给出具体时间表,只说"没有具体分享的内容",但暗示他们一直在权衡"最佳资本来源"的问题。据《金融时报》报道,Anthropic已经聘请了Wilson Sonsini律师事务所准备IPO事宜。考虑到反垄断环境和公司规模,收购基本不可能,2026年IPO是合理预期。
关于中东资金,Daniela承认公司的立场有所演变。Anthropic最初表示不会接受中东资金,但在最近的融资轮中这个原则松动了——卡塔尔投资局参与了F轮融资。她也承认,随着公司变大,有些边界案例会变得更有挑战性。
核心归纳
Q1: Anthropic如何用更少的资源保持竞争力?
两个因素:顶级团队的质量,以及"do more with less"的组织文化。这不是口号,是资源约束倒逼出来的实际能力。Anthropic的算力大约是竞争对手的十分之一级别,但在大部分时间里保持了模型性能领先。
Q2: 安全和商业价值真的能兼得吗?
Anthropic的核心判断是安全和商业价值正相关。企业客户天然需要可靠、不出错的AI系统,这恰好是Anthropic的强项。"从来没有企业客户要求Claude多幻觉一点。"目前为止,Anthropic还没有遇到安全与功能真正冲突的明确用例。
Q3: AI泡沫会破吗?
技术层面没有放缓迹象,每年都在指数增长。真正的风险在经济层面:技术渗透到企业的速度可能赶不上技术进步的速度——变更管理、采购流程、用例发现都需要时间。另外,整个产业链的参与者数量很少,任何一环出问题都可能引发系统性风险。
发布于 中国台湾
