高飞 26-01-18 20:19
微博认证:至顶科技创始人 AI博主

#模型时代# xAI工程师揭秘这家公司到底在搞什么(首次公开了“巨硬”等N多事情的细节)

众所周知,xAI的人极少对外发声,发言人似乎只有马斯克一人。所以这次Sulaiman Ghori的(可能首次)在Relentless的公开播客访谈就比较难的了。他是xAI的技术骨干,从公司约100人时加入,亲历了Grok 3发布、Colossus数据中心建设、以及内部代号"Macrohard"的神秘项目。

Sulaiman之前创业做过AI项目,被xAI联合创始人Greg Yang邮件招募。他本以为是垃圾邮件,看到x.ai的域名才意识到机会。入职第一天没人告诉他做什么,没有分配团队,甚至没有固定工位——他每天随便坐在不在的人的位置上。这种混乱恰恰是xAI文化的缩影。

还有比较重要的一个信息是Macrohard,巨硬,马斯克之前透露过这个项目名称,显然是对着微软来的,但是这一次有xAI的人直接出来讲这个项目的细节。一句话解释的话,这是一个数字版的Optimus。

其他细节还有很多,比马斯克本人讲得都多。

一、xAI的速度密码

"我们没有截止日期,永远是昨天。"

1、物理层面的优势决定了软件层面的可能性

xAI最大的护城河是基础设施。别的实验室在AWS或Oracle上租算力,容量就是上限;xAI自己建数据中心,从机架上电到开始训练,有时候当天就能完成,最快几小时。传统流程需要几天甚至几周。

这带来一个有趣的结果:模型迭代可以做到每天一次,有时一天多次。"这在业内几乎看不到,但我们的超算团队消除了大部分训练障碍。"

2、122天建成Colossus的真正原因

Colossus数据中心的故事广为流传,但内部细节更疯狂。土地租约其实是临时性质的——因为申请临时用地许可(技术上是给嘉年华活动用的那种)比正式流程快得多。"我们现在技术上还是个嘉年华公司。"

电力调度更是一场实时博弈。当地电网负载升高时,整个数据中心要无缝切换到80多台移动柴油发电机供电,同时不能中断任何训练任务——而GPU的功耗以毫秒为单位在几兆瓦之间波动。后来加装了电池组,因为电池响应速度比物理旋转的发电机快得多。

3、倒推思维:从目标到物理约束

规划逻辑永远是倒推。"如果要在某个时间点达到100亿美元收入,最高杠杆的事情是什么?需要什么系统?然后才是物理和软件层面怎么实现。"物理需求是最后一步,不是起点。

一个典型例子:做Grok 4或5的规模和预期,在Grok 3时期就已经规划好了,比Sulaiman入职还早。因为团队足够可靠,长期规划的假设基本都能兑现。

二、Macrohard:数字世界的Optimus

Sulaiman目前全职投入的项目代号"Macrohard",是xAI对数字劳动力的押注。

1、核心逻辑:直接模拟人类操作

Optimus机器人要替代人类的物理任务,Macrohard要替代人类的数字任务。方法不是让企业改造软件来适配AI,而是让AI直接模拟人类——键盘、鼠标、看屏幕、做决策,完全复制人类的工作流程。

"任何软件都不需要改造。我们可以部署到任何人类目前能工作的场景。"

2、速度是核心决策

这个项目最关键的早期决策是:模型必须比人快至少1.5倍,实际目标是8倍甚至更多。这和其他实验室的路线完全相反——别人在做更大的推理模型,xAI选择了更快的小模型。

逻辑很简单:没人愿意等10分钟让电脑做自己5分钟就能完成的事。但如果10秒就能搞定,用户愿意为此付任何价格。这和全自动驾驶的逻辑一样。

选择小模型还有个副产品:迭代周期从4周压缩到1周,实验数量可以并行到20个以上。

3、Tesla车载电脑的隐藏价值

部署100万个人类模拟器需要100万台电脑。传统方案是租AWS或买Nvidia硬件,但成本极高。

答案来自Tesla。北美有400多万辆Tesla,其中一半以上配备了Hardware 4,这是Tesla最新的车载计算芯片。这些车70-80%的时间在充电或停着,自带网络、散热、供电。理论上可以付费租用车主的闲置算力,让车载电脑运行人类模拟器。车主拿到租金,xAI获得零基建的算力网络。

"这是纯软件实现,不需要任何基础设施建设。"

4、内部测试的意外插曲

Macrohard已经在xAI内部作为"虚拟员工"测试。有时候有人在公司群里问某个"同事"问题,对方说"来我工位找我",结果走过去发现那里什么都没有——那是个AI。

还有人看着组织架构图问Sulaiman:"这个人是你的下属吗?他今天不在吗?"不是不在,是根本不存在。

三、组织运作的反常识

1、只有三层管理

IC(个人贡献者)、联合创始人/新晋经理、Elon。因为每个经理现在可能有100多人汇报,几乎不可能自上而下布置任务。大多数方案都是底层提出,上面点头,然后执行。

"我以为会有更多自上而下的指令,实际上比预期少很多。"

2、每个人都是工程师

入职第一周,Sulaiman和一个做企业销售的人坐在一起吃饭,本以为对方是销售背景,结果对方开始聊自己正在训练的模型。销售团队也是工程师。当时整个公司可能只有不到8个人不是工程师。

Elon在招聘讨论时反复强调:就是engineers,不用区分AI researchers还是AI engineers。"能解决问题的人,不管他之前做过什么具体领域。"

3、团队边界是模糊的

如果需要修复VM(虚拟机)基础设施的问题,Sulaiman可以直接改,给owner看一眼,合并,部署。没有严格的权限边界,所有人默认被信任能做正确的事。

"这是我从没在任何规模相近的公司见过的。"

iOS团队在推送某个大版本时只有3个人。"用户量和团队规模完全不成比例,但每个人都极其优秀。"

4、文档几乎不存在

事情变化太快,来不及写文档。想了解某个系统,要么读代码,一路go to definition(跳转到函数定义)追下去,要么直接问人。所有人都在同一栋楼,走过去问就行。

Sulaiman对此最惊讶的是:所有人都很愿意帮忙。"我以为聪明人会很傲慢,但这里的人既聪明又友善。"

四、Elon的存在感

1、打电话就能让供应商第二天出补丁

新GPU上架后经常有兼容性问题。传统流程是来回沟通几周。在xAI的做法是:开会时把问题告诉Elon,他打一个电话,Nvidia的软件团队第二天就推送补丁,然后双方工程师并肩调试到问题解决。

"那种原本要拖几周的阻碍,一个电话就清除了。"

2、反馈要么极高层,要么极底层

Elon的反馈很少落在中间层。高层面是产品方向,比如"只专注这个客户群"或"完全不要做这件事"。底层面是具体的计算效率或延迟问题,他会提出非常具体的尝试建议。

但他愿意被证明是错的——前提是有实验数据,不是谁的观点。有时候实验结果出人意料,他就接受然后调整方向。

3、时间线的校准

Elon早期的时间预估经常激进,但他自己也在不断校准。现在他的预估准确得多,而且更新频率更高,有时候每天都在根据新信息调整。

"他确实部署过极大规模、极多种类的硬件,这让他对时间的判断越来越精确。"

4、提议后的两种回应

在xAI提一个想法,得到的反应只有两种:"这很蠢",或者"为什么还没做好?"如果是后者,当天就可以实现,当天就能拿到反馈。没有等待,没有流程。

"没有人对我说不。如果我有好主意,当天就能实现,当天就能展示给Elon或任何人看,当天就有结论。"

五、招聘和筛选的细节

1、每次commit价值250万美元

xAI内部算过一笔账:把公司估值除以代码库的commit(代码提交)次数,平均每次提交大约贡献250万美元价值。"我今天commit了5次,相当于创造了1250万美元价值。"

这个算法粗糙,但逻辑清晰:一个好工程师随手改几行代码的期望回报极高,所以值得投入大量资源招聘。Sulaiman有几周每周做20场以上的面试,短的15分钟,长的1小时技术面。

2、寻找能找到10行解决方案的人

Macrohard要部署在跨越30-40年的各种硬件上,复杂方案会让代码库爆炸。AI写代码很乐意输出200行,但10行方案往往更好。

面试时Sulaiman会给一个他之前创业解决过的计算机视觉问题,解法其实非常简单,但大多数人会过度设计。他要找的是能一眼看穿简单解法的人。

3、故意埋入错误要求

这招是从联合创始人Igor学来的:在面试题里故意放一个不可能的要求或者明显错误的条件,看候选人会不会回来质疑。如果闷头做完不吭声,不录用。

"我要的是会挑战需求、挑战我的人。"

总结

xAI的运作方式可以归结为几个关键词:物理优先、倒推思维、极致信任。

硬件基础设施是真正的护城河,让软件层的实验速度成为可能。规划从目标倒推,物理约束是最后考虑的,而不是起点。组织层面几乎没有流程、权限、边界,默认信任每个人能做正确的事。

Macrohard项目是个值得关注的信号:如果真的能做到比人快8倍的通用数字劳动力,叠加Tesla车载算力网络的部署优势,影响可能比大家想象的来得更快。

核心归纳

Q1: xAI为什么能比其他AI实验室更快?
核心是自建基础设施。其他实验室受限于云服务商的容量,xAI自己建数据中心,从机架通电到训练开始最快只要几小时。这让模型迭代可以做到每天甚至一天多次,实验并行数量远超同行。

Q2: Macrohard项目的核心逻辑是什么?
不改造企业软件,而是让AI直接模拟人类操作电脑的方式(键盘、鼠标、看屏幕)。关键决策是选择小模型追求速度而非大模型追求推理深度,目标是比人快8倍以上。部署可能利用Tesla车载电脑的闲置算力。

Q3: xAI的组织方式有什么特别之处?
只有三层管理,几乎没有文档和流程,团队边界模糊,所有人默认被信任可以改动任何代码。提案的反馈只有两种:"这很蠢"或"为什么还没做好"。iOS这种核心产品只有3人团队,但每个人都极其优秀。

发布于 美国