德卤爱开车
26-06-29 08:56 微博认证:微博新知博主 汽车博主 微博原创视频博主

马斯克周末在X上连发三条,把Grok接下来的路线基本摊牌了。

Grok 4.5已经在SpaceX和Tesla内部跑了,基底是1.5T参数的V9模型,补充训练时把Cursor的代码数据喂了进去。

早期评估的结果是性能接近Opus,"有可能已经超越了"。

然后他补了一刀:现在的4.3版本,基底是去年12月训的0.5T小模型,"有根本性的缺陷"。

翻译成人话就是,过去一年大家用的Grok,底座其实很拉,4.5是一次真正意义上的大换血。

真正有意思的是后面的节奏。

八月要发的v9,2T参数,几周前才开始训练,但训练数据和配方相比之前是大幅升级。

几十位Starlink和Starship的顶尖工程师已经被抽去做AI,用马斯克的话说叫"accelerating"。

而且SpaceX今年会每个月发一个从零训练的新模型,持续迭代到年底。

这个密度已经不是"追赶"了,是在用火箭工程的节奏做AI。

Cursor被单独点名表扬了。

说在SFT和RL阶段的工程贡献很大,数据加在补充训练里效果不错,虽然不如放进初始训练里好,但还是帮了大忙。

连开源社区的协作模式都被拉进大模型竞赛了,说明马斯克确实把能调的外部资源全用上了。

#人工智能#

发布于 上海