马斯克周末在X上连发三条,把Grok接下来的路线基本摊牌了。
Grok 4.5已经在SpaceX和Tesla内部跑了,基底是1.5T参数的V9模型,补充训练时把Cursor的代码数据喂了进去。
早期评估的结果是性能接近Opus,"有可能已经超越了"。
然后他补了一刀:现在的4.3版本,基底是去年12月训的0.5T小模型,"有根本性的缺陷"。
翻译成人话就是,过去一年大家用的Grok,底座其实很拉,4.5是一次真正意义上的大换血。
真正有意思的是后面的节奏。
八月要发的v9,2T参数,几周前才开始训练,但训练数据和配方相比之前是大幅升级。
几十位Starlink和Starship的顶尖工程师已经被抽去做AI,用马斯克的话说叫"accelerating"。
而且SpaceX今年会每个月发一个从零训练的新模型,持续迭代到年底。
这个密度已经不是"追赶"了,是在用火箭工程的节奏做AI。
Cursor被单独点名表扬了。
说在SFT和RL阶段的工程贡献很大,数据加在补充训练里效果不错,虽然不如放进初始训练里好,但还是帮了大忙。
连开源社区的协作模式都被拉进大模型竞赛了,说明马斯克确实把能调的外部资源全用上了。
#人工智能#
发布于 上海
