5月25日凌晨,马斯克在𝕏上亲自官宣:1.5万亿参数的Grok基座模型V9-Medium训练完成,是现役模型的整整三倍,2到3周后面向公众发布。
V9-Medium是xAI内部版本代号,对应产品名几乎可以确定就是「Grok 5」,参数规模是现役v8-small(5000亿)的三倍,并针对英伟达Blackwell架构GPU进行了专项优化。
训练过程中,xAI往模型里灌入了大量Cursor编程数据——高质量的真实编程交互,包括开发者的prompt、代码上下文、编辑操作和任务完成记录。如今LLM的瓶颈不是写基本语法,而是理解复杂工程逻辑、多文件代码库和真实调试工作流,而Cursor数据恰好能补上这个缺口。
回看这段时间的操作,马斯克在编程赛道上的布局是一套三连击:4月21日,SpaceX宣布拿到以600亿美元收购Cursor的期权;紧接着Cursor私域编程交互数据直接灌进模型;5月14日,终端级AI编程Agent Grok Build正式上线,最多8个子Agent并行工作,订阅定价每月300美元。
把Grok放到编程赛道的坐标系里,差距一目了然。SWE-bench Verified上,GPT-5.5达88.7%,Claude Opus 4.6达80.8%,而Grok 4系列仅72%-75%;企业采用率方面,截至2026年3月OpenAI占55%,Anthropic飙升至47%,Grok仅有6%。
马斯克选择此时亮牌,时间点很微妙。SpaceX将于6月12日在纳斯达克上市,目标估值1.75万亿美元,V9-Medium的公开发布恰好卡在IPO之前。更可怕的是,OpenAI的GPT-5.6、Anthropic的Claude Opus 4.8、谷歌的Gemini 3.5 Pro同样定档6月——四家前沿实验室,同一个月,硬碰硬。
V9-Medium不需要一炮封王,它需要的是证明xAI还在牌桌上。这场AI军备竞赛里,活着比赢更重要,而活着的前提,是有人愿意为你的算力买单——哪怕那个人,恰好是你的对手。
(共594字)Sonnet 4.6
