Grok V9-Medium完成训练

#how i ai#

昨天，马斯克在 X 上连发几条推文，透露了自家模型 Grok 的最新进展。信息量很大，而且每一个都指向同一个方向： Grok 正在全力冲刺编程能力。

先说模型本身的更新。

马斯克透露， Grok 最新的基础模型 V9-Medium已经完成训练，参数规模达到 1.5T 。作为对比，当前承载 Grok 全部生产流量的 v8-small 模型只有 0.5T 参数。这一次直接翻了 3 倍，属于代际级别的参数升级。

按照马斯克的说法， V9-Medium 在深度推理能力、知识储备、复杂上下文理解、长链式思考、复杂开发任务处理等方面都会有显著提升。微调工作正在推进，强化学习阶段几天后启动，按计划 2-3 周将正式向公众发布。

但最值得关注的，不止是参数规模，训练数据的变化才是重点。

在训练 V9-Medium 时，团队加入了大量来自Cursor 的真实用户数据。

Cursor 的数据来自数百万开发者的真实工作流，包含开发者描述需求、定位问题、读取上下文、修改文件、修复报错、迭代追问等全流程工程场景信息。这些数据能为 Grok 补充真实工程场景的"手感"，不单单只停留在理论层面的代码生成。

简单来说，以前的 Grok 可能更像个"会写代码的理论派"，加入 Cursor 数据后，它更像个"有实际开发经验的工程师"。这个差别，在实际编程场景中会被放大很多倍。

马斯克还透露，后续还会持续添加更多 Cursor 相关数据来优化模型能力。

发布于广东