#how i ai#
昨天,马斯克在 X 上连发几条推文,透露了自家模型 Grok 的最新进展。信息量很大,而且每一个都指向同一个方向: Grok 正在全力冲刺编程能力。
先说模型本身的更新。
马斯克透露, Grok 最新的基础模型 V9-Medium已经完成训练,参数规模达到 1.5T 。作为对比,当前承载 Grok 全部生产流量的 v8-small 模型只有 0.5T 参数。这一次直接翻了 3 倍,属于代际级别的参数升级。
按照马斯克的说法, V9-Medium 在深度推理能力、知识储备、复杂上下文理解、长链式思考、复杂开发任务处理等方面都会有显著提升。微调工作正在推进,强化学习阶段几天后启动,按计划 2-3 周将正式向公众发布。
但最值得关注的,不止是参数规模,训练数据的变化才是重点。
在训练 V9-Medium 时,团队加入了大量来自Cursor 的真实用户数据。
Cursor 的数据来自数百万开发者的真实工作流,包含开发者描述需求、定位问题、读取上下文、修改文件、修复报错、迭代追问等全流程工程场景信息。这些数据能为 Grok 补充真实工程场景的"手感",不单单只停留在理论层面的代码生成。
简单来说,以前的 Grok 可能更像个"会写代码的理论派",加入 Cursor 数据后,它更像个"有实际开发经验的工程师"。这个差别,在实际编程场景中会被放大很多倍。
马斯克还透露,后续还会持续添加更多 Cursor 相关数据来优化模型能力。
发布于 广东
