特斯拉将用Grok控车

特斯拉的舱驾融合迎来下一步。接下来可以通过 Grok 用自然语言控车。

这个过去有很多品牌做过，只不过以之前的技术条件，大多数固定指令映射，唤醒语音助手表达上和预设指令稍微有点偏差，就可能失败了。

特斯拉这个做法，大概率是一个Multi-Agent System，在 Grok 和 FSD 之间建立起一个服务通信机制，把导航、实时路况、摄像头看到的周围画面这些极其复杂的环境上下文整合进来。

当用户说了任何驾驶需求后，Grok 首先解析这种自然语义下的高层次驾驶意图，然后把需求传递给 FSD Agent。

这里面比较复杂的问题主要在于行车场景。

第一是 Grok 要非常快的解析，现在特斯拉上的 Grok 用的就是 Grok 4.1-fast，因为行车场景对延迟极其敏感，「 Grok 前面靠边在那台公交车后面临时停下车」，解析慢了那台公交车开走了。

所以低延迟的实时推理非常重要。

第二是安全验证，比如驾驶员需求和交规冲突，或者突发一个动态障碍物加入，FSD 需要被训练到说时迟那时快，及时否决执行需求，秉持 FSD 规划优先。

终于走到这一步了，虽然，3 个月这个时间很可能是不准的。

发布于上海