不是郑小康
26-06-18 11:14 微博认证:汽车博主

特斯拉的舱驾融合迎来下一步。接下来可以通过 Grok 用自然语言控车。

这个过去有很多品牌做过,只不过以之前的技术条件,大多数固定指令映射,唤醒语音助手表达上和预设指令稍微有点偏差,就可能失败了。

特斯拉这个做法,大概率是一个Multi-Agent System,在 Grok 和 FSD 之间建立起一个服务通信机制,把导航、实时路况、摄像头看到的周围画面这些极其复杂的环境上下文整合进来。

当用户说了任何驾驶需求后,Grok 首先解析这种自然语义下的高层次驾驶意图,然后把需求传递给 FSD Agent。

这里面比较复杂的问题主要在于行车场景。

第一是 Grok 要非常快的解析,现在特斯拉上的 Grok 用的就是 Grok 4.1-fast,因为行车场景对延迟极其敏感,「 Grok 前面靠边在那台公交车后面临时停下车」,解析慢了那台公交车开走了。

所以低延迟的实时推理非常重要。

第二是安全验证,比如驾驶员需求和交规冲突,或者突发一个动态障碍物加入,FSD 需要被训练到说时迟那时快,及时否决执行需求,秉持 FSD 规划优先。

终于走到这一步了,虽然,3 个月这个时间很可能是不准的。

发布于 上海