很多人不明白为什么纯视觉和激光雷达的争论再起。
这是因为国内一众车企纷纷体验了特斯拉FSD V14后,表达了各种“震撼”。
这种震撼主要来自于其反应速度。这种“秒反”甚至快到什么程度呢?当发现突然冒头的危险时,甚至终端屏幕还没有显示出来车就已经做出反应了。
这种“秒反”展示了纯视觉方案在输入频率和链路时延上相对于激光雷达的绝对优势。理想的CTO说得很直白:激光雷达受限于物理限制,无法做到更高的输入频率,再快就只能依靠视觉。反应速度事关实时安全性,尤其是L4这种完全自动驾驶级别而言。
纯视觉较之激光雷达,不仅表现在视觉帧率上的绝对优势(视觉普遍在30-120Hz,而激光雷达在10-30Hz。一个激光雷达的点云图生成的时间里,视觉已经生成三四张图了),还体现在:由于不需在车端等待和融合处理激光雷达的信息,其一体化处理的链路时延也比激光雷达低一个数量级。甚至可以在云端大模型上提前模拟成千上万次可能的事故场景,“蒸馏”形成预设方案放在车端,当一个事故场景出现的一瞬间(大概就四五帧画面)里系统就能做出反应,远远超过人类的反应速度。
这才是这次纯视觉和激光雷达争论再起的原因。
理想虽然没有说自己要转向纯视觉,但说了要降低激光雷达的权重。为了提高激光雷达的帧率,从15Hz增加到25Hz,代价就是让点云图稀疏一点,而点云图如果稀疏了,这和激光雷达追求精细探测安全的初心相违背,那激光雷达的意义又何在呢?
发布于 四川
