Navis-慢点评测 25-08-17 16:50
微博认证:汽车博主 头条文章作者

理想的论文里讨论了 VLA 里 L 存在的价值,
加入 L 之后提升最大的 3 个场景是:

1.根据导航选择车道
2.遇到施工需要避让
3.信号灯关系识别

具体看一些例子:

① 施工区变道,L提供的信息:「前方车道被施工设施封闭无法通行,右侧车道畅通,自车可以向右变道」

②导航,提示「83米前右转,车道属性从左到右:左转、直行+右转,请使用最右车道」,而没有 L 模型倾向于保持当前车道。

③红绿灯,路口左转,面对复杂的红绿灯组合。没有 L 的时候模型选择等待,因为看不懂具体的含义,又 L 之后「前方自车道的信号灯包括左转箭头灯和直行圆灯,分别控制左转和直行方向。目前交通灯允许自车左转」,就能左转。

综合去看,在理想的这些测试集里,L 在红绿灯场景提升最大,可以提升 25% 左右,导航也能提升 10%, 而 Road Marking 车道线检测和 Dynamic Obstacle 动态避障这种任务主要还是靠视觉信息,L 的意义不大。

但还有一个问题,L 加入之后可能会输出更保守的结果,在前面有车阻挡,左边车道有车但车比较远的时候,如果只有 V 参与就能直接向左变道超车,但是 L 加入反倒认为左边有车暂时先别变。

最后,理想这个论文用的 L 全都是用的 GPT, Gemini, Claude 的 API,所以还是云端推理,并不是本地部署的,那想要本地部署的话,算力就很重要了

发布于 北京