上一期我们科普了一段式和两段式端到端的区别,评论区很热闹啊。
今天再次借着#听不懂的汽车黑话#,给大家再来一个小科普:一段式端到端和VLA的区别。
首先,两者本质上都是端到端 E2E 架构,无论是一段式端到端、VLA、VLM还是世界模型,都是为了解决智驾复杂场景的一种技术工具和路径。
但大家都有自己独到的解题思路,有的喜欢快慢思考,有的喜欢题海战术,也有的想模仿学霸。
单拎「一段式端到端和VLA」来对比的话,我们举个简单的例子:不知道大家有没有看过《飞驰人生》,拉力赛车手逆袭的故事,车手+领航员合作比赛的模式,和一段式端到端+云端VLM的架构有点类似。端到端是个技术一流的车手,但跑山路急弯多,需要副驾的领航员(云端VLM)作为协助,路口给车手报,前面左三,左三接右四....
这样的好处是,车手和领航员可以各司其职,通过少而精的协作避免延时,在当前阶段把效率拉到极致。
而 VLA 则是一个把路书刻在脑子里的车手,凭借着记忆把路线、弯道速度、坡度位置提前背熟。这样的好处是车手能根据记忆、通识理解应对山路上的极端场景,但相应的,在调取信息时未免存在延时
但现实情况是,比赛路段的随机性非常高,10个赛段500km+的路程,单纯靠记忆来获得最快速度,难度较高,一致性不够强。除非车手是个超级大脑,拥有不设限的算力和带宽。
最近我们的HSD在杭州开启媒体试驾,可变车道是杭州的一大难点场景,HSD能够识别可变车道并按照导航路径规划路线,这也是媒体朋友们比较惊喜的一点。那问题来了,没有LLM语义模型,一段式端到端如何处理这类场景呢?
其实HSD的一段式端到端里,也有语义模型布置在云端,是用VLM+强化学习来训练,同样能轻松应对可变车道、待转区提示和潮汐车道。
除了能在路口前准确判断可变车道的指示牌,它还能识别进入待行区的文字提示,一段式端到端更重要的优势在于,它大幅降低了车端算力和带宽的需求,甚至可以适配基础算力的车型。
不知道听完今天的小科普,大家有没有更进一步理解两个模型的区别,哪种方案更适合你们手上的智能车呢?欢迎大拿们在评论区进行技术分析。
#一段式端到端##地平线HSD量产首秀#
