不是郑小康 22-08-11 20:51
微博认证:汽车博主

刚到酒店,看到大疆公关总监@DJI_谢阗地 先生回复了我的微博,我再来探讨下。

- 谢阗地分享了两种不同的智能驾驶感知技术路线,这里的关键词在于「基于双目视觉实时生成稠密点云」,核心是绕过标注物体分类的过程感知障碍物,并做后续的规控工作。

也就是更接近人类驾驶员:远远的看过去我还不好说那一团是只流浪狗还是个塑料袋,但我能看出来那有个东西,所以要踩刹车减速或者打一把方向盘绕开。

- 这种方法的本质,其实就是给了摄像头激光雷达的能力:感知深度信息。

如果我们看自动驾驶行业,利用计算机视觉做深度识别的研究是比较多的(像大疆车载这样实现工程落地的没那么多)。

如果不谈双目,其实特斯拉和 Mobileye 都公开分享过相关的工程实践,一个是前特斯拉 AI 高级总监 Andrej Karpathy 分享的,用自监督学习的算法,去预测逐个像素点的深度,然后投射出来,实际感知效果和激光雷达的点云非常接近。特斯拉称之为虚拟激光雷达(Pseudo LiDAR)。

另一个是 Mobileye CEO Amnon Shashua 教授分享的,用一个独立的 DNN 做的,称之为 VIDAR——视觉激光雷达 Visual LiDAR 的方法,从多个视角的 2D 图像组合在一起进行三维测量,并获得密集的 3D 感知,同样是深度识别。

从科研上来说,通过摄像头完全可以实现深度识别,完全取代掉激光雷达扮演的角色,这就是「纯视觉」路线的理论基础。摄像头的潜力是无穷的,这是一个广泛的共识。

- 那么大疆车载的路线独特在哪里?大疆是延续无人机上的双目立体视觉来做的,并且在五菱的车上实现了工程化落地。这一技术英文就叫「use stereo vision to detect unrecognizable obstacles」。

- unrecognizable obstacles 翻译成任意障碍物也没什么问题?抱歉,在这个问题上,我还是要说一句不敢苟同。

每一个品牌的自动驾驶工程化都应该慎之又慎,以避免给用户建立错误预期。这包括系统的命名、传播、人机交互、消费者教育、产品设计、算法等很多维度多管齐下。

我相信在实际的工程实践中,从降低误报率的维度考虑,大疆车载这套系统也不会真的对所有的障碍物都做出避障动作吧。@类星频道 后续也会找一台搭载大疆车载系统的车来做相关测试,验证一下我的判断。大家敬请期待。

- 我在之前的微博中已经表达了对大疆车载的高预期,其实我毫不担心这套算法的实际表现,但正因体验不会差,我觉得谨慎和准确的传播才是更重要的。

发布于 浙江