刚到酒店，看到大疆公关总监@DJI_谢阗地先生回复了我的微博，我再来探讨下。- 谢阗地分享了两种不同的智能驾驶感知技术路线，这里的关键词在于「基于双目视觉实时生成稠密点云」，核心是绕过标注物体分类的过程感知障碍物，并做后续的规控工作。也就是更接近人类驾驶员：远远的看过去我还不好说那

刚到酒店，看到大疆公关总监@DJI_谢阗地先生回复了我的微博，我再来探讨下。

- 谢阗地分享了两种不同的智能驾驶感知技术路线，这里的关键词在于「基于双目视觉实时生成稠密点云」，核心是绕过标注物体分类的过程感知障碍物，并做后续的规控工作。

也就是更接近人类驾驶员：远远的看过去我还不好说那一团是只流浪狗还是个塑料袋，但我能看出来那有个东西，所以要踩刹车减速或者打一把方向盘绕开。

- 这种方法的本质，其实就是给了摄像头激光雷达的能力：感知深度信息。

如果我们看自动驾驶行业，利用计算机视觉做深度识别的研究是比较多的（像大疆车载这样实现工程落地的没那么多）。

如果不谈双目，其实特斯拉和 Mobileye 都公开分享过相关的工程实践，一个是前特斯拉 AI 高级总监 Andrej Karpathy 分享的，用自监督学习的算法，去预测逐个像素点的深度，然后投射出来，实际感知效果和激光雷达的点云非常接近。特斯拉称之为虚拟激光雷达（Pseudo LiDAR）。

另一个是 Mobileye CEO Amnon Shashua 教授分享的，用一个独立的 DNN 做的，称之为 VIDAR——视觉激光雷达 Visual LiDAR 的方法，从多个视角的 2D 图像组合在一起进行三维测量，并获得密集的 3D 感知，同样是深度识别。

从科研上来说，通过摄像头完全可以实现深度识别，完全取代掉激光雷达扮演的角色，这就是「纯视觉」路线的理论基础。摄像头的潜力是无穷的，这是一个广泛的共识。

- 那么大疆车载的路线独特在哪里？大疆是延续无人机上的双目立体视觉来做的，并且在五菱的车上实现了工程化落地。这一技术英文就叫「use stereo vision to detect unrecognizable obstacles」。

- unrecognizable obstacles 翻译成任意障碍物也没什么问题？抱歉，在这个问题上，我还是要说一句不敢苟同。

每一个品牌的自动驾驶工程化都应该慎之又慎，以避免给用户建立错误预期。这包括系统的命名、传播、人机交互、消费者教育、产品设计、算法等很多维度多管齐下。

我相信在实际的工程实践中，从降低误报率的维度考虑，大疆车载这套系统也不会真的对所有的障碍物都做出避障动作吧。@类星频道后续也会找一台搭载大疆车载系统的车来做相关测试，验证一下我的判断。大家敬请期待。

- 我在之前的微博中已经表达了对大疆车载的高预期，其实我毫不担心这套算法的实际表现，但正因体验不会差，我觉得谨慎和准确的传播才是更重要的。

发布于浙江