#小马智行彭军称端到端筛选好数据非常有挑战#【小马智行彭军:端到端筛选好数据非常有挑战】4 月 25 日,小马智行与丰田联合开发的首款铂智 4X 自动驾驶出租车(Robotaxi)概念车在北京车展亮相。小马智行、丰田中国、广汽丰田三方组建了合资公司,规划将首批投放上千台规模的铂智 4X 自动驾驶车,接入小马智行 Robotaxi 运营平台。
在发布会上,《晚点 Auto》与小马智行 CEO 彭军交流了关于端到端的问题:
《晚点 Auto》:在端到端之前,自动驾驶系统更多地依赖于人工编写的规则,在这之后更依赖于数据。特斯拉和其他车企、自动驾驶公司的数据相差数量级。这是否意味着,算法的差距会越拉越大?一些很差的司机的数据被喂给系统之后,可能会对系统造成什么影响,如何去筛选和优化?
彭军:一个好的系统,不光自动驾驶(系统),任何 AI 的系统都不是数据量的问题,而是数据质量的问题。因为其实所有系统最怕的就是 garbage in garbage out. 今天应该说没有任何一家 serious 的自动驾驶公司是缺数据的。
每天十辆车跑的数据可以推无穷大的模型。没有任何一个高考学生是因为数据不够考不上大学的。你怎么通过数据学到好的知识,这是重要的。就像大家打开 GPT 3、 GPT 4,最后说,哇,原来这个模型这么小。 GPT 比大家做得好,绝对不是因为它数据量大,而是因为做得好。数量大的时候,如何把好的数据选出来,差的弄掉?其实是真正难的,非常有挑战。#2024北京车展# (文 | 王海璐)
发布于 北京
