对于目前遍地开花的大模型,李弘扬直言,「我认为现在这个行业没有自动驾驶大模型。我们给UniAD工作的定义也是『自动驾驶通用模型』,而不是大模型。」
他表示,现在国内外还没有搞清楚有关大模型的基本问题,如大模型怎么定义、参数量要大到什么程度、建模形式如何、优化目标是什么等。「如果自动驾驶大模型最后是发展成感知大模型,是不完善的,那完全可以在通用视觉里做。」
此外,李弘扬提到,现在自动驾驶领域要以大模型为背景开发第三代自动驾驶数据集。
第一代是由德国卡尔斯鲁厄理工学院和丰田美国技术研究院联合创建的KITTI数据集,是目前国际上最大的自动驾驶场景下的计算机视觉算法评测数据集;第二代是由Motional(前身为nuTonomy)团队开发的nuScenes数据集,是第一个集成摄像头、激光雷达和毫米波雷达等多种传感器、实现360度全传感器覆盖的数据集。
来源:http://t.cn/A60GfZrK
发布于 北京
