#李想称机器人也用VLA#人类能快速学习技能,除了拥有思考能力以外,还拥有百万年来生物进化留下来的本能以及各类视觉、触觉、听觉等感官的协调,而目前绝大部分的AI没办法真正接触到真实的物理环境,所以为了能够更像人类一样理解真实环境,理想汽车提出了3D ViT+多模态思考的方案,通过视频流还原3D的空间、位置、点云、语义和像素。在这一范式下进行大规模的预训练,模型所提取的特征即为3D ViT,能够表达真实、完整的3D信息,将这一套训练方案接入智驾,让智驾更加拟人,更能够处理复杂场景,并且在未来理想还会把算法拓展至机器人等更加先进的领域,实现真正的构建“硅基”生命。#理想全能辅助驾驶来了##理想发布下一代自动驾驶基础模型#
发布于 湖南
