奇点财经 26-03-18 21:47
微博认证:奇点财经官方微博

【#理想全能辅助驾驶来了# 】3月17日,理想汽车基座模型负责人詹锟在2026GTC大会发布下一代自动驾驶基础模型MindVLA-o1。该模型具备3D ViT+多模态思考能力,能够让车真正具备理解3D空间的能力。据了解,传统的BEV(鸟瞰图)只有2D信息,OCC(占用网络)虽然是3D的,但缺少语义信息,都缺乏对三维空间的理解和与语言的深度对齐。

此次理想汽车的方案则是通过视频流,直接还原3D的空间、位置、点云、语义和像素。李想通俗地比喻道,“人类在很小的时候,通过反复训练,形成了对空间的准确把握。比如很小的时候接不住球,但一次次扔,通过大脑训练,眼睛还是那个眼睛,但对球速、距离的判断就越来越准,也不再摔跤了。” http://t.cn/AXfGerdr