博世智能驾驶中国区总裁吴永桥谈到,博世为什么短期内不做VLA。
VLA规模化落地有若干困难点:
1、多模态对齐困难
2、多模态数据的提取和训练更为困难
3、语言模型存在幻觉缺陷
4、目前所有芯片都不是为大模型设计的。
他认为,目前的VLA模型不是完整的,都是拼凑起来的,真正的体验好的VLA大模型参数量要在7B-10B,同时推理频频要在10Hz以上。基于以上四个困难点,博世在短期内会坚定的走一段式端到端架构。#汽车之家全球ai科技大会#
发布于 北京
