离开理想后|专访夏中谱:我做端到端,其实是想“偷懒”
深蓝学院专访栏目|《与优秀的人同行》
核心导览:
①:“两段式”方案存在信息瓶颈,“端到端”是必然趋势,因为信息的无损/低损传递
②:自动驾驶是具身智能的一个特定子集,但机器人面临的环境更复杂、任务更多样、技术挑战也更大;
③:VLA和WM 各自有各自的优势,一个像“读书”,一个像“实践”,人类的智能就是这两者的结合。两者会融合~
④:VLA2.0 相较于1.0 解决了语言是对物理世界的高度压缩。比如“开快一点”,但多快是快?这种精确的数值信息在语言压缩中丢失了,很难恢复的问题。2.0本质上是一个,视觉(Vision)和语言(Language)模块并行地为行动(Action)模块提供信息。这更像一个多模态输入的方案——在不丢失原始视觉信息的前提下,融入语言的理解和泛化能力。这是一个更成熟的探索方向。
#微博新知##懒博小课堂#
发布于 浙江
