麻省理工科技评论
25-11-24 19:22 微博认证:《麻省理工科技评论》杂志官方微博

【0.9B参数刷新五项SOTA,清华团队开发小而强通用VLA模型|对话詹仙园】

如果不是看研究方向,很难把詹仙园和“具身智能”直接联系起来。他本科读的是清华土木工程,后来去美国#普渡大学# 读交通工程博士,博士期间一半时间泡在计算机系做#机器学习# ;毕业后进入#微软亚洲研究院# ,再跟着前上司转去京东科技,主导过基于离线强化学习的火电优化研发项目,并完成了产品化及在国内多个电厂的推广落地。直到 2021 年,他回到清华,正式把重心转回学术研究。

“说白了,就是希望能自由地做一些自己感兴趣的事。”他笑着概括自己一次次转向的原因。表面上看,他从土木到交通,从工业控制到自动驾驶和具身智能,一路在“换赛道”;但如果把这些经历抽象成一个问题,就能看出贯穿其中的主线:怎么用数据驱动的决策优化技术,让智能体在真实物理世界里更好的解决问题。

也因为如此,当具身智能的发展进入大模型时代后,他比很多人更早意识到:真正限制通用机器人能力的瓶颈,不是模型够不够大,而是跨具身形态的异质性——不同机器人之间在硬件、感知和控制上的巨大差异,让本来就相对有限的具身数据形成孤岛,也让所谓的“通用 VLA”经常在迁移时崩塌。

X-VLA 就是在这个判断下诞生的。

戳链接查看详情:http://t.cn/AXLapTRC