今天,蚂蚁集团旗下灵波科技宣布全面开源具身大模型LingBot-VLA。这是蚂蚁开源的第一款具身智能基座模型,实现了跨本体、跨任务泛化能力,并大幅降低后训练成本。
去年9月,灵波科技推出首款单场景服务机器人Robbyant-R1,具备长序列任务能力,可完成从取菜、烹饪到清洁的全流程自动化。昨天,灵波科技开源高精度空间感知模型LingBot-Depth,搭载LingBot-Depth模型的奥比中光Gemini 330系列相机在深度精度和像素覆盖率方面,均优于顶级深度相机。
此次LingBot-VLA的开源,不仅提供了模型权重,还同步开放了包含数据处理、高效微调及自动化评估在内的全套代码库。
在上海交通大学开源的具身评测基准GM-100(包含100项真实操作任务)测试中,LingBot-VLA在3个不同的真实机器人平台上,跨本体泛化平均成功率相较于Pi0.5的13.0%提升至15.7%(w/o Depth)。引入深度信息(w/Depth)后,空间感知能力增强,平均成功率提升至17.3%。
#具身智能##大模型#
发布于 新加坡
