世界模型圈闯出一匹黑马。生数科技的MotuBrain零宣发登顶两个国际权威榜单:WorldArena总分63.77排名第一,RoboTwin2.0的Clean和Randomized两个场景分别拿下95.8和96.1,同样第一。没有发布会,没有融资稿,就这么一声不响地同时爬上了两个榜单顶端。
这两个榜单分别考的是「看得懂世界」和「能在世界里干活」,过去行业把它们视为两个极点——做世界模型的看得懂、动不了;做VLA的能动手、想不远。同时拿下双第一,业内前所未有。
MotuBrain的核心是真正的大一统。基于自研UniDiffuser架构,一次训练同时学会五种能力:VLA、世界模型、视频生成、逆动力学、视频-动作联合预测。它不是五个专科医生会诊,而是一个完整的大脑。随着任务数量增加,Pi-0.5成功率持续下滑,MotuBrain则持续上升,这说明它学到的是跨任务的通用世界知识而非死记硬背。
在实际能力上,MotuBrain实现了三个突破:一脑多能,单一模型应对插花、调酒、整理洗漱台等多类任务;一脑多型,通过统一动作表征适配双臂、移动、人形等不同机器人本体;一脑贯通,直接完成超过10个原子动作级别的长程任务,无需上层规划器拆解。
生数科技背后有更完整的战略图谱:以通用世界模型为底层,数字空间走Vidu视频生成路线,物理空间走Motus/MotuBrain具身智能路线,形成「预测世界、生成世界、行动于世界」的完整闭环。MotuBrain双榜第一,是物理空间这条线走通的证明。用代码和数据,正面把硅谷标杆Pi-0.5撂倒了40个百分点。
