#英伟达北大世界模型对决#2026年6月上旬,AI具身智能领域迎来了一场备受瞩目的技术交锋:英伟达在GTC大会上发布了全模态物理AI模型Cosmos 3,而北大团队则同期推出了主打因果推演的5D世界模型。这不仅是一次技术发布的时间重合,更清晰地揭示了当前AI从“语言理解”迈向“物理世界认知”的两条核心路线。
核心对决:Cosmos 3 与 EvoPhys-World 的技术分野
这场对决的核心在于双方对“世界模型”构建维度的不同理解。具体技术特征对比如下:
复制
全屏
表格
对比维度 英伟达 Cosmos 3 北大 EvoPhys-World
模型定位 全球首款完全开放的全模态物理AI模型 全球首个自进化5D世界模型(以人为中心)
核心架构 混合Transformer架构,打通视觉推理、世界生成、动作预测三大能力 传统三维空间+时间+第五维“因果推演”,行动前预判多条世界线结果
训练逻辑 赋予AI物理直觉引擎,理解重力、摩擦与物体碰撞等基础物理规律 依托人本路线,从人类动作学习直接延伸至机器人物理交互应用
生态与底座 成立NVIDIA Cosmos Coalition全球协作联盟,主打全球化开源生态 模型全程依托国产GPU训练,并成功登顶相关国际榜单 http://t.cn/AXXD77sZ
发布于 山东
