爱可可-爱生活 25-10-08 16:13
微博认证:AI博主 2025微博新锐新知博主

物理AI领域的前沿突破来了!NVIDIA Cosmos-Predict2.5 是最新一代的世界模拟基础模型,专注于以视频形式预测未来世界状态。它融合了文本、图像、视频多模态输入,通过物理AI推理模型Cosmos-Reason1,实现了更高的预测质量和更精准的指令对齐。

不仅支持自动驾驶多视角预测,还能助力机器人、视频分析等多种实际场景。代码开源,基于Apache 2协议,适合AI研发者和研究机构探索物理世界模拟和未来态预测的无限可能。

GitHub 地址:
github.com/nvidia-cosmos/cosmos-predict2.5

主要亮点:
- 统一处理Text2World、Image2World、Video2World三大任务
- 结合物理AI视觉语言推理模型,提升预测准确度
- 支持多种预训练与后训练模型,覆盖自动驾驶等应用场景
- 开放源码,活跃社区贡献,共同推动物理AI发展

想了解更多物理AI最新动态,戳官网:research.nvidia.com/labs/dir/cosmos-predict2.5

发布于 河北