豆包观点,悟界·Physis-v0.1(2026-06-12,智源大会发布)
全球首个通用世界基座模型,核心是从“预测下一个词元”升级为预测下一个物理状态,让AI真正懂物理世界。
一、核心定位
- 全称:悟界·Physis-v0.1(通用世界基座模型)
- 发布方:北京智源人工智能研究院
- 时间:2026年6月12日(2026智源大会)
- 核心范式:物理隐空间表征(替代像素/帧预测),统一全模态信息并压缩为物理状态。
二、关键能力(四大核心)
1. 物理一致性:严格遵循物理规律,推演结果可信。
2. 动作因果性:行为可解释、因果可追溯。
3. 长程可推演性:支持50+复杂物理场景长时序推理。
4. 通用泛化性:一个基座适配多场景(工业、机器人、仿真、科研)。
三、技术亮点
- 全模态输入:视频、深度RGB、3D点云、力触反馈等统一编码。
- 物理隐空间:把多模态数据转为标准化物理状态(Latent State),实现跨场景通用强化学习。
- 范式跃迁:从“字符/像素预测”到“物理状态预测”,为具身智能打基础。
四、配套发布
- 悟界·RoboBrain Orca:具身大脑,主打物理状态预测,实现“想、看、动”一体 。
- 世界模型分级标准:类似自动驾驶分级,统一行业认知 。
五、应用场景
- 具身智能(机器人控制)
- 严肃工业(精密操作、故障预判)
- 物理仿真(虚拟训练、数字孪生)
- 科学研究(物理/材料/生物过程预测)
六、背景意义
智源认为世界模型是下一代AI基座。Physis-v0.1是其走出的第五条技术路径,旨在打通数字与物理世界,为AGI提供物理理解能力。
发布于 江西
