【15M的世界模型】
世界模型的目的是模拟物理世界的运行方式。JEPA是图灵奖得主杨立坤提出的一种世界模型,它首先将观察到的场景映射到一个概念空间,再在该空间学习物理规律。然而,这种模型存在“表示坍塌”的风险,即将所有概念都表示成一个向量。最近,杨立坤团队提出了一种简单的校正机制:强制概念向量符合高斯分布。实验表明,这一方法极大增强了训练稳定性,一个参数只有15M的世界模型,只花数小时便能在单GPU上完成训练,并涌现出了对基础规律的理解。
参考文献:Maes L, Lidec Q L, Scieur D, et al. LeWorldModel: Stable End-to-End Joint-Embedding Predictive Architecture from Pixels[J]. arXiv preprint arXiv:2603.19312, 2026.
#人工智能##ai创造营##世界模型#
发布于 重庆
