【今日份硬核科普已就位,AI世界#源来如此#奇妙】
@微博AI 联合清华大学权威团队@AI光影社 ,带你了解人工智能前沿知识![送花花]
15M 微型世界模型,性能一点不微型[震惊][震惊]
世界模型的目的是模拟物理世界的运行方式。JEPA是图灵奖得主杨立坤提出的一种世界模型,它首先将观察到的场景映射到一个概念空间,再在该空间学习物理规律。
然而,这种模型存在“表示坍塌”的风险,即将所有概念都表示成一个向量。最近,杨立坤团队提出了一种简单的校正机制:强制概念向量符合高斯分布。
实验表明,这一方法极大增强了训练稳定性,一个参数只有15M的世界模型,只花数小时便能在单GPU上完成训练,并涌现出了对基础规律的理解。
