高飞
25-10-17 15:12 微博认证:至顶科技创始人 AI博主

#模型时代# 谢赛宁:想知道世界模型的定义,看杨立昆说的就足够了。

原文是公式,所以归纳了一个文字释义版的。我的个人感受是,某种程度上,LLM就是一种关于人类认知的“世界模型”?理解说了什么,预测接下来还会说什么。但是,人类为什么有这样的认知,是LLM不关心的。即使LLM预测了世界的下一步,也是借助人类经验这个“投影”来预测。

***
什么是“世界模型”(World Model)?——用最通俗的语言解释 Yann LeCun 的定义

LeCun 认为,“世界模型”就是一种能理解世界并预测未来的系统。它的作用,是让智能体(无论是人、动物,还是 AI)能够根据当前看到的情况,结合过去的经验,推测出接下来可能会发生什么。

一、它“看”到什么

世界模型首先会接收到一个“观察结果”,就像我们看到一张画面、听到一句话。这是它当前感知到的世界信息。

但仅仅看到眼前的东西还不够。它还会结合:

过去对世界状态的理解(比如上一次我们觉得“球在桌子上”),

即将采取的行动(比如“我准备去推那个球”),

以及一些未知的、但可能影响结果的隐藏因素(比如“桌面其实有点倾斜”)。

这些要素共同构成了它“思考”的基础。

二、它如何“理解”

在 LeCun 的定义里,世界模型会先对这些观察进行理解和压缩,提取出关键特征——就像我们看一眼画面,就能知道“这里是厨房”。
这个过程叫“表征”(representation)。
简单来说,就是把混乱的现实转化为自己能理解、能处理的内部模型。

三、它如何“预测”

接着,世界模型会用自己的内部理解,结合:

目前的世界状况,

自己打算做的事情,

那些未知但可能起作用的因素,
去预测接下来世界会变成什么样子。

这一步,就是它在“想象未来”。

四、为什么要有“潜在变量”(latent variable)

现实世界中,我们永远不可能知道所有细节。
比如你推一个球,有风、摩擦、重力、微小震动——有些你根本看不到。
这些“看不到但会影响结果的因素”,在 LeCun 的定义里,就叫“潜在变量”。

世界模型必须考虑这些不确定性,因此它会尝试在一组可能的结果之间进行推测。
它不会死记硬背“唯一答案”,而是知道“可能会是这些情况之一”。

五、总结一句话

LeCun 的“世界模型”是一个:

能够理解当前世界、结合过去经验和行动计划,去推测未来可能状况的智能系统。

它并不只是“看见”和“反应”,而是在内心中构建出一个可以想象未来的世界副本。
这也是人类智能与未来 AI 系统的核心能力所在。

发布于 美国