#模型时代# 谢赛宁：想知道世界模型的定义，看杨立昆说的就足够了。原文是公式，所以归纳了一个文字释义版的。我的个人感受是，某种程度上，LLM就是一种关于人类认知的“世界模型”？理解说了什么，预测接下来还会说什么。但是，人类为什么有这样的认知，是LLM不关心的。即使LLM预测了世界的下一步，

#模型时代# 谢赛宁：想知道世界模型的定义，看杨立昆说的就足够了。

原文是公式，所以归纳了一个文字释义版的。我的个人感受是，某种程度上，LLM就是一种关于人类认知的“世界模型”？理解说了什么，预测接下来还会说什么。但是，人类为什么有这样的认知，是LLM不关心的。即使LLM预测了世界的下一步，也是借助人类经验这个“投影”来预测。

***
什么是“世界模型”（World Model）？——用最通俗的语言解释 Yann LeCun 的定义

LeCun 认为，“世界模型”就是一种能理解世界并预测未来的系统。它的作用，是让智能体（无论是人、动物，还是 AI）能够根据当前看到的情况，结合过去的经验，推测出接下来可能会发生什么。

一、它“看”到什么

世界模型首先会接收到一个“观察结果”，就像我们看到一张画面、听到一句话。这是它当前感知到的世界信息。

但仅仅看到眼前的东西还不够。它还会结合：

过去对世界状态的理解（比如上一次我们觉得“球在桌子上”），

即将采取的行动（比如“我准备去推那个球”），

以及一些未知的、但可能影响结果的隐藏因素（比如“桌面其实有点倾斜”）。

这些要素共同构成了它“思考”的基础。

二、它如何“理解”

在 LeCun 的定义里，世界模型会先对这些观察进行理解和压缩，提取出关键特征——就像我们看一眼画面，就能知道“这里是厨房”。
这个过程叫“表征”（representation）。
简单来说，就是把混乱的现实转化为自己能理解、能处理的内部模型。

三、它如何“预测”

接着，世界模型会用自己的内部理解，结合：

目前的世界状况，

自己打算做的事情，

那些未知但可能起作用的因素，
去预测接下来世界会变成什么样子。

这一步，就是它在“想象未来”。

四、为什么要有“潜在变量”（latent variable）

现实世界中，我们永远不可能知道所有细节。
比如你推一个球，有风、摩擦、重力、微小震动——有些你根本看不到。
这些“看不到但会影响结果的因素”，在 LeCun 的定义里，就叫“潜在变量”。

世界模型必须考虑这些不确定性，因此它会尝试在一组可能的结果之间进行推测。
它不会死记硬背“唯一答案”，而是知道“可能会是这些情况之一”。

五、总结一句话

LeCun 的“世界模型”是一个：

能够理解当前世界、结合过去经验和行动计划，去推测未来可能状况的智能系统。

它并不只是“看见”和“反应”，而是在内心中构建出一个可以想象未来的世界副本。
这也是人类智能与未来 AI 系统的核心能力所在。

发布于美国