李建秋的世界
26-04-25 08:42 微博认证:微博新知博主

看过 LeCun在达沃斯的发言吗?

连Meta都已经LLM-pilled,他不想再跟风了,纯生成式架构,不管是LLM、VLM还是VLA,永远造不出哪怕猫级的智能体。

因为它们本质上只是下一个token预测机,只能在文字和像素的空间里做统计关联,从来没有真正理解过这个世界的因果。它们不会预测行动的后果,不会真正的规划,更没有常识。

短期来看,scaling LLM+微调+工具调用,已经能吃掉80%的白领工作,硅谷所有人往这里冲,也算是完全理性,毕竟钱和机会就在这里。

但长期来看,这是一条有天花板的路。因为你永远不可能在文字地图上,开出一辆真正的车。机器人、具身智能、长期自主代理、真正的科学发现,这些坎,纯LLM永远跨不过去。

真正的智能必须有世界模型。就是说给定当前的状态和你要做的动作,你要能准确预测下一秒世界会变成什么样。不是简单的像素级的生成,还需要对物理规律和因果关系的抽象建模。

最近Figure、特斯拉、谷歌的机器人项目,其实都在偷偷补这一课
=======================
从纯研发来说,这也是宇树之类厂商人形机器人的意义。

发布于 湖北