空间智能发展前景分析

《LLM之后的空间智能》

今天看大宇哥的文章，顺便自己也思考了下空间智能。

先看定义吧：
让机器不仅能"理解文字"，还能像人类一样感知、推理和交互于三维物理世界。
李飞飞说的好浪漫：
空间智能代表着超越语言的前沿——它连接了想象、感知和行动，让机器真正能够增强人类生活

现在的大模型是基于语义的，如同读了100万本物理教科书的盲人。
知道重力，却理解不了苹果究竟是怎么落下砸到草地上的。
这里除了语义，还有物理、几何、动力学等复杂的世界规则。

空间智能对哪些场景重要呢？
具身智能、3D内容生产、3D分子结构、建筑学、材料学、自动驾驶、AR/VR眼镜等。
好家伙，这些东西绑一块，估计要10万亿的市场规模了。

2018年图灵奖得主、前Meta首席AI科学家Yann LeCun甚至认为：
LLM从根本上是错的。 "语言是压缩的、符号化的现实表征。它描述发生了什么，不描述为什么发生。一个读了100万本物理书的LLM并不'知道'推一张桌子杯子会动

Yann当然过于激进了。
从更大的视角去看，文字AI到物理AI应该是有行业共识的大势所趋了。
老黄认为：2026年是物理AI元年

空间智能的技术路径目前非常驳杂：
神经辐射场 NeRF+3D高斯泼溅+视频扩散Diffusion模型+世界模型与JEPA架构+视觉-语言-动作模型 VLA+世界基础模型

这7大路线目前还没有跑出来赢家，但高斯泼溅是当前最火的。
空间智能在26年还是一个没有被市场充分定价的边缘领域
真好，这意味着还有大量投资机会

发布于北京