比特傻
26-04-23 00:31 微博认证:北京云开时代信息技术有限公司 投资事业部总经理 财经博主 微博原创视频博主 头条文章作者

《LLM之后的空间智能》

今天看大宇哥的文章,顺便自己也思考了下空间智能。

先看定义吧:
让机器不仅能"理解文字",还能像人类一样感知、推理和交互于三维物理世界。
李飞飞说的好浪漫:
空间智能代表着超越语言的前沿——它连接了想象、感知和行动,让机器真正能够增强人类生活

现在的大模型是基于语义的,如同读了100万本物理教科书的盲人。
知道重力,却理解不了苹果究竟是怎么落下砸到草地上的。
这里除了语义,还有物理、几何、动力学等复杂的世界规则。

空间智能对哪些场景重要呢?
具身智能、3D内容生产、3D分子结构、建筑学、材料学、自动驾驶、AR/VR眼镜等。
好家伙,这些东西绑一块,估计要10万亿的市场规模了。

2018年图灵奖得主、前Meta首席AI科学家Yann LeCun甚至认为:
LLM从根本上是错的。 "语言是压缩的、符号化的现实表征。它描述发生了什么,不描述为什么发生。一个读了100万本物理书的LLM并不'知道'推一张桌子杯子会动

Yann当然过于激进了。
从更大的视角去看,文字AI到物理AI应该是有行业共识的大势所趋了。
老黄认为:2026年是物理AI元年

空间智能的技术路径目前非常驳杂:
神经辐射场 NeRF+3D高斯泼溅+视频扩散Diffusion模型+世界模型与JEPA架构+视觉-语言-动作模型 VLA+世界基础模型

这7大路线目前还没有跑出来赢家,但高斯泼溅是当前最火的。
空间智能在26年还是一个没有被市场充分定价的边缘领域
真好,这意味着还有大量投资机会

发布于 北京