陈龙谈小米智驾技术

#微博声浪计划# #听见微博# 过去三年，人们的目光聚焦在语言模型，但当下，物理AI正在被热议。这其中，VLA（Vision-Language-Action）和世界模型（World Model）这两个技术方向极具潜力又充满争议。
今天邀请到的嘉宾，是小米的具身基座大模型负责人陈龙。陈龙博士是90后，是全球最早将VLA与智能驾驶融合的顶尖科学家。加入小米后，他正试图将车与机器人打通，打造一种 AI 学习的新范式。
很喜欢这一期，其中既有大量硬核的信息量，也有技术的初心、烟火气和浪漫想象。
点一些核心的独家信息（普通人看完访谈也能理解）：

1.第一视角还原小米智驾最前沿的一手信息：业界首个融合智能驾驶+机器人任务的Mimo Embodied具身大脑框架、XLA潜空间推理的技术细节…
2.还原了自动驾驶从“三段式➡️两段式➡️VLA➡️XLA”的完整路径，明确了智驾和具身的融合路线，1+1 大于 2
3.小米智驾梦之队+小米 90 后 AI 当家团队的工作日常（包括陈龙博士与罗福莉的合作等）
4.关于 VLA、世界模型的路线之争，以及具身的 Scaling Law 时刻
（本期内容的视频版，欢迎前往微博、b站、小红书、视频号、Youtube等平台观看。）
本期嘉宾：陈龙（小米智驾负责人、具身基座大模型负责人）本期 Shownotes：02:00 CV是计算机与真实世界的接
05:36 训练神经网络，小规模的Scaling Law
06:19 自动驾驶的三阶段
09:56 从规则算法到数据学习
11:05 《苦涩的教训》
19:29 雷军亲自面试了我
22:14 LLM 加速了自动驾驶
24:15 从端到端，到 VLA，是认知的改变
27:47 伦敦生活
30:24 小米智驾梦之队
34:04 90后，罗福莉，与 Mimo大模型
46:05 世界模型与 VLA
51:14 打通机器人与车的智能，训练具身基座大模型
57:55 语言是最高效的吗？
01:00:47 从VLA，到XLA
01:14:00 具身的Scaling Law，与物理AI
01:25:19 智驾与具身的人才大战
加入听友群👇 http://t.cn/AXx0GlFR