卫诗婕SJ_Jelyne 26-04-24 08:32
微博认证:视频播客《卫诗婕_漫谈Light the Star》创始人

#微博声浪计划# #听见微博# 过去三年,人们的目光聚焦在语言模型,但当下,物理AI正在被热议。这其中,VLA(Vision-Language-Action)和世界模型(World Model)这两个技术方向极具潜力又充满争议。
今天邀请到的嘉宾,是小米的具身基座大模型负责人陈龙。陈龙博士是90后,是全球最早将VLA与智能驾驶融合的顶尖科学家。加入小米后,他正试图将车与机器人打通,打造一种 AI 学习的新范式。
很喜欢这一期,其中既有大量硬核的信息量,也有技术的初心、烟火气和浪漫想象。
点一些核心的独家信息(普通人看完访谈也能理解):

1.第一视角还原小米智驾最前沿的一手信息:业界首个融合智能驾驶+机器人任务的Mimo Embodied具身大脑框架、XLA潜空间推理的技术细节…
2.还原了自动驾驶从“三段式➡️两段式➡️VLA➡️XLA”的完整路径,明确了智驾和具身的融合路线,1+1 大于 2
3.小米智驾梦之队+小米 90  后 AI 当家团队的工作日常(包括陈龙博士与罗福莉的合作等)
4.关于 VLA、世界模型的路线之争,以及具身的 Scaling Law 时刻
(本期内容的视频版,欢迎前往微博、b站、小红书、视频号、Youtube等平台观看。)
本期嘉宾:陈龙(小米智驾负责人、具身基座大模型负责人)本期 Shownotes:02:00 CV是计算机与真实世界的接
05:36 训练神经网络,小规模的Scaling Law
06:19 自动驾驶的三阶段
09:56 从规则算法到数据学习
11:05 《苦涩的教训》
19:29 雷军亲自面试了我
22:14 LLM 加速了自动驾驶
24:15 从端到端,到 VLA,是认知的改变
27:47 伦敦生活
30:24 小米智驾梦之队
34:04 90后,罗福莉,与 Mimo大模型
46:05 世界模型与 VLA
51:14 打通机器人与车的智能,训练具身基座大模型
57:55 语言是最高效的吗?
01:00:47 从VLA,到XLA 
01:14:00 具身的Scaling Law,与物理AI
01:25:19 智驾与具身的人才大战
加入听友群👇 http://t.cn/AXx0GlFR