物理AI与北京车展探讨

为什么大家都要通向物理AI ？北京车展和元戎周光、阮翀做了交流。

到底什么是物理AI？

今年北京车展最大的热词之一，虽然没人解释的很清楚，但我的理解是过去大语言模型其实构建的是在概念认知上，一直没有在一个物理空间建立，而物理AI要解决的是大模型如何在一个物理空间里做感知预测到决策，最后形成一个闭环的系统。

机器人、和自动驾驶都是我们目前能见到的最重要的两种载体，短期我们能看到的就是我们的汽车。

所以这也势必是近几年车企也好供应商也好，一个非常重要的转型。

1、智驾也迎来了“基座大模型”时代

阮翀之前是 DeepSeek 研发负责人，也是多模态技术核心研究员，来到元戎后会建立一整套新的大模型架构，周光更倾向于战略的思考。

来到今天，智能驾驶已经从“一堆小模型拼凑”的时代变成了“一个大模型挑大梁”的时代了。

我们聊了那么多的GPT，终于迎来了物理 GPT的时刻，只不过这个愿景比我们想象中更大，它不单只是服务于一个智驾大模型。

今年理想、小米等公司也迎来战略调整，因为转变背后是贯穿整个公司的研发、落地到升级全流程的角色。在后大语言模型时代，原生AI这个词应该会越来越频繁。

在过去的小模型时代，智能驾驶的多个任务一般会拆分成几个模型，所以在大部分公司的组织管理中，就需要有不同人来设计、调试还有管理。

但是小模型的问题是一来小模型的能力很有限，二来小模型容易出现打架的情况，比如今天优化某个场景隔天另一个好的场景又挂了。

所以最好的方式是一开始就建立一整套基座大模型，用一个大模型来替代原有的小模型。

2、大模型对数据的理解发生了质的改变。

模型变大以后，它吃进去的数据也会更大，过去小模型对数据的理解比较难，也需要很多人工做分类或者筛选，而智驾的原生大模型就可以把各个传感器的数据融合在一块，直接灌给它，让它自己筛选，自己理解。这点意味着数据输入的量变大，同时也能消化，解决了过去很多数据浪费的问题。

数据管理还有一个大的变化，是过去数据和研发的关系是事后补救，比如先发版本，上车路测再发现问题，再调优。

从研发角度大模型可以改变这一问题，大模型的可以通过专门的数据表征模型，提前对数据做分析，能够知道模型在哪个场景的能力不够，需要补哪些数据，再往里喂。

这次虽然没有说世界模型，但是阮翀提到元戎还会建立一套模型评估系统，在虚拟环境下来评估，

这样整体的数据训练、利用率再到对有效数据的抓取，还有对大模型的评估体系都有了更好的循环。

3、大模型不再是专科医生。

从研发角度来说，一旦大模型的能力足够强时，研发团队就不用再为每个任务单独开发小模型，只要在这个大模型的基础上，稍微调整，就能衍生出适合不同场景、不同需求的模型版本。

这也是我们理解的专家混合模型，过去传统大模型遇到的问题是，我们看病要么挂专科，但是专科医生只能看一种病，一种是全科，它什么都能解决，但是整体成本很高。

混合专家模型，就是在一个中台上安排了多个专科医生来回调用，他可以针对不同问题，来激活各个专科医生，在原先的基础上新增了一个问诊的中间环节。

这样大模型的背景下，大量的人力就可以集中聚焦在优化大模型这件事上。可以降低开发和管理成本，也缩短了研发时间。

4、大模型的部署，和大算力不一定有关。

阮翀提到大模型的部署第一可以通过中轴（蒸馏）去解决，用大模型教一个小模型，这样小模型的能力也会很强，比你从头训练一个小模型强很多。

第二，要相信时间的力量。时间意味着硬件的进步，以前车载芯片算力有限，过几年翻几倍。只要你相信这个过程是持续的，模型的大小就不会是问题。

其次模型的密度其实也在发生变化。

这一代模型跟上一代相比，能力可以跨量级比较。模型设计密度本身也会提升。随着模型发展，可能需要一个直接模型才能达到预期的能力；但可能过两年，可能只需要一个更小的模型就可以了。

这种转变背后，研发流程和公司组织方式也在跟着升级。在后大语言模型时代，AI不再是智驾系统的“辅助工具”，而是建立以大模型为核心的AI 原生体系。

而未来能存活下来的智驾公司，也终将变成具备通用能力的智能移动AI公司。

#新能源汽车##大v聊车#

发布于广东