飞机先生_ 26-04-28 17:57
微博认证:深圳市新出行科技有限公司 主编

为什么大家都要通向物理AI ?北京车展和元戎周光、阮翀做了交流。

到底什么是物理AI?

今年北京车展最大的热词之一,虽然没人解释的很清楚,但我的理解是过去大语言模型其实构建的是在概念认知上,一直没有在一个物理空间建立,而物理AI要解决的是大模型如何在一个物理空间里做感知预测到决策,最后形成一个闭环的系统。

机器人、和自动驾驶都是我们目前能见到的最重要的两种载体,短期我们能看到的就是我们的汽车。

所以这也势必是近几年车企也好 供应商也好,一个非常重要的转型。

1、智驾也迎来了“基座大模型”时代

阮翀之前是 DeepSeek 研发负责人,也是多模态技术核心研究员,来到元戎后会建立一整套新的大模型架构,周光更倾向于战略的思考。

来到今天,智能驾驶已经从“一堆小模型拼凑”的时代变成了“一个大模型挑大梁”的时代了。

我们聊了那么多的GPT,终于迎来了物理 GPT的时刻,只不过这个愿景比我们想象中更大,它不单只是服务于一个智驾大模型。

今年理想、小米等公司也迎来战略调整,因为转变背后是贯穿整个公司的研发、落地到升级全流程的角色。在后大语言模型时代,原生AI这个词应该会越来越频繁。

在过去的小模型时代,智能驾驶的多个任务一般会拆分成几个模型,所以在大部分公司的组织管理中,就需要有不同人来设计、调试还有管理。

但是小模型的问题是一来小模型的能力很有限,二来小模型容易出现打架的情况,比如今天优化某个场景隔天另一个好的场景又挂了。

所以最好的方式是一开始就建立一整套基座大模型,用一个大模型来替代原有的小模型。

2、大模型对数据的理解发生了质的改变。

模型变大以后,它吃进去的数据也会更大,过去小模型对数据的理解比较难,也需要很多人工做分类或者筛选,而智驾的原生大模型就可以把各个传感器的数据融合在一块,直接灌给它,让它自己筛选,自己理解。这点意味着数据输入的量变大,同时也能消化,解决了过去很多数据浪费的问题。

数据管理还有一个大的变化,是过去数据和研发的关系是事后补救,比如先发版本,上车路测再发现问题,再调优。

从研发角度大模型可以改变这一问题, 大模型的可以通过专门的数据表征模型,提前对数据做分析,能够知道模型在哪个场景的能力不够,需要补哪些数据,再往里喂。

这次虽然没有说世界模型,但是阮翀提到元戎还会建立一套模型评估系统,在虚拟环境下来评估,

这样整体的数据训练、利用率再到对有效数据的抓取,还有对大模型的评估体系都有了更好的循环。

3、大模型不再是专科医生。

从研发角度来说,一旦大模型的能力足够强时,研发团队就不用再为每个任务单独开发小模型,只要在这个大模型的基础上,稍微调整,就能衍生出适合不同场景、不同需求的模型版本。

这也是我们理解的专家混合模型,过去传统大模型遇到的问题是,我们看病要么挂专科,但是专科医生只能看一种病,一种是全科,它什么都能解决,但是整体成本很高。

混合专家模型,就是在一个中台上安排了多个专科医生来回调用,他可以针对不同问题,来激活各个专科医生,在原先的基础上新增了一个问诊的中间环节。

这样大模型的背景下,大量的人力就可以集中聚焦在优化大模型这件事上。可以降低开发和管理成本,也缩短了研发时间。

4、大模型的部署,和大算力不一定有关。

阮翀提到大模型的部署第一可以通过中轴(蒸馏)去解决,用大模型教一个小模型,这样小模型的能力也会很强,比你从头训练一个小模型强很多。

第二,要相信时间的力量。时间意味着硬件的进步,以前车载芯片算力有限,过几年翻几倍。只要你相信这个过程是持续的,模型的大小就不会是问题。

其次模型的密度其实也在发生变化。

这一代模型跟上一代相比,能力可以跨量级比较。模型设计密度本身也会提升。随着模型发展,可能需要一个直接模型才能达到预期的能力;但可能过两年,可能只需要一个更小的模型就可以了。

这种转变背后,研发流程和公司组织方式也在跟着升级。在后大语言模型时代,AI不再是智驾系统的“辅助工具”,而是建立以大模型为核心的AI 原生体系。

而未来能存活下来的智驾公司,也终将变成具备通用能力的智能移动AI公司。

#新能源汽车##大v聊车#

发布于 广东