扬子晚报 26-03-04 10:39
微博认证:《扬子晚报》官方微博

#理想发布端侧大模型软硬协同定律##端侧大模型重新定义上车方式# 【当大模型走向端侧,理想汽车重新定义“上车”方式】进入2026年,人工智能正从云端的“思考者”转变为现实世界的“行动派”。从春晚舞台上灵动的机器人,到愈发拟人的智能驾驶,AI的实体化浪潮对端侧计算提出了前所未有的苛刻要求:如何在有限的功耗、成本和物理空间内,承载大模型级别的认知智能?
在复杂度最高的端侧场景——智能汽车中,这一矛盾尤为突出。一方面,以大语言模型为核心的VLA(视觉-语言-行动)系统需要更高的认知智能;另一方面,车载芯片的功耗、散热、成本等物理限制,让传统“暴力堆算力”的模式难以为继。单纯依赖算力堆叠的路径已触及天花板,行业迫切需要一套全新的方法论,来重新定义AI“上车”的方式。
理想的解题思路是从源头打破芯片与算法的壁垒。近期,理想汽车MindVLA团队联合国创决策智能技术研究所,正式提出端侧大语言模型的“软硬协同设计定律”(Hardware Co-Design Scaling Laws via Roofline Modelling for On-Device LLMs)。该研究通过引入屋顶线模型,将模型精度、推理延迟与硬件特性统一纳入数学建模,让芯片与算法在研发初期实现协同优化,而非事后适配。
该定律在研发中展现出三大实践价值:时间维度上,将传统数月的模型设计和选型周期压缩至一周以内;硬件层面,指导模型适配芯片物理特性,无需盲目采用高端芯片即可释放同等智能;应用层面,能基于应用场景的输入输出参数快速匹配最优模型配置,显著缩短应用开发周期。
基于工程实践,理想提炼了多项定义下一代芯片的关键技术发现:稀疏计算成为标配,要求芯片原生支持稀疏运算;内存子系统重要性超越算力峰值,芯片需具备动态微架构重构能力;传统Transformer的FFN扩展比效率偏低,计算单元配比需更灵活;INT8量化实际加速仅1.3-1.6倍,下一代芯片需原生支持混合精度与算子融合。
这些理论在自研芯片“马赫100”上得到验证。搭载于全新理想L9的双马赫100系统总算力2560TOPS,其数据流架构为算法提供最大优化空间,单颗芯片“有效算力”达英伟达Thor U的三倍。软硬协同释放的“有效算力”,转化为用户可感知的价值:更高帧率、更短响应时间,让车辆在紧急情况下更快避险。
理想认为,没有通用芯片,只有场景最优芯片,这证明了“算法定义芯片”的必要性。“软硬协同设计定律”不仅解决了自身工程难题,更将复杂系统优化变为可计算、可预测的科学问题,为端侧AI产业提供了可复制路径。从星环OS到马赫100再到协同设计理论,理想汽车正从“技术跟随者”向“范式定义者”跃迁,在AI实体化浪潮中重新定义智能的边界。(记者 于海燕)