《主动安全的模型化~致敬国内负责开发主动安全功能的小伙伴们》
很久没有写长博,刚好看到@杨杰Safety 很开心的丢了两篇研究给我【图一/图二】,简单读了一下觉得还是有感触想说几句。[流鼻血][不愧是你]
这个就不是当作文献解读,而是讲讲我对主动安全的理解和认识吧~
原因写在最前面,现在无论是消费者还是厂家还是供应商都把更多的精力放在舒适性配置【驾驶辅助】上,其实最为主动安全功能的研发团队,是非常受限于研发预算、数据途径和消费者技术感知去获得更大的话语权。而从实际角度来说,L2的驾驶辅助只是解放了我们部分驾驶疲劳和精力,而主动安全功能确实拯救了一个个鲜活的生命。
主动安全功能最早是由我一直尊敬的沃尔沃品牌在力推,刚巧不巧我家里最早的车也是瑞典产的沃尔沃[不愧是你],而我成年以前的Dream Car 也是 沃尔沃XC90的T8,后来沃尔沃发布带L3的EX90后就一直希望未来可以买一辆EX90【没想到现在还没落地】[泪奔]。刚好有好多同学也在这个领域里,也因为自己的学术和知识背景参与过一些关于L3、主动安全和交互层面的探讨。
欸,好像有点偏题了,拉回来。回归头来讲为什么要做主动安全的模型化?
原因在于,我们都知道最开始的主动安全功能包括FCW、AEB 等等是沃尔沃做的最好,但是随着国内新势力【供应商】开始卷新的传感器,包括但不限于高线束激光雷达、4D毫米波、大算力芯片等等。我们发现好像在横向测试中沃尔沃的表现已经不是最好的。一方面是沃尔沃这些可能更多依赖于传统供应商,以Rule Based 为主的定义好的主动安全功能开发;另一方面,因为传统主机厂很难有高质量的数据回传导致,后续OTA迭代存在很大难度【没说没有做,也在做,只是真的很难】。
随着我们对主动安全功能的要求越来越高,像AES、ELKA等等各种各样场景,包括不规则下雨天鬼探头、雨雪雾天气的AEB等等。 传统的Rule Base的主动安全功能开发越来越不适应这个新环境。这也是我在2024年的时候就和另一个负责主动安全模型开发的同学聊起来,主动安全开发模型化势在必行【无论是做多个并行小模型还是其他的方式】,可以大大的提高主动安全能力的边界。当然最后他们也是国内主动安全功能做的最好的企业之一[不愧是你][不愧是你],不愧是清华大佬[不愧是你][不愧是你]
讲清楚,为什么要做主动安全的模型化后,其实问题就比较清楚。做模型,就非常依赖数据,而主动安全的触发数据和传统NOA里面所谓的100w 500w 1000w clips的数据收集、标注和配比完全不一样。
简单的逻辑是,传统NOA作为一个舒适性配置,主要是让模型能尽可能覆盖各种场景的数据匹配,这也是我们在做端到端场景中,有个数据场景分类的指标。好的一个行车端到端模型可能会有大几十种场景、甚至上百种场景的数据分类,单个数据分类也是呈现一个比较正太的数万clips的数据集。
而主动安全场景因为涉及到就 几个:1. 主动安全过早触发【导致舒适度下降】2. 主动安全过迟触发、无触发【发生碰撞或者其他】3. 主动安全误触发【虚惊,最不好的】4. 主动安全正确触发【减速时机合理且舒适度不错】。但是这个几个场景里面的数据不是正态分布的,所以数据标注和收集和NOA有很大的逻辑差异。
好了注意力拉回来,来看看这两篇研究~
一篇是《Scaling Learning-based AEB with Massive Unlabeled Data》基于海量无标注数据扩展学习式自动紧急制动系统:
另一篇是《Learning to Annotate Delayed and False AEB Events: A Practical System for Extreme Class Imbalance and Asymmetric Label Noise》学习标注延迟和错误的自动紧急制动(AEB)事件:一种应对极端类别不平衡和不对称标签噪声的实用系统。
这里我们看到,理想的主动安全团队@safety研究员 他们这两篇分别被ICRA【国际机器⼈与⾃动化会议】和IROS【智能机器⼈与系统国际会议】收录。这两篇文章其实都是尝试去解读,如何把主动安全功能模型化做好。
⭐第一篇SL-AEB模型,因为随着传感器和整车的迭代,传统的规则式的AEB算法很难处理传感器的信息,更难很早的去感知到 交通参与者的时空交互可能性从而提供更造的主动安全能力上限。而现在基于数据驱动的模型,可以自发的学习到主动安全的策略,从而实现更广泛的能力泛化。
但是最关键式这个AEB的数据标识,传统的人工打标签有两个最大的问题:1. 个体专家主观偏好,特别是AEB这类需要精准判断是否在触发边界的模糊场景其实质量并不高 2. 依赖于人工标注的成本太高,很难实现高质量数据集搜集。
所以是否可以用半监督学习【Semi-Supervised Learning】的方式通过大量无标注数据和少量小规模的安全标注锚点【labeled anchor】,实现AEB数据集的高可靠扩展?但是直接用SSL,刚才讲到因为主动安全任务场景的特殊性,会扩大虚假制动【虚惊】,从而影响AEB功能的可靠性。
这里因此提出了元反馈半监督学习【Meta-Feedback Semi-Supervised Learning, MF-SSL】的方式实现AEB的模型化【图三】。
简单来说就是一个教师模型一个学生模型,两套安全锁。教师模型为海量无标注数据生成伪标签训练学生;噪声感知解耦(NAD)剔除标注锚点中的模糊样本,防止边界争议污染模型;运动学门控 + 教师冲突惩罚用轻量级TTC检查器拦截与物理常识矛盾的伪标签,防止“风险幻觉”。
在仿真中,无标注数据从100万扩展到10亿窗口时,碰撞缓解分数(S_safe)从47.90提升至67.80,舒适度分数(S_comf)从92.70提升至97.67——安全性和舒适性同步提升。
在量产数据中,部署至数十万辆车,经超10亿公里真实驾驶验证,正负激活比(PFR)超过100:1,无事故行驶里程(AFM)提升35%。每100次正确制动中误触发不到1次。
⭐实现了主动安全行业里程碑意义的突破!大幅度提升了无事故行驶里程!⭐
⭐第二篇【图四】则从AEB标注层面触发,通过革新了标注模式,提高了AEB量产运营能力的上限。
第一篇论文解决了 模型AEB 怎么学习?,那么学习的素材哪里来?
这里回过头要看一下, AEB的模型学习基础的标注数据 在哪里?
在实际工程运营中 理想的主动安全团队,每天处理数千次主动安全的触发事件【也证明量产车队是真的大】,但是在这里延迟触发、误触发占比不到5%。
而测试工程师需要人工标注这些 占比不到5%的数据来定位现在AEB能力的不足,这个成本实在太高。
因此理想的主动安全团队首次提出了 AEB触发事件自动化标注框架。
为什么这个自动化标注框架很难,主要是两个问题:
1. 极端类别不平衡,在AEB标注数据中 真触发、误触发、延迟触发的数据占比约50:1:1。在52个样本中只有1个延迟触发和1个误触发。标准交叉熵训练中少数类样本对总体损失的贡献微乎其微,模型在优化过程中被自然拉向多数类,倾向于对所有样本预测为真触发。后果极为严重:模型几乎无法学习延迟触发和误触发的判别特征。
2. 非对称标签噪声,AEB标注中存在独特的噪声。延迟、误触发因为专家仔细分析标注准确率无限接近100%,而真触发会有1%左右的错误标注【实际上是错误触发、延迟触发,但是被标注成真触发了】。这种非对称性的噪音(少数类被错误标注成多数类)。会让模型出现自我强化机制。模型遇到少数类特征却看到多数类标签时,学会“即使有这些特征也应预测多数类”的保守策略以最小化损失,从影响到AEB的能力。
因此他们提出了双策略,AEB针对性数据增强(操控焦点目标属性、移植运动向量合成逼真少数类样本)和硬度驱动噪声抑制(跨训练轮次估计,区分“边界样本”和”错误标注”)。
实际的表现:
⭐90%召回率下,延迟触发精度达60.1%,误触发精度达59.7%,相比次优基线分别提升10.3%和11.1%。
⭐部署后每日数千条事件中不到100条需人工复核——95%自动化率,召回提升80%,人工工作量减少50%
从这两篇文章,其实理想的主动安全功能团队实现了【AEB的数据飞轮】
第二篇论文的标注系统持续产出高达【95%自动化标注】的数据质量,给第一篇论文的SSL框架,用数据训练更加优秀AEB模型,部署在车端上;车端触发的AEB数据回到标注系统自动处理后持续优化。
从而实现AEB的持续自我改进车开得越多,数据越厚,模型越强,系统越安全。
最后我们从方法论的角度来看一下,为什么这两个研究很重要,客观来说好像这两个研究并不是这么的高深。但是本质上是主动安全部门,掌握、了解、学习的 主动安全场景的数据特点,从要收集哪些数据、如何成本可控的去搜集这些数据构建高质量数据集,来提升模型能力,从而实现功能的优化。
换句话说,如果主动安全部门负责搜集数据的不理解什么是真的主动安全场景,那么就没法实现针对性的数据搜集。 再用更加简单的话来说,因为主动安全功能是一个,你在正常开车最好是【0触发】,但是遇到极端场景最好【100%正确触发】。意思是这个模型既要理解什么是正常开车,我不应该介入,什么是反直觉的有危险的【灵光一闪】我需要介入。
这个也是主动安全模型化最难的地方,而为了保护所有路上的交通参与者。我一直支持所有做主动安全功能的小伙伴们【这里包括我的好多同学朋友】,大家一起加油,把这个系统做的更好、更强。
也希望主机厂、供应商的决策层可以再多给一点资源到主动安全领域,谢谢大家~
3650字,纯手搓~有错别字的地方请谅解[流鼻血]
#懒博小课堂# #微博新知# #大v聊车# #理想汽车[超话]#
