新智元
25-06-03 09:02 微博认证:新智元官方微博

你打造了一支「超级AI战队」——战队里每个AI都各司其职:有的收集信息、有的负责判断,还有的协调执行,一起协作攻克复杂任务。#AI创造营#

这个愿望看似天衣无缝,结果却往往以失败告终。问题就出在:当「问题」出现的时候,如何知道是哪个AI干的?

就像代码Debug一样,从堆积如山的模型对话记录、调用日志和中间结果找到哪个AI掉链子几乎不可能,而且AI本身还是个「黑箱」。

这就是今天多智能体AI系统面临的真实困境:不仅频繁失败,而且溯源问题困难。
为了解决这个「AI版罗生门」,宾夕法尼亚州立大学与杜克大学联合Google DeepMind等机构的研究者们首次提出了:自动化失败归因(Automated Failure Attribution)——让AI自己举手:我错了!

目前,这篇论文不仅成功斩获了顶会ICML 2025 Spotlight,而且配套的首个专用基准数据集Who&When和相关代码也已全部开源。

论文地址:http://t.cn/A6e7BDCk
代码地址:http://t.cn/A6eykA19