你打造了一支「超级AI战队」——战队里每个AI都各司其职：有的收集信息、有的负责判断，还有的协调执行，一起协作攻克复杂任务。#AI创造营# 这个愿望看似天衣无缝，结果却往往以失败告终。问题就出在：当「问题」出现的时候，如何知道是哪个AI干的？就像代码Debug一样，从堆积如山的模型对话记录、

你打造了一支「超级AI战队」——战队里每个AI都各司其职：有的收集信息、有的负责判断，还有的协调执行，一起协作攻克复杂任务。#AI创造营#

这个愿望看似天衣无缝，结果却往往以失败告终。问题就出在：当「问题」出现的时候，如何知道是哪个AI干的？

就像代码Debug一样，从堆积如山的模型对话记录、调用日志和中间结果找到哪个AI掉链子几乎不可能，而且AI本身还是个「黑箱」。

这就是今天多智能体AI系统面临的真实困境：不仅频繁失败，而且溯源问题困难。
为了解决这个「AI版罗生门」，宾夕法尼亚州立大学与杜克大学联合Google DeepMind等机构的研究者们首次提出了：自动化失败归因（Automated Failure Attribution）——让AI自己举手：我错了！

目前，这篇论文不仅成功斩获了顶会ICML 2025 Spotlight，而且配套的首个专用基准数据集Who&When和相关代码也已全部开源。

论文地址：http://t.cn/A6e7BDCk
代码地址：http://t.cn/A6eykA19