近日,伊利诺伊大学厄巴纳 - 香槟分校(UIUC)等团队在智能体从错误中学习领域取得了重要进展。
UIUC与谷歌云AI研究团队联合开发了ReasoningBank框架。该框架通过结构化推理记忆,让智能体不仅能从成功中提炼策略,更能从失败中提取预防性教训。它采用LLM自评判机制来识别成功和失败,消除了对人工标注的需求,使整个学习过程完全自动化。在WebArena测试中,ReasoningBank相比基线智能体有显著提升,如在WebArena Admin子集测试中,ReasoningBank成功率达到51.1%。
此外,UIUC等团队还发布了AgentDebug框架。该框架为智能体引入了“调试循环”,当任务失败时,它会自动触发错误检测、根因定位与定向修复。实验表明,AgentDebug的“根因修复”策略显著优于传统的“反思—重试”方法,在三大环境的综合测试中,它将任务成功率平均提升了26%,错误定位准确率提升24%,步骤预测精度提升17%。 http://t.cn/AXAsem6G
发布于 福建
