[LG]《CORAL: Towards Autonomous Multi-Agent Evolution for Open-Ended Discovery》A Qu, H Zheng, Z Zhou, Y Yan… [MIT & NUS] (2026)
在GPU内核优化和数学发现等开放性问题中,现有LLM进化框架受困于固定启发式规则——智能体只能按预设流程"提议候选方案",无法自主决定检索什么、何时测试、记住什么。这道枷锁在多智能体系统中更致命:当任务分解方式本身未知,预设角色和通信结构就成了盲人摸象。
CORAL的核心洞见是:把进化算法的控制权从外部脚手架还给智能体本身。由此,三项关键操作使问题得以解开——共享持久文件系统让多智能体通过"尝试/笔记/技能"异步交换发现;心跳机制(反思、整合、转向)在智能体陷入局部极值时强制重定向;隔离工作区则防止智能体互相干扰或破解评估器。
这项工作真正留下的遗产是:用"自主进化"替代"固定搜索"的范式,证明多智能体协作带来的收益来自协同本身而非算力堆砌——在Anthropic内核工程任务上,4个协同智能体将最优解从1363周期压缩至1103周期,超越了人类与AI的先前纪录。它为后来者打开的新门是:让智能体自我定制心跳规则、注入异质性角色以激发更大探索多样性。但尚未跨过的门槛是:当评估器本身难以获取或存在根本歧义时,如何让评估逻辑与解法同步共同进化。
arxiv.org/abs/2604.01658
#机器学习# #人工智能# #论文# #AI创造营#
发布于 北京
