CORAL框架实现多智能体自主进化

[LG]《CORAL: Towards Autonomous Multi-Agent Evolution for Open-Ended Discovery》A Qu, H Zheng, Z Zhou, Y Yan… [MIT & NUS] (2026)

在GPU内核优化和数学发现等开放性问题中，现有LLM进化框架受困于固定启发式规则——智能体只能按预设流程"提议候选方案"，无法自主决定检索什么、何时测试、记住什么。这道枷锁在多智能体系统中更致命：当任务分解方式本身未知，预设角色和通信结构就成了盲人摸象。

CORAL的核心洞见是：把进化算法的控制权从外部脚手架还给智能体本身。由此，三项关键操作使问题得以解开——共享持久文件系统让多智能体通过"尝试/笔记/技能"异步交换发现；心跳机制（反思、整合、转向）在智能体陷入局部极值时强制重定向；隔离工作区则防止智能体互相干扰或破解评估器。

这项工作真正留下的遗产是：用"自主进化"替代"固定搜索"的范式，证明多智能体协作带来的收益来自协同本身而非算力堆砌——在Anthropic内核工程任务上，4个协同智能体将最优解从1363周期压缩至1103周期，超越了人类与AI的先前纪录。它为后来者打开的新门是：让智能体自我定制心跳规则、注入异质性角色以激发更大探索多样性。但尚未跨过的门槛是：当评估器本身难以获取或存在根本歧义时，如何让评估逻辑与解法同步共同进化。

arxiv.org/abs/2604.01658

#机器学习# #人工智能# #论文# #AI创造营#

发布于北京