爱可可-爱生活
26-05-09 05:32 微博认证:AI博主 2025微博新锐新知博主

[LG]《SkillOS: Learning Skill Curation for Self-Evolving Agents》S Ouyang, J Yan, Y Chen, R Han… [University of Illinois Urbana-Champaign & Google Cloud AI Research] (2026)

在自演化智能体中,经验如何沉淀成可复用技能是一个悬而未决的难题。过去的方法受困于人工整理或固定规则,本质原因是技能好坏要到后续任务才显形。

本文的核心洞见是:把技能库重新看作可被训练的操作系统。由此,让策展器通过插入、更新、删除技能,并用相关任务流的后续表现反向奖惩,使经验变成可维护资产。

这项工作真正留下的遗产是把“会做题”推进到“会整理做题经验”。它为后来者打开的新门是训练专职技能策展器,但尚未跨过的门槛是开放世界中技能冲突、遗忘与安全边界。

arxiv.org/abs/2605.06614 #机器学习# #人工智能# #论文# #AI创造营#

发布于 北京