进化微调论文_新浪新闻

[CL]《Evolution Fine-Tuning: Learning to Discover Across 371 Optimization Tasks》Y Lee, S Kim, M Kang, A C L Chuen… [University of Minnesota & CMU & KAIST] (2026)

在自动科学发现领域，利用大模型解决复杂优化任务长期受困于“冷启动”瓶颈。过去的方法高度依赖外部搜索框架（Scaffold）来驱动迭代，模型仅被当作随机变异器使用，本质原因是模型未能内化变异、回溯与演化的认知逻辑，导致每次面对新问题都必须从零开始，且小规模开源模型在复杂路径中极易迷失。

本文的核心洞见是：将进化搜索的轨迹本身视为一种可学习的监督信号，通过“中期微调”（Mid-training）让模型内化发现能力。由此，研究者构建了包含 15.6 万条演化路径的 Finch 数据集，使模型在跨域训练中掌握了“如何改进方案”的元技能。这种认知跳跃让 9B 规模的模型能将数值分析的策略迁移至竞赛编程，实现了从“依赖框架驱动”向“模型自主演化”的转变。

这项工作真正留下的遗产是证明了“发现能力”可以被蒸馏进模型参数，为开发通用型科学发现智能体提供了标准化范式。它成功让小型开源模型在多个数学与工程任务上逼近闭源巨头的表现，打破了算力门槛；但尚未跨过的门槛是，当前模型仍局限于单轮次演化推理，在处理极高难度的前沿数学猜想时，其搜索深度与创造性仍需进一步突破。

arxiv.org/abs/2606.29082 #机器学习# #人工智能# #论文# #AI创造营#

发布于北京