上海交通大学与小红书团队提出了 LoopTool:一个自动的(autonomous)、模型感知(model-aware)、迭代式(iterative)的数据进化框架,首次实现了工具调用任务的数据–模型闭环优化。团队仅依靠开源模型 Qwen3-32B 作为数据生成器与判别器,在无闭源 API 依赖的情况下,让一个 8B 规模的 LoopTool 模型在工具调用表现上显著超越其 32B 数据生成器,并在 BFCL-v3 与 ACEBench 公开榜单上取得同规模模型的最佳成绩。 http://t.cn/AXLvqbR3
