爱可可-爱生活 26-01-11 10:27
微博认证:AI博主 2025微博新锐新知博主

【Claude Code现在能帮你微调模型了,成本只要0.5美元】

一个有意思的进展:Claude Code的能力边界又被拓宽了。

Belinda团队做了一个基于Tinker的Claude Code skill,让普通用户也能轻松完成模型微调这件“技术活”。

这个skill的设计思路很值得琢磨。它本质上是把Tinker Cookbook的内容重新组织,但采用了“渐进式披露”的策略——agent不会一股脑把所有文档塞进system prompt,而是根据当前任务按需调取相关信息。这种设计让整个流程更加高效精准。

实测效果如何?他们用一位同事的Obsidian笔记做了测试。一次Claude Code对话,0.5美元的计算成本,就训练出了一个能模仿他写作风格的模型。

这个案例让我想到一个更大的命题:AI工具正在把原本需要专业背景的工作变得平民化。微调模型曾经是ML工程师的专属领域,现在通过合理的工具封装,普通用户也能上手。

有人问了一个好问题:这和直接让Claude Code写训练脚本有什么区别?

Belinda的回答很精辟:这就像pip模块,但是用于自然语言。你当然可以自己从头写Python脚本,但用社区验证过的方案能省下大量时间。

这个类比点出了skills的本质价值——它是一种知识和最佳实践的封装形式,让经验可以被复用和传递。

值得一提的是,OpenAI联合创始人John Schulman也在评论区表示会尝试这个功能。当顶级研究者也开始用这类工具,说明它确实解决了真实痛点。

目前这个skill主要针对微调场景,团队表示后续会加入eval功能,也可能扩展到RL领域。另外有人提到,现在分享Claude skills只能通过GitHub repo,确实需要更便捷的方式。

如果你想尝试,项目地址在这里:github.com/sundial-org/skills/tree/main/skills/tinker

x.com/belindmo/status/2009302081702691127

发布于 北京