Claude Code开放模型微调

【Claude Code现在能帮你微调模型了，成本只要0.5美元】

一个有意思的进展：Claude Code的能力边界又被拓宽了。

Belinda团队做了一个基于Tinker的Claude Code skill，让普通用户也能轻松完成模型微调这件“技术活”。

这个skill的设计思路很值得琢磨。它本质上是把Tinker Cookbook的内容重新组织，但采用了“渐进式披露”的策略——agent不会一股脑把所有文档塞进system prompt，而是根据当前任务按需调取相关信息。这种设计让整个流程更加高效精准。

实测效果如何？他们用一位同事的Obsidian笔记做了测试。一次Claude Code对话，0.5美元的计算成本，就训练出了一个能模仿他写作风格的模型。

这个案例让我想到一个更大的命题：AI工具正在把原本需要专业背景的工作变得平民化。微调模型曾经是ML工程师的专属领域，现在通过合理的工具封装，普通用户也能上手。

有人问了一个好问题：这和直接让Claude Code写训练脚本有什么区别？

Belinda的回答很精辟：这就像pip模块，但是用于自然语言。你当然可以自己从头写Python脚本，但用社区验证过的方案能省下大量时间。

这个类比点出了skills的本质价值——它是一种知识和最佳实践的封装形式，让经验可以被复用和传递。

值得一提的是，OpenAI联合创始人John Schulman也在评论区表示会尝试这个功能。当顶级研究者也开始用这类工具，说明它确实解决了真实痛点。

目前这个skill主要针对微调场景，团队表示后续会加入eval功能，也可能扩展到RL领域。另外有人提到，现在分享Claude skills只能通过GitHub repo，确实需要更便捷的方式。

如果你想尝试，项目地址在这里：github.com/sundial-org/skills/tree/main/skills/tinker

x.com/belindmo/status/2009302081702691127

发布于北京