MoonShotAI 刚也发了个新模型——Kimi-Dev-72B 这个模型是基于 Qwen2.5-72B 微调得到的。经过了摧枯拉朽的强化学习，把 SWE-Bench 分数弄到了60分+，超过了 Qwen3-235B-A22B, DeepSeek-R1-0528. 我是对这个分数有怀疑的，真这么猛为啥不放出 kimi-2? 总之是骡子是马咱们拉出来溜溜.另外 Lin Junyan

MoonShotAI 刚也发了个新模型——Kimi-Dev-72B

这个模型是基于 Qwen2.5-72B 微调得到的。经过了摧枯拉朽的强化学习，把 SWE-Bench 分数弄到了60分+，超过了 Qwen3-235B-A22B, DeepSeek-R1-0528. 我是对这个分数有怀疑的，真这么猛为啥不放出 kimi-2? 总之是骡子是马咱们拉出来溜溜.

另外 Lin Junyang (Qwen研发负责人) 在X上说并没有授权, 不过Kimi这个微调用MIT是没问题的. 我研究了一下Qwen协议，里面写着Qwen模型本身部分用Qwen协议，剩下自己微调的部分是可以用其他协议发布的. 所以这么做的确没什么问题.

目前官方还没放出技术报告，等有了我给大家解读一下。模型我已经在测了，预计30分钟后放出测试视频，请大家稍等。

模型地址：huggingface.co/moonshotai/Kimi-Dev-72B

#ai创造营##AI生活指南#

发布于美国