MoonShotAI 刚也发了个新模型——Kimi-Dev-72B
这个模型是基于 Qwen2.5-72B 微调得到的。经过了摧枯拉朽的强化学习,把 SWE-Bench 分数弄到了60分+,超过了 Qwen3-235B-A22B, DeepSeek-R1-0528. 我是对这个分数有怀疑的,真这么猛为啥不放出 kimi-2? 总之是骡子是马咱们拉出来溜溜.
另外 Lin Junyang (Qwen研发负责人) 在X上说并没有授权, 不过Kimi这个微调用MIT是没问题的. 我研究了一下Qwen协议,里面写着Qwen模型本身部分用Qwen协议,剩下自己微调的部分是可以用其他协议发布的. 所以这么做的确没什么问题.
目前官方还没放出技术报告,等有了我给大家解读一下。模型我已经在测了,预计30分钟后放出测试视频,请大家稍等。
模型地址:huggingface.co/moonshotai/Kimi-Dev-72B
#ai创造营##AI生活指南#
发布于 美国
