karminski-牙医 25-06-17 09:00
微博认证:AI博主

MoonShotAI 刚也发了个新模型——Kimi-Dev-72B

这个模型是基于 Qwen2.5-72B 微调得到的。经过了摧枯拉朽的强化学习,把 SWE-Bench 分数弄到了60分+,超过了 Qwen3-235B-A22B, DeepSeek-R1-0528. 我是对这个分数有怀疑的,真这么猛为啥不放出 kimi-2? 总之是骡子是马咱们拉出来溜溜.

另外 Lin Junyang (Qwen研发负责人) 在X上说并没有授权, 不过Kimi这个微调用MIT是没问题的. 我研究了一下Qwen协议,里面写着Qwen模型本身部分用Qwen协议,剩下自己微调的部分是可以用其他协议发布的. 所以这么做的确没什么问题.

目前官方还没放出技术报告,等有了我给大家解读一下。模型我已经在测了,预计30分钟后放出测试视频,请大家稍等。

模型地址:huggingface.co/moonshotai/Kimi-Dev-72B

#ai创造营##AI生活指南#

发布于 美国