Kimi-K2-Thinking 实测! 差距继续缩小!
给大家带来 kimi k2 thinking 的测试结果:
大象牙膏测试没问题, 感觉物理效果又进步了! 这个粘稠的质感已经越来越象大象牙膏了, 不过烧瓶内液面还是差点意思.
鞭炮连锁爆炸也没问题, 老强项了, 可以看跟过去的 kimi k2 0905 的对比, 鞭炮皮优化了.
这次的新测试效果也很好, 对比之下跟 Claude-Sonnet-4.5 生成的结果几乎看不出来差别.
python 杯子倒水测试同样跟 0905 版本对比也好了很多,
另外, 本次还追加了前端页面测试, 写一个瀑布流页面, 也没问题, 缩放效果良好.
最后, 我还给大家整了个活, 2个小时内极限 Vibe 编程, 用 claude code + kimi k2 thinking 写了个 claude code 的克隆 Rock Code, 实现了写代码, 编辑文件, 本地运行脚本. 全程很顺畅.
总结, 国产大模型虽然还没有超过 claude, 但是已经距离 claude 越来越近了! Anthropic 就问你怕不怕?
#ai创造营##ai生活指南##月之暗面# http://t.cn/AXAdq3F1
发布于 北京
