#Kimi新模型反超DeepSeek##AI数学SOTA又变天#
Kimi新模型数学超越DeepSeek了!
Kimi定理证明模型更新,直接在数学能力上实现反超——在miniF2F基准测试中,通过率干到了92.2%,一举超越DeepSeek-Prover-V2,成为当前数学推理SOTA。
这次胜出的,是Numina和Kimi团队联手打造的Kimina-Prover模型,虽基于仅72B参数的Qwen2.5,但凭借两项关键技术突破,成功击败了参数高达671B的DeepSeek版本。
具体来说:
- 团队引入了一个全新的测试时强化学习(TTRL)搜索框架,让模型可以像人类一样,通过拆分问题、反复尝试、复用中间结论(引理),实现更深层的结构化推理;
- 增加了一个“能读懂自己错误”的纠错模块,结合训练中批量失败重演策略,让模型能有效吸收每一次失败经验,大幅提升修正能力。
Kimi和DeepSeek在这条赛道上已经多次过招,两个月前还是DeepSeek领先,如今又被反超。双方这场AI数学对决,确实越来越有意思了。http://t.cn/A6kG3OOX
