#Kimi新模型反超DeepSeek##AI数学SOTA又变天#Kimi新模型数学超越DeepSeek了！Kimi定理证明模型更新，直接在数学能力上实现反超——在miniF2F基准测试中，通过率干到了92.2%，一举超越DeepSeek-Prover-V2，成为当前数学推理SOTA。这次胜出的，是Numina和Kimi团队联手打造的Kimina-Prover模型，虽

#Kimi新模型反超DeepSeek##AI数学SOTA又变天#

Kimi新模型数学超越DeepSeek了！

Kimi定理证明模型更新，直接在数学能力上实现反超——在miniF2F基准测试中，通过率干到了92.2%，一举超越DeepSeek-Prover-V2，成为当前数学推理SOTA。

这次胜出的，是Numina和Kimi团队联手打造的Kimina-Prover模型，虽基于仅72B参数的Qwen2.5，但凭借两项关键技术突破，成功击败了参数高达671B的DeepSeek版本。

具体来说：

- 团队引入了一个全新的测试时强化学习（TTRL）搜索框架，让模型可以像人类一样，通过拆分问题、反复尝试、复用中间结论（引理），实现更深层的结构化推理；

- 增加了一个“能读懂自己错误”的纠错模块，结合训练中批量失败重演策略，让模型能有效吸收每一次失败经验，大幅提升修正能力。

Kimi和DeepSeek在这条赛道上已经多次过招，两个月前还是DeepSeek领先，如今又被反超。双方这场AI数学对决，确实越来越有意思了。http://t.cn/A6kG3OOX