晓春哥XCG 25-11-28 10:37
微博认证:数码博主 超话粉丝大咖(知电晓春哥超话) 微博原创视频博主 头条文章作者

#DeepSeek推出新模型#
DeepSeekMath‑V2发布了,此次是主打可自我验证的数学推理训练框架。
团队认为,仅追求最终答案正确率难以保证推理链条的严谨性,尤其在定理证明等需要逐步推导的任务中更为突出。模型通过构建基于 LLM 的验证器,对生成的证明进行自动审查,并利用扩展的验证计算持续生成高难度训练样本提升验证器能力。
就是简单说,不仅仅是给答案,还要有推理过程。
深入研究下去,可以构建更强大、更可靠的数学智能系统。

发布于 北京