DeepSeek推出新模型

#DeepSeek推出新模型#
DeepSeekMath‑V2发布了，此次是主打可自我验证的数学推理训练框架。
团队认为，仅追求最终答案正确率难以保证推理链条的严谨性，尤其在定理证明等需要逐步推导的任务中更为突出。模型通过构建基于 LLM 的验证器，对生成的证明进行自动审查，并利用扩展的验证计算持续生成高难度训练样本提升验证器能力。
就是简单说，不仅仅是给答案，还要有推理过程。
深入研究下去，可以构建更强大、更可靠的数学智能系统。

发布于北京