大模型可以自己提出问题，然后自己写代码，然后运行代码来验证想法是否正确，这样循环左右互搏来提升自己吗？可以的！来看这个项目：Absolute-Zero-Reasoner这个项目就能完成上述功能，让大模型编程和数学能力变得更强，从数据上来看，使用 Qwen2.5-7B 测试，编程能力提升了5分，数学能力提升了15.

大模型可以自己提出问题，然后自己写代码，然后运行代码来验证想法是否正确，这样循环左右互搏来提升自己吗？

可以的！来看这个项目：Absolute-Zero-Reasoner

这个项目就能完成上述功能，让大模型编程和数学能力变得更强，从数据上来看，使用 Qwen2.5-7B 测试，编程能力提升了5分，数学能力提升了15.2分（100分满分）！

那么代价是什么？答案是费显存，官方的数据是：3b 模型需要 2 块 80gb 的 GPU，7/8b 模型需要 4 块 80gb，14b 模型需要 8 块 80gb。

项目地址：github.com/LeapLabTHU/Absolute-Zero-Reasoner
论文：arxiv.org/pdf/2505.03335

#ai创造营# #AI生活指南#

发布于日本