大模型可以自己提出问题,然后自己写代码,然后运行代码来验证想法是否正确,这样循环左右互搏来提升自己吗?
可以的!来看这个项目:Absolute-Zero-Reasoner
这个项目就能完成上述功能,让大模型编程和数学能力变得更强,从数据上来看,使用 Qwen2.5-7B 测试,编程能力提升了5分,数学能力提升了15.2分(100分满分)!
那么代价是什么?答案是费显存,官方的数据是:3b 模型需要 2 块 80gb 的 GPU,7/8b 模型需要 4 块 80gb,14b 模型需要 8 块 80gb。
项目地址:github.com/LeapLabTHU/Absolute-Zero-Reasoner
论文:arxiv.org/pdf/2505.03335
#ai创造营# #AI生活指南#
发布于 日本
