爱可可-爱生活 25-03-06 13:22
微博认证:AI博主 2025微博新锐新知博主

【[61星]Light-R1:用不到1000美元的成本,从零训练出超越现有数学大模型的AI。亮点:1. 仅用6小时训练时间,成本约1000美元;2. 在AIME24等数学竞赛中超越DeepSeek-R1-Distill-Qwen-32B;3. 提供完整的训练数据和代码,助力低成本复现】
'Light-R1: Surpassing R1-Distill in Math from Scratch with $1000 through Curriculum SFT & DPO'
GitHub: github.com/Qihoo360/Light-R1
#数学AI# #低成本训练# #开源模型# #AI创造营#

发布于 北京