VibeThinker-3B数学94.3分

微博自研VibeThinker-3B模型以30亿参数、数万美元成本，在AIME数学测试斩获94.3分，性能直逼6710亿参数的DeepSeek V3.2！这记“四两拨千斤”的技术突袭，彻底动摇了“参数越大越好”的行业迷思。其核心在于精准聚焦：将有限算力集中于数学/代码等硬推理任务，而非填充通用知识。对比MiniMax M1单次训练53.5万美元的投入，VibeThinker-3B的成本效率堪称颠覆。它证明在特定场景下，精巧算法设计能绕过算力军备竞赛——这对资源有限的创业团队无疑是重大利好。更深远的意义在于，AI发展或将分化出“知识巨擘”与“推理精兵”双轨路线，智能的本质或许不在记忆广度，而在推理深度。 http://t.cn/AXSKckrM

发布于安徽