开眼视点
26-06-26 09:39 微博认证:C114通信人家园3G版主、专栏作者李建昆,出版作品有《如影随形》 科技博主

微博自研VibeThinker-3B模型以30亿参数、数万美元成本,在AIME数学测试斩获94.3分,性能直逼6710亿参数的DeepSeek V3.2!这记“四两拨千斤”的技术突袭,彻底动摇了“参数越大越好”的行业迷思。其核心在于精准聚焦:将有限算力集中于数学/代码等硬推理任务,而非填充通用知识。对比MiniMax M1单次训练53.5万美元的投入,VibeThinker-3B的成本效率堪称颠覆。它证明在特定场景下,精巧算法设计能绕过算力军备竞赛——这对资源有限的创业团队无疑是重大利好。更深远的意义在于,AI发展或将分化出“知识巨擘”与“推理精兵”双轨路线,智能的本质或许不在记忆广度,而在推理深度。 http://t.cn/AXSKckrM

发布于 安徽