#微博大模型可真能省钱#如今整个AI赛道基本都在陷入疯狂内卷,各家一味堆砌超大参数、疯狂投入高额算力,训练一次就要烧掉巨额资金,仿佛只有砸钱才能做出好用的大模型。
微博自研的VibeThinker-3B算是走出了完全不一样的路子,不仅登顶Hugging Face热榜,在Hacker News也冲到第四,在海外收获了不少认可。
最亮眼的还是它的投入成本,仅仅几万美金就完成训练,性价比直接拉满。三十亿小参数的体量,却能搞定数学计算、代码编写这类硬核推理任务,对标一众千亿级顶尖模型完全不落下风。
在我看来AI未来拼的不该是谁更舍得烧钱,高效轻量化才是长久方向,这种低成本还能打效果的模型,才更容易大范围落地普及。#ai创造营# http://t.cn/AXSophaV
发布于 浙江
