26-06-25 11:58 微博认证:城中梦影摄影工作室 摄影师 汽车博主

#微博大模型可真能省钱#
刷到微博自研VibeThinker-3B模型有点颠覆认知,行业一直默认堆大参数、砸算力才是硬道理,结果30亿小模型推理能力直接对标千亿级GPT、Gemini,训练成本还低到离谱,差距几十上百倍。

核心思路挺有意思,把推理和知识库拆开压缩,不用无脑堆规模也能搞定数学、编程这类难题,等于打破“越大越强”的固有思维。

其实日常用AI真不一定需要全能巨无霸,写代码、算题这种刚需场景,轻便高效的小模型反而更实用。现在行业都在疯狂烧钱做大模型,微博这波“以小博大”算是走出新思路。

好奇大家更偏向全能大模型,还是低成本、推理在线的轻量化AI?

发布于 天津