小欣科技
26-06-25 12:14 微博认证:科技博主

微博这波有点意思啊,他们闷声搞了个VibeThinker-3B 的模型,参数才 30 亿,训练成本就几万美元,结果直接冲上了 Hugging Face 首页热榜,还在 Hacker News 排到第四。
现在满大街都在比谁参数大、谁烧钱狠,微博偏偏走了条反方向的路,用小几十亿参数、花点奶茶预算,一样把效果做到能打。
这说明智能这条路,确实不止更大这一种解法,会省也是一种本事。#微博大模型可真能省钱#

发布于 山西