120B模型断货_新浪新闻

【消失的120B：AI模型尺寸的“断层”阳谋】

最近开源模型要么是30B小钢炮，要么直奔200B，中间的120B档突然断货。这背后是技术进化与商业算计的夹击。

技术上，MoE架构效率革命挤压了空间。现在35B模型通过精简活跃参数，体验已能和老一代120B打平，还省显存，中间档性价比全无。

商业上则是“防守性挤压”。120B是危险的甜点位：它足够聪明，一旦开源能本地替代九成商业API；但对普通玩家又太重。大厂不发这个级别，是为了保护云端订阅，把用户往两极逼。

不必纠结这个断档，榨干35B级别的优质Quant，就是现阶段的最佳解。

reddit.com/r/LocalLLaMA/comments/1u6e0fo/why_there_is_a_lack_of_new_100b120b_models

#人工智能##AI创造营##开源模型##MoE#

发布于北京