【消失的120B:AI模型尺寸的“断层”阳谋】
最近开源模型要么是30B小钢炮,要么直奔200B,中间的120B档突然断货。这背后是技术进化与商业算计的夹击。
技术上,MoE架构效率革命挤压了空间。现在35B模型通过精简活跃参数,体验已能和老一代120B打平,还省显存,中间档性价比全无。
商业上则是“防守性挤压”。120B是危险的甜点位:它足够聪明,一旦开源能本地替代九成商业API;但对普通玩家又太重。大厂不发这个级别,是为了保护云端订阅,把用户往两极逼。
不必纠结这个断档,榨干35B级别的优质Quant,就是现阶段的最佳解。
reddit.com/r/LocalLLaMA/comments/1u6e0fo/why_there_is_a_lack_of_new_100b120b_models
#人工智能##AI创造营##开源模型##MoE#
发布于 北京
