量子位 25-04-11 16:23
微博认证:量子位官方微博

#字节小参数模型反超DeepSeek##豆包迎来史诗级加强#

字节最新深度思考模型,在数学、代码等多项推理任务中超过DeepSeek-R1了?而且参数规模更小。

同样是MoE架构,字节新模型Seed-Thinking-v1.5有200B总参数和20B激活参数。

对比DeepSeek-R1的671B总参数和37B激活参数,可以算得上轻量级了。

为了训练出更聪明的AI,字节Seed团队从三方面下手,详见文章。 http://t.cn/A6rlxLJr