老刘说NLP_刘焕勇
25-07-11 09:52 微博认证:AI博主

近期代表性开源大模型梳理:Decoder转Encoder-Decoder、多模型组合新趋势,近期国外开源了不少有趣的模型,大的小的都有,还有对deepseek-r1的魔改,这里做个汇总,包括:SmolLM3小模型、T5Gemma模型、NextCoder-32B模型、DeepSeek-TNG-R1T2-Chimera专家组合模型,一共4 个模型。尤其是,其中用到的模型合并方案,看来已经是广泛采用了。http://t.cn/A6kUekUS

发布于 北京