近期代表性开源大模型梳理:Decoder转Encoder-Decoder、多模型组合新趋势,近期国外开源了不少有趣的模型,大的小的都有,还有对deepseek-r1的魔改,这里做个汇总,包括:SmolLM3小模型、T5Gemma模型、NextCoder-32B模型、DeepSeek-TNG-R1T2-Chimera专家组合模型,一共4 个模型。尤其是,其中用到的模型合并方案,看来已经是广泛采用了。http://t.cn/A6kUekUS
发布于 北京
近期代表性开源大模型梳理:Decoder转Encoder-Decoder、多模型组合新趋势,近期国外开源了不少有趣的模型,大的小的都有,还有对deepseek-r1的魔改,这里做个汇总,包括:SmolLM3小模型、T5Gemma模型、NextCoder-32B模型、DeepSeek-TNG-R1T2-Chimera专家组合模型,一共4 个模型。尤其是,其中用到的模型合并方案,看来已经是广泛采用了。http://t.cn/A6kUekUS