里约热内卢市 IT 团队发布了一个前沿级的 397B MoE 模型,从数据上来说是开源模型的 SOTA 。
但很快就被人发现,这个模型是由 Qwen 3.5 和 Nex N2 Pro合并出来的。
没错,甚至不是蒸馏,是直接就合并了 ……
发布于 上海
里约热内卢市 IT 团队发布了一个前沿级的 397B MoE 模型,从数据上来说是开源模型的 SOTA 。
但很快就被人发现,这个模型是由 Qwen 3.5 和 Nex N2 Pro合并出来的。
没错,甚至不是蒸馏,是直接就合并了 ……