【#蚂蚁开源首个100B扩散语言模型LLaDA2.0#】12月12日,蚂蚁集团正式开源了LLaDA2.0系列。LLaDA2.0包含MoE架构的16B (mini)和100B (flash)两个版本,蚂蚁将Diffusion模型的参数规模首次扩展到了100B量级。
【#蚂蚁开源首个100B扩散语言模型LLaDA2.0#】12月12日,蚂蚁集团正式开源了LLaDA2.0系列。LLaDA2.0包含MoE架构的16B (mini)和100B (flash)两个版本,蚂蚁将Diffusion模型的参数规模首次扩展到了100B量级。