元力社 26-03-18 11:25
微博认证:元宇宙资讯、产业服务平台!专注元宇宙、AI、数字人等前沿科技。

【#日本乐天3.0基于中国AI大模型的框架#】3月17日,日本乐天集团正式在Hugging Face开源「Rakuten AI 3.0」模型,并高调宣称这是“日本最大高性能人工智能模型”。

该模型采用Mixture of Experts(MoE)架构,总参数约671亿,激活参数37亿,上下文长度达128K,针对日语及日本文化深度优化。在多项本土基准测试中表现亮眼,乐天称其将为生态系统带来高达90%的推理成本降低。

然而,模型上线后,AI社区开发者迅速通过Hugging Face页面配置文件、权重tensor尺寸、tokenizer及chat template发现,其底层架构与中国的DeepSeek-V3一致,实际是在DeepSeek V3基础上进行继续预训练与本地化微调。

乐天官方新闻则表示,该模型依托GENIAC项目支持,结合开源社区最佳成果及自家高质量双语数据开发。

发布于 山东