乐天高调宣称Rakuten AI 3.0是“日本最大高性能 AI 模型”,但开发者在开源社区Hugging Face上发现其配置文件config.json中明确包含deepseek_v3架构字段。
其总参数量为6710亿,推理激活370亿,上下文窗口128K,这些核心规格与DeepSeekV3完全相同。两者均采用MoE(混合专家)架构。
乐天并未在宣传中主动提及 DeepSeek,但在争议出现后表示该模型是基于“开源社区成果”构建的,并结合了乐天自有的日语、英语双语数据进行微调(Fine-tuning)。
批评者认为乐天在获得日本政府(METI 和 NEDO)算力项目 GENIAC 支持的情况下,直接搬用中国开源模型DeepSeek的架构而未充分说明,属于缺乏原创性的“换皮”行为。
发布于 江苏
