【#日本乐天AI模型被指套壳DeepSeek#】
3 月 18 日消息,日本乐天集团 17 日发布了号称“日本国内最大规模”的高性能 AI 模型 Rakuten AI 3.0。却在不到 12 小时内被技术社区发现,其核心架构完全基于中国深度求索公司的开源模型 DeepSeek V3,且初始版本中未对原创者进行任何标注,引发舆论哗然。
据技术社区爆料,在 Rakuten AI 3.0 发布当天上传至 Hugging Face 开源平台的文件中,其核心配置文件(config.json)的“architectures”字段明确显示为“DeepseekV3ForCausalLM”,“model_type”字段亦为“deepseek_v3”。模型总参数量(671B)、激活参数量(37B)等核心指标与 DeepSeek V3 原版完全一致,被指“仅进行了换皮微调”。
