IT之家
26-05-09 11:28 微博认证:IT之家(www.ithome.com)官方微博

【MiniMax 不认马嘉祺?#稀宇科技公布大模型失语原因#:特定词元后训练不足导致】稀宇科技(MiniMax)发现其 M2 模型无法正确输出“马嘉祺”等特定人名,根源在于后训练数据中某些词元(如“嘉祺”)样本极少,导致其生成概率被高频词元“挤压”。团队通过全词表合成数据修复,使模型性能显著提升。这暴露了大模型训练中词元覆盖不均衡的普遍性问题。#AI 大模型##稀宇科技#