机器之心Pro 26-03-23 14:44
微博认证:机器之心官方微博

来自清华大学的研究团队在一篇发表在ICLR 2026上的论文中提出:交叉熵损失本身并不真正遵循规模定律;真正scale的,是它内部一个隐藏的成分。 http://t.cn/AXfYl5qX ​