François Chollet谈Transformer训练核心

François Chollet 分享的一个核心观点：训练 Transformer 执行算法时，如果直接提供完整的逐步算法，模型可以“记住”它，但真正的机器学习目标应该是从输入输出对中“发现”算法，而不是简单复制已有程序

发布于广东