François Chollet 分享的一个核心观点:训练 Transformer 执行算法时,如果直接提供完整的逐步算法,模型可以“记住”它,但真正的机器学习目标应该是从输入输出对中“发现”算法,而不是简单复制已有程序
发布于 广东
François Chollet 分享的一个核心观点:训练 Transformer 执行算法时,如果直接提供完整的逐步算法,模型可以“记住”它,但真正的机器学习目标应该是从输入输出对中“发现”算法,而不是简单复制已有程序