大模型缩放定律悖论

【#大模型“缩放定律”悖论：RL（强化学习）越强，AGI（通用智能）越远？#】知名科技博主犀利指出，各大实验室通过RL（强化学习），耗资数十亿美元让大模型“排练”Excel、网页操作等技能，恰恰暴露其距真正AGI仍远。若AI真接近类人智能，就该像人类一样从经验中自主学习，而非依赖“可验证奖励训练”。而真正突破在于“持续学习”能力，这一过程或需5-10年才能完善。http://t.cn/AX42NMuI