【#大模型“缩放定律”悖论:RL(强化学习)越强,AGI(通用智能)越远?#】知名科技博主犀利指出,各大实验室通过RL(强化学习),耗资数十亿美元让大模型“排练”Excel、网页操作等技能,恰恰暴露其距真正AGI仍远。若AI真接近类人智能,就该像人类一样从经验中自主学习,而非依赖“可验证奖励训练”。而真正突破在于“持续学习”能力,这一过程或需5-10年才能完善。http://t.cn/AX42NMuI
【#大模型“缩放定律”悖论:RL(强化学习)越强,AGI(通用智能)越远?#】知名科技博主犀利指出,各大实验室通过RL(强化学习),耗资数十亿美元让大模型“排练”Excel、网页操作等技能,恰恰暴露其距真正AGI仍远。若AI真接近类人智能,就该像人类一样从经验中自主学习,而非依赖“可验证奖励训练”。而真正突破在于“持续学习”能力,这一过程或需5-10年才能完善。http://t.cn/AX42NMuI