华尔街见闻APP
25-12-24 10:37 微博认证:华尔街见闻 网址 http://wallstreetcn.com/ 官方微博

【#大模型“缩放定律”悖论:RL(强化学习)越强,AGI(通用智能)越远?#】知名科技博主犀利指出,各大实验室通过RL(强化学习),耗资数十亿美元让大模型“排练”Excel、网页操作等技能,恰恰暴露其距真正AGI仍远。若AI真接近类人智能,就该像人类一样从经验中自主学习,而非依赖“可验证奖励训练”。而真正突破在于“持续学习”能力,这一过程或需5-10年才能完善。http://t.cn/AX42NMuI