爱可可-爱生活 25-10-07 06:25
微博认证:AI博主 2025微博新锐新知博主

今日推介(第1916期):学习中的拓扑不变性和破缺、使用分层记忆进行预训练、用顾问模型操控黑盒大模型、基于可验证奖励的低概率Token持续探索强化学习、温度采样在推理时扩展中的作用 公·众·号:爱可可爱生活 http://t.cn/AXzzYYcO #机器学习##人工智能##论文# ​

发布于 河北