明浩-rosicky311 25-06-10 00:30
微博认证:微博新知博主 投资内容创作者

业界知名的newsletter-SemiAnalysis发了一篇关于这一波大模型浪潮下的强化学习的深度报告,这里:
http://t.cn/A6eocSqE
中文翻译可以看锦秋的公众号
http://t.cn/A6eocSqR

这篇长文非常完整的整理了当下这个时点关于强化学习的种种现状、问题和趋势,读完之后你会得到很多问题的答案,
1.GPT-4o的谄媚行为是怎么来的?
2.Meta为什么要投Scale AI几十亿美金?
3.Agent执行任务的复杂性
4.Deepseek R1 0528版是怎么来的?
5.类似“梯云纵”效果的递归自我进化是如何成为现实的?

总之,超长文非常推荐,
非技术人员读起来比较友好…

发布于 上海