歸藏的AI工具箱 24-12-03 18:59
微博认证:AI博主

果然离职有利于产出啊。#ai#

Lilian Weng 从 Open AI离职后首次发文。

关于强化学习中的 Reward Hacking 综述。

让 Claude 总结了一下,跳过了数学部分。

原文:http://t.cn/A6mJhy2L ​

发布于 北京