爱可可-爱生活
24-02-20 05:15 微博认证:AI博主 2025微博新锐新知博主

[LG]《RLVF: Learning from Verbal Feedback without Overgeneralization》M Stephan, A Khazatsky, E Mitchell, A S Chen, S Hsu, A Sharma, C Finn [Stanford University] (2024) http://t.cn/A6YoCU6N #机器学习##人工智能##论文# ​

发布于 北京