爱可可-爱生活
24-05-03 05:43 微博认证:AI博主 2025微博新锐新知博主

[LG]《Self-Play Preference Optimization for Language Model Alignment》Y Wu, Z Sun, H Yuan, K Ji, Y Yang, Q Gu [University of California, Los Angeles & CMU] (2024) http://t.cn/A6Hv3EgJ #机器学习##人工智能##论文# ​

发布于 北京