[IR]《LLM-Based User Personas for Recommendations at Scale》H Wang, H Lu, Z Feng, J Huang… [Google Deepmind & Google] (2026)
在工业级推荐系统中,传统方法依赖结构化ID表达用户兴趣,牺牲了语义丰富性与可解释性。更关键的是,现有LLM应用受限于离线处理模式,无法实时捕捉用户意图变化,且强化了系统反馈循环的固有偏差——推荐总在用户历史行为的安全区打转。
本文将用户画像生成重构为"总结-探索"二元任务,在单次LLM推理中同时蒸馏既有兴趣与推断新领域。通过知识蒸馏将大模型推理能力迁移至轻量模型,配合异步生成架构、语义聚类输入优化,在十亿用户规模下实现了毫秒级在线推理,使自然语言用户画像直接驱动检索而非仅做离线验证。
这项工作在工业推荐系统中打通了"实时LLM推理→语义用户理解→内容发现"的完整链路,证明了LLM可作为在线推理引擎而非数据标注工具。其真正突破在于用自然语言打破了反馈循环的自我强化,让用户探索行为持续转化为长期兴趣。但尚未解决的门槛是如何让用户主动参与画像迭代,以及如何将这套范式迁移至跨模态、跨领域场景。
arxiv.org/abs/2606.12198 #机器学习# #人工智能# #论文# #AI创造营#
发布于 北京
