爱范儿
26-02-01 17:10 微博认证:爱范儿官方微博

庞天宇加盟腾讯混元,负责多模态强化学习方向

据凤凰网科技报道,清华大学计算机系博士、可信机器学习与生成式模型领域研究者庞天宇昨天确认加入腾讯混元团队,担任 Multimodal RL 方向的 Tech Lead,并将于 2 月 4 日正式入职。

他将主要负责多模态模型的强化学习研究,前期重点聚焦生成模型方向,并在腾讯混元多模态部 Exploration Center 开展前沿算法探索。

公开资料显示,庞天宇 1995 年出生,清华直博期间在机器学习鲁棒性、深度学习等方向取得多项成果,以第一作者(含共同一作)身份在 ICML、NeurIPS、ICLR 等顶会发表多篇论文,并多次入选 Oral 或 Spotlight。

他曾获得微软学者奖学金、英伟达学术先锋奖等荣誉,毕业后在新加坡 Sea AI Lab 担任高级研究科学家。

此次加入腾讯,被业内视为混元团队持续吸引原生 AI 人才的又一信号。今年以来,腾讯在大模型架构、组织结构和人才体系上持续调整。

此前,前 OpenAI 高级研究员姚顺雨加入腾讯并担任首席 AI 科学家,负责 AI Infra 部及大语言模型部,推动混元体系的深度重构。

马化腾在今年年会上也提到,混元团队在过去一年经历了「深度重构」,并加速了人才引入与内部协同。

在产品层面,腾讯 AI 助手「元宝」从去年起持续迭代,今年春节档上线「派」功能,并宣布派发 10 亿红包。

1 月 28 日,混元团队开源混元图像 3.0 图生图版本,并同步接入元宝。在最新 LMArena 图像编辑榜单中,该模型进入第一梯队。

与此同时,MLNLP 社区也发布了庞天宇团队的招聘信息,面向 26 届、27 届校招及毕业三年内社招人才,重点寻找具备生成模型、diffusion models、RL infra、VLM agent 等方向经验的候选人。

实习岗位则面向在读硕博生,要求具备较强工程能力或理论基础,并有顶会论文经历者优先。

从更早的公开活动可见,庞天宇长期深耕可信机器学习方向,其在 2022 年的 TechBeat Talk 中曾提出「合理定义的鲁棒性与准确率之间不存在矛盾」,并提出自洽鲁棒性 SCORE 方法,为对抗训练与模型泛化提供新的解释框架。

随着庞天宇正式加入,腾讯混元在多模态强化学习方向的研发力量进一步增强,也为其在开源模型、生成式 AI 应用及基础设施层面的竞争提供更多技术储备。