量子位
25-08-01 17:42 微博认证:量子位官方微博

#抖音全新推荐大模型RankMixer##推荐算法开始卷硬件了#

抖音背后的推荐算法又进化了——推出新模型RankMixer,这是字节跳动算法团队专门为推荐系统重新设计的超大模型架构。

简单来说,推荐模型以前就像“用高速公路跑马车”,硬件很强,但模型没跟上;而现在,RankMixer让模型结构真正对上了GPU的“硬件节奏”,推理速度没慢,效果却强了很多。

- 模型容量暴涨:从原来的千万级参数,直接升到10亿参数,但推理成本几乎没变。

- 利用GPU更聪明:算力利用率(MFU)提升了近10倍,推理效率从“30%开工”提升到“80%+满负荷”。

- 实际业务有效果:在抖音主Feed上已经全量上线,用户使用时长提升1%,日活跃天数提升0.3%,特别是在低活用户上效果更明显。

为什么能做到这么大还这么快?RankMixer主要做了三件事:

1. 特征Token化:把各种用户和视频特征打包成统一结构,方便并行计算。

2. TokenMixing交叉特征:不用复杂计算,轻量混合不同特征信息,效率比Self-Attention还高。

3. 逐Token专家网络:不同特征走不同“专家通道”,每个Token都有定制建模方式,还能动态分配资源,更适配推荐场景的个性化需求。

过去的推荐模型拼堆结构、参数少、算力浪费多;RankMixer则是用硬件协同+结构革新,把参数堆起来的同时还能算得快。

它不仅上线了抖音主Feed,还拓展到了电商广告等多个字节系产品线,成为统一通用架构。

这也标志着一个趋势:推荐模型正在像大语言模型一样迈入“大模型”时代,关键还在于软硬件一起“炼丹”,让推荐更智能,更精准。