#抖音全新推荐大模型RankMixer##推荐算法开始卷硬件了#抖音背后的推荐算法又进化了——推出新模型RankMixer，这是字节跳动算法团队专门为推荐系统重新设计的超大模型架构。简单来说，推荐模型以前就像“用高速公路跑马车”，硬件很强，但模型没跟上；而现在，RankMixer让模型结构真正对上了GPU的“

#抖音全新推荐大模型RankMixer##推荐算法开始卷硬件了#

抖音背后的推荐算法又进化了——推出新模型RankMixer，这是字节跳动算法团队专门为推荐系统重新设计的超大模型架构。

简单来说，推荐模型以前就像“用高速公路跑马车”，硬件很强，但模型没跟上；而现在，RankMixer让模型结构真正对上了GPU的“硬件节奏”，推理速度没慢，效果却强了很多。

- 模型容量暴涨：从原来的千万级参数，直接升到10亿参数，但推理成本几乎没变。

- 利用GPU更聪明：算力利用率（MFU）提升了近10倍，推理效率从“30%开工”提升到“80%+满负荷”。

- 实际业务有效果：在抖音主Feed上已经全量上线，用户使用时长提升1%，日活跃天数提升0.3%，特别是在低活用户上效果更明显。

为什么能做到这么大还这么快？RankMixer主要做了三件事：

1. 特征Token化：把各种用户和视频特征打包成统一结构，方便并行计算。

2. TokenMixing交叉特征：不用复杂计算，轻量混合不同特征信息，效率比Self-Attention还高。

3. 逐Token专家网络：不同特征走不同“专家通道”，每个Token都有定制建模方式，还能动态分配资源，更适配推荐场景的个性化需求。

过去的推荐模型拼堆结构、参数少、算力浪费多；RankMixer则是用硬件协同+结构革新，把参数堆起来的同时还能算得快。

它不仅上线了抖音主Feed，还拓展到了电商广告等多个字节系产品线，成为统一通用架构。

这也标志着一个趋势：推荐模型正在像大语言模型一样迈入“大模型”时代，关键还在于软硬件一起“炼丹”，让推荐更智能，更精准。