抖音算法动画版说明书上线

#他们给算法做了个动画版说明书#
又到了抖音算法公开日，今年抖音上线了“体验算法”板块（抖音安全与信任中心），里面有一款可以交互的PPT小游戏（什么是推荐系统），引言+5页小游戏+结语就没了…

能让技术小白，轻松看懂抖音算法的奥秘。

像正文用一张图就表现出来了，抖音的算法推荐是多层漏斗状的钢珠游戏，

去年抖音算法揭秘是文字版的，为啥今年做成了图像小游戏呢？

心理学家Allan Paivio提出过一个双重编码理论：
其实大脑是“视觉动物”，人类大脑皮层里，大约有30%-50%的区域专门用于处理视觉信息，能在13毫秒内识别图像的含义。文字则是后天发明的“解码游戏”，咱们只看文字时大脑处理负荷要比图像重的多，眼睛扫描文字➡️大脑解码语义➡️构建相关概念，要消耗大量脑力。

前者是本能，后者是技能。
看图+文字，能同时激活两个通道，大大提升理解能力。
这就是看视频比阅读更受欢迎的原因了。

对科普小游戏感兴趣的点👉什么是推荐系统
只想看文字解析的，往下拉。

像正文第一页：什么是推荐系统。
很容易看明白，抖音算法是精巧运作的多层漏斗，通过召回和多轮排序的方式，从数亿级内容池里给你推荐内容，这一路可不简单啊，有点像韩国电影里的弹珠机（pachinko），一颗钢珠想进洞几率是渺茫的。

正文第二页，抖音推荐系统很经典的主力模型：双塔模型
双塔是指内容塔和用户塔
一条视频内容诞生后，视频主题、出演人物、风味类型都被转化为了数字，譬如（0.64，0.17，0.83）。
而我们作为用户，所有行为都会被记录，完整观看了一支影视飓风的视频，看到班味视频立刻划过了，点赞评论美女帅哥，搜索过了伊朗局势等等，这些你在现实生活中的动作，也会成为一组组数字密码。

假如你的行为密码跟一条内容的数字坐标很接近，那么这条视频就会被双塔模型选中，进入到你的兴趣推荐里。

抖音用了方枪枪、丁小乐、张大名做演示，我把整个过程录屏了，方便一些人观看。

正文第三页，兴趣时钟。
其实每个人兴趣是动态变化的，有着丰富的时钟和场外因素。

譬如爱做饭的人在饭点前后会刷到做菜教程，爱炒股的人会被推股市早报和财经新闻，工作时间刷到AI相关内容，下班后情迷影视综艺解说。像伊朗局势这种大事件，它会穿透到很多人视野里，当然，不包括那些对时政完全不感兴趣的人类。

正文第四页，Wide & Deep模型
这是一套打分系统，算法通过多个模型对内容进行打分，用户的点赞、收藏、转发、评论等行为都会成为打分的依据。

Wide负责抓牢已知的兴趣，Deep负责深度挖掘跟这些兴趣相关的。

淘宝、PDD就是这个算法逻辑，你刚搜iPhone17，Wide负责给你推iPhone17数字版、Pro、ProMax等不同内存规格，Deep给你推手机壳、充电宝、MacBook、钢化膜。

如果一个人在抖音上刷了很久的六级英语听力提分技巧，Deep会给她推《英国旅游必须要懂的英文标识》《唐诗宋词英文翻译赏析》等等。

正文第五页，随机扰动
很多人担心推荐算法造成信息茧房
其实在推荐算法一直在寻找你的新兴趣。
兴趣时钟、Wide & Deep模型、随机扰动一定程度上都服务于这个目标。
如果说前面提到的模型是一套严密的概率计算，那么随机扰动的出现就是给严谨的数学过程“添点儿乱”：它会从已经按照得分高低排好的推荐列表中，挑出一些内容随机地加分或者减分。

这么做的目的很简单，就是避免连续刷到一样的内容，帮助我们发现更多样的兴趣点。在演示中，通过不同的扰动强度的切换，可以看到推荐列表从千篇一律到“画风突变”。

说到底，人类才是自身茧房的缔造者，有太多不感兴趣的项目，即便是被其他人类验证过的高赞视频，也会毫不留情的轻易划走。

#原来算法是这样打破信息茧房的#

发布于浙江