#他们给算法做了个动画版说明书#
又到了抖音算法公开日,今年抖音上线了“体验算法”板块(抖音安全与信任中心),里面有一款可以交互的PPT小游戏(什么是推荐系统),引言+5页小游戏+结语就没了…
能让技术小白,轻松看懂抖音算法的奥秘。
像正文用一张图就表现出来了,抖音的算法推荐是多层漏斗状的钢珠游戏,
去年抖音算法揭秘是文字版的,为啥今年做成了图像小游戏呢?
心理学家Allan Paivio提出过一个双重编码理论:
其实大脑是“视觉动物”,人类大脑皮层里,大约有30%-50%的区域专门用于处理视觉信息,能在13毫秒内识别图像的含义。文字则是后天发明的“解码游戏”,咱们只看文字时大脑处理负荷要比图像重的多,眼睛扫描文字➡️大脑解码语义➡️构建相关概念,要消耗大量脑力。
前者是本能,后者是技能。
看图+文字,能同时激活两个通道,大大提升理解能力。
这就是看视频比阅读更受欢迎的原因了。
对科普小游戏感兴趣的点👉什么是推荐系统
只想看文字解析的,往下拉。
像正文第一页:什么是推荐系统。
很容易看明白,抖音算法是精巧运作的多层漏斗,通过召回和多轮排序的方式,从数亿级内容池里给你推荐内容,这一路可不简单啊,有点像韩国电影里的弹珠机(pachinko),一颗钢珠想进洞几率是渺茫的。
正文第二页,抖音推荐系统很经典的主力模型:双塔模型
双塔是指内容塔和用户塔
一条视频内容诞生后,视频主题、出演人物、风味类型都被转化为了数字,譬如(0.64,0.17,0.83)。
而我们作为用户,所有行为都会被记录,完整观看了一支影视飓风的视频,看到班味视频立刻划过了,点赞评论美女帅哥,搜索过了伊朗局势等等,这些你在现实生活中的动作,也会成为一组组数字密码。
假如你的行为密码跟一条内容的数字坐标很接近,那么这条视频就会被双塔模型选中,进入到你的兴趣推荐里。
抖音用了方枪枪、丁小乐、张大名做演示,我把整个过程录屏了,方便一些人观看。
正文第三页,兴趣时钟。
其实每个人兴趣是动态变化的,有着丰富的时钟和场外因素。
譬如爱做饭的人在饭点前后会刷到做菜教程,爱炒股的人会被推股市早报和财经新闻,工作时间刷到AI相关内容,下班后情迷影视综艺解说。像伊朗局势这种大事件,它会穿透到很多人视野里,当然,不包括那些对时政完全不感兴趣的人类。
正文第四页,Wide & Deep模型
这是一套打分系统,算法通过多个模型对内容进行打分,用户的点赞、收藏、转发、评论等行为都会成为打分的依据。
Wide负责抓牢已知的兴趣,Deep负责深度挖掘跟这些兴趣相关的。
淘宝、PDD就是这个算法逻辑,你刚搜iPhone17,Wide负责给你推iPhone17数字版、Pro、ProMax等不同内存规格,Deep给你推手机壳、充电宝、MacBook、钢化膜。
如果一个人在抖音上刷了很久的六级英语听力提分技巧,Deep会给她推《英国旅游必须要懂的英文标识》《唐诗宋词英文翻译赏析》等等。
正文第五页,随机扰动
很多人担心推荐算法造成信息茧房
其实在推荐算法一直在寻找你的新兴趣。
兴趣时钟、Wide & Deep模型、随机扰动一定程度上都服务于这个目标。
如果说前面提到的模型是一套严密的概率计算,那么随机扰动的出现就是给严谨的数学过程“添点儿乱”:它会从已经按照得分高低排好的推荐列表中,挑出一些内容随机地加分或者减分。
这么做的目的很简单,就是避免连续刷到一样的内容,帮助我们发现更多样的兴趣点。在演示中,通过不同的扰动强度的切换,可以看到推荐列表从千篇一律到“画风突变”。
说到底,人类才是自身茧房的缔造者,有太多不感兴趣的项目,即便是被其他人类验证过的高赞视频,也会毫不留情的轻易划走。
#原来算法是这样打破信息茧房的#
发布于 浙江
