【#SBTI底层算法#,#SBTI背后有啥算法名堂#】近日,一个名为「SBTI」的人格测试,从各大社交网站上爆火,从各种BOSS、FAKE、POOR的人格截图,到全套的人格图鉴,可以说铺天盖地,甚至,还有网友连夜赶制出了SBTI人格解析笔记。
当然,疯玩之外,也有不少网友对测试本身展开了讨论,不少网友觉得是Vibe Coding出来的。
火爆全网的SBTI,背后到底有啥算法名堂?
据量子位用GLM-5.1分析源码得出的结论是:
大概率是「人工主导+AI辅助」的协作产物。换句话说就是,代码、文案部分可能是GPT-4或Claude之类的工具帮忙写的,但整体创意,应该还是由人来操刀的…
如果大家这两天玩了这个测试,其实从SBTI的20多种人格的文案风格中不难看出来——那文风,可以说是《高度统一》。
举个栗子,像不少人格文案介绍的第一句上来就说:恭喜你,你是稀有/珍稀物种。
不仅如此,这套人格属性文案的修辞手法密度可以说是《极高》…排比、比喻、转折等各种LLM最常用的修辞手法层出不穷,比如最直观的“你不是、你压根”“不一定、但可能”等等。
开头强调稀有感+幽默夸张比喻+调侃口吻+个性化强调,让不同人格描述看起来风格一致又有趣??
当然了,整个测试搭建过程中人手搓出来的部分当然肯定也有。
像ATM-er、Dior-s、THAN-K、MALO这些人格命名,如此之谐音梗,如此之生动形象,说实话,AI自己很难写的出来…
感觉吧,更像是靠聪明的人脑灵机一动策划的??
此外在技术栈上,整个测试的技术架构也比较简单——
网页就是单文件操作DOM,路由靠单页hash或screen切换。
图片也都是外部链接存储,所以目测整个项目是零依赖的「纯原生前端项目」。
接下来问题又来了。
通过简简单单的31道生活问答题,就能精准拿捏住一批又一批网友,那这背后的「算法逻辑」也自然不简单。
对此呢,我们也小小地研究了那么一下下(仅供参考)——
其实SBTI的算法逻辑的不是直接测试人格类型,而是给你15个小标签,然后用数学距离找跟你「最像的人设」。
具体来说,我们可以把这套人格算法逻辑拆成答题拆维度 、分数归档、模板匹配三个维度:
第一步:答题拆维度——用户答题后,系统把答案拆成15个小维度,每个维度算一个小分数。第二步:分数归档——把每个维度的小分数压缩成低/中/高三档,先把用户进行粗略分类。第三步:模板匹配——用这组15维“人格向量”去和预设模板比对,谁最像谁就当结果输出~
简单说就是,这个测试把不同人格拆成了包括自我 (S)、情感 (E)、态度 (A)、驱力 (Ac)、社交 (So)在内的5个模型。
而每个模型下面又分成3个小维度,比如下面图片中的S1、S2、S3这些子维度,所以算在一起一共是15个细分维度。
此外,每个维度只有2道题,每题3个选项。
选项分值分别对应1、2、3分,这么算下来的话,一个维度最后的原始总分范围是2到6分的样子~
这样做的好处是,每个人的回答可以更精准地映射到不同人格特质上,不会把复杂的人格信息搅成一锅粥!!!
模型划分我们搞明白了,那下一步就是先把答题结果变具体的成「分数」!
我们可以设想一下,假如某一个维度有两道题,我们第一题得了2分,第二题得了3分,那这个维度的总分就是5分。
所以这一步的意义,相当于把每个维度先做一个小结算~
有了具体的分数后,下一步系统要做的,就是给「分值」进行归档处理。
事实上系统并不保留我们原始的2、3、4、5、6 这些具体分数,而是统一压成三个等级档位——
比如总分是2到3,那就记为L(低档);总分为4,就记为M(中档);总分5到6,记为H(高档)。(就像咱们上学的时候老师在咱试卷上写的A+,A、B、C成绩一样~)
接下来是关键一步。
系统会把我们的答题结果整理成一个15维向量,也就是把每个维度的等级(L、M、H)排成一串标签。
比如我们可以把它想成这样:H,M,H,L,M…
为了方便计算,系统会把它们转换成数字:L=1,M=2,H=3,这样你的向量就变成了类似:3,2,3,1,2…
接下来,系统会拿你的这组15维向量,去和预设好的25种常规人格模板逐一比对——比对方式也非常很直接了当,那就是就是:一维一维地看差多少。
具体来说,每个维度都会计算你和模板之间的差值,再把15个维度的差值全部加起来,得到一个总差距。
此外系统还会额外统计一项数据:有多少个维度和模板是完全一样的,也就是「精确命中数」。
最终的人格评判标准就是——
系统会先看总差最小的,再看完全匹配最多的,最后看相似度最高的。
而排在第一位的那个人格模板,就是系统认定和你最接近的人格结果!!!
此外颇有意味的是,这套算法后面似乎还接了一个「特殊判定」机制。
比如喝酒隐藏题被触发时,会直接进入特殊人格;再比如最高相似度低于60%,系统会给出一个兜底人格…(量子位)#有卖家称666元搭建SBTI同款测试#
