杰伦·布朗和德里克·怀特的比较有一个前情,就是这两名球员作为队友在2024-25赛季的表现以及休赛期大家对此的总结和对新赛季的展望。简单来说,上个赛季虽然布朗入选了全明星,但起码在微博普遍认为怀特的表现是比布朗更好的。而在布朗的一贯强项季后赛中,他又受到伤病困扰,表现非常糟糕,因此从总结赛季的角度大家觉得怀特比布朗更好。站在休赛期,大家已知塔图姆至少大半个赛季不会出场,自然要思考塔图姆的角色尤其是进攻角色由谁来承担的问题。很显然没有一个球员能直接代替塔图姆的作用,整体的思路大概就是塔图姆发起进攻的部分,怀特、普里查德和布朗都应该有承担,怀特是最主要的那个;塔图姆终结进攻的部分,布朗、怀特和西蒙斯(相比上个赛季的霍乐迪)都应该有承担,布朗是最主要的那个。不过也有观点认为怀特作为发起进攻者本来就会天然多出很多终结机会,他的个人进攻才华也存在继续释放的技术基础,可能整体的增长点都在怀特身上。
赛季进行到现在,布朗展现了现象级的出手能力,得分效率靠着各个区域的强势表现也比过去赛季更好,非常好的承担了他的角色;与之相比,怀特的角色对于他来说可能有些困难了,他的得分效率下降较多,即使将开季的糟糕表现简单解释为所谓的状态,仅看其状态回暖后的表现和上赛季也就堪堪持平。怀特在得分数量、得分效率两方面都落后布朗较多,传球上也谈不上领先,仅仅在控制失误和防守两方面维持了自己的固有优势。以本赛季的表现来看,布朗大概是联盟15名的球员,怀特大概是联盟40名的球员。
讨论到这里实际已经结束了,但其实这个讨论才刚刚开始,因为很多人觉得这个讨论不应该这样结束。根据on-off和EPM,怀特比布朗强了很多,很多人对此又进行了各种各样细节的数据拆分,去修正这个数据可能产生的误差。我对此的态度当然是我最擅长的部分,去寻找过往的例子,用让步的方式讨论如果你的A成立,那过往的BCDEF都得被推翻。我看到了10安东尼比卢普斯、14阿尔德里奇巴图姆、21米切尔康利,还有其他很多例子。但我觉得这些例子都说服性不够,因为在一些人看来这些例子当然都可以被推翻。那我只好找到这个例子:
从怀特来到凯尔特人的第一天起,他的常规赛on-off就比布朗好,23和24两个赛季都比布朗高10以上;从怀特来凯尔特人的第一天起,他的EPM就比布朗高,24年也高了1以上。23年和24年,EPM已经被微博的老师们广泛使用了,on-off更是被广泛使用很多年了,没有什么人觉得怀特能和布朗比。25年怀特的on-off和布朗几乎接近,反而成为怀特公认强于布朗的年份。那这些数据在其中起到的意义究竟是什么呢?
答案是很显然的。怀特在24-25赛季进步了,具体体现在能肆意妄为地投三分,并且命中率也很高,这让他看起来从一个全能角色球员变成了一个攻防兼备的小明星。与此同时,布朗打出了他过去五年来最糟糕的赛季,这最终造成了怀特比布朗的表现更好。因此,问题的关键根本不是on-off,或者EPM,而是怀特成为了一个不伦不类的在特殊优质环境下的小球星,这是让他的评价产生变化的原因,即他真的进步了。
怀特本赛季目前为止在比上赛季更恶劣的环境(注意:以联盟整体来看肯定不是恶劣环境,有可能是优质环境)下没有维持上赛季的表现,这可以推导出两个可能:1.怀特上赛季的进步是假的/怀特上赛季的环境太好不可复制;2.怀特这赛季慢慢调能变回上赛季的他,或者和上赛季水平接近形态稍有不同的他。
但这里最重要的是什么呢?是布朗证明了他上赛季如果是下滑(我倒是没有看到什么人真这么认为)是大假特假的,以布朗这个人本身为标准,这当然是最好的布朗。且不论布朗这赛季算不算相对于他过往的最好水准进步了,他至少回到了过去的那个自己,并且拿出了过往从未有过的表现。明明21年、23年或者什么时候的布朗都是确切的8分球员,25年的怀特按乐观的方式计算也差不多是这个水准,怎么一个表现比过去的自己好的布朗和一个不如去年的自己的怀特,产生了所谓的可比性?如果要产生这个可比性,请先推翻过往的很多观点,比如直接说过去的巅峰布朗根本没有全明星水平,或者去年怀特就是明确的最佳阵容表现。
这个可比性的产生原因很简单,就是复杂的数据让人不相信自己看到的,或者改变了人思考问题的方式。人首先诉诸于数据,然后试图去解释数据,最后还不得不让步于数据的淫威之下,不敢违逆数据这个皇帝太多,这导致人的思考被异化了。事实上,布朗和怀特的讨论从一开始就结束了。2026布朗就是比2026怀特强的多,看过球的都知道。但有人会觉得,我们看过球也不知道。我们看了很多的球,我们没看的球更多,人类是渺小的,我们还有很长的路要走。现在的数据提供了全面的看待比赛的方式,那我们在看比赛的时候,也要去学习数据抓比赛的办法。当然,这里实际上就是一种先入为主。过去的球迷先入为主地看比赛,觉得进球的球员厉害;现在的球迷在先入为主的看比赛的方面还不如过去,他们觉得数据好的球员厉害,然后以这样的视角去看到比赛中的部分,如果没有看到就再想想,再看看有什么问题。
解决这个问题有一个很简单的办法,就是在大部分时候放弃数据,只感受数据的意图而不把它当做可以进行细致分析的真相。这个问题的关键在于,这是你选的。你非要从这些数据出发,去探究事情的真相,但你又无法把控全局。对这一个具体问题,你以为你说服了自己,但你可能不知道,还有很多其他一样的问题。你默认了这一切,自然地接受了那些部分,但矛盾早已产生。
现代数据分析最亟待解决但看起来不可能解决的问题是,我们在分析球队整体上有一个总的思维,我们清楚哪些因素会影响自己和对方得分的多少。但将整体拆分成局部时,自下而上的讨论固然因其采集信息丰富程度的局限性而存在问题,自上而下的讨论则因其暂时过于粗暴而缺乏对篮球这一复杂系统的拆解能力。所谓的现代数据,则是将这两种方法进行结合,再通过预测的方式提高准确性。毫无疑问,这个方法是精妙的,是先进的,是比过去的方法高级的,但这并不意味着它比过去的结果接近事实的真相,因为它目前的结果就是如此的差。甚至另一方面,局部的可解释性让其更容易被人感知到问题所在,而整体的混沌感让人更加无从下手。我们过去经常讲化学反应,实际上就是将球员的能力和表现中间的地方算在其中。事实上,影响力数据在做的事情就是,将精妙的化学反应带来的加成,送给影响力声称自己喜欢的球员;将糟糕的化学反应带来的负面,送给影响力声称自己讨厌的球员。我们都已经清楚,影响力数据很难反映能力,最多只能反映表现或贡献。但我们也要知道,影响力数据只是反映了表现和贡献,而不是就是表现和贡献。
四要素是比分变化的四个或八个成因,这些因素在球队层面是高解释性的。但一个球员自己获得的这些数据,或者其在场的这些数据,它的解释性究竟如何?你究竟如何把系统拆分成系统中的元素?它的能力是如此低下,以至于在很多时候,他的正确率不如一些低级的数据。共线性和小样本是从数学层面上它越不过去的两座大山,但问题的关键其实依然在于篮球系统的复杂。
当然,可以将一些这样的错误说成是解释篮球运动的新视角和新学派。毕竟,一个观点只要信的人很多,又无法直接证伪,他就会形成潮流。某种意义上潮流才是重要的,而并非所谓的正确与否。
手握影响力数据,然后进行自喜的解释,和@猩皇威武 手握粗糙正负值进行自喜的解释没有任何区别。因为这样的分析方法不是制式的,这里的核心当然在于自喜。虽然你确实用了更流行、更好、置信度更高的数据,但它的正确率更高是在大样本层面下的。对任何一个具体问题,在你对它进行自喜的解释的情况下,它都没有任何置信度可言。这样的数据使用只是看起来更科学,但最终你的结论到底是怎么来的?
我还记得2019年的两个核心话题:杜兰特对勇士是不是正作用;德罗赞和丹尼·格林谁强。杰伦·布朗和德里克·怀特的比较能引起广泛讨论,这本身已经足够说明问题。从大的角度,这证明了一些思想的深入人心,证明了某种成功的教化和宣传。据我所知,在美国并没有产生这样的讨论,我对此感到开心,说明中国的民间篮球分析水平可能已经不在美国之下,这盛世正如你所愿。因此,站在2025年,我们没有比2019年前进任何一步。
发布于 吉林
