视频见http://t.cn/AXStQgT1
http://t.cn/AXS1nOta
锚点:越简单越好?大模型说:不一定 | 袁岚峰
图片
袁岚峰:我看到您关于SMC(序贯蒙特卡洛)的工作,既有对算法的设计,也有一些是对于算法数学性质的证明。请问这两类工作之间是什么关系?如果一个人想成为统计学家,他应该如何培养自己在这两方面的能力?
图片
图片
刘军:我借用一个大家(常说)的话:对于一个准确问题的近似答案,要比对一个近似问题非常精准的答案,要好很多倍。
图片
图片
意思就是说,更着重于对问题本身的方法解决,证明可能是一种搭配式的。我可能对里面的一些数学的结构,或者一些数学的特性,我会非常感兴趣。但有时候为了证明而证明,我其实并没有很大兴趣。
袁岚峰:所以这么说的话,最重要的是设计算法的能力,是吧?
刘军:设计算法本身,其实包含了很多因素:一个是对计算的了解,一个是对数学结构的了解。其实你算法设计差不多的话,有时候哪怕不能证明,不能从数学上严格地证明,你可以从各种方式来衬托出它可能还可以。所以在统计上来讲,我觉得方法性的东西,或者说思想架构上的东西,其实影响更深远,而且贡献更大。
图片
图片
现在我去读很多关于大模型、人工智能的文章或者工作等等,我对那些非常感兴趣:在什么情况下,它能真的成功?比如说我们最近在研究transformer(一种深度学习模型),为什么transformer能做,而我们以前比如说统计里面的很多时间空间模型做不到?
图片
深度学习网络,我觉得它更是对人的认知的一个冲击,而不是具体技术上的。以前全迷信Occam's razor(奥卡姆剃刀原则),科学,所有人都是要简单的。其实是我们混淆了两件事:科学的理解越简单越好,F = ma;但是somehow(不知何故)咱们就把这个扩展到未知情况下做模型预测、做模型建模的时候,也是越简单越好。这两个是不等价的。这个其实对人的冲击,就是说你可以非常复杂的模型,但还是能fit(拟合)得挺好,还是能预测得很好。这一点其实是非常反直觉的。
图片
袁岚峰:是的,它一开始应该给很多人造成一个,至少是美感上的一个冲击。
刘军:我觉得这是一个巨大的冲击。这个我觉得是完全把我们从box(固有思维)里面打出来了。我觉得这点很重要。
至于它真正起什么效果,我觉得都是这个的consequence(结果)。一旦突破了那个维度之后,你忽然发现它有一些很神奇的效果。概念上突破,才导致这些神奇的现象。概念上能有几亿个参数,而且能够比那个数据量多几十倍,但是你做出来它的预测效果是非常好,这一点是没有想过的。所以我们就在把这个东西拆开了,真正去理解它每一小步在做什么事情。现在我们在做这个工作。
图片
图片
如何预测台风的移动?如何为无人机导航?如何寻找生物DNA碱基对中潜藏的关键信息?如何填充取样调查时缺失的数据?许多看似纷繁复杂的问题,其实都归结到需要设计高效的统计算法。
从两百多年前的高斯到一百多年前的皮尔逊、到近一百年前的费舍尔等人再到现在,统计算法一直是一个蓬勃发展的领域。我们上一期访问的美国科学院院士、清华大学统计与数据科学系主任、兴华卓越讲席教授刘军博士,正是一位当代的统计算法大师。他发展的序贯蒙特卡洛、粒子滤波、吉布斯保守串取样和指针等方法,已经在许多领域创造了奇迹。
工欲善其事,必先利其器。在许多领域背后,统计学家是设计“器”的人。让我们再来深入了解刘军老师的创造。
图片
《锚点》节目中国科学技术大学科技传播系副主任袁岚峰对话清华大学统计与数据科学系刘军教授,东方卫视2026年3月25日播出。本片为精彩片段,25分钟的全片可见于上海广播电视台“看看新闻”网站(http://t.cn/AXSyeuUg)、app以及视频号。
■ 锚点节目在哔哩哔哩上线了!
2025年1月1日,我和上海广播电视台合作的科学家对话节目《锚点》在东方卫视开播,每周三22:00播出。经常有朋友问全片回放在哪里看,以前唯一可看的地方是上海广播电视台的“看看新闻”网站,在其中搜“锚点”就可以看到。从11月5日开始,锚点节目在哔哩哔哩上线了!欢迎大家关注新开的“东方卫视锚点”账号,欢迎大家在B站观看锚点全片,在“东方卫视锚点”账号或者我的账号“袁岚峰”或者B站纪录片频道都可以看到。真科学,真对话,欢迎大家来到锚点!
