可视化球 24-12-08 08:46

初学者在阅读数学教材时,很怕看到“显然(obvious)”、“容易看出(easy to see)”、“证明留作练习(the proof is left as exercise)”等等这类字眼。除了读者基础太差和作者太懒的原因以外,有时一些结论确实并不“显然”,那作者为什么不把推导或思考的详细过程写出来呢?

其中一个解释来自几何学大师格罗莫夫(Mikhail Gromov),他的原话(图1)翻译成中文如下:

“一个普遍而不幸的事实是:几乎任何数学理论都缺乏基本思想和动机的充分呈现。这可能源于数学感知的二元特性:要么你对某个思想毫无概念,要么一旦你理解了它,这个思想就显得如此明显,以至于你不愿意大声说出来。此外,一旦你的思维从黑暗状态转向光明,关于黑暗状态的所有记忆都会被抹去,因此很难想象另一个人会觉得这个思想并不是显而易见。”

这就是所谓 #知识的诅咒#。教材编写者无法对初学者的困惑感同身受,其实源自人类思维的缺陷,人一旦深刻理解了某一块知识,它就会自动地变成直觉的一部分。许多经典教材的作者是数学家,大脑常年沉浸在熟悉的领域,久而久之就很难想象学会之前的状态,写书时自然会把认为浅显的过程一笔略过。

假如你是初学者,从学习一个数学证明的角度看,如果作者能够很体贴地把原先被隐藏的“显然易得”证明步骤全部写出来,那你是不是就能完全看懂这个证明呢?

未必。就像观战围棋高手对弈,每一步棋都是公开的,你能看出每一步都合乎规则,但很难像高手一样宏观地理解每盘棋局的取胜之道。你能验证出每个证明步骤都合乎逻辑,然而证明过程所蕴含的通用方法和技巧却往往难以掌握。

这里要提到 #防御性证明# 这个概念。所谓防御性证明,就是直接展示一个命题的正确性,而不详细解释得出证明过程的动机或灵感,关键的思考过程被作者有意无意地省略了。验证proof的正确性不难,但读完还是一脸懵逼:“它是怎么想到可以这样证的?”。一个极端的典例见图2。

网友看完都纷纷吐槽“注意力惊人”, 只需“注意到”某个等式就能直接证毕,简直是“Attention is all you need”。

实际上,如果把证明“任何有理数可以表示为三个有理数的立方之和”的思考过程完整展开,大约需要10页长度的小论文,构造的思路可参考数学家H.W Richmond在1930年发表的一篇文章On Rational Solutions of x³ + y³ + z³ = R. (见图3和图4)

阅读一段晦涩的防御性证明,就像程序员阅读一段没有注释的代码,看不懂就会开始抱怨为什么不写注释。近年编程领域有出现“防御性编程”的概念,当然它与“防御式设计”的原意是相悖的,只是码农调侃的一种“过河拆桥”式风格,为了保护饭碗而故意把代码写得可读性很差(图5)。

与恶意的编码风格不同,防御性证明的初衷是好的,它其实是一种数学论文写作的要求,简短的证明对审稿人是友好的,毕竟谁都不想动辄阅读几十上百页的论文。在论文中长篇分享个人的直觉也会被认为是不专业的行为。

这种简洁的风格是数学王子高斯带起来的。高斯有一句著名的口头禅:“当一幢建筑物完工时,应该把脚手架拆除干净”(见图6)。 阿贝尔也曾吐槽过“高斯就像一只狐狸,走过之后要用尾巴把自己的足迹抹掉。”

试图“攻克”防御性证明时曾遭遇的困难,不仅令我怀疑自己的智商,也迫使我去反思学习数学的方法。

读教材当然是初学者的必经之路,但我们往往在验证书中结论的正确性方面耗费了过多的时间。

初学者一个常见的自学误区是,在网上看到高手们力推的经典书籍后,就死磕一部教材,即使做了非常漂亮的笔记,把每个证明步骤都过一遍并抄下来,遇到新问题时也依旧一筹莫展,然后被挫败感再度劝退。学不到数学思想的精髓,只是因为教材作者惜墨如金吝于分享吗?

容易被忽视的一点是,学习的深度常会受到广度的制约: 只有先拓宽认知的广度,才能有效地增加深度。很多时候你觉得理论的讲解或证明的过程不够直观,是因为其背后的核心思想隐藏在其他尚未涉猎的主题之中,可能在同一本教材的其他章节,可能在不同的数学分支,甚至可能在其他学科例如物理学和计算机的常见应用之中。

我最早有过类似的体验是初学集合论的ZFC公理系统,当时看到大佬的推荐去读Enderton的Elements of Set Theory,第二章中作者尝试通过一个简化的模型来解释ZFC公理背后的动机(图7),后来发现其实就是“冯·诺依曼宇宙”的概念(见图8的wiki词条)。我读好几遍都没理解,又花了大量时间查找相关资料,还是没有看懂,只能硬着头皮耐心往下读,直到学习了第七章序数(Ordinals)的理论之后才豁然开朗。

Gromov所说的从黑暗到光明的转换,其实是个量变到质变的过程。数学不仅仅是“读”出来的,更是“做”出来的。主动去探索并解决具体的问题,积累更多有启发性的思维过程,才能将知识与原理融会贯通。人在实践中见识过足够多的例子,自然会产生从其中抽象出共性的需求,此时再回顾经典教材中罗列的定理,才能深切体会到它们的简洁和优雅。

思考的过程不只对人类学习者很重要,对于现今的AI训练也很有价值,因为仅仅记忆概念和定理等知识很难变得更聪明。OpenAI的新模型o1采用Chain of Thought + RL, 之前还花钱请各个专业领域的PhDs打标,手写一道复杂题目的思考过程,报酬要远高于以前那些简单问题的数据打标。

最后聊一聊“数学天赋”。我们普通人通过更科学的学习方法 (保留“脚手架”的理论教学)和实践经验的长期积累,可以提升自己的抽象(泛化)能力, 但却难以拥有数学天才们那种大海捞针一般的惊人直觉。他/她们可以提出很多前沿的新问题和新猜想。历史上一个典型的代表人物是拉马努金(Ramanujan)。对他的故事感兴趣可以去看传记电影《The Man Who Knew Infinity》。据说他写出过几千条类似图9的复杂公式(图里就是著名的π的无穷级数表示),并在后来被证明大部分是正确的。他说是印度当地女神托梦给他的,没有任何推导过程。如此恐怖的“注意力”,仿佛一个人形的数学公式生成器,无神论者看了都觉得有点动摇。信仰AGI的技术理想主义者也许可以期待不远的未来AI能达到此等人类水平。

发布于 广东