#提示工程师# 3Blue1Brown的创始人：现在比任何时候都更适合做软件工程师。最近3Blue1Brown的数学讲解视频，频频在国内外学习社区刷屏，最近我就看到了关于线性代数的课程获得了百万次的浏览。更早一点，还有3Blue1Brown对于机器学习原理的讲解，尤其是关于Transformer架构的介绍，帮助无数人完成了大

#提示工程师# 3Blue1Brown的创始人：现在比任何时候都更适合做软件工程师。
最近3Blue1Brown的数学讲解视频，频频在国内外学习社区刷屏，最近我就看到了关于线性代数的课程获得了百万次的浏览。更早一点，还有3Blue1Brown对于机器学习原理的讲解，尤其是关于Transformer架构的介绍，帮助无数人完成了大语言模型的启蒙。

3Blue1Brown的课程涵盖了线性代数、神经网络、微积分、傅立叶变换、量子力学等一系列知识点。但是这些工作的背后，无论是视频，还是视频背后的动画引擎，都是其创始人格兰特-桑德森在斯坦福大学学习数学和计算机科学期间的副业（当然，也包括很多志愿者的参与帮助）。具体可以看其官网（3blue1brown.com/about）

格兰特-桑德森说他的课程分两类：主要侧重于多元微积分，第一类旨在通过数学的实用性来激励数学，第二类旨在将数学作为一种艺术形式来激励数学。

说完背景，再说这只视频，是油管Dev (GPT Learning Hub)频道对格兰特-桑德森做了一次采访。我发的部分是关于他对机器学习的学习建议的。关于硬核技术部分，就不做评价了。我最感兴趣的是他讲，多数人对大模型的看法太极端，要么觉得是牛市，要么觉得熊市，但他觉得现在的情况是牛和熊之间的东西。所以，对于AI可能取代人类程序员编码的问题。他的观点就与众不同，他不认为是“掌握AI的人取代人类”，而是“掌握AI的人干了比之前多三倍的活”。

一些主要观点：
***
一、大语言模型是否具备真正的推理能力？
在这个颇具争议的问题上，他认为，这不应该被简单地归类为"是"或"否"的二元问题。
Grant指出："这是个连续光谱（spectrum），人们常常把它说成非黑即白的事情，好像现在就不是推理，也许将来某天会是。但我认为，把一些通过next token预测产生的内容描述为推理、描述为一种思维链是很合理的。"

并特别强调了以下几点：
尽管模型的基础机制是next token预测，但它展现出的能力已经超出了简单的模式匹配
当模型能够回答互联网上没有的问题时，它展现出的灵活性令人印象深刻
如果一个孩子展现出类似的行为，我们会毫不犹豫地称之为推理

因为，"模型在生成答案时会考虑上下文中所有tokens之间的关系，这种计算过程某种程度上确实类似于推理。虽然每次只预测下一个token，但通过注意力机制，模型实际上在综合考虑所有可能的关联。"

二、数学与机器学习的学习关系
在这个话题上，Grant对传统的"先修课程"概念提出了颠覆性的看法。他认为，数学不应该成为学习机器学习的门槛，而应该作为一个"协同课程"（co-requisite）。

关键观点包括：
机器学习实际上是学习多元微积分的最好动力，比单纯学习纯数学要有效得多
不需要预先掌握所有数学概念，很多概念可以在实践中"即时学习"（learn on the fly）
数学的熟练度更像是一种"语言流畅度"，而不是必备的先决条件

如Grant所说："你不需要预先知道梯度的定义才能开始学习。当有人在实际场景中解释它并给出几个例子时，你自然就能理解了。重要的是培养对这种数学语言的熟悉度，而不是预先掌握所有细节。"

三、平衡的技术观：为什么软件工程师不必恐慌
Grant对AI技术的态度非常平衡，既不过分乐观，也不过分悲观。他用了一个有趣的比喻：处在"看涨"（bull）和"看跌"（bear）之间的某个位置。
具体来说，他们强调：

软件工程师的需求仍在强劲增长，而且工程师恰恰是AI工具最大的受益者
AI工具能让优秀的工程师效率提升约三倍，但不会取代他们
使用AI工具建设实际应用时，一旦出现问题，仍需要专业工程师的介入和解决

所以他比较乐观的预测："现在比任何时候都更适合做软件工程师，因为你是真正看到这些工具好处的人。如果普通人试图用这些机器人来建网站，可能一开始能快速得到结果，但一旦出现问题，没有专业知识就无法解决。" http://t.cn/A6nyKCiz

发布于北京