#提示工程师# 3Blue1Brown的创始人:现在比任何时候都更适合做软件工程师。
最近3Blue1Brown的数学讲解视频,频频在国内外学习社区刷屏,最近我就看到了关于线性代数的课程获得了百万次的浏览。更早一点,还有3Blue1Brown对于机器学习原理的讲解,尤其是关于Transformer架构的介绍,帮助无数人完成了大语言模型的启蒙。
3Blue1Brown的课程涵盖了线性代数、 神经网络、 微积分、 傅立叶变换、 量子力学等一系列知识点。但是这些工作的背后,无论是视频,还是视频背后的动画引擎,都是其创始人格兰特-桑德森在斯坦福大学学习数学和计算机科学期间的副业(当然,也包括很多志愿者的参与帮助)。具体可以看其官网(3blue1brown.com/about)
格兰特-桑德森说他的课程分两类:主要侧重于多元微积分,第一类旨在通过数学的实用性来激励数学,第二类旨在将数学作为一种艺术形式来激励数学。
说完背景,再说这只视频,是油管Dev (GPT Learning Hub)频道对格兰特-桑德森做了一次采访。我发的部分是关于他对机器学习的学习建议的。关于硬核技术部分,就不做评价了。我最感兴趣的是他讲,多数人对大模型的看法太极端,要么觉得是牛市,要么觉得熊市,但他觉得现在的情况是牛和熊之间的东西。所以,对于AI可能取代人类程序员编码的问题。他的观点就与众不同,他不认为是“掌握AI的人取代人类”,而是“掌握AI的人干了比之前多三倍的活”。
一些主要观点:
***
一、大语言模型是否具备真正的推理能力?
在这个颇具争议的问题上,他认为,这不应该被简单地归类为"是"或"否"的二元问题。
Grant指出:"这是个连续光谱(spectrum),人们常常把它说成非黑即白的事情,好像现在就不是推理,也许将来某天会是。但我认为,把一些通过next token预测产生的内容描述为推理、描述为一种思维链是很合理的。"
并特别强调了以下几点:
尽管模型的基础机制是next token预测,但它展现出的能力已经超出了简单的模式匹配
当模型能够回答互联网上没有的问题时,它展现出的灵活性令人印象深刻
如果一个孩子展现出类似的行为,我们会毫不犹豫地称之为推理
因为,"模型在生成答案时会考虑上下文中所有tokens之间的关系,这种计算过程某种程度上确实类似于推理。虽然每次只预测下一个token,但通过注意力机制,模型实际上在综合考虑所有可能的关联。"
二、数学与机器学习的学习关系
在这个话题上,Grant对传统的"先修课程"概念提出了颠覆性的看法。他认为,数学不应该成为学习机器学习的门槛,而应该作为一个"协同课程"(co-requisite)。
关键观点包括:
机器学习实际上是学习多元微积分的最好动力,比单纯学习纯数学要有效得多
不需要预先掌握所有数学概念,很多概念可以在实践中"即时学习"(learn on the fly)
数学的熟练度更像是一种"语言流畅度",而不是必备的先决条件
如Grant所说:"你不需要预先知道梯度的定义才能开始学习。当有人在实际场景中解释它并给出几个例子时,你自然就能理解了。重要的是培养对这种数学语言的熟悉度,而不是预先掌握所有细节。"
三、平衡的技术观:为什么软件工程师不必恐慌
Grant对AI技术的态度非常平衡,既不过分乐观,也不过分悲观。他用了一个有趣的比喻:处在"看涨"(bull)和"看跌"(bear)之间的某个位置。
具体来说,他们强调:
软件工程师的需求仍在强劲增长,而且工程师恰恰是AI工具最大的受益者
AI工具能让优秀的工程师效率提升约三倍,但不会取代他们
使用AI工具建设实际应用时,一旦出现问题,仍需要专业工程师的介入和解决
所以他比较乐观的预测:"现在比任何时候都更适合做软件工程师,因为你是真正看到这些工具好处的人。如果普通人试图用这些机器人来建网站,可能一开始能快速得到结果,但一旦出现问题,没有专业知识就无法解决。" http://t.cn/A6nyKCiz
发布于 北京
