高飞 24-12-01 12:27
微博认证:至顶科技创始人 AI博主

#模型时代#杨立昆:大语言模型是“非智能”的填空游戏。
Meta首席AI科学家,也是深度学习开创者之一的杨立昆(Yann LeCun),最近出席印度一次科技论坛,与信实集团AI负责人Gaurav做了场100分钟的对话。杨立昆之前的讲座学术性比较强,而这一次则讲得比较科普,把自己的AI理念做了一个比较细致的介绍,油管原频道有留言写道:
“杨立昆是一位令人难以置信的演讲者。他解释了许多我一直想学的概念,而且他的解释简单易懂。而且,他很有耐心,愿意把已经解释过的东西再解释一遍,并尝试用不同的方式让对方理解。这是一位优秀教师的品质”。

其中比较重要的,是他谈到了对AI的未来技术路线看法。对于大语言模型的路线价值,杨立昆的立场一直是怀疑的,认为这东西到不了AGI。他也用不少动物举例过,比如说现在的AI还不如乌鸦聪明。当然,持这一观点的顶尖人士有很多,既包括耕耘于计算机视觉领域的李飞飞(创建了世界模型试验室),也包括更认可强化学习路线的Andrej Kaparthy(他前两天刚说大语言模型不是推理,只是人类数据标记员工作的复制粘贴)。怎么说呢,大概是大语言模型这个技术路线,从“学术”角度,太不优雅?容易被认为是算力、数据、参数量的工程堆叠。

也正是这个原因,现在一些人认为大语言模型架构的AI会威胁人类,杨立昆就觉得太夸张了。

不过,杨立昆只是LLMs悲观主义者,不是AI悲观主义者,他觉得十年内,有望实现人类水平的智能,方法则是通过JEPA(联合嵌入预测架构),因为大语言模型只是一个“系统一”的东西,他要做的是“系统二”。(这部分知识可以查卡尼曼的思考快与慢理论)

解释一下JEPA和LLMs的核心思想区别:
1、编码和表示方式的不同:
JEPA: 不直接预测原始数据(如视频像素、文本词元),而是先通过编码器生成抽象的高维表示,再在这个抽象空间中进行预测
Transformer: 直接在原始数据空间(如词元)上进行预测

2、预测方式的差异:
JEPA: 分层次的预测能力,可以进行不同时间尺度的预测。短期预测更精确具体,长期预测更抽象概括
Transformer: 主要是基于上下文的序列预测,预测范围相对固定

3、架构目标的区别:
JEPA: 试图构建"世界模型",能够理解因果关系并进行规划
Transformer: 专注于理解和生成文本,主要是基于统计模式的语言建模

4、认知系统的对应:
JEPA: 更接近人类的系统2思维(深度思考、规划)
Transformer: 更类似系统1思维(快速、直觉式反应)

5、因此杨立昆认为,仅靠扩大Transformer架构的规模无法达到真正的人类级智能,而是需要像JEPA这样的新架构,能够:
从现实世界中学习
进行分层规划
理解行动的因果关系
在抽象层面进行推理

用Claude 对讲座的核心观点做了个摘要:
***
1. 大语言模型的局限性:非智能的"填空游戏"
**核心概括**:现有大语言模型本质上是在玩填空游戏,缺乏对物理世界的理解和推理能力。
深入探讨中,杨立昆直言不讳地指出大语言模型的根本局限。他通过生动的类比解释道,目前的语言模型训练方法就像在做填空题 - 删掉文本中的某些词,然后训练系统预测这些缺失的内容。这种方法虽然在语言处理上取得了显著成果,但无法让AI真正理解物理世界,也无法进行有效的推理和规划。这种观点直接挑战了当前AI领域"大力堆料就能实现通用智能"的主流思维。

2. JEPA:迈向真正智能的新范式
**核心概括**:联合嵌入预测架构(JEPA)或将成为下一代AI系统的关键突破口。
杨立昆提出了一个令人耳目一新的概念 - JEPA(联合嵌入预测架构)。他以木星轨道预测为例,精妙地阐述了这一理念:预测木星运动轨道只需要六个数字(三个位置参数和三个速度参数),而不需要知道它的大小、密度、成分等其他特征。这一思路启示我们,AI系统应该学会提取真正相关的信息,而不是试图预测所有细节。这种方法可能让AI获得更接近人类的认知能力。

3. "工程先于理论"的发展模式
**核心概括**:AI领域的突破往往是工程实践领先于理论解释,这符合科技发展的历史规律。
通过蒸汽机、飞机等历史案例,杨立昆阐释了一个重要观点:突破性技术往往先于其理论解释而出现。就像蒸汽机的发明早于热力学理论,深度学习的实践同样走在理论之前。这种"实践引领理论"的观点,为当前AI研究提供了重要的方法论指导。

4. 视觉学习的重要性
**核心概括**:仅靠文本训练无法实现人类级AI,视觉学习才是关键。
杨立昆提供了一组震撼的数据对比:当前最大的语言模型训练数据量约为10的14次方字节,而一个4岁孩子在清醒时间内接收的视觉信息总量也差不多是这个数字。但关键的区别在于,儿童接收的是关于物理世界运作的原始感知数据,这种学习方式远比纯文本学习更有效。

5. AI发展的下一个十年展望
**核心概称**:预计在5-7年内可能实现重大突破,10年内或达到人类级智能。
杨立昆展现了难得的乐观:他预测在未来5-7年内,我们很可能开发出具备常识推理能力的AI系统,并在10年内实现人类级别的智能。这个愿景的实现将依赖于JEPA等新架构,而不是简单地扩大现有语言模型的规模。他同时强调,这种智能系统最终将部署在每个人的智能手机和智能眼镜上,真正实现AI民主化。​​​​​​​​​​​​​​​​

时间轴:
***
00:00 Yann 的开场白
01:50 工程师与科学家的区别
03:15 Yann 对 AI 和数学的兴趣
04:05 “AI 之父”称号 | Yann 的感受
05:22 在纽约大学的教学与名声
06:00 科学中的英雄
07:46 Yann 眼中的世界三大问题
10:18 什么是 AI,我们是如何走到这一步的?
13:13 什么是智能?| 大象类比
15:00 AI 的感知与理解
16:20 AI 的两大分支:解决与学习
17:30 经典计算机科学的兴起 | 启发式编程
20:15 AI 是否从生物学中得到启发?
26:36 AI 能否构建真实的金融模型?
28:36 AI 的不同部分 | GOFAI 和机器学习
30:18 什么是 GOFAI?
31:14 不同类型的机器学习
32:22 什么是强化学习?
33:19 什么是自监督学习?| 新兴趋势
35:14 AI 是否只是告诉你想听的?
38:00 什么是 Transformer?
40:24 什么是反向传播算法?
42:58 强化学习领域的进展
48:06 什么是卷积神经网络?
49:08 什么是神经元?| 机器学习视角
50:00 什么是神经网络语言模型?它如何工作?
58:00 AI 树 | 大语言模型(LLMs)
59:55 AI 的下一个挑战
1:01:40 图片/视频领域的进展
01:03:20 大语言模型的有限记忆 | 不同类型的记忆
01:04:45 AI 通向类人学习的路径
01:10:26 什么是 JEPA?
01:11:58 JEPA 可以预测多远的未来?
01:14:10 AI 对未来的预测 | 乌托邦还是反乌托邦?
01:16:30 大语言模型的循环 | 需要改变的地方
01:18:50 在印度建设数据中心 | Yann 的看法
01:21:09 25 岁应该在 AI 领域做什么?| AI 领域的职业选择
01:26:18 投资者应该投资什么?| Yann 的未来预测
01:29:13 AI 世界中人类智能的命运
01:32:09 什么是智能?| 最终解读
01:34:00 结束还是刚刚开始? http://t.cn/A6mfA3uz

发布于 韩国