Yundor 25-11-12 23:51
微博认证:女性成长博主

今晚看了下Shunyu Yao的博士毕业答辩,听得懂全英文的可以直接去油管看原视频,听不懂的可以直接看我总结。

他是做语言智能体方向的研究者,这个方向也是最近各家大模型在卷的重点。
视频是2024年上传的,算是一手信源,虽然不是最新,但观点非常前沿。

大概观点如下:

1️⃣他提到传统智能体的局限性是基于人工规则去强化学习的,只能在特定的训练场景下强化,但无法有训练场景以外的环境。所以最好的办法是让数字自动化作为新的训练环境,比如“互联网”“代码库”“软件”这类天然数据场景里。
这是什么意思呢?就是过去的AI,只能在被规定好的场域里学,比如AlphaGo只能下棋、自动驾驶只能在模拟路况中学。一旦出了这个场景,它就懵了。
看完这个例子,我会想到微博的智搜和抖音的豆包都是基于他说的这个例子,因为有足够多的数字自动化训练环境,才能生成结果足够丰富。它们都是依托的是巨量的实时数据和反馈机制,可以让AI能在开放场景中反复修炼,输出也越来越聪明。

2️⃣他说,智能体的三大要素是:1.记忆(短期记忆和长期记忆)2.强化学习 3.决策程序
这三个词看似学术,但你可以这样理解:
1.记忆是“它记得你是谁”
2.强化学习是“它知道怎么变得更好”
3.决策是“它能自己判断接下来该干什么”
让我想到国内语言大模型大多数都是短期记忆为主,目前为止好像只有GPT是支持长期记忆的。(能记住你上次聊的事并在下次用上)。
但是新出的Kimi K2 Thinking就是在第二点和第三点方面很强,它不光能回答,还能自己去验证、检索、思考。这已经是国产模型在智能体方向上一个很大的突破,这也是我为其很骄傲的点。

3️⃣他说,未来的方向不是教AI思考,而是让AI思考自己。也就是说AI未来要能自己发现新知识、自己整理长期记忆、自己理解用户的好奇心和动机。相当于你跟一个AI长期相处,它能自动归纳出你喜欢的主题、你的思维习惯、你提问的方式。
那它就真的变成了你的数字化分身,可以放大你十倍百倍的思维能力。
这一点让我想起阿西莫夫十几年前写的机器人小说,我是五年前看的,当时只是科幻,如今正在兑现。AI确实在知识储备、逻辑推演、深度思考上已经超越了人类。我们真正要思考的,是怎样不被取代,并且学会与它共存。

以上三个观点我是结合他的技术语言翻译成大白话给大家听的,会考虑大家的理解力,所以不是百分百的原意,也会举例更通俗易懂的例子方便看懂。

如果大家能看懂也感兴趣,我愿意经常翻译一些还没有中翻过的前沿知识视频并加上自己理解给大伙听。

#云朵的零基础ai课#
#微博跨域计划##人工智能#

发布于 广东