1月10日,清华大学办了一场AGI-Next峰会。
这阵容放在中国AI圈绝对是顶配了。
智谱AI的唐杰、月之暗面的杨植麟、阿里云通义千问的林俊旸,外加学界泰斗杨强,还有刚从OpenAI回国加入腾讯的姚顺雨。
我花了点时间把演讲和圆桌的内容看完,有些观点确实挺有意思,今天把这场峰会里最重要的几个观点整理出来。
1️⃣ 第一个观点:Scaling可能是人类偷懒的办法。
这话是唐杰说的。
过去几年大模型的逻辑很简单,堆数据、堆算力、堆参数,效果就会变好。
这条路确实有效,但唐杰认为这本质上是最笨的办法。
他的原话大概是:我们应该找到新的知识压缩方式,探索未知的Scaling范式。
智谱现在在做的一个方向叫RLVR,全称是可验证奖励的强化学习。
简单说就是在数学、编程这类能判对错的场景里,让模型自己卷自己。
智谱最新的GLM-4.7就是这么练出来的,在Coding和Agent任务上表现不错。
但唐杰也承认,这个方法的局限性很明显。
数学题能判对错,但很多现实世界的问题没有标准答案,怎么让模型在这些场景里也能自我进化,目前还没有好的解法。
唐杰还提了一个挺有意思的概念,叫机器睡眠。
他认为人脑之所以聪明,很大程度上是因为睡觉的时候在整理记忆、消化知识。
未来的AI也应该有类似机制,不是被动接受投喂,而是主动反思和学习。
这个想法听起来有点科幻,但仔细想想确实指向了一个核心问题:现在的模型都是被训练出来的,什么时候它们能自己学?
2️⃣ 第二个观点:Token效率可能比模型规模更重要。
这个观点来自杨植麟。
他把大模型的发展归结为一件事:用能源换智能。
芯片越好,架构越优,同样的电费能换来的智商就越高。
月之暗面过去一年做了两个东西。
第一个叫Muon优化器。
这玩意儿干掉了统治业界十年的Adam,实现了两倍的Token效率提升。
意思是达到同样的智能水平,只需要一半的数据量。
杨植麟展示了一张Loss曲线图,那条曲线完全平稳下降,没有任何毛刺,他说这是他2025年见过最美的东西。
第二个是Key-Value Cross Attention,专门解决长上下文任务。
传统的线性注意力机制处理超长文本时容易掉链子,这个新架构不仅解决了问题,速度还快了6到10倍。
杨植麟还透露了一个数据。基于这些技术打造的Kimi K2模型,在一个叫HLE的测试里达到了45%的准确率。
这个测试的全称叫人类最后的考试,难度可想而知。
他在演讲最后说了一句话,大意是:智能和电力不一样,电力是同质化的,但智能是非同质化的。
一位音乐家产生的智能和一位程序员产生的智能完全不同。
这个视角挺有意思,它意味着未来的模型竞争可能不只是比谁更聪明,而是比谁更懂特定领域。
3️⃣ 第三个观点:模型要从学霸变成能干活的人。
这是林俊旸的核心观点。
作为通义千问的负责人,他说得很直接:如果你的想法不是帮助全人类,那不如不做大模型。
Qwen明年的主力模型叫Qwen-3,核心方向是混合架构。
具体来说就是把Transformer和Mamba按3:1的比例混起来,解决无限长文本带来的显存和计算瓶颈。
林俊旸展示了两张对比图。
一张是8月份生成的图片,AI味儿很重;另一张是12月份生成的宿舍女生自拍风格,逼真程度确实吓人。
但他更在意的不是生图效果,而是把生成和理解打通。
比如解几何题卡住了,模型可以自己画辅助线,然后基于新图继续推理。
林俊旸观察到一个现象:旧金山已经进入了Vibe Coding时代,没人再手写代码了,但国内还没普及。
他认为能操作电脑、写代码、甚至在物理世界里端茶倒水的AI,才是最终形态。
4️⃣ 第四个观点:自主学习不会像核爆,更像间谍渗透。
这个判断来自姚顺雨。
作为刚从OpenAI回来的人,他的视角确实不太一样。
他先给了一个基本判断:ToC端的体验正在趋于平缓,ToB端的革命已经发生。
普通用户今天用ChatGPT和去年用,感受差别没那么大了。
但在企业端尤其是Coding场景,变化翻天覆地。
他举了个例子。
一个年薪20万美元的员工每天处理10个任务,顶级模型能做对9个,差一点的模型只能做对5个。
问题在于你不知道错的那5个是哪5个,所以企业宁愿付溢价买确定性。
关于下一个范式,姚顺雨的预判很有画面感。
他认为自主学习不会像AlphaGo那样突然爆发,更像一个间谍在悄悄渗透。
ChatGPT利用用户数据调整风格,Claude Code编写了自己项目95%的代码,这些都是自主学习的雏形。
他说得最直接的一段话是关于中国研究界的。
大意是:在中国,大家更喜欢做安全的事情。如果这个事情已经被证明可行,几个月就能复现并做到极致。
但要探索未知领域,大家就会犹豫。
他回忆在OpenAI的经历,那里的人更在乎能不能创造新东西,而不是能不能在榜单上高出一分。
他特别点名表扬了DeepSeek,说他们没那么关注榜单,而是关注用户体验和正确的技术路径。
2026年可能是中国AI的一个分水岭,不是说技术会有多大突破,而是大家的心态在变。
参数竞赛的时代正在过去,关于智能本质的探索才刚刚开始。
发布于 上海
