今天刷到一条消息,直接把我看清醒了。
晚点 LatePost 报道了阿里 Qwen 团队的大变动。
林俊旸,那个带领 Qwen 开源模型杀出一条血路的技术负责人,在X上发了一句 me stepping down. bye my beloved qwen。
整个 AI 圈都炸了。
我觉得,这件事没有表面上那么简单。
它不只是一个人的去留问题,背后折射出的是大厂 AI 团队在高速发展期面临的一个根本矛盾:
技术理想和组织管理之间,到底怎么平衡?
1
很多人只注意到了林俊旸,但其实这波离职潮涉及的范围更广。
Qwen 的后训练负责人郁博文同一天也正式离职了,而 Qwen Code 负责人惠彬原早在今年 1 月就已经离开阿里去了 Meta。
这三个人有一个共同点:他们的第一份工作都在阿里,都是从校招进来的应届生,全程参与了 Qwen 模型从零到一的早期训练。
他们不是空降兵,是阿里自己一手带大的。
现在三个核心人物先后离开,对团队士气的冲击可想而知。据报道,有 Qwen 的同事得知消息后直接哭了。
接替郁博文的是从 DeepMind 加入的周浩,他在 Gemini 3.0 和 DeepResearch 等项目上有很深的积累。
从外部引入重量级人才当然不是坏事,但老兵离开、新人接棒这个过程中间的磨合期,往往是最脆弱的。
2
林俊旸为什么走?表面上看是因为通义实验室要把 Qwen 团队拆开。
原来 Qwen 是一个垂直整合的体系,预训练、后训练、多模态这些环节都在一个团队里闭环运转。
但现在阿里要把它拆成一个个独立的水平分工小团队,林俊旸的管理范围因此被缩小了。
不过更深层的矛盾在于:这种拆法跟林俊旸对技术趋势的判断是冲突的。
他一直认为预训练和后训练甚至 Infra 团队应该越绑越紧、越走越近,而不是各管各的。
从去年开始,Qwen 团队甚至已经在自建 Infra 能力了,就是不想在关键环节上受制于人。
那阿里为什么要拆呢?
因为 Qwen 越长越大,已经从一个模型团队变成了一个五脏俱全的小型 AI 实验室,做 VLA 具身模型、做文生图、做语音,跟通义实验室旗下其他团队的地盘开始重叠。
从管理者的视角来看,资源重复配置肯定是要优化的。但从技术执行者的角度看,你把一个打了胜仗的队伍拆散重编,代价可能比你以为的大得多。
3
Qwen 在全球开源社区的地位毋庸置疑。
Cursor 在用它做微调,一大票中国的具身智能公司拿它当基模,Hugging Face 上的下载量更是遥遥领先。
但问题是,开源越成功,阿里通过 API 直接卖模型赚钱的空间就越小。
这个张力一直都在。
而且据晚点的报道,阿里内部有高管对除夕夜发布的 Qwen-3.5 并不满意,觉得是个半成品。
与此同时,阿里云在 AI 云服务上被火山引擎追着打,千问 App 在春节补贴大战里也没能拉近和豆包的差距。
站在阿里集团的角度想想:技术影响力是好东西,但它不是目的,它得服务于卖云、做 App 这些实实在在的商业目标。
当技术团队的探索方向和公司的商业优先级没有完全对齐的时候,组织调整几乎是必然的。
只是这次调整的时机有点微妙,发生在 Qwen 外部口碑和内部士气都还不错的时候,而不是出了什么大问题之后。
4
拉开视野来看,不只是阿里在折腾。
字节的 Seed 团队内部搞赛马,同一方向多个团队同时跑;
豆包的主模型团队按预训练和后训练的流程来切分;
腾讯去年调整完之后反而走向了更加整合的路线,让姚顺雨一个人同时管模型训练和 Infra。
有人在拆,有人在合,根本没有所谓的最优解。
每家公司的选择取决于它当下面临的核心瓶颈是什么。
但有一点是共通的:频繁的组织变动对核心技术人才的消耗是巨大的。
林俊旸 1993 年出生,32 岁就做到了阿里最年轻的 P10,不是海归博士,完全是本土培养出来的技术领袖。
他走了之后在社交媒体上收到的那些反馈,来自 MiniMax、Unsloth、ollama 这些公司和社区,足以说明他在行业里的分量。
这样的人,走了就是走了,不是换一个组织架构图就能补回来的。
我最大的感受是:AI 行业进入了一个新阶段。
早期那种一小群人躲在角落里安安静静做模型的时代,在大厂里基本结束了。
当 AI 变成每家科技公司输不起的战略级战场,模型团队就不可避免地要面对更多来自组织层面的拉扯。
几个趋势可能会越来越明显:顶尖 AI 人才从大厂向创业公司和海外流动的速度会加快;大厂的 AI 团队架构还会继续调整,合了拆、拆了合;开源和商业化之间的平衡会变得更难把握。
林俊旸接下来会去哪?是创业还是加入另一家公司?Qwen 团队重组之后还能不能保持战斗力?2026 年的中国 AI 格局会因为这些变动发生什么变化?
这些问题现在都没有答案,但值得我们持续关注。
