#阿里Qwen负责人宣布离开#
阿里巴巴开源大模型Qwen技术负责人林俊旸(1993年生,阿里最年轻P10技术高管)在Qwen3.5小模型开源次日,于社交平台发文“me stepping down. bye my beloved qwen”,确认卸任技术负责人职务。其未透露是否离开阿里,官方亦未回应。
除林俊旸外,后训练负责人郁博文、Qwen Code负责人惠彬原(1月已离职)、Qwen3.5核心贡献者Kaixin Li等至少3-4名骨干同步宣布离开。团队成员Chen Cheng直言“离开并非你的选择”(leaving wasn't your choice)。
有成员得知消息后“伤心落泪”,多名研究者在朋友圈发布“🙏”致敬,口号“Qwen is nothing without its people”广泛传播,被类比为OpenAI山姆·阿尔特曼离职事件。
林俊旸最终选择离开,很可能与 Qwen 团队正经历的组织调整有关。林俊旸直接负责的 Qwen(通义千问)团队隶属于阿里云 CTO 周靖人负责的通义实验室。
近期,通义实验室计划将 Qwen 团队分拆,从涵盖不同训练流程和模态的 “垂直整合” 体系,变成预训练、后训练、文本、多模态等一个个分开的水平分工团队,这些团队仍隶属通义实验室。林俊旸的管理范围被缩小。
把模型团队拆开、打散的变化,也不符合林俊旸对技术趋势的判断。去年至今,林俊旸曾多次提及,他认为预训练、后训练,乃至 Infra 和训练团队应该更紧密地结合和沟通。
在这次变动之前,Qwen 团队在阿里内部面临微妙的张力:
一方面,Qwen 在全球开源社区有大量开发者拥趸。它以丰富的尺寸受到中小创业公司的喜爱,不少知名司,如 Cursor 等都会基于 Qwen 系列模型做微调和后训练;Qwen 的多模态开源系列也是一众中国具身智能公司选择的基模。
同期,Qwen 和林俊旸不断扩展能力边界,与通义实验室的其它平行团队已有重合:据了解,Qwen 也在开发 VLA 具身模型,同在通义实验室的许主洪负责的团队也做相关工作;Qwen 同时在做文生图模型(Qwen-image)和语音模型,这和通义实验室的通义万相(主要做多模态生成)和百聆(主要做语音模型)亦有重合。当 Qwen 也开始组建自己的 Infra 等团队后,它逐渐变得像一个五脏俱全的 “全栈 AI 实验室”。
另一方面,阿里内部也在持续评估 Qwen 的成果和价值。
其中有对开源模型商业化效率的追问:Qwen 虽声名显赫,但开源会影响阿里直接通过售卖模型 API 获得收入。
也有对 Qwen 的一些具体产出的评价。我们了解到,阿里内部有高管对除夕夜亮相发布的 Qwen-3.5 并不完全满意,称其是一个 “半成品”。
从整个阿里的角度考虑,技术影响力和开源社区贡献并不是目的,而是达成 AI 云、超级 AI app 等战略和商业目标的手段。在 AI 云上,阿里云面临火山引擎的激进追赶,而字节走的是闭源模型路线。在超级 App 上,刚刚结束的春节补贴大战上,千问 App 也未明显缩小与豆包的差距。
商业目标和技术目标之间并没有完全对齐;从上而下制定战略和分工,与内部小团队的独立探索之间的拉扯,是 Qwen 团队与阿里大环境之间更深层的问题。
#老张聊科技# http://t.cn/AXcDGTUf
发布于 河南
