基地边缘BaseEdge
25-07-06 22:08 微博认证:微博新知博主 科技博主 微博原创视频博主

最近,关于华为盘古 Pro MoE 模型“抄袭 Qwen”的舆论甚嚣尘上。感觉我觉这场争论,本质上不是谁抄了谁,而是我们对“开源”的误解还太深。

一、用了开源代码 ≠ 抄袭
在盘古 Pro MoE 的回应中,有两句话很关键:
“模型架构为基于昇腾硬件平台全新开发。”
“确有引用其他开源代码,严格遵守开源协议,已清晰标注。”

这在技术界并不稀奇,反而是最基础的协作模式。拿几个真实的例子说话:

1、ChatGLM 系列大量参考了 LLaMA 和 GPT 架构,但没人说它抄了。相反,它因“参数高效”和“对话微调优化”被看作是中国对话模型的重要突破。

2、Mistral 7B在代码实现中直接使用了 LLaMA 的大量结构设计,它甚至默认兼容 LLaMA 的权重结构,但人们尊重它在推理效率上的巨大优化。

3、Meta 发布 LLaMA 时也明确写道:欢迎大家在其之上继续构建,甚至把开源许可开放给初创团队。

开源的本质就是“站在他人肩膀上”,而不是“重复造轮子”。你不能一边说“我们要做生态”,一边又用“开源参考 = 抄袭”把人打死。那样整个国产AI都得去集体“认罪”。

二、看懂这次盘古 Pro MoE 的突破点

如果真有人去看华为这次的盘古 MoE 架构,会发现它干的事是“从硬件往上构建”,不是简单的“模型调个参数”。这次它首创了 MoGE 架构(分组混合专家),解决的是:分布式训练中的负载不均;专家路由时的性能浪费;昇腾平台算力调度下的“瓶颈对齐”。

这是很“系统性工程”的技术活,不靠模型微调是搞得出来的。它解决的是“芯片+模型”协同进化的问题,是真底座上的战斗。

今天我们不是在争一个 PR 分数,而是在推进中国AI的“系统能力”。Qwen 开源值得敬佩,它拓宽了社区门槛;华为值得支持,它补上了芯片生态的关键拼图。在面对巨头垄断、专利压制、工具链卡脖的现实下,中国的每一家科技公司,都是在硬碰硬。我们最应该做的,是别让自己人先内耗了自己人。

国产AI走到今天,靠的不是口水战,而是那些真正写代码、扛住算力压强、搞懂硬件底座的人。向前走,需要争议,但更需要公允。我们需要支持一切长期主义者,也支持不为流量所动的技术信仰。

发布于 陕西