量子位 25-09-29 13:03
微博认证:量子位官方微博

#华为盘古718B模型最新成绩##华为开源模型国内第二#

高手如云,高手如云,但华为依旧“杀”出了一片天。

就在最新一期的SuperCLUE中文大模型通用基准测评中,各个AI大模型玩家的成绩新鲜出炉。

从大家最为关心的开源、国产两个维度来看,前三名排名分别为:

- DeepSeek-V3.1-Terminus-Thinking
- openPangu-Ultra-MoE-718B
- Qwen3-235B-A22B-Thinking-2507

(注:SuperCLUE是一个综合性的大模型评测基准,本次通过对数学推理、科学推理、代码生成、智能体Agent、幻觉控制、精确指令遵循六个维度的核心能力进行评估,共计1260道题目。)

那么华为这个拥有7180亿参数体量的MoE大模型,究竟凭什么脱颖而出?

在我们与openPangu核心成员深入交流之后,发现他们的训练哲学并非是大力出奇迹,与之恰恰相反——不靠堆数据,靠会思考。

这又是什么意思呢?接下来,我们就来一同细看。http://t.cn/AX7iabjh