不是郑小康
26-06-30 13:56 微博认证:汽车博主

华为兑现承诺,今天正式开源 openPangu-2.0-Flash 模型,这个模型是之前华为 HDC 2026 开发者大会上老余发布的,同期发布的还有 openPangu 2.0 Pro,那是一个 5050 亿总参数,激活参数 180 亿的大模型。

这个开源比较特别的是,除了模型结构、权重、技术报告和推理代码,华为把预训练代码、后训练代码以及推训算子一起开源了。

老余之前解释过,openPangu 2.0 参数量不算高,是因为昇腾大量的算力都支持国内其他企业了,留给华为自己的集群算力非常有限,目前还不能满足更大模型的训练需求。

这是老余第二次接受华为的大模型业务,第一次是在 2021 年 4 月。「我代表华为云发布了全中国第一个大模型。当时不仅全中国,全世界都不知道大模型为何物的时候,我们就发布了盘古大模型,是这个行业的绝对先驱者。」

「去年国庆节前夕,公司又让我来负责这个大模型。我想我会带领团队一路赶超,在我余承东的字典里,没有第二,只有第一。」

发布于 上海