关于华为盘古大模型的大瓜,今天又有新的后续,总结一下:
1、华为诺亚方舟实验室有不同的纵队,爆料者所在的四纵队,负责大语言模型研发;还有个十六纵队,原本是小模型实验室,后来也做大模型研发。
2、四纵队坚持理想主义,从0~1全栈从头自研,去年145B V3已经达到2024年竞品效果,但是,代码和数据都直接被十六纵队小模型实验室要走。不过,这也印证了华为具备全栈自研的能力。
3、华为刚开源的那个盘古72B pro moe是在阿里通义千问的基础上继续训练而来,不是从头全栈训练的那个版本,而且还开源,爆料人的自尊和信仰已经崩塌。
大家怎么看?
发布于 广东
