盘古大模型的瓜还在更新[允悲]当初只看了deepseek论文没看盘古大模型的论文确实是我的一大失误......好几个测试结果小数点后面全是0，还有100.0这种成绩，8000多个题目100%正确率这个大模型可以封神了然后转述一下今天的更新：吹哨人页面又有内部自爆把原因写出来了，很多项目只测试了100道题的

盘古大模型的瓜还在更新[允悲]

当初只看了deepseek论文没看盘古大模型的论文确实是我的一大失误......好几个测试结果小数点后面全是0，还有100.0这种成绩，8000多个题目100%正确率这个大模型可以封神了

然后转述一下今天的更新：

吹哨人页面又有内部自爆把原因写出来了，很多项目只测试了100道题的测试子集，自然小数点后面全是0，结果这玩意没对齐别的模型测试过程，竟然把子集结论写到论文上来了，还搞出了prompt里面塞选项的操作。

先不说这件事换个厂商能上三天三夜热搜，就内部而言我认为挺恐怖的，23年还在说全栈自主创新不会开源，没有采用任何开源技术，25年就开源了并且找到了引用对象，内部也爆出来这个问题。

如果内部问题是真的，我觉得这和技术路线摇摆不定有一定关系，两年线路就完全翻转，对于任何长期技术开发来说都不太合适，希望华为好好内部整改把。

外面kol骗骗粉丝可以，但是华为是我国目前少数有希望做到算力和模型都自研自主的厂商，这样的问题是对整个行业和产业的重创。

发布于江苏