薛定谔的英短咕咕咕 25-07-08 14:58
微博认证:数码博主

盘古大模型的瓜还在更新[允悲]

当初只看了deepseek论文没看盘古大模型的论文确实是我的一大失误......好几个测试结果小数点后面全是0,还有100.0这种成绩,8000多个题目100%正确率这个大模型可以封神了

然后转述一下今天的更新:

吹哨人页面又有内部自爆把原因写出来了,很多项目只测试了100道题的测试子集,自然小数点后面全是0,结果这玩意没对齐别的模型测试过程,竟然把子集结论写到论文上来了,还搞出了prompt里面塞选项的操作。

先不说这件事换个厂商能上三天三夜热搜,就内部而言我认为挺恐怖的,23年还在说全栈自主创新不会开源,没有采用任何开源技术,25年就开源了并且找到了引用对象,内部也爆出来这个问题。

如果内部问题是真的,我觉得这和技术路线摇摆不定有一定关系,两年线路就完全翻转,对于任何长期技术开发来说都不太合适,希望华为好好内部整改把。

外面kol骗骗粉丝可以,但是华为是我国目前少数有希望做到算力和模型都自研自主的厂商,这样的问题是对整个行业和产业的重创。

发布于 江苏