看了一下Deepseek v3的技术报告,不光我傻了,AK都傻了,(我认为是8到12k片的gpu,AK说是16K),然后人家deepseek v3只用了2k的gpu,而且语料也就只有14T, 训练了两个月,疯狂打脸openai和google,anthropic啊[污],不过海外对deepseek的赞叹和不解远高于国内,国内似乎都没反应过来发生了什么[并不简单],夸张一点的话,这甚至可以封一个逆向scaling law了[二哈][二哈][二哈],只能说China No 1,和黑悟空同级别的2024年的震撼
发布于 北京
