看了一下Deepseek v3的技术报告，不光我傻了，AK都傻了，(我认为是8到12k片的gpu,AK说是16K),然后人家deepseek v3只用了2k的gpu，而且语料也就只有14T, 训练了两个月，疯狂打脸openai和google,anthropic啊[污]，不过海外对deepseek的赞叹和不解远高于国内，国内似乎都没反应过来发生了什么[并不简单]，

看了一下Deepseek v3的技术报告，不光我傻了，AK都傻了，(我认为是8到12k片的gpu,AK说是16K),然后人家deepseek v3只用了2k的gpu，而且语料也就只有14T, 训练了两个月，疯狂打脸openai和google,anthropic啊[污]，不过海外对deepseek的赞叹和不解远高于国内，国内似乎都没反应过来发生了什么[并不简单]，夸张一点的话，这甚至可以封一个逆向scaling law了[二哈][二哈][二哈]，只能说China No 1,和黑悟空同级别的2024年的震撼

发布于北京