今天中午大伙儿都在看马斯克xAI的Grok-3发布，在基准测试下确实是到全球第一的位置了。可惜的xAI只会在未来几个月把Grok-2给开源了，Grok-3开源的时间还未知。Andrej Kaparthy（从OpenAI离职的哥们）提前获得了Grok-3的账号，在发布会以后立刻就分享了他使用Grok-3的体验：能力上大致与OpenAI o1-pro（

今天中午大伙儿都在看马斯克xAI的Grok-3发布，在基准测试下确实是到全球第一的位置了。可惜的xAI只会在未来几个月把Grok-2给开源了，Grok-3开源的时间还未知。Andrej Kaparthy（从OpenAI离职的哥们）提前获得了Grok-3的账号，在发布会以后立刻就分享了他使用Grok-3的体验：能力上大致与OpenAI o1-pro（每个月200美元）相当，优于DeepSeek-R1 和 Gemini 2.0 Flash Thinking。

有意思的是，Grok-3有一个和DeepSeek-R1 相似的点，就是比较不守“规则”。大家在用DeepSeek R1的时候都在诟病他总是有很多幻觉，这对要准确信息的请求是个弊端；但从正面去想，有这种幻觉才能有更大的可能做出创造性的内容出来，进而激发人类的思考。Grok-3在这个层面上似乎比DeepSeek-R1更甚，这位大佬尝试让他去求解黎曼猜想，结果他还真认认真真在尝试解出来，并不想其他的大模型看到问题就放弃。

有这种情况是好事，等模型的能力持续进步，或许哪天就真解出来了。Grok-3的能力是靠大规模算力怼出来的，去年GPU数量已经扩增至20万颗，当前已经开始建设下一个集群，算力规模要提升5倍。

大模型的智能程度依然需要靠算力来提升，所以算力的需求确定性是非常高的。再看国内也是一样，大厂都在增加资本开支了，并且国内还有各行业AI应用大爆发的趋势，如果技术跑得比较快，指不准今年算力供应又会出现紧缺的情况了。

发布于北京