要不我来试试水 25-02-18 21:25
微博认证:投资内容创作者 财经观察官 财经博主 超话粉丝大咖(基金超话) 微博原创视频博主

今天中午大伙儿都在看马斯克xAI的Grok-3发布,在基准测试下确实是到全球第一的位置了。可惜的xAI只会在未来几个月把Grok-2给开源了,Grok-3开源的时间还未知。Andrej Kaparthy(从OpenAI离职的哥们)提前获得了Grok-3的账号,在发布会以后立刻就分享了他使用Grok-3的体验:能力上大致与OpenAI o1-pro(每个月200美元)相当,优于DeepSeek-R1 和 Gemini 2.0 Flash Thinking。

有意思的是,Grok-3有一个和DeepSeek-R1 相似的点,就是比较不守“规则”。大家在用DeepSeek R1的时候都在诟病他总是有很多幻觉,这对要准确信息的请求是个弊端;但从正面去想,有这种幻觉才能有更大的可能做出创造性的内容出来,进而激发人类的思考。Grok-3在这个层面上似乎比DeepSeek-R1更甚,这位大佬尝试让他去求解黎曼猜想,结果他还真认认真真在尝试解出来,并不想其他的大模型看到问题就放弃。

有这种情况是好事,等模型的能力持续进步,或许哪天就真解出来了。Grok-3的能力是靠大规模算力怼出来的,去年GPU数量已经扩增至20万颗,当前已经开始建设下一个集群,算力规模要提升5倍。

大模型的智能程度依然需要靠算力来提升,所以算力的需求确定性是非常高的。再看国内也是一样,大厂都在增加资本开支了,并且国内还有各行业AI应用大爆发的趋势,如果技术跑得比较快,指不准今年算力供应又会出现紧缺的情况了。

发布于 北京