#Grok4比DeepSeek强吗#昨天马斯克发布了号称世界上最强的Grok-4,在一场人类顶级的终极考试中,得分直接碾压了市面上所有的模型,再次登顶大模型榜首。Grok-4可能在每个学科上都要超过博士水平,无一例外。距离Grok-3发布才仅仅过去了四个多月,就在这一百多天里,AI江湖风云变幻,各个大模型你追我赶,榜单第一的位置几乎是天天易主,竞争早已经白热化了。
这次XAI搞了一个叫“人类终极考试”的超难测试集,全是博士和科研级别的问题。结果Grok-4加强版拿下了惊人的44.4%的准确率,而市面上最强的模型之一Gemini 2.5 Pro只有26.9%,ChatGPT-3是24.9%。在AIME25美国数学邀请赛中,Grok-4加强版更是拿到了满分,这学习能力确实有点恐怖。
它的加强版并不是一个模型在战斗,而像一个学霸学习小组。会同时派遣多个AI智能体,从不同角度独立思考同一个问题,最后互相对答案、讨论辩论,选出最佳解法。这比单个模型运算或者少数服从多数要高级很多,也更接近人类顶级团队解决难题的方式。
Grok-4在图像和视频的理解能力还很弱。专门解决这个问题的第七版基础模型已在训练中,预计几周内完成,计划使用超过10万块英伟达GB200芯片来训练。此外,还计划在八月推出专用的编程模型,九月推出多模态智能体,十月推出视频生成模型。
标准版Grok-4还是每月30美元,但这次重头戏Grok-4 Heavy定价是每个月300美元,马斯克这是直接要掏空用户钱包了。更重要的是,马斯克在发布会上明确预测,最快明年我们就能玩到由AI生成的真正好玩的电子游戏。
想象一下,你只需要告诉AI“我想要一个赛博朋克风格的开放世界游戏”,几个小时后一个可执行的模块就交到你手上了。这不是科幻,这是XAI正在努力实现的目标。马斯克说,我们正身处一个巨大的智能爆炸的开端,这颗智能的种子已经种下了[并不简单]#ai生活指南#
