#Grok4比DeepSeek强吗#昨天马斯克发布了号称世界上最强的Grok-4，在一场人类顶级的终极考试中，得分直接碾压了市面上所有的模型，再次登顶大模型榜首。Grok-4可能在每个学科上都要超过博士水平，无一例外。距离Grok-3发布才仅仅过去了四个多月，就在这一百多天里，AI江湖风云变幻，各个大模型你追我赶

#Grok4比DeepSeek强吗#昨天马斯克发布了号称世界上最强的Grok-4，在一场人类顶级的终极考试中，得分直接碾压了市面上所有的模型，再次登顶大模型榜首。Grok-4可能在每个学科上都要超过博士水平，无一例外。距离Grok-3发布才仅仅过去了四个多月，就在这一百多天里，AI江湖风云变幻，各个大模型你追我赶，榜单第一的位置几乎是天天易主，竞争早已经白热化了。

这次XAI搞了一个叫“人类终极考试”的超难测试集，全是博士和科研级别的问题。结果Grok-4加强版拿下了惊人的44.4%的准确率，而市面上最强的模型之一Gemini 2.5 Pro只有26.9%，ChatGPT-3是24.9%。在AIME25美国数学邀请赛中，Grok-4加强版更是拿到了满分，这学习能力确实有点恐怖。

它的加强版并不是一个模型在战斗，而像一个学霸学习小组。会同时派遣多个AI智能体，从不同角度独立思考同一个问题，最后互相对答案、讨论辩论，选出最佳解法。这比单个模型运算或者少数服从多数要高级很多，也更接近人类顶级团队解决难题的方式。

Grok-4在图像和视频的理解能力还很弱。专门解决这个问题的第七版基础模型已在训练中，预计几周内完成，计划使用超过10万块英伟达GB200芯片来训练。此外，还计划在八月推出专用的编程模型，九月推出多模态智能体，十月推出视频生成模型。

标准版Grok-4还是每月30美元，但这次重头戏Grok-4 Heavy定价是每个月300美元，马斯克这是直接要掏空用户钱包了。更重要的是，马斯克在发布会上明确预测，最快明年我们就能玩到由AI生成的真正好玩的电子游戏。

想象一下，你只需要告诉AI“我想要一个赛博朋克风格的开放世界游戏”，几个小时后一个可执行的模块就交到你手上了。这不是科幻，这是XAI正在努力实现的目标。马斯克说，我们正身处一个巨大的智能爆炸的开端，这颗智能的种子已经种下了[并不简单]#ai生活指南#

发布于浙江