#Gemini3凭什么被称为最强AI# 独立评测机构Artificial Analysis把Gemini 3 Pro封为“新AI领袖”，要点如下：1.领先的智能指数Gemini 3 Pro Preview 在人工智能分析智能指数的 10 项评估中，有 5 项位居榜首，包括 GPQA Diamond、MMLU-Pro、HLE、LiveCodeBench 和 SciCode。它在人工智能分析公司新推

#Gemini3凭什么被称为最强AI# 独立评测机构Artificial Analysis把Gemini 3 Pro封为“新AI领袖”，要点如下：

1.领先的智能指数
Gemini 3 Pro Preview 在人工智能分析智能指数的 10 项评估中，有 5 项位居榜首，包括 GPQA Diamond、MMLU-Pro、HLE、LiveCodeBench 和 SciCode。它在人工智能分析公司新推出的知识和幻觉评估工具 AA-Omniscience 中也处于领先地位，在 Omniscience Index（评估首要指标，会对错误答案扣分）和 Omniscience Accuracy（正确率）两项指标中均名列第一。

2.高级编码和智能体能力
Gemini 3 Pro Preview 在人工智能分析指数的三项编码评估中，有两项名列前茅，其中 SciCode 测试得分高达 56%，比之前的最高分提高了 10 个百分点以上。它在智能体领域也表现出色，在 Terminal-Bench Hard 和 Tau2-Bench Telecom 测试中均取得了第二高的分数。

3.多模态能力
Gemini 3 Pro Preview 是一款多模态模型，能够接收文本、图像、视频和音频作为输入。它在 MMMU-Pro 基准测试中得分最高，该测试旨在检验模型处理图像输入时的推理能力。目前，谷歌模型占据了我们 MMMU-Pro 排行榜的第一、第三和第四名（GPT-5.1 上周刚刚获得第二名）。

4.速度
Gemini 3 Pro Preview 的速度与 Gemini 2.5 Pro 相当，每秒可输出 128 个令牌。这使其领先于其他前沿模型，包括 GPT-5.1（高）、Kimi K2 Thinking 和 Grok 4。这可能得益于谷歌的第一方 TPU 加速器。#科技先锋官# #ai创造营#

评测来源：x.com/ArtificialAnlys/status/1990813106478715098

发布于中国香港