张岱樾
25-11-19 18:28 微博认证:AI博主

#Gemini3凭什么被称为最强AI# 独立评测机构Artificial Analysis把Gemini 3 Pro封为“新AI领袖”,要点如下:

1.领先的智能指数
Gemini 3 Pro Preview 在人工智能分析智能指数的 10 项评估中,有 5 项位居榜首,包括 GPQA Diamond、MMLU-Pro、HLE、LiveCodeBench 和 SciCode。它在人工智能分析公司新推出的知识和幻觉评估工具 AA-Omniscience 中也处于领先地位,在 Omniscience Index(评估首要指标,会对错误答案扣分)和 Omniscience Accuracy(正确率)两项指标中均名列第一。

2.高级编码和智能体能力
Gemini 3 Pro Preview 在人工智能分析指数的三项编码评估中,有两项名列前茅,其中 SciCode 测试得分高达 56%,比之前的最高分提高了 10 个百分点以上。它在智能体领域也表现出色,在 Terminal-Bench Hard 和 Tau2-Bench Telecom 测试中均取得了第二高的分数。

3.多模态能力
Gemini 3 Pro Preview 是一款多模态模型,能够接收文本、图像、视频和音频作为输入。它在 MMMU-Pro 基准测试中得分最高,该测试旨在检验模型处理图像输入时的推理能力。目前,谷歌模型占据了我们 MMMU-Pro 排行榜的第一、第三和第四名(GPT-5.1 上周刚刚获得第二名)。

4.速度
Gemini 3 Pro Preview 的速度与 Gemini 2.5 Pro 相当,每秒可输出 128 个令牌。这使其领先于其他前沿模型,包括 GPT-5.1(高)、Kimi K2 Thinking 和 Grok 4。这可能得益于谷歌的第一方 TPU 加速器。#科技先锋官# #ai创造营#

评测来源:x.com/ArtificialAnlys/status/1990813106478715098

发布于 中国香港