小互AI 25-12-05 09:17
微博认证:AI博主

在OpenAI 宣称将要反击的时候

Google 再放大招,提前把OpenAI 摁在地上摩擦😅

Google 推出 Gemini 3 Deep Think

超强深度推理模型

在所有高难度测试中,均拿下最高分

在ARC-AGI-2测试中 评分是GPT 5.1的2.5倍

它支持并行思考:可以同时探索多个假设(而不是一步步线性推理)

这是通用人工智能(AGI)评测的“圣杯”级别基准ARC-AGI-2测试中:

达到前所未有的 45.1% 准确率。🤯

是 GPT-5.1:17.6% 的 2.5倍

在Humanity’s Last Exam测试中:无需工具即达到 41.0% 准确率;

在 GPQA Diamond 高精度的科学知识问答评估中。Gemini 3 Deep Think 达到 接近满分的表现。

一个实例

指令内容:

在一个单一的 HTML 文件中,创建一个程序化渲染的类地行星…

左边(Gemini 3 Pro):“敷衍了事”

画了一个发光的白球,外面套了一个简单的圈。

右边(Gemini 3 Deep Think):“超级学霸”

直接做出了一个好莱坞大片级别的 3D 地球!

详细介绍:http://t.cn/AXyJnQS6

发布于 安徽