在OpenAI 宣称将要反击的时候
Google 再放大招,提前把OpenAI 摁在地上摩擦😅
Google 推出 Gemini 3 Deep Think
超强深度推理模型
在所有高难度测试中,均拿下最高分
在ARC-AGI-2测试中 评分是GPT 5.1的2.5倍
它支持并行思考:可以同时探索多个假设(而不是一步步线性推理)
这是通用人工智能(AGI)评测的“圣杯”级别基准ARC-AGI-2测试中:
达到前所未有的 45.1% 准确率。🤯
是 GPT-5.1:17.6% 的 2.5倍
在Humanity’s Last Exam测试中:无需工具即达到 41.0% 准确率;
在 GPQA Diamond 高精度的科学知识问答评估中。Gemini 3 Deep Think 达到 接近满分的表现。
一个实例
指令内容:
在一个单一的 HTML 文件中,创建一个程序化渲染的类地行星…
左边(Gemini 3 Pro):“敷衍了事”
画了一个发光的白球,外面套了一个简单的圈。
右边(Gemini 3 Deep Think):“超级学霸”
直接做出了一个好莱坞大片级别的 3D 地球!
详细介绍:http://t.cn/AXyJnQS6
发布于 安徽
