零重力瓦力 25-11-18 21:33
微博认证:AI博主

疑似泄露的 Gemini 3 Pro 模型卡

模型卡显示,Gemini 3 Pro 基于稀疏 MoE Transformer 架构,支持高达 100 万 token 的上下文窗口,输出 64K token,非常适合处理长文档和大规模数据。测评数据非常亮眼,在推理、多模态、工具使用、多语言能力以及长上下文等多个基准测试中,全面超越了 Gemini 2.5 Pro。对话风格也有明显提升,回答问题时更加安全、客观,不会无故拒绝用户的提问。

不过,这份文档中也存在一些可疑之处,真伪如何,相信很快就会有答案。

文档来源:web.archive.org/web/20251118111103/storage.googleapis.com/deepmind-media/Model-Cards/Gemini-3-Pro-Model-Card.pdf

发布于 上海