Google发布Gemini 3.1 Flash-Lite

Google 发布 Gemini 3.1 Flash-Lite

价格大约是Gemini 3.1 Pro的八分之一

跟上一代 Gemini 2.5 Flash 对比：

比 2.5 Flash 快了2.5 倍
输出速度 363 token/s，快了45%
支持Minimal、Low、Medium、High四档思考级别调整

一个重要的信息点：3.1 Flash-Lite是从Gemini 3 Pro蒸馏出来的

它继承了大模型的"智慧"，但通过模型压缩技术实现了更快的推理速度和更低的运行成本。

3.1 Flash-Lite的定价是每百万输入token 0.25美元，每百万输出token 1.50美元。

按照Artificial Analysis给出的3:1的输入输出混合比例计算，混合价格约为每百万token 0.56美元。

Benchmark表现：小模型打出大模型的成绩

在各项评测中，3.1 Flash-Lite展现出了超越其"体型"的实力。在推理和多模态理解方面的表现尤其值得关注：

3.1 Flash-Lite在与GPT-5 mini、Claude 4.5 Haiku、Grok 4.1 Fast等同级别模型的对比中，多项指标都处于领先位置。

灵活的"思考级别"控制

3.1 Flash-Lite的一个重要架构更新是内置了"思考级别"（Thinking Levels）调整功能。

开发者可以选择Minimal、Low、Medium、High四个不同的推理深度，以编程方式动态调节模型的推理强度。

模型可以灵活切换：

轻量任务（翻译、内容审核）：用最小档，跑得飞快、成本极低

复杂任务（生成 UI 和仪表盘、创建模拟、遵循复杂指令）：拉到高档，推理能力上来

详细内容：http://t.cn/AXcD4ORZ http://t.cn/AXcD4R6A

发布于安徽