小互AI 26-03-04 09:06
微博认证:AI博主

Google 发布 Gemini 3.1 Flash-Lite

价格大约是Gemini 3.1 Pro的八分之一

跟上一代 Gemini 2.5 Flash 对比:

比 2.5 Flash 快了2.5 倍
输出速度 363 token/s,快了45%
支持Minimal、Low、Medium、High四档思考级别调整

一个重要的信息点:3.1 Flash-Lite是从Gemini 3 Pro蒸馏出来的

它继承了大模型的"智慧",但通过模型压缩技术实现了更快的推理速度和更低的运行成本。

3.1 Flash-Lite的定价是每百万输入token 0.25美元,每百万输出token 1.50美元。

按照Artificial Analysis给出的3:1的输入输出混合比例计算,混合价格约为每百万token 0.56美元。

Benchmark表现:小模型打出大模型的成绩

在各项评测中,3.1 Flash-Lite展现出了超越其"体型"的实力。在推理和多模态理解方面的表现尤其值得关注:

3.1 Flash-Lite在与GPT-5 mini、Claude 4.5 Haiku、Grok 4.1 Fast等同级别模型的对比中,多项指标都处于领先位置。

灵活的"思考级别"控制

3.1 Flash-Lite的一个重要架构更新是内置了"思考级别"(Thinking Levels)调整功能。

开发者可以选择Minimal、Low、Medium、High四个不同的推理深度,以编程方式动态调节模型的推理强度。

模型可以灵活切换:

轻量任务(翻译、内容审核):用最小档,跑得飞快、成本极低

复杂任务(生成 UI 和仪表盘、创建模拟、遵循复杂指令):拉到高档,推理能力上来

详细内容:http://t.cn/AXcD4ORZ http://t.cn/AXcD4R6A

发布于 安徽