谷歌发布 Gemini 3.1 Flash-Lite：首字提速 2.5 倍，算力成本再创新低在大模型竞争白热化的当下，速度与成本依然是开发者最关心的两大维度。谷歌于本周正式推出 Gemini 3.1 Flash-Lite——Gemini 3 系列迄今最快、性价比最高的模型，并已在 Google AI Studio 和 Vertex AI 上向开发者开放预览访问。

谷歌发布 Gemini 3.1 Flash-Lite：首字提速 2.5 倍，算力成本再创新低

在大模型竞争白热化的当下，速度与成本依然是开发者最关心的两大维度。谷歌于本周正式推出 Gemini 3.1 Flash-Lite——Gemini 3 系列迄今最快、性价比最高的模型，并已在 Google AI Studio 和 Vertex AI 上向开发者开放预览访问。

速度：首字响应提速 2.5 倍
对于实时交互场景而言，Time to First Token（首字响应时间）是衡量用户体验的核心指标。根据第三方权威基准测试平台 Artificial Analysis 的数据，Gemini 3.1 Flash-Lite 相比上一代 Gemini 2.5 Flash，首字响应速度提升了 2.5 倍，整体输出速度则提升了 45%。

成本：每百万 Token 仅需 $0.25
在定价层面，3.1 Flash-Lite 的竞争力同样突出

智能：性能不因轻量而妥协
"轻量快速"并不意味着能力打折。在多个权威评测基准上，Gemini 3.1 Flash-Lite 展现出超越预期的推理能力：
* Arena.ai Leaderboard Elo 得分：1432，在同级别模型中名列前茅
* GPQA Diamond（研究生级科学推理）：86.9%
* MMMU Pro（多模态理解）：76.8%
值得注意的是，这两项得分甚至超越了谷歌前一代规模更大的 Gemini 2.5 Flash，充分说明新一代架构在效率优化上的实质性突破——以更少的算力实现了更高的智能密度。
#人工智能##谷歌##gemini3.1#

发布于山东