谷歌发布 Gemini 3.1 Flash-Lite:首字提速 2.5 倍,算力成本再创新低
在大模型竞争白热化的当下,速度与成本依然是开发者最关心的两大维度。谷歌于本周正式推出 Gemini 3.1 Flash-Lite——Gemini 3 系列迄今最快、性价比最高的模型,并已在 Google AI Studio 和 Vertex AI 上向开发者开放预览访问。
速度:首字响应提速 2.5 倍
对于实时交互场景而言,Time to First Token(首字响应时间) 是衡量用户体验的核心指标。根据第三方权威基准测试平台 Artificial Analysis 的数据,Gemini 3.1 Flash-Lite 相比上一代 Gemini 2.5 Flash,首字响应速度提升了 2.5 倍,整体输出速度则提升了 45%。
成本:每百万 Token 仅需 $0.25
在定价层面,3.1 Flash-Lite 的竞争力同样突出
智能:性能不因轻量而妥协
"轻量快速"并不意味着能力打折。在多个权威评测基准上,Gemini 3.1 Flash-Lite 展现出超越预期的推理能力:
* Arena.ai Leaderboard Elo 得分:1432,在同级别模型中名列前茅
* GPQA Diamond(研究生级科学推理):86.9%
* MMMU Pro(多模态理解):76.8%
值得注意的是,这两项得分甚至超越了谷歌前一代规模更大的 Gemini 2.5 Flash,充分说明新一代架构在效率优化上的实质性突破——以更少的算力实现了更高的智能密度。
#人工智能##谷歌##gemini3.1#
发布于 山东
