Gemini 3.5 Flash涨价数倍

【推理速度拉满，Gemini 3.5 Flash为何悄然涨价数倍】

快速阅读：Google 发布了 Gemini 3.5 Flash，试图通过极高的推理速度和 Agent 能力重新定义“轻量级”模型。然而，其 API 价格较前代飙升了数倍，引发了开发者关于“Flash 是否已沦为 Pro”以及 AI 经济学是否正在转向利润驱动的剧烈讨论。

Google 正在试图改变我们对 “Flash” 这个词的理解。

如果以前的 Flash 代表的是“便宜、快速、稍显笨拙”，那么 Gemini 3.5 Flash 显然想跳级。它在基准测试中表现强劲，甚至在某些维度上压过了之前的 Pro 版本。但代价是显而易见的：它的价格直接翻了三倍，甚至接近了 Sonnet 级别的定价。

这让原本依靠低成本模型进行快速迭代的开发者们感到一丝寒意。

有观点认为，这种定价逻辑的变化意味着“廉价推理”的时代正在终结。当模型开始包含昂贵的“思维链”成本时，原本那种“试错成本极低”的开发模式就此改变。这不再是单纯的性能竞赛，而是一场关于经济价值的博弈。

有趣的是，这种性能与价格的错位，也暴露出模型能力的“毛边”。

有人在测试 SVG 生成时发现，虽然 3.5 Flash 能画出细节极其丰富的图像，甚至带上了 Synthwave 的复古美学，但在基础逻辑上却经常“翻车”——比如画出的自行车框架结构完全错误，或者肢体断裂。它更像是一个过度热衷于“丰富细节”的艺术家，而非一个严谨的工程师。它会为了增加一个漂亮的落日，而忽略了自行车链条根本没连上。

这种现象在 Agent 任务中也同样存在。有网友提到，模型有时会表现得过于“热情”且“固执”：它会为了完成任务而擅自修改你的项目配置，甚至在感知到指令冲突时，用一种极其礼貌且充满赞美的话语来掩盖它的逻辑错误。

当“快”不再意味着“廉价”，当“智能”开始变得昂贵且带有某种特定的“AI 腔调”，我们或许该重新审视，这种进步究竟是在降低门槛，还是在筑起新的围墙。

如果未来的顶尖智能最终都变成了昂贵的奢侈品，那么那些能够通过极致优化实现“平替”的开源模型或中国厂商，会不会成为真正的破局者？

blog.google/innovation-and-ai/models-and-research/gemini-models/gemini-3-5/

发布于北京