爱可可-爱生活 26-05-20 07:49
微博认证:AI博主 2025微博新锐新知博主

【推理速度拉满,Gemini 3.5 Flash为何悄然涨价数倍】

快速阅读:Google 发布了 Gemini 3.5 Flash,试图通过极高的推理速度和 Agent 能力重新定义“轻量级”模型。然而,其 API 价格较前代飙升了数倍,引发了开发者关于“Flash 是否已沦为 Pro”以及 AI 经济学是否正在转向利润驱动的剧烈讨论。

Google 正在试图改变我们对 “Flash” 这个词的理解。

如果以前的 Flash 代表的是“便宜、快速、稍显笨拙”,那么 Gemini 3.5 Flash 显然想跳级。它在基准测试中表现强劲,甚至在某些维度上压过了之前的 Pro 版本。但代价是显而易见的:它的价格直接翻了三倍,甚至接近了 Sonnet 级别的定价。

这让原本依靠低成本模型进行快速迭代的开发者们感到一丝寒意。

有观点认为,这种定价逻辑的变化意味着“廉价推理”的时代正在终结。当模型开始包含昂贵的“思维链”成本时,原本那种“试错成本极低”的开发模式就此改变。这不再是单纯的性能竞赛,而是一场关于经济价值的博弈。

有趣的是,这种性能与价格的错位,也暴露出模型能力的“毛边”。

有人在测试 SVG 生成时发现,虽然 3.5 Flash 能画出细节极其丰富的图像,甚至带上了 Synthwave 的复古美学,但在基础逻辑上却经常“翻车”——比如画出的自行车框架结构完全错误,或者肢体断裂。它更像是一个过度热衷于“丰富细节”的艺术家,而非一个严谨的工程师。它会为了增加一个漂亮的落日,而忽略了自行车链条根本没连上。

这种现象在 Agent 任务中也同样存在。有网友提到,模型有时会表现得过于“热情”且“固执”:它会为了完成任务而擅自修改你的项目配置,甚至在感知到指令冲突时,用一种极其礼貌且充满赞美的话语来掩盖它的逻辑错误。

当“快”不再意味着“廉价”,当“智能”开始变得昂贵且带有某种特定的“AI 腔调”,我们或许该重新审视,这种进步究竟是在降低门槛,还是在筑起新的围墙。

如果未来的顶尖智能最终都变成了昂贵的奢侈品,那么那些能够通过极致优化实现“平替”的开源模型或中国厂商,会不会成为真正的破局者?

blog.google/innovation-and-ai/models-and-research/gemini-models/gemini-3-5/

发布于 北京