零重力瓦力 26-03-18 19:36
微博认证:AI博主

OpenAI 今天发布了 GPT-5.4 mini 和 GPT-5.4 nano。

与 GPT-5 mini 相比,GPT-5.4 mini 在代码生成、推理、多模态理解以及工具调用等方面均有明显提升,整体速度提升超过两倍。在 SWE-bench Pro 和 OSWorld-Verified 等评测中的表现也已逼近 GPT-5.4。也就是说,一些原本需要 GPT-5.4 才能完成的复杂任务,现在用 mini 也可以胜任,而且速度更快。

编程依然是 GPT-5.4 mini 的重点。它尤其适合高频、短链路、需要反复迭代的工作,例如定向修改代码、浏览代码库、生成前端页面以及执行调试循环。这类任务对响应速度非常敏感,一旦变慢就会明显影响开发体验。mini 的价值就在于,在保持足够能力的同时具备更快的响应,整体性价比更高。

在 Codex 这类系统中,可以让更大的 GPT-5.4 负责整体规划与最终决策,而将具体的小任务并行分配给 GPT-5.4 mini,例如代码搜索、长文件阅读和辅助材料整理。这种多模型协作的模式,很可能会成为智能体系统的常态。

在多模态理解和计算机操作方面,GPT-5.4 mini 同样具备竞争力。它能够更快地理解界面截图,适合执行 “看屏幕再操作” 的任务。在 OSWorld-Verified 等测试中,其表现已明显超过 GPT-5 mini,并接近 GPT-5.4。

相比之下,GPT-5.4 nano 的定位更为纯粹,就是将 “快” 和 “省” 发挥到极致。它适用于分类、数据提取、排序以及各类简单子任务,可以理解为一个非常适合分流、预处理和基础执行的模型。

不过,这两款模型的价格不低。GPT-5.4 mini 每百万输入 Token $0.75、输出 4.50 $,最长上下文为 400K。nano 的价格为每百万输入 Token $0.20、输出 $1.25 ,是 GPT-5 mini 和 nano 的三倍。

#GPT-5.4-mini##AI创造营#

发布于 上海