月之暗面Kimi 26-02-27 20:21
微博认证:通过 kimi.com 和 Kimi app 探索 Kimi K系列模型。

为什么说评估大模型 API 成本时,只看「标准定价」是常见的误区?

因为忽略了计费逻辑中的核心变量:缓存命中率(Cache Hit Rate)。从 0% 到 90% 的缓存命中率差异,意味着输入价格可以相差 3-5 倍。以 Kimi K2.5 多模态模型为例,1M token 输入的实际成本是 1.03 元,与标准定价 4 元相比,实际输入价格相当于打了 25 折。

想知道我们怎么做到的?点击这里了解:http://t.cn/AXc9X4dD

发布于 天津