【服务过载、售罄、中断:模型厂商陷入“算力荒”】算力供给受限,AI需求暴增,市场现“等Token”局面。近期,包含MiniMax( 00100.HK )、Kimi、智谱( 02513.HK )等在内的多家主流模型厂商模型调用API出现过载或中断。http://t.cn/AXxVFpUm
一位开发者向财新展示,其在调用MiniMax模型时,提示“当前服务集群负载较高,请稍候重试,感谢您的耐心等待”。他告诉财新,在几个初创模型厂商中,MiniMax此前API资源相对充裕、Token输出速度较快,但也已出现算力承压迹象。而自2月以来,Kimi在使用过程中时常出现“高峰期算力不足”提示。
该开发者所在企业正推进将AI能力嵌入业务流程,“现在每天都担心Token停了怎么办,这些事情都停摆吗?”持续的服务不稳定也使他在进一步重构AI工作流时趋于谨慎。
