今天又测试了下 siliconflow 的接口,DeepSeek V2 模型的速度大概能比官方快一倍。但是能把付费模型的RPS调高一些吗?[允悲] @OneFlow @老师木
我们跑工作流一个请求1分钟以上,RPS 3 也就是说整个产品同时只能3个人用,根本不够商用啊 [苦涩]
个人这块,比如沉浸式翻译的场景,一个页面就是一堆请求,RPS3 多几个页面得翻译N久。比如图二。
其实如果资源不够,可以按充值余额做个阶梯设定。比如图三。
发布于 重庆
