机器之心Pro
26-05-22 14:35 微博认证:机器之心官方微博

一个模型,三种解码模式,没有额外的草稿模型,没有架构变更。最快的模式 token 吞吐量能提升 4 倍。 http://t.cn/AX6U33Kn ​