新浪网
机器之心Pro
26-05-22 14:35
微博认证:机器之心官方微博
一个模型,三种解码模式,没有额外的草稿模型,没有架构变更。最快的模式 token 吞吐量能提升 4 倍。 http://t.cn/AX6U33Kn