刘群MT-to-Death
26-06-10 18:44 微博认证:刘群,中国科学院计算技术研究所研究员、机器翻译领域专家 微博新知博主

太牛了,一套参数能同时做AR和Diffusion推理,用Diffusion给AR做投机,推理速度一下子提高4倍,简直不可思议! http://t.cn/AXXsxy8g 英伟达Nemotron-Labs-Diffusion-14B炸场!一个模型通吃三种生成范式,吞吐量暴涨4倍 ​

发布于 中国香港