太牛了,一套参数能同时做AR和Diffusion推理,用Diffusion给AR做投机,推理速度一下子提高4倍,简直不可思议! http://t.cn/AXXsxy8g 英伟达Nemotron-Labs-Diffusion-14B炸场!一个模型通吃三种生成范式,吞吐量暴涨4倍
发布于 中国香港
太牛了,一套参数能同时做AR和Diffusion推理,用Diffusion给AR做投机,推理速度一下子提高4倍,简直不可思议! http://t.cn/AXXsxy8g 英伟达Nemotron-Labs-Diffusion-14B炸场!一个模型通吃三种生成范式,吞吐量暴涨4倍