新浪网
IT之家
26-03-19 17:05
微博认证:IT之家(www.ithome.com)官方微博
【英伟达调整 AI 推理加速规划:搁置 Rubin CPX,聚焦 Groq LPU】Rubin CPX 服务于推理的预填充(上下文、提示处理)阶段,而 Groq LPU 则聚焦解码(输出生成)。