【英伟达发力智能体!#英伟达开源模型Nemotron 3 Super# 参数1200亿,吞吐量提升五倍】Nemotron 3 Super推理时仅激活120亿活跃参数,原生支持100万token上下文窗口;性能跃升来自三项架构创新:混合Mamba-Transformer骨干网络、潜在专家混合模型(latent MoE)、多token预测(MTP)。该模型在Blackwell平台以NVFP4精度运行,推理速度最高提升至Hopper 平台FP8的四倍,且精度无损失。Perplexity成为首家接入该模型执行智能体任务的合作方。详见http://t.cn/AXVWd8NP
