NVIDIA 刚刚发布了一个开源的 300 亿参数模型,性能超过 GPT-OSS 和 Qwen3-30B,而且运行速度快 2.2–3.3 倍。#科技先锋官#
Nemotron 3 Nano:
🔹 最长 100 万 token 上下文
🔹 MoE 架构:总参数 316 亿,激活参数仅 36 亿
🔹 SWE-Bench 表现达到同级最佳
🔹 完全开放:模型权重 + 训练方案 + 可再分发的数据集
🔹 本地可跑:仅需 24GB 内存 即可运行
链接:http://t.cn/AXUxtWw7
NVIDIA 刚刚发布了一个开源的 300 亿参数模型,性能超过 GPT-OSS 和 Qwen3-30B,而且运行速度快 2.2–3.3 倍。#科技先锋官#
Nemotron 3 Nano:
🔹 最长 100 万 token 上下文
🔹 MoE 架构:总参数 316 亿,激活参数仅 36 亿
🔹 SWE-Bench 表现达到同级最佳
🔹 完全开放:模型权重 + 训练方案 + 可再分发的数据集
🔹 本地可跑:仅需 24GB 内存 即可运行
链接:http://t.cn/AXUxtWw7