12月1日,DeepSeek正式推出V3.2系列模型,包括标准版和Speciale增强版,最让人惊喜的是标准版推理能力已经追上GPT-5水平,离Gemini-3.0-Pro也只差一点点。这次升级可不是小修小补,核心亮点是把“思考”和“工具调用”捏到了一起,模型遇到问题不会直接上手,而是先分析规划、再调用工具验证,像人一样有思考闭环,这在开源模型里还是头一回。背后靠的是DSA稀疏注意力机制,处理长文本又快又省资源,还有1800多个训练环境和8.5万条复杂指令的加持,泛化能力大幅提升。增强版更厉害,直接拿下了IMO和IOI两项国际竞赛金牌,数学、编程这类高难度任务表现超亮眼。不管是日常办公、代码开发,还是企业级部署,这个模型都能hold住,既降低了使用成本,又缩小了开源和闭源模型的差距,对开发者和企业来说都是个实用的好选择。
#科技[超话]##微博声浪计划##听见微博# http://t.cn/AXy4bUWQ
发布于 福建
