国盛证券:DeepSeek-V3.2发布,国产模型再度引领创新
DeepSeek-V3.2版本发布,国产模型实现重要创新。标准版在推理能力上已接近GPT-5水平,略低于Gemini-3.0-Pro,首次将思考过程融入工具调用,智能体性能达到开源模型最优。特别版性能媲美Gemini-3.0-Pro,并在多项顶级竞赛中取得金牌级表现。主要创新包括:一是采用稀疏注意力机制,通过选择性处理信息显著降低计算负载,支持更长上下文;二是强化学习在后训练阶段算力投入超过预训练的10%,大幅提升模型推理能力;三是使用海量合成数据让模型学会边思考边使用工具。这表明通过扩大训练规模提升模型能力的路径仍然有效,大模型技术远未触顶。
发布于 山东
