#DeepSeekV4更新了什么#DeepSeek‑V4:国产AI算力与技术双突破,以双版本架构、百万上下文、全栈国产算力三大突破,重新定义开源大模型上限。
V4采用Pro+Flash双路线:Pro版1.6万亿参数、激活49亿,Agent能力超越Claude Sonnet 4.5,接近Opus 4.6非思考模式;Flash版2840亿参数、激活13亿,主打普惠,输入1元/百万tokens、输出2元/百万tokens,成本仅为GPT‑5.5的约1/20。全系标配1M上下文,依托自研DSA稀疏注意力,显存与计算量大幅下降,可一次性处理全书、大型代码库与长文档。
最具行业意义的是,V4全面迁移至华为CANN框架,全流程跑在昇腾950PR,推理速度较H20提升2.87倍、能耗降40%,标志国产芯片可支撑万亿级模型训练与推理。当前Pro受产能限制高价限流,下半年量产放量后价格将下调,普惠可期。
第三方测评显示,V4知识储备仅次于Gemini 3.1 Pro,与GLM‑5.1整体相当,长文本与成本优势突出;目前暂未开放原生多模态,为后续迭代重点方向。模型已深度适配OpenClaw等主流Agent,企业长文本任务成本可降约90%。
从技术攻坚到算力自主,DeepSeek‑V4以长期主义推进技术普惠,不仅拉高国产AI天花板,更加速国产算力产业链商业化,为开源模型树立新标杆。#科技先锋官#
发布于 重庆
