渡势行 26-04-24 13:05
微博认证:投资内容创作者

#DeepSeek v4 百万上下文#
DeepSeek V4 终于来了!这一次,不止是长上下文的胜利,更是国产算力的高光时刻!🚀

🔹 性能表现:中规中矩,稳扎稳打

1M超大上下文直接拉满!跑分方面,SWE-Pro 超过了哈基米3.1,不过目前距离 GLM5.1 和 GPT-5.4 还有一点追赶空间。不神话,只求实,这个进度条很健康。

🔹 技术硬核:1M 即将常态化

V4 采用了全新的注意力机制,并结合 DSA 稀疏注意力。这套组合拳不仅大幅压缩了计算和显存需求,更让“百万级上下文”从实验室走进了现实。官方实锤:1M上下文将成为旗下所有官方服务的标配。

🔹 灵魂亮点:基于华为昇腾芯片训练与推理!🔥

重点看下图那行不起眼的小字——DeepSeek V4 是基于华为昇腾芯片完成的训练和推理!

这才是真正的深水炸弹。随着下半年华为昇腾950芯片的大规模上市,算力的底层逻辑将被重写。

💡 大胆预测:

底层算力一旦彻底打通,下半年 Pro 版的价格大概率会迎来巨幅下调。降本增效的终极形态,就是要让每个人都能用得起顶级的 AI 服务。

英伟达的护城河正在被重塑,老黄,你颤抖了吗?👀

#DeepSeekV4 ##华为昇腾 #AI #大模型 ##科技圈大小事#

发布于 江苏