沉寂一年半,deepseek再次震惊世界
今天,DeepSeek专家模式正式上线。
但很多人不知道,这个功能背后,藏着一个迟到了一年半的秘密。
DeepSeek V4,从V3发布到现在,快一年半了,为什么还不出?
不是没能力,是他们在干一件比做模型更难的事——换地基。
前天,路透社和The Information同时爆料:
V4将100%跑在华为芯片上,彻底摆脱英伟达。
要知道,全球AI都被锁在英伟达的CUDA框架里,美国卡芯片,就是在卡我们的算力命脉。
但这次,梁文峰带着团队,和华为、寒武纪的工程师坐在一起,
一行一行重写底层代码,把整个模型迁移到华为自研的CANN架构。
为什么等这么久?因为这不是调参,是换引擎。
年初DeepSeek连发三篇论文——MHC、Ingram、D-Pace,
表面看是算法、数学、工程,拼起来才发现:
他们从一开始就在设计一套不依赖英伟达的架构。
用算法优化,弥补芯片性能差距。
华为芯片只有英伟达六成性能,但DeepSeek硬是跑出了可用方案。
外媒还爆出:阿里、字节、腾讯,几十万片华为芯片已下单。
这不是试水,是战略投票。
从西部戈壁的绿电,到华为芯片,到DeepSeek模型,再到海底光缆输出全球——
整条链路,中国自研。
美国人可以卡芯片,但卡不住我们换地基的决心。
专家模式上线只是一个开始,V4,才是真正的底牌,这一局,我们自己说了算。#DeepSeek专家模式上线# http://t.cn/AXMy3U5d
发布于 安徽
