一则震动全球科技界的重磅消息尘埃落定,梁文锋酝酿已久的战略布局终于落地。
4月24日,DeepSeek正式上线并开源DeepSeek-V4预览版,印证了外媒半月前的行业预判。
彭博社此前曾爆料:DeepSeek下一代旗舰模型V4,将全面适配华为昇腾950系列,底层代码从英伟达CUDA架构,全面重构为华为自研CANN异构计算框架,计划于4月下旬对外发布。
这个时间点拿捏得无比精准,不得不说美国佬对中国社会的渗透之深,令人感到可怕。
DeepSeek此次全栈转向国产算力的抉择,终于兑现了英伟达老板黄仁勋内心的恐惧。
4月15日,黄仁勋接受知名科技播客主持人德瓦克什・帕特尔专访时直言:“如果DeepSeek率先基于华为算力平台完成迭代发布,对美国科技产业而言,将是灾难性的后果。”
这时发生了一个插曲,颇有意思。
印度裔的德瓦克什・帕特尔是个极端反华的播主。听了黄仁勋对中国企业的盛赞,感觉极不舒服,一句话把黄老板怼到墙上:你不是说英伟达的护城河很深,无人可破吗?
以子之矛,攻子之盾。一下子把黄老板整急眼了,当场发飙怒斥帕特尔“幼稚”。
论语言的艺术,玩科技的果然搞不过玩过嘴皮子的。
言归正传。DeepSeek-V4发布,将给我们带来怎样的惊喜呢?
一
说到DeepSeek-V4,就不得不是一年前发布的DeepSeek-V3。
大家应该记得,DeepSeek-V3发布时引发全球震撼,被西方媒体称为“人工智能的斯普特尼克时刻”,其意义堪比冷战时期苏联发射首颗人造卫星对美国形成的战略冲击。
在此之前,全球AI竞争都集中在算力上。算力越强大,人工智能就越强大。
在高端算力领域,美国长期占据绝对先发优势。
英伟达的AI芯片+Cuda生态,构筑起美国在人工智能领域的绝对垄断地位。
全球顶级AI算力的核心硬件、底层生态,长期被美方掌控,国内产业高度依赖进口供应链。
彼时,美国已搭建起从底层芯片硬件、中层软件云生态,到顶层应用落地的完整闭环体系,层层封锁,壁垒森严,让追赶者感到绝望。
在DeepSeek-V3诞生之前,舆论场悲观情绪蔓延,不少专家学者片面唱衰国产AI发展,放大技术差距,制造焦虑氛围。
最要命的是,中国被美国视为对手国家(其实就是敌人),不断加码高端芯片出口管制、技术封锁与产业遏制,全方位围堵我国科技升级之路。
算力即国力。面对巨大的算力鸿沟,也难怪很多人看衰中国,甚至笃定中国会像苏联、德国、日本等曾经的挑战者一样,因科技发展的通道被锁死,让美国摁在地上摩擦。
而DeepSeek-V3的问世,以本土化技术创新完成了一场成本革命,打破了“高性能必然高成本”的行业定式,实现高性能、低成本、易部署三者兼顾。
去年2月13日,中国工程院院士李国杰在专访中表示,DeepSeek在受限资源下探索通用人工智能开辟了新的道路,实现了从“追赶者”到“规则改写者”的转变。
李国杰院士强调,这是中国人第一次在核心技术领域以颠覆性创新挑战西方霸权。
依托极致算法优化与工程创新,DeepSeek-V3在有限算力条件下,实现了世界顶级大模型能力,为长期受算力桎梏的国产AI产业,争取到了宝贵的喘息与发展空间。
由此可见,DeepSeek-V3 的价值早已超越模型本身,成为中国人工智能从跟跑、并跑,迈向局部领跑的关键转折点。
二
如果DeepSeek-V4只是在上一代的基础上,按部就班地进行性能升级,绝不至于让黄老板恐惧。
究其根源,DeepSeek-V3虽实现算力优化、降本增效,但底层仍依托英伟达芯片产业链与CUDA生态,并未跳出海外算力框架。
同时,全球AI算力需求持续高速增长,单一模型的算力节省,难以撼动英伟达的基本盘。
这也解释了为何V3发布后,英伟达股价短暂下跌便快速反弹,市值一路走高,再度突破5万亿美元大关。
DeepSeek-V4最核心、最致命的突破,是在极致压缩算力成本的同时,完成彻底“去CUDA化”。
换句话来说,就是国产顶级大模型第一次把庄稼种在中国自主可控的人工智能产业链底座之上。
这一核心逻辑,也是帕特尔始终无法理解的关键,更是黄仁勋当场破防的根本原因。
帕特尔在访谈中追问:DeepSeek是开源的,理论上可以跑在任何加速器上,即便它在华为昇腾上首发,在英伟达GPU上同样能跑,区别到底在哪里?
我们从黄仁勋的回答中,可以清晰地看出他害怕的东西:“假设它是针对华为优化的,针对他们的架构化了,那就会让我们处于劣势。”
长期以来,全球大模型都遵循“先在CUDA上调通跑顺,再考虑其他平台”的路径。这使得华为昇腾、AMD等竞争对手的硬件即使纸面性能不差,在实际市场中仍只是“备选方案”兼容CUDA,难以形成核心竞争力。
全行业的首发优化、性能标杆、生态适配全部绑定CUDA,形成强者恒强的闭环,迁移成本居高不下,最终构筑起英伟达难以撼动的商业护城河。
如今,全球第一梯队的顶级大模型,率先以国产算力为原生优化底座,一旦技术跑通、性能稳定、成本优势凸显,开发者的选择逻辑将彻底改写——
从过去被动的供应链妥协、地缘政治考量,转变为市场化、商业化的理性选择。
此举意味着,全球AI生态将诞生一股全新的核心力量,英伟达也有可能从行业唯一标杆沦为备选方案(至少在中国),维持多年的技术垄断与定价霸权必将逐步松动。
当下,国内先进芯片制程持续突破、产能稳步释放,国产算力软硬件生态加速成熟,英伟达依靠技术壁垒躺着赚钱的好日子真的不多了。
更具战略价值的是,这条“去CUDA化”的AI全栈生态,牢牢掌握在我国企业手中。
长远来看,美国再也无法通过芯片断供、技术限制等手段,在人工智能这一未来核心赛道卡中国脖子。
目前,华为昇腾芯片+CANN异构系统+DeepSeek顶级大模型的完整组合,标志着我国正式补齐人工智能核心技术底座,实现全链条闭环。
诚然,这套自主生态现阶段仍处于成长阶段,与美国成熟体系存在差距,但依托庞大的市场需求、工程师红利与持续的技术攻坚,国产AI必将以更快的迭代速度缩小差距、实现赶超。
这个超越的时间,我觉得有一个5年计划的时间就差不多了。不信等等看,相信我的绝大多数读者能看到这一天。
三
DeepSeek-V4的落地,补齐了国产人工智能自主底座的最后一块关键拼图,更是对英伟达CUDA帝国、美国AI霸权的釜底抽薪。
正是无数科技企业的逆势突围,让中国人的腰杆子越来越硬,表现得越来越硬气。
4月22日,美国商务部长卢特尼克在参议院拨款委员会听证会上接受质询。面对那些质疑政府放松对中国人工智能芯片管制决定的议员,曾是极端反华鹰派的卢特尼克一脸苦涩地称:截至现在,中国一块芯片也没买。
在此之前,特朗普政府先后放松英伟达H20芯片、H200芯片对华的禁限制,本来还想着收25%的“英伟达税”,结果中国一块没买。
需要明确的是,H200芯片作为英伟达次旗舰产品,仅比当前量产的Blackwell Ultra架构落后一代,综合性能远优于早期“阉割版”H20。
哪怕只差一代的H200芯片,那还是好家伙啊。单芯片算力、显存容量、传输带宽等核心指标,全面领先国内已量产的昇腾910系列,相较于即将发布的昇腾950系列,仍保有一定优势。
大家看,“懂王”那家伙还是很有“诚意”。可是,即便如此有“诚意”,咱中国人也不伺候。因为美方的“诚意”,完全建立在我们科技突破的基础上。
如今,国产AI芯片、异构计算框架、大模型生态全面成型,自主可控的软硬件体系已然跑通,凭什么让它们进中国市场分一块蛋糕?
喜闻乐见的是,华盛顿的老爷们依旧沉浸在技术霸权的固有思维中,还在意淫通过芯片卡中国人工智能产业的脖子。
听证会初期,美国议员纷纷指责商务部管制松懈,质疑放宽H200芯片出口会削弱技术壁垒,直到卢特尼克公布“零采购”的现实,全场直接干沉默了。
在这些白皮的固有认知里,美国主动放宽技术限制,就是一种“施舍”,中国人应该感恩戴德地抢购才对啊。现在居然“一块没买”,它们怀疑卢特尼克是不是拿错了版本?
当现实与幻想彻底背离,他们甚至难以理解,开始质疑政策执行与数据统计。
卢特尼克现场解释,这是“中方主管部门未允许中国企业购买”。
总有一天,这些白皮必然会调转舆论风向,炒作“市场不公平”“贸易壁垒”,刻意掩盖自身长期技术封锁的本质,颠倒黑白转嫁矛盾。
以它们的尿性,绝对不会记得这一切是他们卡中国脖子引发的。
四
一代人有一代人的使命,一代人有一代人的“上甘岭”。
从任正非深耕硬核科技突围,到梁文锋扎根AI底层攻坚,正是一代代科技领军人挺身而出、负重前行,才让才让我们能在美国白皮面前直起腰杆子。
这场关乎国运的科技“上甘岭战役”,并非只是任正非、梁文锋他们的事,我们普通人同样可以为他们助攻。
不知道大家注意到没有,DeepSeek-V4发布后,舆论场一如以往那样出现一些别有用心的人,把DeepSeek说得一无是处,消解本土技术突破的价,引导一些没脑子的人跟风,从而误导很多国人。
客观而言,我国AI自主生态起步较晚,软硬件协同、工具链完善度、生态适配性仍在持续打磨,短期存在差距无可回避。
正因为如此,我们对本土硬核科技突破,理应多一份包容与鼓励,少一份苛责与偏见。
作为普通人,大量使用DeepSeek就是对中国AI产业最有力的支持。
全民使用、持续反馈、广泛普及,才能倒逼技术迭代、优化体验,让国产AI在市场化打磨中快速成长、走向成熟。
相比于梁文锋团队赌上企业命运、对抗全行业惯性、直面技术封锁的孤勇坚守,我们为中国人工智能领域的“上甘岭战役”做这么一点事,又算得了什么?
DeepSeek-V4从英伟达CUDA生态全面迁移至华为CANN系统,是一场“在飞行中更换发动机”的艰难战略转型,需要付出多维度的高昂代价。
要知道,DeepSeek-V4是万亿参数MoE大模型,原路线和全球所有大厂一样,也是CUDA+英伟达GPU。
为了“在飞行中更换发动机”,DeepSeek-V4需重写超过40万个底层算子,重构通信协议、显存分配、并行框架等数十个核心模块,实现从训练到推理的全栈重构。
DeepSeek-V4原计划2026年初春发布,但因深度适配华为昇腾,发布窗口数次跳票,直至4月末才正式上线,市场一度质疑DeepSeek“掉队”。
CANN适配工程远超预期,梁文锋团队称其复杂度“不低于模型训练本身”。
此举意味着,DeepSeek彻底放弃CUDA生态积累(过去几年的CUDA优化、工具链、知识库基本作废),把公司命脉绑在生态、工具链、第三方支持远不如英伟达的国产算力上。
一旦昇腾迭代放缓、生态适配滞后、技术升级遇阻,DeepSeek将会被锁死在非主流算力上,大好“钱景”彻底玩完。
想一想,梁文锋如此“豪赌”,谁会干吗?
试问,咱们众多大厂资金雄厚、人才充沛、资源富集,紧要关头谁敢挺身而出?
什么是英雄?并非天生自带BUG,而是敢于在紧要处往前站一步的人。
在观察这场重大科技事件时,我突然产生了强烈的人文情怀,不由自主地想起那首歌——
爱你孤身走暗巷
爱你不跪的模样
爱你对峙过绝望
不肯哭一场
爱你破烂的衣裳
却敢堵命运的枪
爱你和我那么像
缺口都一样
去吗?配吗?这褴褛的披风
战吗?战啊!以最卑微的梦
致那黑夜中的呜咽与怒吼
谁说站在光里的才算英雄
他们说 要戒了你的狂
就像擦掉了污垢
他们说要顺台阶而上而代价是低头
那就让我不可乘风
你一样骄傲着那种孤勇
谁说对弈平凡的不算英雄
梁文锋,就是AI时代的孤勇者:在所有人都走CUDA捷径时,他孤身走CANN的暗巷;在大家都向英伟达低头时,他对峙绝望、硬扛封锁;用仍不成熟的国产算力衣裳,堵命运的枪;不在光里,却在废墟上造自己的城邦。
以孤勇破困局,以坚守护自强。
对于这样扎根核心技术、为国破局的时代栋梁,我们理应致以最真挚的掌声与敬意。
对于这款免费开源、性能顶尖、代表国产AI突破的硬核产品,主动体验、广泛使用,便是普通人最朴素的支持。#烽火问鼎计划#
发布于 北京
