Joken是个runner 25-10-23 08:02
微博认证:2023年深圳宝安马拉松 马拉松运动员 海外新鲜事博主

《经济学人》中国芯片制造商巧妙地绕开美国限制China’s chipmakers are cleverly innovating around America’s limits

他们在极限中创新,扩大规模,并依靠“模糊数学”

微芯片战争自2018年开始打响。那一年,美国在特朗普(以及后来拜登和再度上台的特朗普)领导下,开始对希望向中国出售产品的半导体公司施加越来越严厉的出口限制。这场高科技禁运的目标,是挫败中国建立本国先进芯片制造产业的雄心。

但结果恰恰相反——它反而刺激了中国的创新。中国希望本国企业能够像在软件领域那样,在硬件领域也“绕道超车”。2025年1月,中国软件公司DeepSeek(深度求索)以极少的算力训练出了一个可与西方竞争对手媲美的人工智能(AI)模型,让世界惊讶不已。如今,中国的芯片制造商正试图复制这一奇迹——他们在把制造工具逼到极限、通过芯片集群弥补单个芯片性能不足,并融合软硬件来榨取每一分性能。问题是:中国能否把这些组件——芯片、系统与代码——整合成一个自给自足、具有竞争力的AI“技术堆栈”。

从芯片开始

根据风投公司 Edgerunner Ventures 的瑞安·坎宁安(Ryan Cunningham)收集的数据,中国AI芯片的中位性能为114万亿次浮点运算(teraflops),明显落后于美国同行。华为旗舰AI芯片 昇腾910c(Ascend 910c) 的性能为800 teraflops,而英伟达(Nvidia)高端产品 B200 则达到了2500 teraflops。

性能差距的根源在于制造难度。半个世纪以来,加快芯片速度的最可靠方法是缩小晶体管——这些微型电开关的开关状态代表二进制的“1”和“0”。B200芯片拥有2080亿个晶体管,分布在上千个核心中,全部压缩在一块只有几十毫米宽的硅片上。

全球只有三家公司能生产最微小晶体管的芯片:韩国的三星半导体、台湾的台积电(TSMC)以及在一定程度上美国的英特尔(Intel)。其中,台积电独占鳌头。但由于美国施压,其最先进的工厂不再向中国客户开放。中国企业只能依赖本国制造商,如中芯国际(SMIC)和华为。

推旧机器到极限

不过,中芯国际和华为同样受限。芯片工厂依赖另一类高端设备制造商提供关键机台。比如,光刻机利用光线将电路图案蚀刻到硅晶圆上。正如毛笔比蜡笔更精细,波长越短的光线能刻出更细微的图案。最先进的光刻机使用极紫外光(EUV),波长仅13.5纳米。这类设备仅由荷兰公司 ASML 制造,其技术积累耗费数十年。

在美国压力下,ASML禁止向中国出售EUV光刻机。于是,中国厂商只能继续使用较旧的**深紫外光(DUV)**设备(波长193纳米),并将其推至极限。一个关键手段是“多重曝光(multi-patterning)”——不再一次曝光完成,而是多次重复叠加,从而实现单次无法达成的更精细结构。

这种方法会增加成本、降低产量并提高缺陷率。但对中国而言,“自给自足比效率更重要”。不过,DUV的物理极限终将到来。多数分析师认为,除非中国能获得ASML的EUV设备,否则大规模生产最先进芯片仍需多年。

数量胜于质量

既然质量暂时落后,另一条路就是拼数量。AI运算的数学特性非常适合“并行化”——把任务分解成若干小块,由大量芯片同时处理。2025年4月,华为宣布推出 CloudMatrix 384 AI系统,可在数据中心机架中部署。该系统连接384颗昇腾910c芯片,目标是挑战英伟达的 GB200 NVL72 系统(由72颗B200芯片组成)。

咨询机构 SemiAnalysis 估算,每颗昇腾910c的性能大约是B200的三分之一。也就是说,华为系统虽然使用五倍芯片,总体性能仍略低于英伟达系统。但代价是功耗:华为系统耗电600千瓦,是英伟达的四倍多。不过坎宁安认为这笔交易“值得”——毕竟,“中国不缺电”。

这种大规模芯片互联方式也契合华为的强项。华为发家于通信与网络技术,CloudMatrix 384通过光信号而非电信号在芯片间传输数据。光互连相比电互连更节能、散热更少。过去这种技术主要用于长距离光纤通信,如今正逐步进入数据中心。投资公司伯恩斯坦(Bernstein)分析师林庆元(Qingyuan Lin)指出,华为的这种架构正在“从根本上改变AI基础设施的构建方式”。

软硬一体与“模糊数学”

中国战略的最后一环是让硬件与软件深度融合。一个关键例子是芯片内部处理数字的方式。

一般处理器使用32位或64位来表示数字。位数越多,表示范围越大、精度越高。但每一个额外的位都需要晶体管来表示,也就意味着更高功耗。

然而,AI模型能容忍一定的数学模糊性。许多现代AI芯片因此仅使用16位、8位甚至4位来表示数字。美国伊利诺伊大学厄巴纳-香槟分校电气工程师 拉凯什·库马尔(Rakesh Kumar) 称这种方法“简单但非常有效”。

2025年8月,DeepSeek 推出了新的8位数字表示格式:它不区分正负数,也没有小数部分。
虽然这种格式的数值范围有限、精度不高,但效率极高。消息公布后,中国芯片设计公司 寒武纪(Cambricon) 股价大涨——其处理器已支持这种格式。华为芯片尚未支持,但预计很快会跟进。

前路仍长,但自信增长

中国构建本土AI技术栈的努力开局不错,但仍有很长的路要走。英伟达的CUDA编程生态仍然占据主导。中国芯片设计师依旧依赖美国公司的设计软件,如 Synopsys 和 Cadence。美国曾于2025年5月禁止两家公司向中国出口,后在7月部分放宽。

此外,中国芯片在推理任务(inference)上已接近西方水平,但在训练阶段(training)仍显落后。训练AI模型需要海量数据在存储器与处理器间传输,而先进存储芯片也是美国限制中国的另一个关键领域。

尽管如此,从国家安全角度看,中国的芯片产业不需要世界第一,只要够用就行。在2025年4月美国限制英伟达专供中国市场的H20芯片销售后,当白宫数月后放松禁令时,中国并未表示松口气,而是呼吁科技公司彻底放弃英伟达产品,全面使用国产替代品。

发布于 广东