GPU四小龙:春节不打烊,与国产大模型共跑AI赛道
春节前后的国产大模型赛场格外热闹:字节跳动Seedance 2.0视频生成模型刷屏全球,智谱GLM-5、MiniMax-M2.5相继登场……而在这些模型背后,摩尔线程、沐曦股份、天数智芯、壁仞科技这"国产GPU四小龙"的团队,正以"随时待命"的状态,在假期里上演着一场与时间的赛跑。
假期里的"适配竞速赛"
智谱GLM-5发布当天,摩尔线程便在MTTS5000芯片上完成适配,沐曦股份基于曦云C系列同步官宣兼容,天数智芯也依托天垓系列实现对接。对这些GPU企业而言,"适配"远不止让模型"能跑"——要将开箱性能从50%提至80%以上,既需技术积累,更得拼响应速度。
"GPU架构的通用特性帮了大忙。"摩尔线程CTO张钰勃解释,相比专用架构,通用GPU适配效率更高,"一个人几小时就能搞定的事,换别的架构可能要几十人忙几天"。为抢时间,企业甚至会采取"人肉递送":模型发布前派专人带硬盘上门拷贝,签保密协议、驻场待命成了常态。沐曦股份联合创始人杨建笑称:"春节休假?团队手机不敢静音,就怕错过大模型发布的'发令枪'。"
一年之间的"从跟跑到并肩"
与去年春节相比,国产GPU与大模型的配合已判若两人。DeepSeek等开源模型的爆发,成了关键转折点——不仅引爆推理市场,更让行业意识到:国产算力未必只能做"备选"。
"以前模型企业训练时不敢用国产卡,怕三个月练不出成果打水漂。"天数智芯副总裁石加圣坦言,如今推理场景成了突破口:英伟达芯片功能受限的背景下,国产GPU在搜推广、自动驾驶等特定场景已能与国际巨头掰手腕。优刻得研发总监王晓慧观察到,不少国企客户开始主动指定用国产芯片,"从'能用'到'敢用',这步跨越花了整整一年"。
更明显的变化在技术底气上。沐曦股份的软件栈性能泛化能力显著提升,摩尔线程实现万卡集群端到端训练,天数智芯一年推出两代架构……杨建感慨:"我们终于敢在特定场景喊出'比国外产品更好'的目标了。"
2026:在缝隙里凿出天地
四小龙的2026年路线图已清晰可见:摩尔线程将基于"花港架构"推出新芯片,目标实现"数量级能力跃升";沐曦股份保持两年至少两颗芯片的迭代速度;天数智芯计划用两代架构覆盖更多场景……
尽管制程等短板仍待弥补,但石加圣的信心很足:"工程学难题,中国人总能攻克。"当国产大模型在短视频生成、代码编写等领域持续突破,当县域营业厅、工业产线都开始部署AI一体机,这些春节不打烊的GPU企业,正从巨人肩膀上站起,朝着"与国际巨头并肩跑"的目标加速冲刺。
这个春节,没有硝烟的竞速赛仍在继续。对GPU四小龙而言,最好的新年礼物,或许就是让"国产算力"在更多场景里,从"备选"变成"首选"。
