云天励飞 今年是应用元年, 而应用被大厂包圆,无法外溢可以外溢的,就是使用的人多了,token消耗就指数级别变大而这个token消耗就指向 推理算力的需求。之前开发的时候,需要的是 训练算力,这个已经过去。国产算力需求 应该主要集中在 : 推理芯片现在大模型基本上格局已定,所以训练芯片就没有多大意义了。更多的是,使用需求。用户每一次需求提交,推理芯片使用一次。 所以推理芯片 应该是 国产算力需求的紧要环节可以简单理解为: 训练芯片是用来 研发大模型的。 推理芯片是用来 落地使用的 现在这些多模态大模型啥的 算力稀缺在于: 用的人太多 加上Gemini 3 Deep Think对老模型的增强,本质是AI从“通用对话”向“专业推理/工程落地”的转型,而这一转型直接推动了AI算力硬件从“通用GPU”向“ASIC专用推理芯片” 的核心切换,谷歌TPU V6成为本次需求的核心催化剂,同时带动HBM3/3E、先进封装、高速光芯片等配套赛道的需求爆发,也为国产高端ASIC推理芯片的国产替代带来了重要机遇。
发布于 湖南
