美国创新公司D-Matrix推出新的AI推理芯片,在处理小型算力任务时,速度可达英伟达GPU的10倍,能耗仅为五分之一。
该芯片采用SRAM架构,不依赖DRAM,小型算力模型速度非常快。
D-Matrix累计融资约5亿美元,估值约20亿美元。
微软是该公司投资方之一。公司已拿下多家云服务商和AI实验室的采购意向,自本月起开始批量发货。
其芯片仍然依靠台积电代工,单卡售价数万美元,可即插即用地部署于现有数据中心机架。
现在的AI应用已经由训练转向推理,而推理的速度快慢是当前模型的关键之一。
发布于 上海
