理想居然给了最终算力利用率的数字,挺好。
MFU(Model FLOPs Utilization),算法就是拿一个具体模型在芯片上跑推理,统计单位时间内实际完成的乘加运算次数,再除以芯片标称的理论峰值TOPS。
也就是说这颗芯片跑理想自己的模型,算力是 1000 TOPS 左右。
发布于 北京
理想居然给了最终算力利用率的数字,挺好。
MFU(Model FLOPs Utilization),算法就是拿一个具体模型在芯片上跑推理,统计单位时间内实际完成的乘加运算次数,再除以芯片标称的理论峰值TOPS。
也就是说这颗芯片跑理想自己的模型,算力是 1000 TOPS 左右。