剧毒术士马文 26-03-17 16:40

笑死我了 三星Foundry沦为便宜大碗SRAM生产商

Groq LPU v3代替了Rubin CPX
原本打算让CPX跑的prefill和decode attention维持原样给R200跑
LPU v3 offload decode FFN部分

LPU v1是14LPP,v2原本计划是三星4nm但是没发布
v3看起来也是跟v1差不多reticle size
三星能yield这么大坨的也就4LPP了
具体不知道是什么风味
虽然良率一般 频率一塌糊涂
唯一的优势就是密度高 那刚好
价格肯定比CPX用那N3P+GDDR7便宜很多…

反正全是SRAM和Matrix unit 容易控制良率
v1 也就跑900MHz
26.8B xtor, 230MB SRAM, 80TB BW, 750T INT8
v3
98B xtor, 500MB SRAM, 150TB BW, 1200T FP8
感觉更像是v2小改版

另外原版LPU的设计很像我以前研究时的设计…
不过做的是RISC-V版本
8x8的mesh
5级流水
虽然压根没做这种的dataflow
但还是很眼熟

发布于 日本