砺算的那个 6nm 显卡还有个专业卡 7G105,跟消费卡是相同GPU,不过显存提升到了 24GB GDDR6 内存并支持 ECC。
我搜了一下并没有搜到 GPU 最大可用的显存带宽,如果按照 NVIDIA Ampere (8 nm) 系列卡比如 RTX A5000来估算的话,显存带宽至少有500GB/s+ ,双卡就接近1T,算是相当可用了。希望砺算多放出来点数据,尤其是直观的跑大模型的 token/s 的性能数据,这样能迅速给想要采用国产方案的企业信心。
(图来自 TechPowerup)
#ai创造营# #ai生活指南#
发布于 日本
