简单交易日志
26-06-06 13:12 微博认证:财经博主

关于Nvidia调整内存配比     
1)rubin的机柜从单条192GB内存降为96GB,原因是192GB做agent推理仍然不够,做训练又显得冗余,因此调整为rubin标准机柜只满足训练与普通推理的内存需求。
2)agent推理的内存需求调整为通过Vera的CPU机柜来满足,一个Vera的CPU机柜配备256颗CPU,393TB内存。由客户自己根据业务选择需要配置多少比例的agent推理比例,不在通过rubin nvl72机柜来满足这部门内存需求。
3)CPU机柜与Rubin机柜通过scale out网络连接。

存储GPU端不变,CPU端由之前的硬性供应砍半,由客户根据自身需求量,自己买!

市场看到砍半,成了情绪杀跌!

主要还是供应不足导致的短期改变,话句话说,即便CPU端砍半依然供应不足!

发布于 广东