最近在ai模型研究工作中有如下体会:因为Memory机制的成本效益远高于扩展模型参数,但这也意味着存储成本将从‘附属’变为‘核心’。在未来的AI系统架构中,‘存储-计算’的资源配比将发生扭转。这是一种全新的‘存储优先’的AI设计范式,从英伟达的icms平台到ds的engram架构都有这个方向的趋势。大胆估计26-28年存储成本占比大概在25%-40%,29-30年可能会去到45%-60%超越gpu。
发布于 广东
最近在ai模型研究工作中有如下体会:因为Memory机制的成本效益远高于扩展模型参数,但这也意味着存储成本将从‘附属’变为‘核心’。在未来的AI系统架构中,‘存储-计算’的资源配比将发生扭转。这是一种全新的‘存储优先’的AI设计范式,从英伟达的icms平台到ds的engram架构都有这个方向的趋势。大胆估计26-28年存储成本占比大概在25%-40%,29-30年可能会去到45%-60%超越gpu。