随着三星、SK海力士等内存大厂的积极推进，存内计算/近存计算将有望加速走向商用。在冯·诺伊曼架构中，计算与内存是分离的，计算单元从内存中读取数据，计算完成后再存回内存。特别是随着人工智能等对性能要求极高的场景爆发，传统的冯·诺依曼架构的短板开始凸显，例如功耗墙、性能墙、内存墙的问题。

随着三星、SK海力士等内存大厂的积极推进，存内计算/近存计算将有望加速走向商用。
在冯·诺伊曼架构中，计算与内存是分离的，计算单元从内存中读取数据，计算完成后再存回内存。特别是随着人工智能等对性能要求极高的场景爆发，传统的冯·诺依曼架构的短板开始凸显，例如功耗墙、性能墙、内存墙的问题。
造成这一问题的原因主要有两点：
一是数据搬运带来了巨大的能量消耗。数据显示，在传统架构下，数据从内存单元传输到计算单元需要的功耗是计算本身的约200倍，因此真正用于计算的能耗和时间其实占比很低。
二是内存性能的发展远远滞后于处理器的发展。目前，处理器的算力以每两年3.1倍的速度增长（AI对于算力的需求每两年提升750倍），能够处理器的数据量也快速增长，但是内存的性能每两年只有1.4倍的提升。也就是说，即使处理器每秒能够处理3.1倍的数据量，但是由于处理器从内存中存取数据都是经过同一条内存总线访问，而这个内存总线如果最多只能通过1.4倍的数据量，这也意味着处理器也只能处理1.4倍的数据量。内存性能限制了处理器性能的提升。
目前内存性能的提升速度严重滞后于处理器性能提升的速度，这就好比一个漏斗，宽的一端是处理器，而狭窄的一端则是存储器，后者的性能极大地影响了数据传输的速度，这也被认为是传统计算机的阿克琉斯之踵。这一点在AI/HPC计算领域尤为明显。
因此，目前众多的芯片巨头都有在研究存内计算（Processing-in-memory，PIM）芯片，在2021年12月，阿里巴巴旗下达摩院计算技术实验室成功研发全球首款基于DRAM的3D键合堆叠存算一体AI芯片，号称在特定AI场景中，该芯片性能提升10倍以上，能效比提升高达300倍。此外，三星、SK海力士等存储芯片大厂也在研究PIM芯片。
http://t.cn/A6OBYXWW

发布于广东