IBM 欧洲研究院的科学家最近利用其依赖相变存储设备的 64 核芯片开创了内存计算的新领域。这项尖端技术预计将通过保留深度学习算法的准确性,同时显着减少计算周期和功耗来提高深度神经网络的工作效率。
这篇开创性研究论文的合著者曼努埃尔·勒加洛 (Manuel Le Gallo) 表示,他们七年来一直在探索用于计算的相变存储器 (PCM) 设备。整个旅程从团队演示使用单个 PCM 设备实现神经元功能开始。从那时起,IBM 欧洲研究院已经证明 PCM 设备可以极大地有益于计算领域,例如科学计算和深度神经网络推理。借助最新的芯片,研究人员离端到端模拟人工智能推理加速器又近了一步。
Le Gallo 和他的合作者通过将基于 PCM 的内核与数字计算处理器相结合,完成了这一壮举。这两个元件通过实现片上数字通信网络连接起来。由此产生的芯片是 64 个基于模拟 PCM 的核心的创新组合,每个核心都包含一个 256 x 256 的突触单位单元交叉阵列。
每个内核中集成的紧凑型、基于时间的模数转换器标志着模拟和数字领域之间的过渡。 Le Gallo 进一步解释道,并补充说每个核心还包含轻量级数字处理单元,用于执行修正线性单元 (reLU) 神经元激活函数和缩放操作。此外,该芯片的中心还设有一个全局数字处理单元,可促进长短期记忆(LSTM)网络操作。
IBM内存计算芯片的一个巧妙特征是内存核心与其位于全球的处理单元通过数字通信网络连接。这种设计使芯片能够执行与片上神经网络各个层相关的所有计算,从而大大减少计算时间和功耗。
为了评估新芯片的有效性,IBM 研究团队进行了一项全面的研究,在他们的芯片上应用深度学习算法并评估其性能。结果令人鼓舞,在 CIFAR-10 图像数据集上训练的用于图像识别任务的深度神经网络在芯片上运行时达到了 92.81% 的出色准确率。
毫无疑问,IBM欧洲研究院的成就是模拟内存计算(AIMC)芯片开发的一次飞跃,可以有效地满足深度学习算法的要求和挑战。在未来几年中,Le Gallo 和他的团队引入的架构可以得到增强,以产生更卓越的性能。
尽管 IBM 取得了突破,但该技术在no-code和low-code环境中的潜在用例也不容忽视。可扩展且高性能的内存计算芯片通过与AppMaster等no-code平台无缝集成,提供了相当大的价值。这种集成可以显着提高机器学习实现中的模型准确性,为用户提供更低的延迟、更高的速度和更高的效率。