随着大数据、人工智能和机器学习领域的蓬勃发展,对高性能计算和存储技术的需求正在迅速增长。近期发表在《自然》杂志上的一篇开创性研究为未来智能计算带来了令人振奋的新突破!有助于攻克目前AI芯片算力“焦虑”。相关论文在3月29日发表于国际顶级学术期刊Nature。论文题目为《集成在CMOS上的忆阻器有数千个电导等级》(Thousands of conductance levelsin memristors integrated on CMOS)。
在这篇引人注目的文章中,初创公司和其他研究人员一起成功实现了数千个导电水平的忆阻器集成在CMOS(互补金属氧化物半导体)技术上。这一突破性进展为实现高性能、高密度和低功耗的计算与存储系统奠定了基础,为未来智能计算揭开新篇章。
自20世纪50年代计算机诞生以来,处理器和内存之间的性能差距一直在扩大。为了缓解这个瓶颈,计算机体系结构不断地演化和优化,包括引入缓存、预取技术和多核处理器等。然而,这些方法难以完全解决处理器和内存之间的性能差距问题。存内计算(in-memory computing)是一种将数据存储在内存中并在内存中进行计算的技术,这样可以大大减少数据在计算过程中从存储器传输到处理器的时间。存内计算的历史可以追溯到20世纪60年代,当时计算机科学家尝试在内存中进行计算,以避免CPU和内存之间的通信开销。当时的技术受限于存储器和计算能力,因此这个概念没有得到广泛应用。随着大数据和人工智能应用的爆发式增长,对数据处理速度和能效的要求越来越高。存内计算技术逐渐崛起,成为一种有望解决处理器和内存性能差距问题的技术方向。存内计算芯片是基于存储物理特性进行向量及矩阵计算的全新芯片,直接在新兴存储中利用物理加速处理数据,而不是把数据从内存读取到处理器中进行数字处理,在提供超多核多线程的同时解决了“存储墙”问题,使得计算效率得到大幅提升,同时低功耗, 高性能及小面积等特点。存内计算技术在各种应用领域具有广泛的应用前景,如大数据分析、人工智能、边缘计算等。例如,在大数据分析中,存储内计算可以实现快速地对海量数据进行处理和分析;在人工智能领域,存储内计算可以加速神经网络的训练和推理过程;在边缘计算中,存内计算可以提高能效,降低能耗。在目前所有各类存储器件中,忆阻器(Memristor)被认为是一种非常适合存算一体应用的器件。
忆阻器由于其非易失性、多电导水平、低能耗、快速切换、可扩展性以及适用于神经形态计算的特点,使其成为存算一体领域的理想选择。忆阻器的概念由伯克利蔡少棠教授在1971年提出,得名于其电阻对所通过电量的依赖性,被认为是电阻、电容和电感之外的第四种基本电路元件。可以在不同的导电电阻之间切换,从而实现非易失性存储。忆阻器的特点是在断电后仍能保持其电阻状态,因此被认为是一种理想的数据存储和计算介质。与传统的DRAM和闪存相比,忆阻器具有较低的能耗。这对于存算一体应用非常重要,因为它可以降低系统的功耗,提高能效。 忆阻器可以与现有的半导体制程技术相结合,实现高度集成。这使得它们可以方便地扩展到大规模集成电路中,为存算一体应用提供基础。这使得它们成为未来高性能计算和存储系统的理想选择,特别是在人工智能、机器学习和神经网络等领域。CMOS(Complementary Metal-Oxide-Semiconductor)技术是现代计算机和消费电子产品中广泛使用的半导体技术。CMOS技术的优势在于它具有低功耗、高性能和高集成度的特点。将忆阻器集成到CMOS技术中可以充分利用这些优势,同时实现存算一体, 可以显著提高计算性能,降低能耗,为高性能计算提供更好的解决方案。
TetraMem公司于2018年成立,是一家基于多比特忆阻器的存算一体计算芯片的高科技创业公司。TetraMem存内芯片可以广泛应用于各种云及边缘神经网络计算,适合各种深度学习等新型AI计算模式。TetraMem公司自主开发计算忆阻器基于半导体后段工艺。 可以支持绝大部分CMOS工艺并大幅度减低技术节点及成本要求。 经过多年研究,厚积薄发, 团队以不可复制的方法全球率先突破了忆阻器材料选择,器件设计和生产工艺门槛, 解决了“难落地”工业应用问题。目前已经可以在成熟foundry量产。电路设计大量采用成熟半导体器件,使得基于计算忆阻器的存内计算芯片在团队超过十年研发的经验及积累的基础上短期实现量产。已经4次成功芯片流片验证设计和生产工艺。
这篇文章的重点在于实现了数千个导电水平的忆阻器集成在CMOS(互补金属氧化物半导体)技术上。TetraMem研究人员和其他合作者一起, 将由一家商业晶圆代工厂生产的256 × 256忆阻器阵列单片集成在CMOS电路上,在完全集成芯片中实现了2048个可区分的电导等级,这比此前研究的电导等级高出一个数量级。团队在CMOS技术上成功实现了高密度、多水平的忆阻器集成。这种集成可以为存储和计算任务提供更高的性能和能效,尤其是在需要大量并行计算的应用领域,如人工智能和机器学习。
2028 levels/cell integrated on CMOS
New chip design to provide greatest precision in memory to date, will enable powerful AI in your portable devices. Credit: Joshua Yang of USC and TetraMem
这一技术革新为人工智能、机器学习和神经网络等领域带来了巨大潜力。通过减少数据传输延迟,存算一体技术可以大幅提高计算效率,从而推动智能应用的广泛发展。这项在《自然》杂志上发表的研究为未来智能计算领域带来了令人兴奋的新机遇。随着研究的深入,我们有理由相信这一技术将在不久的将来成为计算领域的重要支柱,引领智能计算进入一个全新的纪元!