Nature Communications | 南科大王中锐课题组联合中科院微电子所刘明院士团队,在模拟人工智能硬件领域取得重要进展

来源:南方科技大学深港微电子学院 #电阻存储# #存算一体# #边剪枝#
3427

近日,南方科技大学微电子学院王中锐副教授课题组联合中国科学院微电子研究所刘明院士团队尚大山研究员、许晓欣研究员,在面向模拟人工智能优化的电阻式存储器领域取得重要研究进展。团队提出了一种基于边剪枝拓扑优化的软硬件协同设计框架,针对随机加权的电阻存储神经网络,有效解决了模拟计算中器件编程随机性、非线性以及高编程能耗与时间开销等核心瓶颈。该方法受大脑Hebb规则与结构可塑性启发,通过“保留有效连接、剪除冗余边”直接优化网络拓扑,利用电阻存储器电成形过程的内在随机性低成本生成大规模随机权重,并将器件随机性转化为计算优势,实现对非理想特性的天然鲁棒性与显著能耗降低。相关研究成果以“Pruning random resistive memory for optimizing analog AI”为题发表于Nature Communications(DOI:10.1038/s41467-025-67960-6)。南方科技大学为论文的通讯单位,王中锐副教授为通讯作者。中国科学院微电子研究所为重要合作单位,尚大山研究员和许晓欣研究员为共同通讯作者。论文的第一作者是南方科技大学、中国科学院微电子研究所和香港大学共同培养的博士毕业生李熠以及博士生王松琦。

人工智能尤其是深度学习模型规模的迅猛增长带来了巨大的计算资源需求与能耗挑战,引发了对环境可持续性的广泛关注。模拟存算一体计算借助电阻式存储器等新型模拟器件,直接在器件中处理连续信号,在能效上展现出显著优势:实现存储与计算合一、避免冯·诺依曼架构频繁数据搬运、具备优异可扩展性与三维集成潜力、非易失性支持断电数据保持。然而,模拟计算系统仍面临器件编程过程中的随机性与非线性、远高于数字存储的编程能耗与时间开销等关键难题。这些非理想特性严重限制了模拟AI硬件的实际部署与大规模应用,尤其在精度要求高的复杂任务中难以实现高效训练与推理。因此,如何在充分发挥模拟计算高能效潜力的同时,克服编程非理想性与高成本,已成为新型存储器基AI硬件领域的亟待突破的核心问题。

针对上述挑战,研究团队提出了一种脑启发边剪枝拓扑优化软硬件协同框架,在算法、器件、电路与系统层面实现系统性创新:

1.在算法层面,团队在随机初始化的过参数化网络中固定权重,仅通过学习边的重要性动态剪除或恢复连接,直接优化网络拓扑结构,而非依赖对存储器电导的精确连续调控。该方法继承了随机网络可剪枝出等效性能子网络的理论观点,在图像分类、语音分类、图像分割等多项基准任务上显著提升准确率。

2.在器件与硬件层面,充分利用电阻存储器电成形过程中的内在随机性,以低成本生成大规模随机权重,将器件随机性从“非理想因素”转化为“计算资源”。通过简单的复位(reset)或置位(set)操作实现物理连接的剪除与恢复,避免精细模拟编程,从而对器件随机性、非线性具有天然鲁棒性,并将编程操作和推理能耗降低两个数量级以上。

3.在系统架构层面,采用混合模拟-数字设计,以电阻存储器阵列为核心执行高并行向量-矩阵乘法与物理剪枝操作,数字处理器负责反向传播与控制逻辑,有效缓解数据搬运瓶颈。实验验证显示,该框架在多个数据集上实现显著性能提升与能效优化,并展现向ResNet-50等大规模模型的可扩展潜力。

该研究将生物启发的拓扑优化与电阻存储器随机性巧妙融合,从根本上缓解了模拟AI计算中的随机性与能耗瓶颈,展现出优异的准确率、能效与鲁棒性综合优势。该框架不仅适用于电阻存储器,还可推广至其他模拟非易失存储技术,为构建高能效、可扩展的下一代人工智能硬件提供了通用且实用的解决方案。未来,团队将继续推进软硬件协同优化与芯片集成,推动该技术向更大阵列规模与更复杂AI应用演进,有望为边缘智能、可持续计算等领域打破传统架构能耗壁垒提供关键技术路径。

本研究获国家自然科学基金、深圳市相关计划等项目资助。

论文原文链接:https://www.nature.com/articles/s41467-025-67960-6

图1:基于边剪枝的软硬件协同模拟计算总体框架(图示生物启发机制、算法原理、系统架构与电路实现的对比整合)

END

编辑 | Karen

供稿:王中锐副教授课题组

责编: 集小微
来源:南方科技大学深港微电子学院 #电阻存储# #存算一体# #边剪枝#
THE END
关闭
加载

PDF 加载中...