北京大学集成电路学院7篇论文在ICCAD发表

来源:爱集微 #北京大学# #ICCAD#
2.5w

以北京大学集成电路学院为第一完成单位的7篇论文在美国旧金山举行的第42届国际计算机辅助设计会议(ICCAD 2023)上发表。7篇论文内容涉及EDA算法和物理后端设计,人工智能调度、映射和加速器设计方法隐私计算等多个学术前沿领域。

论文详情如下:

一、考虑二阶信息的宏模块布局优化技术

宏模块布局是大规模集成电路物理设计中的关键环节,也是近年来备受关注的问题。林亦波研究员团队提出一种改进的混合尺寸布局引擎内核,实现鲁棒布局收敛和宏模块合法化,并在MMS、ISPD2005和TILOS测试用例上分别达到了6.5%、29.6%和33.3%的线长优化。通过将该内核集成到英伟达AutoDMP宏模块布局工具中,提高了帕累托前沿的搜索性能。该工作以《Stronger Mixed-Size Placement Backbone Considering Second-Order Information》为题发表(博士生陈一帆为第一作者,林亦波研究员为通讯作者)。

二、AI与异构计算加速物理设计优化技术

布线拥塞和时序是集成电路物理设计中关注的重要指标。林亦波研究员团队提出利用AI建模技术和GPU异构并行加速拥塞和时序优化,并克服传统设计流程各环节之间的信息依赖。进一步在开源AI for EDA数据集CircuitNet上进行验证,实现高效拥塞和时序优化。该工作为ICCAD邀请报告,并以《Accelerating Routability and Timing Optimization with Open-Source AI4EDA Dataset CircuitNet and Heterogeneous Platforms》为题发表(博士生江循和郭资政为共同第一作者,林亦波研究员为通讯作者)。

三、面向芯粒加速器成本效益感知的定制设计方法

论文提出一种成本感知的加速器设计方法,系统探索单芯粒架构与多芯粒集成的设计空间。我们开发了面向多芯粒的性能建模框架与基于机器学习的设计优化框架,能够在成本预算内为应用定制高性能加速器设计。该工作以《Monad: Towards Cost-effective Specialization for Chiplet-based Spatial Accelerators》为题发表(博士生郝晓辰为第一作者,梁云研究员为通讯作者)。

四、面向各类存算设备统一的深度神经网络映射框架

该论文设计并实现了一个神经网络算子到多种存内计算设备的自动化映射框架。该框架的核心是提出了一个描述存内计算设备的计算和数据映射特性的硬件抽象,包括计算抽象和内存抽象两个部分。依据该抽象,我们对映射空间进行了系统定义,并可以自动化生成和探索映射空间。该工作以《ARES: A Mapping Framework of DNNs towards Diverse PIMs with General Abstractions》为题发表(博士生崔修萍为第一作者,梁云研究员为通讯作者)。

五、可靠性增强的神经网络加速器数据流优化算法

为提高加速器对于时序错误的鲁棒性,提出一种可靠性增强的加速器数据流优化技术(READ),从而有效减少时序错误。READ通过探索将训练好的深度神经网络映射到加速器时的最优计算顺序,来减少关键输入模式的出现。在VGG和ResNet上的实验结果表明,READ平均将时序错误率(TER)降低7.8倍。该工作以《READ: Reliability-Enhanced Accelerator Dataflow Optimization using Critical Input Pattern Reduction》为题发表(张作栋博士后为第一作者,李萌研究员为通讯作者)。

六、面向边缘设备的高效内存感知调度算法

该论文提出基于迭代计算图优化的高效考虑内存的调度框架,采用一种迭代图融合算法,可以在保持调度最优性的同时简化计算图。进一步提出了一个整数线性规划模型,结合拓扑感知的变量剪枝,来高效地调度简化后的计算图。在不同的网络上评估了我们的方法与先前的算法的对比,并证明了该方法在所有的基准测试中都优于现有的技术,将峰值内存占用量降低了13.4%以上。该工作以《Memory-aware Scheduling for Complex Wired Networks with Iterative Graph Optimization》为题发表(博士生仲书璋为第一作者,李萌研究员为通讯作者)。

七、面向轻量级神经网络的高效同态加密打包算法

该论文提出了Falcon,一种针对基于同态加密的两方计算框架的有效的密集打包算法。Falcon采用一种零感知的贪心打包算法和一种通信感知的算子切割策略,来提高逐深度卷积的打包密度。Falcon在算子级别较CrypTFlow2, Iron和Cheetah分别实现了超过15.6 倍,5.1 倍和1.8 倍的延迟降低。同时,在网络级别,Falcon 在Tiny Imagenet数据集上分别实现了4.2% 的准确率提升。该工作以《Falcon: Accelerating Homomorphically Encrypted Convolutions for Efficient Private Mobile Network Inference》为题发表(博士生许天识为第一作者,李萌研究员为通讯作者)。

北京大学集成电路学院消息显示,ICCAD被公认为EDA领域最重要的会议之一,是探索EDA研究领域新挑战、展示前沿创新解决方案和识别新兴技术的重要论坛,涵盖从器件和电路级到系统级的所有设计与自动化主题,及后CMOS设计等新型方向。

责编: 赵碧莹
来源:爱集微 #北京大学# #ICCAD#
THE END

*此内容为集微网原创,著作权归集微网所有,爱集微,爱原创

关闭
加载

PDF 加载中...