7月15-16日,第六届集微半导体峰会在厦门国际会议中心酒店举办,本届峰会以“裂变:从混沌到有序”为主题,共计2天。
在16日的“高端通用芯片专场论坛”上,天数智芯首席技术官呂坚平博士以“创新通用GPU启动后摩尔时代 AI-图形 融合”为主题,深刻解读了通用GPU如何赋能AI计算,实现AI与图形在云端系统的融合创新。
从自然语言处理到机器视觉,AI已经成为解决问题方法的典范,小到智能手机、PC、VR/AR等消费电子设备,大到城市智能化、工业自动化、材料和医学研究,以及数字孪生/元宇宙等各个应用领域,通用GPU加持的科学计算,已经成为以数据解决问题的典范(而不是特定应用领域),并持续创造迭代突破,加速商业化。
GPU能够完美匹配各种通用并行计算,尤其是包括AI训练推理、图形渲染以及科学通用计算皆以大量可并行处理的乘加 (MAC, Multiply-Accumulation) 计算为主的新兴应用的计算需求。天数智芯首席技术官呂坚平博士表示:“与传统的CPU和图形GPU不同的是,通用GPU核心数往往要高于CPU几个数量级。而目前,业界所谓的GPU‘核心’(相对于CPU核),事实上只是一条SIMT Lane(单指令多线程跑道),这也是为何GPU号称核数远超过CPU,在CPU擅长的富于指针的应用领域,依然不如CPU的原因。”
而与图形GPU相比,通用GPU也有所不同。尽管通用GPU与其共享同一算力池,但图形GPU在运行图形管线时,只有部分会使用到图形专用硬件,未来也将更加仰赖通用计算;而通用GPU运行计算图谱,也不会用到图形专用硬件,未来的趋势则是更加强调对AI的优化。
呂坚平博士解释到:“通用GPU其实只是GPU的一种用法,但后来,我们开发了GPU的硬件,略掉了图形专用的硬件,保留了通用的部分。虽然GPU可以在图形、AI、通用计算领域充分发挥优势,但这三者目前是处于分裂的状态。这个过程中,对图形的优化往往会导致AI的缺失,对AI的优化往往也会影响图形的优化。但图形渲染本身可微分之后,也可以变成AI的一部分。通用GPU未来就是希望能够各取图形渲染和通用计算所长,将图形及AI变成对方不可或缺的一环。”
从应用的角度来看,AI为何需要持续创新的通用GPU?呂坚平博士引用了2018年图灵奖得主 John Hennessy 及 David Patterson 教授在得奖演说 ”A New Golden Age for Computer Architecture”中指出的判别计算架构赢家的三个准则,即:1、软件的进步启发架构创新;2、提升软硬件界面缔造架构创新机会;3、市场最终摆平架构论争。
除此之外,呂坚平博士认为,“架构赢家主导下一波软件进步”也是进一步圆满架构迭代演进的关键准则。
根据以上四个准则,市场已经认定通用GPU为架构的赢家。呂坚平博士解释到:“因为AI不是某个应用领域,而是解决问题方法的典范。没有适当配置的专用算力将穷于应付层出不穷的崭新算法,提供通用并行算力的通用GPU是唯一被广泛采用开发新AI算法(也就是AI时代的‘软件进步’)的软硬件平台。现在通用GPU可以说是唯一被广泛采用开发新AI的算法的软硬件平台,放眼全世界,所所有试图取代GPU的竞争者,都无法顺利跑通刚从AI学术大会刚出炉的最新AI算法,甚至忙于应付性能测试标准中的基本算法。讽刺的是,被竞争者视为‘不够AI专业’的通用GPU却能应对自如。这也就意味着,AI架构赢家必定坚守通用的准则。”
更何况,AI与图形如今已在云端进行深度融合。如今,图形的极致即元宇宙/数字孪生,往往需要“云-移动端”协同内容生成,这需要与图形高度配合的AI;而讲求“云-移动端”协同图形渲染,也需要能善用AI的图形;也就是说,AI与图形必须在云端融合。但非GPU的架构无法因应AI与图形在云端融合的挑战,反而通用GPU可以追加图形功能,非常适合此类应用。
那么,要如何在通用GPU上开发图形,并兼顾通用计算呢?天数智芯认为,首先,是实现DSA通用化,这能够发挥GPU的持续通用优势,即将专用(DSA)算力迭代融入GPU通用算力池,即能提升效能,又能维持通用及可编程性。其次,通过图形计算化来跨接先进图形,此方法能够让图形充分利用算力,使得图形管线大为简化,图形专用硬件大量减少。而且,简化的图形管线可以实现计算图谱的节点,发展更灵活的渲染演算法,不再受固定管线的限制。
另外,通过计算图形化来提升计算效能,也能够在计算图谱节点之间,实现类似图形管线节点之间非同步运作及芯片内分享数据,达到重叠运算及存取,更能降低芯外存取所产生的功耗。最后,通过硬件微分化来促进AI图形的融合,即将图形硬件可微分,使其融入实现AI算法的计算图谱,将图形渲染纳入AI问题解决典范,从而能够大幅促进AI与图形的融合。
天数智芯旗下的天垓通用GPU,各取图形与通用计算所长,充分整合了GPU的图形、AI与通用计算“三重人格”。呂坚平博士表示:“天垓通用GPU遵循图形走向通用计算的潮流趋势,以成功量产的天垓100通用GPU为坚实基础,并开发了‘云原生’内容生成与图形渲染,能够达到元宇宙/数字孪生所需的AI与图形融合,完美的契合AI图像融合计算的各类应用场景。”
天数智芯是国内GPU领域的领先品牌,公司已于2020年12月便成功点亮国内第一款7nm云端训练通用GPU产品——天垓100,并于2021年3月正式对外发布,截止至2022年3月底,天垓100产品已实现销售订单近2亿元,协助客户落地达两百多应用场景。2022年5月,第二款产品-7nm云边推理芯片“智铠100”成功点亮,产品迭代开发和商业广泛应用遥遥领先国内同行,成为国内少有的GPU领域国产替代的优秀企业。(校对/萨米)