【芯视野】DPU蓝海现“百家争鸣”:中国企业如何突围破局?

来源:爱集微 #芯视野# #DPU百家争鸣# #中国企业破局#
2.3w


集微网报道,近年来,在摩尔定律逐渐逼近极限情况下,CPU的性能增长瓶颈已经较为显著。但随着大数据、云计算和人工智能等产业方兴未艾,算力需求却出现爆炸式增长,进而导致出现严峻的算力供需错配局面。在这样的背景下,DPU横空出世,并逐步将数据处理逻辑改变为“以数据为中心”,从而有望成为继CPU、GPU之后的“第三块主力芯片”。

虽然仅仅正式“诞生”约一年半时间,但DPU已俨然成为“兵家必争之地”。在这一赛道,英伟达、英特尔、Marvell、博通、AMD等国际巨头争相布局,芯启源、中科驭数、Fungible和Pensando等国内外新贵也在摩拳擦掌、冲劲十足。与此同时,为了缩减数据中心运营成本,虎视眈眈的亚马逊、微软、阿里巴巴、腾讯等云供应商也纷纷下场自研DPU。

目前,凭借技术经验、人才梯队等优势,海外巨头在DPU的各技术路线上构筑了较高的行业壁垒,并在获得规模客户方面占据先机。但中国DPU厂商与其处于基本一致的发力节点,同样在各技术路线取得不少突破,因而也拥有显著的发展机遇。那么,在“百家争鸣”的DPU赛道,面对实力强劲的海外巨头竞争,中国企业未来要如何才能实现破局和突围?

DPU将成数据中心核心支柱

随着大数据、云计算及人工智能时代号角奏响,一路飙升的算力逐渐成为计算浪潮的核心,并推动数据中心等建设如火如荼。据调研机构IDC的数据显示,全球数据量在过去10年的年均复合增长率接近50%,每四个月对于算力的需求就会翻一倍。而由此带来的几何级数据联网端口增长速度,远超摩尔定律和Dennard缩放比例定律的计算周期速度。

对此,经过多项探索实验,DPU已成为减轻网络开销的最佳方式,进而正在取代CPU作为数据中心服务器的中央控制点,逐步建立以数据为中心的计算架构。而作为具有高度灵活可编程性的芯片,DPU最直接的效果就是为CPU减负,承担了大量网络、存储、安全和虚拟化等占用CPU算力但并非直接用于计算的基础设施功能,从而将CPU的算力释放给核心应用程序。

在DPU技术路线方面,据国内相关产业研究报告介绍,一是以通用众核处理器为基础,以多核Arm为核心,以众取胜,可编程灵活性较好,但是应用针对性不够;二是以专用核为基础的异构核阵列,针对性较强、性能较好,但是牺牲了部分灵活性;第三种路线结合了前二者优势,即将通用处理器的可编程灵活性与专用的加速引擎相结合,正在成为最新的产品趋势。

基于高度灵活可编程等特性,除了能够提高数据处理性能,DPU还可以通过不同的软硬件定义,延伸至企业网络、电信系统、存储、网络安全、5G通信和云端等领域,从而满足不同应用场景的具体需求,可实现的增长价值巨大。据统计,未来用于数据中心的DPU量级将达到和数据中心服务器等量的级别。如果考虑到部署到众多其它领域,这将是不可估量的增量市场。

对于未来行业发展,在芯启源方面看来,DPU将致力于解决“网络协议处理、数据安全、算法加速”等问题,而这些问题有着“CPU做不好,GPU做不了”的特点。另外,英伟达首席执行官黄仁勋则曾表示:“DPU将成为未来计算的三大支柱之一,未来的数据中心标配是‘CPU+DPU+GPU’,CPU用于通用计算、GPU用于加速计算、DPU则进行数据处理。”

行业呈现“百家争鸣”竞争格局

一个颠覆性的核心器件,必然是兵家必争之地。目前,传统的老牌芯片巨头英伟达、英特尔、Marvell、博通等先后下场,国内的创业型公司芯启源、中科驭数、云豹智能、大禹智芯等也在力争上游。此外,下游云计算龙头AWS、阿里云等厂商也均已有布局。由于DPU概念和技术标准尚未统一,各家从自身优势出发输出相应解决方案,形成了“百家争鸣”的竞争格局。

目前,在海外企业方面,博通是以通用众核为基础的同构众核DPU,并运用了通用SoC和ASIC;英特尔基于FGPA做DPU(命名为IPU),属于以专用核为基础的异构核阵列;英伟达则是基于ASIC做DPU,属于将通用处理器的可编程灵活性与专用的加速引擎相结合。以英伟达的BlueField-3系列DPU来看,就包括16个ARM核及多个专用加速引擎。

整体上,在DPU软硬件研发等方面,英伟达无疑都相对占住了市场先机。其产品目前开发到了BlueField-3,网速高达400Gbps,并且有通用的工具包DOCA,能够使整体的扩展和研发都保持兼容的状态。而作为英伟达的有力竞争者,为了释放CPU算力,英特尔的IPU承担了原本由CPU处理的存储、网络虚拟化等基础设施层功能,并辅以为开发者提供的ONE API软件框架。

芯启源第四代DPU智能网卡 图:芯启源

另外,国内DPU厂商也是多条技术路线并行。其中,芯启源基于独特可扩展的多核芯片SoC架构;中科驭数基于自主研发的KPU架构;云豹智能主要基于FPGA方案;专注PCIe技术栈的边缘智芯则提供另一种视角,数据从网卡进入其设计的XPU后,分发给CPU、GPU、SSD;星云智联正在研发的DPU将在IAAS和PAAS之间形成独立的CAAS(通信服务层)。

由于通过使用DPU所需的服务器数量更少,云服务商不仅可以降低前期硬件投入成本,还能减少数据中心用电规模、机房空间需求和CO2 排放量,从而实现节能减排目标。亚马逊和微软等云服务商很早就意识到了其中的巨大益处,于是纷纷选择卸载掉服务器的联网功能,并将这部分工作转移到DPU上运行,以便释放出更多CPU核,优化服务器利用率及降低联网成本。

例如亚马逊收购了Annapurna,专门开发类似器件和DPU芯片;微软通过将FPGA集成到DPU上卸载服务器的联网功能,并实现数以百万计规模的部署;而阿里云的做法是在神龙服务器核心组件MOC卡中使用专用的X-Dragon芯片,以实现DPU的多种相关功能。此外,云厂商也在通过投资等方式寻找合适的解决方案,如腾讯投资云豹智能,字节跳动投资云脉芯联等。

国内DPU企业如何突围破局?

当前,大多数DPU方案都是从基本的网络控制器开始扩展至SoC。其中,英伟达、英特尔分别采用处理器配合ASIC和FPGA,外加加速引擎的方式;Marvell、博通则使用最新通用处理器内核配合加速引擎的方式。这三种方式基本代表着DPU产业的未来主流发展方向。而面对兵强马壮的海外巨头构筑的较高行业壁垒,国内DPU企业要如何实现突围破局?

首先,区别于海外国家通常主要由个体企业进行算力布局,中国可以通过宏观政策引导,充分调动国家、社会资源,集中力量推动数字化转型的进程。基于此,新基建、“东数西算”的建设将有力推动国内DPU行业的发展。在这一前所未有的契机下,国内DPU厂商应该充分扎根本土,打造快速响应各类定制化及国产化需求的能力,以提供高效率和专业的定制化服务。

其次,抛开中国的宏观政策和诺大市场前景等因素,自主DPU企业要在“百家争鸣”中脱颖而出,势必还有赖于核心技术。因为只有掌握了最底层最经得起市场考验的核心技术,才能在行业竞争中充分掌握话语权。目前,国内DPU发展的一个重要短板就体现在基础研究上,因而需切实提升自主芯片的研发能力,夯实基础然后“由点及面”,而不是盲目追逐潮流。

另外,由于DPU尚属于新兴市场,客户需求处于相对粗放和分散的阶段,因此现阶段各企业基本都能通过为客户进行定制化服务获得订单。目前,国际巨头主要针对大型互联网和通信服务商市场,但受成本因素等限制无法为众多中小客户进行定制化服务。因此,作为DPU赛道相对较新的玩家,国内DPU厂商可通过FPGA和NP等适用性较好的方案切入市场。

再者,在DPU产业,不遗余力的构建生态也至关重要。DPU的软件生态具体表现形式为DPU软件功能覆盖的广度与适配性程度,是实现高度灵活可编程性的关键。而除了软件生态,DPU还应当具备产业垂直应用覆盖生态、横向的协同生态以充分实现其增长价值。因此,行业可建立起以DPU为中心,并联合芯片行业各方力量共建协同的立体生态。

最后,如今除了数据中心,DPU典型适配场景如企业网络、电信系统、5G通信、云端、网络安全、存储和嵌入式系统等的应用同样发展迅猛。与此同时,国内企业与巨头直接交锋难度可想而知:不仅要在DPU性能、生态上一较长短,更重要的是能否在应用端不断迭代进化。由此,国内广泛的应用市场应对国产DPU秉有信心,敢于为其提供充分成长的“黑土地”。

结语

可以确定是,未来数年内DPU市场在全球都是一片蓝海。但从芯片市场竞争格局的历史走向来看,未来DPU赛道极可能将不是各巨头与初创企业混战的市场。随着众多强势资本、技术、人才等要素不断投入,最终有实力的大企业将演变为整个市场的主导力量,同时众多中小企业通过与垂直领域结合,构建创新型、高效能、灵活适用的产品将能实现在DPU市场分一杯羹。

而在这场决胜未来的角逐中,中国与海外DPU厂商基本处于相同的发力节点,拥有显著的发展机遇。鉴于此,国内DPU企业应当站在全球化的维度,以更开放、包容的视野和心态面对应用端的广泛需求,同时加强与芯片厂商、产业链上下游厂商等各方的深度合作,建立起兼容的业界标准和协同生态,进而在推动DPU产业发展同时,带动中国芯片行业整体能力持续提升。(校对/隐德莱希)

责编: 武守哲
来源:爱集微 #芯视野# #DPU百家争鸣# #中国企业破局#
THE END

*此内容为集微网原创,著作权归集微网所有,爱集微,爱原创

关闭
加载

PDF 加载中...