5月29日,Arm宣布推出 2023 全面计算解决方案(TCS23),包括最新推出的旗舰GPU产品Immortalis-G720以及第四代 Cortex-X 内核—— Arm Cortex-X4等众多创新产品。
其中,超大核Cortex-X4 与 Cortex-X3 相比,其性能提高 15%,基于相同工艺的全新高能效微架构可降低功耗达 40%。Immortalis-G720与上代相比也有15%的性能提升。
Arm方面表示,TCS23解决方案将成为最重要的移动计算平台,为智能手机带来绝佳的解决方案。TCS23 提供一整套针对特定工作负载而设计与优化的最新 IP,可作为一个完整系统无缝地协同工作,从而满足日益增长的移动用户体验需求。
奠定最佳视觉体验的基石
Arm 在 2022 年推出全新旗舰 GPU 产品 Immortalis-G715,并与TCS22在天玑 9200 上率先得到使用,同时助力OPPO、vivo旗舰智能手机实现超高的跑分表现。
今年,Arm继续推动视觉体验方面的持续创新。最新推出的 GPU 产品采用了全新的第五代 GPU 架构,该架构是 Arm 迄今为止最高效的 GPU 架构,重新定义了部分图形管道,以优化内存带宽,从而在移动设备上支持高几何负载的下一代游戏和实时 3D 应用,同时带来更顺畅、并与 PC 端和游戏主机媲美的游戏体验。延迟顶点着色(Deferred Vertex Shading, DVS)是第五代 GPU 架构新引入的图形功能,可重新定义数据流,有助于合作伙伴扩展核心数量,达到更高的性能水平。DVS 的优势已经在包括《原神》和《堡垒之夜》等许多流行游戏中得到体现。
全新的 Arm Immortalis-G720 是 Arm 目前性能和能效表现最为出色的 GPU,与上一代产品相比,其性能和能效分别提高 15%,系统级效率更跃升了 40%,从而带来更高质量的图形渲染,实现更身临其境的视觉感受。
除了Immortalis-G720之外 ,Arm 也同时推出新的 Arm Mali™-G720 和 Mali-G620,旨在将高端移动图形功能快速地推向更广大的消费终端市场。
自2019年其,Arm以全面计算解决方案的形式来进行产品定义以及开发,TCS2023是其第三代平台型产品。
Arm 高级副总裁兼终端事业部总经理 Chris Bergey在接受集微网采访时表示,每一年 Arm都在打磨和提升技术, TCS23是 Arm连续第三年在 Armv9 架构上实现性能双位数的提升。此外,人们非常关注性能,无论是 GPU 性能,还是运行生成式 AI 和大型语言模型的 AI 性能,都需要全面的系统化以及对系统的深刻理解,这不光要单纯考虑性能上的提升,同时要以一种非常高功效的方式来实现。
“把这些技术挑战融合在一起并以系统级的方式解决,每个技术的模块都是独立的,但合在一起又能够实现总体性能功效的最优表现,这就是 TCS 的概念。” Chris Bergey说。
如今,ChatGPT 的出现,带动了 AI 芯片需求大增,这是否会对架构创新提出更高的要求?又将会给 Arm 带来哪些机遇与挑战?
Chris Bergey表示,大型语言模型将塑造计算的未来,这意味着需要进一步提升AI方面的工作负载,而 Arm 一直以来都在做这项工作,Arm 在这方面有非常深厚的储备,在 Arm 的平台上 AI 性能已经提高了两倍。Arm将继续推进对 Arm NN 和 Arm Compute Library 的支持,以便那些以世界上部署最多的平台 (即 Arm) 为目标的开发者能够继续利用类似 Chat GPT 或大型语言模型的应用程序来开发应用。
“一方面,我们确实看到云在创造大型语言模型方面持续发挥着巨大的推动作用。但另一方面,有一个重要的趋势使得小型模型在设备上应用而生,如安卓。这是由两个原因所驱动,一是隐私保护,出于隐私保护的考虑,有很多数据大家更愿意在本地储存;二是考虑到能效的问题,本地运行和处理在能效方面比云端更加有效益。”Chris Bergey告诉集微网。
CPU 性能领先助力打造智能 AI
作为 TCS23 的一部分,全新的 Armv9 Cortex® CPU 计算集群彰显了 Arm 对提供领先 CPU 性能的坚定承诺。该集群在连续三年实现两位数性能增强的同时,效率也得到显著提升。
作为第四代 Cortex-X 内核,新的 Arm Cortex-X4是该高性能集群的关键组成部分,可突破旗舰智能手机的性能极限。Cortex-X4 是 Arm迄今为止打造的最快速的 CPU,与 Cortex-X3 相比,其性能提高 15%。与此同时,基于相同工艺的全新高能效微架构可降低功耗达 40%。这一性能和效率的提升可以将设备使用体验(如 UI 响应能力和应用程序启动时间)提升到一个新的水平,并让实现面向下一代人工智能和机器学习的应用成为可能。
Arm 终端事业部产品管理高级总监 Stefan Rosinger告诉集微网,15% 的性能提升,其中一个关键驱动因素是提高每时钟指令。同时,随着制程工艺的结合,能够达到比起上一代还要多的额外频率。而降低功率的关键之一是清楚地了解如何利用额外的 IPC,与上一代相比,基本上是在更低的工作和电压点去运转。
Arm 领先的 CPU 性能也扩展至其全新大小核,即Arm Cortex-A720 和 Cortex-A520。Cortex-A720 是业界主流 CPU IP,作为新 CPU 集群的核心主力,可提高持续性能。而 Cortex-A520 则是Arm目前最出色的高效率核心。这些全新的 CPU 设计较前几代产品实现了 20% 的能效提升,可惠及包括AAA级游戏、全天候生产力和后台任务等用例。
制程工艺和计算能力更为紧密的结合是实现最高性能和最高效设计的关键。在新一代 CPU设计中,Arm 在 TSMC N3E 制程工艺上顺利完成了业内首个 Cortex-X4 流片,进一步深化了双方长期合作的伙伴关系。这项合作同时确保了Arm 生态系统已做好准备,能在流片完成后,充分发挥Arm处理器技术带来的功耗、性能、面积(PPA)优势。
Arm 全新 CPU 集群提供了合作伙伴所需的性能与效率,其中,DSU-120 专为满足要求苛刻的多线程使用场景而设计,支持从可穿戴设备到智能手机、笔记本电脑的众多设备,使新的 CPU 集群臻于完善。
为全球开发者提供软件和安全解决方案
凭借 TCS23,Arm 确保数百万基于Arm 架构、为 Arm架构应用进行开发的移动开发者们能够拥有编写更简易、更快速且更安全软件的能力与工具。
生成式人工智能等新的智能体验在过去的一年里令世界惊叹,而智能手机的人工智能处理能力每两年翻一番。Arm 始终站在技术前沿,通过其开源软件库不断提升 Arm IP 的机器学习功能,让开发者在处理人工智能和机器学习工作负载时能充分获益。Arm NN 和 Arm Compute Library 已在安卓平台上面向 Google应用开放,目前已拥有超一亿的日活用户,助力开发者优化运行在 Armv9 CPU 和 Arm GPU 的机器学习工作负载。
所有新 CPU 均支持 64 位计算和 Armv9 安全创新功能,能够抵御更高级别的数字威胁。通过 Armv9 CPU,Arm 在整个移动生态系统中持续成功部署 Arm 内存标记扩展 (MTE) 功能,以消除占所有软件漏洞高达 70% 的内存安全漏洞。
Chris Bergey指出,Arm 在十年前就开始陆续将 64 位处理器推向市场,从 32 位向 64 位计算的过渡期是一个缓慢的过程,而Arm相信只有 64 位才是正确的方向,在去年的 TCS22 中提供的 IP 以及今年的 TCS23 的 IP 已经说明了这一点。
Chris Bergey强调,仅支持 64 位不光保证了更高的性能,也进一步夯实了计算安全。在中国的顶级应用商店中,排名前 3,000 位的应用都是 100% 的兼容 64 位。所以,从Arm的角度看,作为一个面向广泛市场应用的IP供应商,Arm仍然在处理器核心提供 32 位的支持,面向诸如物联网及更小型的计算平台的应用。
移动设备已经触及到当今数字生活的方方面面,使每个人得以创作并使用由人工智能加速的沉浸式体验,由此也催生了对计算能力的更多需求。而 Arm 正是这一切的核心,为更广大的人群带来不可胜数的乐趣、生产力与成就。Arm 将持续构建基础平台,以满足不断增长的计算需求,并始终专注于性能和效率的提升。通过与广泛的生态系统伙伴保持密切的合作,Arm 为每一代消费级设备提供所需的性能、效率和智能支持,助力拓展数字生活方式。
“TCS23的发布对于Arm来说是一个非常重要的时刻。在这一重要的时刻,非常高兴能够有这么多中国媒体的参与。我们对我们的工程团队所创造的东西感到非常兴奋,我相信它为 Arm 的合作伙伴生态系统提供了机会,包括芯片供应商和手机 OEM。同时,我们还将我们对于性能和安全的承诺扩展到了在 Arm 架构上进行开发的 900 万移动开发者。”Chris Bergey说。