中科曙光发布新一代通用高性能计算平台 全国产百核CPU打造

来源:爱集微 #曙光# #CPU#
616

6月15日,中科曙光发布新一代通用高性能计算平台。该平台以国产百核级通用CPU为核心,面向科学与工程计算等对精度要求极高、计算复杂度极高的通用计算场景,通过“算存网”全栈协同优化,整体规格首次达到国际厂商旗舰级水平,实现了国产通用计算性能的历史性突破。

中科曙光今年以来动作频繁:3月12日发布scaleFabric 国产400G原生RDMA高速网络;3 月26日发布scaleX40 世界首个无线缆箱式超节点;4月郑州国产6万卡级超智融合集群投用;5月13日发布高端全闪存存储系统FlashNexus 9000。通过“算—存—网”三个方向的整体发力,实现系统级突破。此次新一代高性能通用计算平台的发布将进一步完善中科曙光的算力产品矩阵。

算、存、传全栈优化

根据中科曙光高端计算总工程师李建军的介绍,本次中科曙光本次发布的新一代通用计算平台有两个核心特点:第一,搭载首个国产10T级通用CPU(128核、单CPU FP64双精度算力10T),相较当代平台,HPL双精度浮点相对性能提升近2倍,STREAM访存性能提升近1倍,比肩国际同类高端产品。第二,采用算、存、传一体全栈优化方法。计算层引入BurstBuffer缓存加速与SocketDirect通信优化技术,进一步释放CPU算力;存储层搭载ParaStor F9000,实现端到端无阻塞I/O;网络层基于自研scaleFabric高速交换机,端到端时延低至0.93μs(其中交换机转发延时仅 260 ns),单子网支持11.4万卡组网,从根本上破解大规模并行场景下的“通信墙”问题;结合HPC-Kit基础软件库,在编译优化、数学库优化、MPI通信库增强等多个环节实现系统级协同优化,从而提升整体计算效率。

本次发布的计算平台提供风冷、冷板液冷、浸没液冷三种散热形态的计算节点。其中,2U风冷标准双路机架式服务器H620G59,单节点可提供20TFLOPS算力,性能强劲,配置灵活;冷板式高密计算柜TC800 G6,单柜实现P级计算能力,PUE低至1.08;浸没式超高密计算柜TC8600H G5则采用第三代浸没相变液冷技术,最高支持80000+ CPU核心部署,PUE进一步降至1.04。

从风冷、冷板液冷到浸没式液冷,不仅意味着散热方式升级,更意味着国产高性能计算平台正在形成覆盖不同规模场景的完整工程化能力,为用户带来的不只是“省电”,更是可靠的系统收益。高密部署能力、长期稳定运行能力以及更低运维成本,正在让国产超算从“可用”逐渐走向“更好用”。

支撑科研工程计算6大场景

当下以GPU为核心的AI算力备受关注,为何中科曙光推出以CPU为核心的通用高性能计算平台?李建军指出,尽管AI算力的建设备受关注,但传统CPU计算需求一直存在,而且需求还十分旺盛。特别是科研机构与工业企业对于超智融合算力的需求正呈现出爆发式增长的态势。一方面利用AI提升模型训练与推理效率,另一方面依赖高性能计算平台完成复杂科学问题求解。很多用户算法是无法迁移到GPU上的(如Fortran语言无法在GPU运行)。

目前,中科曙光新一代通用高性能计算平台已覆盖地球科学(天气预报、气候模拟)、工业设计制造(仿真,如大飞机、轮船、汽车)、能源勘探(找石油,爆炸分析)、物理化学材料(新材料筛选)、生命科学(蛋白质分析、新药研发)、集成电路(电磁仿真)等六大行业。这些场景无论并行规模、商业软件依赖还是逻辑判断运算,都需要CPU处理。虽然业界也在用GPU加速,但仍有大量场景因复杂逻辑和生态依赖而需要CPU。

未来科学研究既需要高精度科学计算能力,也需要低精度智能计算能力,数学模型与数据模型将形成深度互补,高精度与低精度算力协同运行。因此,中科曙光开发以CPU为核心的通用高性能计算平台既有市场需求,又有其产业意义。

基于国产通用CPU性能均衡突出

随着人工智能进入智能体AI阶段,当前的AI应用场景正从传统的大模型训练、被动推理,转向海量轻量化、高并发、自动化的智能体作业。不同于传统AI场景中GPU主导算力输出的格局,智能体的自主规划、工具调用、任务编排、持续迭代全链路,均需要 CPU 完成核心调度与执行,CPU的重要性在智能体时代被重新认识。

科学与工程计算领域对CPU的性能又有哪些不同的需求?李建军指出,不同场景确实有着不同的需求。整体而言,六大场景都需强大的算力,但有的偏访存密集型(CPU到内存性能更好),有的是计算密集型。例如,生命科学需要更好的并行化能力和更多核心线程;材料领域需要特定指令集(如AVX512)。

此次,中科曙光发布的通用高性能计算平台基于国产通用CPU,不挑场景,各方面表现都很突出:128核、多线程、AVX512指令集、访存性能(支持6400速率,国产最高,与国际主流一致)。性能均衡,可以满足不同场景的需求。

责编: 张轶群
来源:爱集微 #曙光# #CPU#
THE END

*此内容为集微网原创,著作权归集微网所有,爱集微,爱原创

关闭
加载

PDF 加载中...