光互连超节点加速落地，壁仞科技推动国产万卡集群进入商用时代

作者：张杰 05-21 17:08

来源：爱集微 #壁仞科技#

1.8w

随着大模型参数规模持续攀升，AI训练与推理对底层算力基础设施提出更高要求。在万亿参数模型与多模态AI快速发展的背景下，超大规模智算集群正成为产业竞争的核心基础能力。然而，传统电交换架构在带宽、功耗、时延及跨机柜扩展能力方面的瓶颈日益凸显，新一代高性能、高能效、可扩展的AI基础设施正加速成为全球产业关注焦点。

在此背景下，光互连、液冷、高密度GPU超节点等技术路线正加速走向产业化。近日，国产GPU厂商壁仞科技联合上海仪电、曦智科技、中兴通讯正式发布光跃超节点128卡商用版（LightSphere 128），标志着国产光互连光交换GPU超节点方案正式迈入规模商用阶段。

据了解，该方案已实现数千卡规模部署，成为国内率先实现规模化商用的光互连光交换GPU超节点解决方案之一。

从技术架构来看，光跃超节点以曦智科技全球首创的硅光OCS光交换芯片为核心，搭载壁仞科技自主原创架构的大算力通用GPU液冷模组“壁砺™166L”，并集成中兴通讯高性能AI服务器及自研软件平台，构建起覆盖芯片、服务器、互连与调度系统的全栈国产智算集群方案。

其中，光跃超节点搭载壁仞科技“壁砺™166L”自主原创架构大算力通用GPU液冷模组。该模组单卡BF16算力，通过多计算芯粒（Chiplet）与CoWoS 2.5D先进封装协同设计，搭配革新载板互连技术，实现超高密度算力输出。同时，高效的液冷方案显著提升超节点的能效比与系统稳定性，为大规模智算集群建设构筑强大、安全、可靠的算力底座。

目前，光跃超节点128卡商用版已成功适配DeepSeek、MiniMax、Kimi、GLM及阶跃星辰Step系列等主流大模型。官方数据显示，在训练DeepSeek V3 671B模型过程中，其训练性能较传统非超节点集群显著提升，模型切换延迟降低至微秒级，传输延迟降低90%以上，并已实现长期稳定训练运行。

在商业化层面，依托BR106与BR166的全形态量产能力，壁仞科技已交付多个千卡级GPU集群项目，并在国家级算力平台及电信运营商等核心场景完成落地验证。同时，公司持续推进下一代BR20X系列及超节点方案研发，强化在大模型训练与推理时代的系统级竞争力。

值得关注的是，在国产AI算力需求持续释放的背景下，壁仞科技商业化能力同步提升。公司2025年营业收入达到10.35亿元，同比增长207.2%，毛利率提升至53.8%；截至2025年末，在手订单规模超过12亿元。随着BR106、BR166等核心产品实现规模化交付，公司已完成从芯片研发向大规模算力基础设施落地的关键跨越。

业内普遍认为，随着AI模型参数规模持续增长，万卡级智算集群正逐渐成为行业主流发展方向，而光互连技术有望成为下一代AI基础设施的重要演进路径。光跃超节点128卡商用版的落地，也意味着国产GPU超节点方案正从技术验证阶段，迈向真实业务场景的大规模应用阶段。

5月27日至29日，第十届集微大会将在上海举行。作为核心论坛之一的“AI赋能峰会”将于27日大会首日重磅启幕。届时，壁仞科技AI框架架构副总裁丁云帆将发表《基于光互连GPU超节点打造国产万卡集群》主旨演讲，系统分享公司在相关领域的技术沉淀、量产落地经验与成熟行业解决方案，研判产业发展趋势，为行业协同发展提供前沿观点与实践参考。

集微大会被誉为中国半导体产业“风向标”。据悉，第十届集微大会将进行多维升级，参会规模与活动规格创历届新高，预计吸引来自产业界、政府及高校超过7000位嘉宾参与。本届大会以“AI重构未来、生态协同致远”为主题，聚焦AI算力、端侧AI、先进封装、EDA/IP、存储及产业投资等方向，持续推动产业链协同与生态融合。（校对/孙乐）