随着大模型参数规模持续攀升,AI训练与推理对底层算力基础设施提出更高要求。在万亿参数模型与多模态AI快速发展的背景下,超大规模智算集群正成为产业竞争的核心基础能力。然而,传统电交换架构在带宽、功耗、时延及跨机柜扩展能力方面的瓶颈日益凸显,新一代高性能、高能效、可扩展的AI基础设施正加速成为全球产业关注焦点。
在此背景下,光互连、液冷、高密度GPU超节点等技术路线正加速走向产业化。近日,国产GPU厂商壁仞科技联合上海仪电、曦智科技、中兴通讯正式发布光跃超节点128卡商用版(LightSphere 128),标志着国产光互连光交换GPU超节点方案正式迈入规模商用阶段。
据了解,该方案已实现数千卡规模部署,成为国内率先实现规模化商用的光互连光交换GPU超节点解决方案之一。
从技术架构来看,光跃超节点以曦智科技全球首创的硅光OCS光交换芯片为核心,搭载壁仞科技自主原创架构的大算力通用GPU液冷模组“壁砺™166L”,并集成中兴通讯高性能AI服务器及自研软件平台,构建起覆盖芯片、服务器、互连与调度系统的全栈国产智算集群方案。
其中,光跃超节点搭载壁仞科技“壁砺™166L”自主原创架构大算力通用GPU液冷模组。该模组单卡BF16算力,通过多计算芯粒(Chiplet)与CoWoS 2.5D先进封装协同设计,搭配革新载板互连技术,实现超高密度算力输出。同时,高效的液冷方案显著提升超节点的能效比与系统稳定性,为大规模智算集群建设构筑强大、安全、可靠的算力底座。
目前,光跃超节点128卡商用版已成功适配DeepSeek、MiniMax、Kimi、GLM及阶跃星辰Step系列等主流大模型。官方数据显示,在训练DeepSeek V3 671B模型过程中,其训练性能较传统非超节点集群显著提升,模型切换延迟降低至微秒级,传输延迟降低90%以上,并已实现长期稳定训练运行。
在商业化层面,依托BR106与BR166的全形态量产能力,壁仞科技已交付多个千卡级GPU集群项目,并在国家级算力平台及电信运营商等核心场景完成落地验证。同时,公司持续推进下一代BR20X系列及超节点方案研发,强化在大模型训练与推理时代的系统级竞争力。
值得关注的是,在国产AI算力需求持续释放的背景下,壁仞科技商业化能力同步提升。公司2025年营业收入达到10.35亿元,同比增长207.2%,毛利率提升至53.8%;截至2025年末,在手订单规模超过12亿元。随着BR106、BR166等核心产品实现规模化交付,公司已完成从芯片研发向大规模算力基础设施落地的关键跨越。
业内普遍认为,随着AI模型参数规模持续增长,万卡级智算集群正逐渐成为行业主流发展方向,而光互连技术有望成为下一代AI基础设施的重要演进路径。光跃超节点128卡商用版的落地,也意味着国产GPU超节点方案正从技术验证阶段,迈向真实业务场景的大规模应用阶段。
5月27日至29日,第十届集微大会将在上海举行。作为核心论坛之一的“AI赋能峰会”将于27日大会首日重磅启幕。届时,壁仞科技AI框架架构副总裁丁云帆将发表《基于光互连GPU超节点打造国产万卡集群》主旨演讲,系统分享公司在相关领域的技术沉淀、量产落地经验与成熟行业解决方案,研判产业发展趋势,为行业协同发展提供前沿观点与实践参考。
集微大会被誉为中国半导体产业“风向标”。据悉,第十届集微大会将进行多维升级,参会规模与活动规格创历届新高,预计吸引来自产业界、政府及高校超过7000位嘉宾参与。本届大会以“AI重构未来、生态协同致远”为主题,聚焦AI算力、端侧AI、先进封装、EDA/IP、存储及产业投资等方向,持续推动产业链协同与生态融合。(校对/孙乐)