剑指2000 Tokens/s!北大系流式推理芯片黑马寒序科技融资数千万元

来源:爱集微 #寒序科技# #推理芯片# #融资#
1207

近期,专注超快流式推理芯片的国内北大系创业公司寒序科技宣布完成数千万元融资,投资方为启高资本、赛意产业基金,源合资本担任独家财务顾问。蛰伏两年后,该公司首颗芯片样片回片测试全面跑通,核心硬指标单位面积带宽达100 GB/s/mm²,其采用片上存储权重的流式高带宽架构,摒弃硬件调度,专注解决大模型推理的带宽受限问题,与Groq核心理念相近但单位面积权重存取能力更具优势。

资料显示,寒序科技成立于2023年8月,致力于开发超大带宽、确定性流式大模型推理芯片,目前已完成四轮融资,核心目标是为实时AI应用提供基础设施,破解大模型推理中的核心难题。

寒序科技核心创始团队源自北京大学磁学中心,擅长底层新型存储器与存算架构融合。该公司下一代芯片将采用首创的“MRAM+SRAM”混合存储架构,兼顾速度与存储密度,目标性能直指2000 Tokens/s,有望解决Groq纯SRAM方案存储密度低、成本功耗高的短板,满足具身智能、实时同传等场景的低延迟需求。

当前,大模型算力焦点已向推理倾斜,寒序科技的技术路线避开GPU架构缺陷,通过架构创新突破“内存墙”,成为国产推理芯片突围的重要力量。随着Agent、具身智能的落地,推理芯片的性能、能效比需求提升,为垂直创新企业提供了发展空间。


责编: 李梅
来源:爱集微 #寒序科技# #推理芯片# #融资#
THE END

*此内容为集微网原创,著作权归集微网所有,爱集微,爱原创

关闭
加载

PDF 加载中...