深耕三大周边场景,炬芯科技端侧AI音频芯片加速AI应用落地

来源:爱集微 #炬芯科技#
5479

“过去一些从未接触过的海外知名品牌,现在主动通过各种方式找到我们,接洽之后很快就达成合作,其中不乏国际一线品牌。如今炬芯科技海外品牌客户的占比也越来越高了,炬芯的目标是成为全球化的专业音频芯片品牌”

近日,炬芯科技董事长兼CEO周正宇博士在接受集微网采访时表示,2024年我们业务的成长态势整体向好,其中一个重要因素是与海外市场的拓展有关,即便是在消费类电子市场缓慢回暖,但是炬芯科技的营收、毛利率、市占率都在持续增长,这个算是我们一个初步的成绩单,也算是我们在国际一线品牌的持续突破所带来的,整体而言还是比较亮眼。

2024年前三季度,炬芯科技实现营收4.67亿元,同比增长24.05%;实现归母净利润0.71亿元,同比增长51.12%;实现扣非净利润0.48亿元,同比增长31.23%;其中,前三季度毛利率达47.13%,第三季度毛利率达48.16%,公司盈利能力明显增强。

“9月份炬芯科技实现了成立以来单月营业额最高的一个月,三季度同样创下了炬芯科技成立以来最高营业额的一个财季。”周正宇博士表示,驱动我们快速成长有三大原因,第一得益于我们国际一线品牌的持续突破,第二是无线低延迟、高音质需求在私有协议音频设备市场份额不断扩大;第三是最重要的——炬芯科技在端侧AI音频产品的应用实现增长。

围绕三大周边场景深耕细作

行业周知,炬芯科技起源于珠海炬力,技术团队以低功耗高音质的音频SoC芯片“见长”,经过20多年的深耕细作与创新,已经成为全球智能音频AIoT芯片领域的佼佼者,产品已经涵盖蓝牙音频SoC芯片系列、便携式音视频SoC芯片系列、端侧AI处理器芯片系列等,广泛应用于蓝牙音箱、无线家庭影院、智能手表、无线麦克风、无线收发 dongle、蓝牙耳机、无线电竞耳机、蓝牙语音遥控器及低功耗端侧AI处理器等领域。

“炬芯科技的产品矩阵从最早的MP3、MP4到无线蓝牙音箱、耳机,到低延迟私有协议无线音频产品,再到如今的端侧AI音频产品,已经实现了多个国际一线品牌的突破。”在周正宇博士看来,炬芯科技的目标是成为全球化视野的专业音频芯片品牌,能够到海外去替代国际知名的芯片品牌,而不只是在国内做国产替代。

截至目前,炬芯已经拥有了超过三百多项全球专利,以及服务超过一百多家品牌,其中除了华为、OPPO、小米、荣耀、realme、TCL、海信、大疆、猛玛等国产品牌外,与JBL、SONY、BOSE、RODE、Vizio、Samsung等国际一线品牌也携手推出终端产品,炬芯科技的产品也受到越来越多全球性的头部品牌认可。

周正宇博士笑称,一些过去从未接洽过的海外知名品牌甚至从未用过中国芯片的品牌厂商还主动通过各种方式找到我们,双方接洽之后很快就达成合作。

而炬芯科技之所以能够快速实现国际一线品牌客户的突破,与其厚积薄发的技术积累之外,更与其精准的产品定位和应用客户群有莫大关系。

从应该场景的战略规划来看,周正宇博士表示,炬芯科技的产品会围绕三大周边应用场景深耕细作,其中第一是手机周边,包括蓝牙音箱、蓝牙耳机、智能手表、无线麦克风等,第二是围绕电视周边的无线家庭影院音响设备和无线K歌设备等,以及电脑周边需要更为专业电竞耳机、手柄、键盘、鼠标产品,这些产品大部分需要低延迟高音质的要求,而这正是炬芯科技的技术优势所在。

从几个周边的产品导入来看,周正宇博士透露,炬芯科技已经成功进入国际三大音频品牌供应链,在以低延迟私有协议为基础的无线麦克风市场已成为主流供应商,另外电视品牌海信、TCL等的无线环绕音箱也用了我们无线音频芯片。

更重要的是,在基于模数混合SRAM存内计算的端侧AI音频芯片三个系列的加持下,炬芯科技有望在端侧AI产品应用方面,实现更为强劲的成长。

端侧AI音频芯片追求极致能效比

随着生成式AI正以前所未有的速度发展,混合AI架构即在云端和边缘终端之间分配并协调AI工作负载也在同步推开,尤其是服务器云端AI的搭建已经逐渐成型,边缘终端AI将会迎来快速的增长。

这对于音频穿戴或者音频便携式产品而言,提升端侧AI体验的挑战和机遇,是如何在每毫瓦功耗上打造尽可能大的算力,而不是简单追求大算力绝对值。以电池供电为基础的便携式音频或者穿戴产品,成功AI化的核心诉求是在低功耗下打造大算力,才能实现更好的AI体验。

周正宇博士表示,在从端侧AI到生成式AI的广泛应用中,不同的AI应用对算力资源需求差异显著,而许多端侧AI应用是专项应用, 并不需要大模型和大算力;尤其是以语音交互、音频处理、预测性维护、健康监测等为代表的AIoT领域。

根据ABI Research预测,端侧AI市场正在快速增长,预计到2028年,基于中小型模型的端侧AI设备将达到40亿台,年复合增长率为32%。到2030年,预计75%的这类AIoT设备将采用高能效比的专用硬件。

由于过去一直专注于低功耗无线音频市场,因此炬芯科技主要关注的端侧AI是对于由电池供电且AI算力要求相对较高的中小型模型端侧AI市场。具体的范围来说,主要覆盖算力要求在0.01-3TOPS之间,存储空间小于10MB,模型参数大小在0.01-10MB之间,功耗小于10mW的目标市场。

周正宇博士介绍称,在这个区间,能让电池续航满足终端运行的需求,实现最佳能效比是最重要的;超大算力超大模型不是炬芯科技的追求,而在合理的模型和算力要求下,续航能力关键,同时成本不能过高,才是让端侧AI快速变为现实的关键。因此周正宇博士提出的 “Actions Intelligence”是针对电池驱动的端侧AI落地提出的战略,将聚焦于模型规模在一千万参数(10M)以下的电池驱动的低功耗音频端侧AI应用,致力于为低功耗AIoT装置打造在10mW-100mW之间的功耗下提供0.1-1TOPS的通用AI算力。

而现有的通用CPU和DSP解决方案虽然有非常好的算法弹性,但是算力和能效远远达不成上述目标。要知道在传统构架下芯片性能提升逐渐达到极限,冯·诺依曼架构已成为发展芯片算力的桎梏,存内计算Computing-in-Memory(简称CIM)作为一种新型计算架构,其核心思想是将部分或全部的计算移到存储中,让存储单元具有计算能力,数据不需要单独的运算部件来完成计算,而是在存储单元中完成存储和计算,消除了数据访存延迟和功耗,是一种真正意义上的存储与计算融合。同时,由于计算完全依赖于存储,因此可以开发更细粒度的并行性,大幅提升性能尤其是能效比。

机器学习的算法基础是大量的矩阵运算,适合分布式并行处理的运算,存内计算非常适用于人工智能应用。

于是,炬芯科技创新性的采用了基于模数混合设计的电路实现存内计算(Mixed-Mode SRAM based CIM,简称MMSCIM)技术,在SRAM介质内用客制化的模拟设计实现数字计算电路,既实现了真正的CIM,又保证了极致能效比。

据介绍,目前炬芯的模数混合SRAM存内计算方案已经能够实现近10TOPS/W的高能效表现,即在1TOPS算力下,功耗仅100mW。未来炬芯希望继续朝着100TOPS/W的能效表现迈进。此外,由于无需进行数据搬运,SRAM存内计算也可以带来更低的延时表现。

周正宇博士称,炬芯科技基于模数混合SRAM存内计算芯片是追求极致的能效比和算力之间的平衡追求,来定义产品在不同算力和模型中实现极致的应用。

端侧AI音频芯片即将出货

基于MMSCIM技术架构的端侧AI音频芯片,由于减少了在内存和存储之间数据传输的需求,它可以大幅降低延迟,显著提升性能,有效减少功耗和热量产生。对于要在追求极致能效比电池供电IoT设备上赋能AI,在每毫瓦下打造尽可能多的AI算力,炬芯科技采用的MMSCIM技术或将是实现端侧AI落地的最佳解决方案之一。

目前,炬芯科技已经面向电池驱动的低功耗IoT领域成功落地了第一代基于模数混合电路实现的SRAM based CIM在500MHz时实现了0.1TOPS的算力,并且达成了6.4TOPS/W的能效比。基于此核心技术的创新,炬芯科技已经打造出了下一代低功耗大算力、高能效比的端侧AI音频芯片平台。

据介绍,炬芯科技新一代基于MMSCIM端侧AI音频芯片,共三个芯片系列:第一个系列是 ATS323X,面向低延迟私有无线音频领域;第二个系列是ATS286X,面向蓝牙AI音频领域;第三个系列是 ATS362X,面向AI DSP领域。

这三个系列芯片均采用了CPU(ARM)+ DSP(HiFi5)+ NPU(MMSCIM)三核异构的设计架构,炬芯的研发人员将MMSCIM和先进的HiFi5 DSP融合设计形成了炬芯科技“Actions Intelligence NPU(AI-NPU)”架构,并通过协同计算,形成一个既高弹性又高能效比的NPU架构。在这种AI-NPU架构中MMSCIM支持基础性通用AI算子,提供低功耗大算力。同时,由于AI新模型新算子的不断涌现,MMSCIM没覆盖的新兴特殊算子则由HiFi5 DSP来予以补充。

此外,周正宇博士还对炬芯科技MMSCIM路线有明确规划,从路线图中显示:

炬芯科技第一代(GEN1)MMSCIM已经在2024年落地,GEN1 MMSCIM采用22 纳米制程,每一个核可以提供100 GOPS的算力,能效比高达6.4TOPS/W @INT8;到 2025 年,炬芯科技将推出第二代(GEN2)MMSCIM,GEN2 MMSCIM采用22 纳米制程,性能将相较第一代提高三倍,每个核提供300GOPS算力,直接支持Transformer模型,能效比也提高到7.8TOPS/W @INT8;到 2026 年,推出新制程12 纳米的第三代(GEN3)MMSCIM,GEN3 MMSCIM每个核达到1 TOPS的高算力,支持Transformer,能效比进一步提升至15.6TOPS/W @INT8。

以上每一代MMSCIM技术均可以通过多核叠加的方式来提升总算力,比如MMSCIM GEN2单核是300 GOPS算力,可以通过四个核组合来达到高于1TOPS的算力。炬芯科技也借此踏出了打造低功耗端侧AI算力芯片的良好开端。

周正宇博士透露,炬芯科技的端侧AI音频芯片ATS323X已经在客户端进行导入验证,预计在今年上半年实现产品落地。未来,炬芯科技将继续加大端侧设备的边缘算力研发投入,通过产品迭代实现算力和能效比进一步跃迁,提供高能效比、高集成度、高性能和高安全性的端侧AIoT芯片产品,推动AI技术在端侧设备上的融合应用,助力端侧AI生态健康、快速发展。

责编: 邓文标
来源:爱集微 #炬芯科技#
THE END

*此内容为集微网原创,著作权归集微网所有,爱集微,爱原创

关闭
加载

PDF 加载中...