离线芯片+NLP方案 探境给出的端侧语音最优解

来源:爱集微 #探境科技#
3.9w

每一个时代都有一种占主导地位的交互方式,人类的生产及生活方式也因此被改变。

未来十年我们的生活将变成什么样子? 尽管众多科技公司的技术演进方式并不相同,但语音交互一定是绕不开的命题。

自1952年AT&T贝尔实验室研发的语音识别系统Audry算起,语音已在科技史上历经了70年的变革,语音方案也渐渐从云计算中心向边缘端下沉。

当时间的飞轮驰入2022年,语音又将给出什么样的惊喜?

离线NLP,这是探境科技给出的答案。离线NLP(Natural Language Processing,自然语言处理),或称端侧NLP技术,是不依赖云端算力,通过端侧芯片来实现自然语言理解的方案。探境科技CEO鲁勇坚信:随着AI语音模型的轻量化,以及端侧芯片算力的逐步提高,AI语音最终将全部以分布式部署到终端设备上。

离线 NLP 即普世,又普适

尽管语音成为 IoT 设备的交互标配是大势所趋,但从现实来看,在各式各样名目繁多智能音箱在不断的“教育和打磨”市场后,AI语音的智能家居并未如设想一般进入寻常百姓家。

这主要由于传统实现语音支持主要通过云端来实现,配置维护难度极高,如Wi-Fi经常断网、下载各类APP、要进行各种繁琐操作等,复杂程度让人望而却步,用户不愿意花精力去学习。

 “所有的高科技一定是要化繁为简,家电应该以人为中心,越智能的家电,用起来就应该越简单、那些让人望而生畏的家电,只适合被敬仰,不适合被使用。”鲁勇解读说。“想要翻越用户体验这座大山,必须解决传统配置方式带来的市场端问题。”

与之相比,离线语音方案则无需依赖云端技术,可以直接在本地语音控制家电产品,并且不需要其它额外的操作,即插即用,拥有更快的响应速度和更好的隐私保护,与云端相比,更符合原有家电使用习惯,属于更为普世的“百姓智能”。

如果说AI语音从在线到离线是一大跃迁的话,那从离线到离线NLP则是另一个层面的飞跃。离线NLP让自然语义从云端下移到了端侧,用户与家电之间的交互就像日常对话,既操作简单,又交互自然。离线NLP在应用层面给到用户更普适体验的同时,也势必会加速其在国内家电市场落地的脚步。

此外,将语音处理放在端侧,对于家电厂家而言,从搭建并运营一套复杂的云端系统,变成了元器件级别的改造,直接从生产端切入,降低了产品间的转换成本,这也是鲁勇对于离线NLP落地前景看好的底气之一。

芯片和算法 咬合紧密的双轮 NLP 引擎

越易用的产品,内核往往越复杂。

离线NLP方案的挑战在于要低功耗情况下保持高性能、低成本,减少由于环境复杂和模型压缩带来的精度损失。这对于技术层面的考验有两个:一方面在芯片设计时要在低成本的前提下,考虑到算法的需求,包括算力、存储容量等是否满足需求,并且是否有盈余以应对未来的再升级。

另一方面,在算法层面要考虑对深度学习的支持度上是否够广泛,同时根据芯片所能实现的能力进一步优化和整合,保持原信息处理能力的轻量化算法重新构建能力。

这就需要在底层芯片与高精度算法间腾挪跌宕,进行软硬协同的全面整合,才能实现两者间的高度耦合。

探境的离线NLP芯片Voitist721,作为探境性能强劲的三核AI芯片,集成NPU、DSP和CPU三核,并且实现了对算法模型的端到端支持。

探境Voitist721语音芯片

此外,支撑端到端的 NLP意味着不用局限于人为设计的数量有限的关键词,而是依靠知识图谱和基于注意力机制的深度学习算法,挖掘出自然语言表达中所蕴含的信息,以适应更为灵活的表达方式和更为广泛的落地场景。

照明领域NLP知识图谱示例

要想在离线NLP领域构筑全新价值,需要做到以下两点,一是语义识别的广泛度,二是更高的准确度。

这就需要在算法模型下足功夫,“深挖洞,广积粮”,探境的算法模型工业化生产平台,是终端智能落地应用的强有力支撑,能够有效解决远场识别、误唤醒率、噪声干扰、地域口音、词语泛化等核心用户体验痛点,其基于统一数据管理系统的采集、训练、测试三大系统平台整体联动,快速响应能满足批量化发布的业务需求。

据鲁勇透露,探境NLP算法今年上半年就已经研发成功,并且凭借超强的人机交互能力,让多个头部客户的眼前一亮,从而获得了进一步打开离线AI语音市场的新“钥匙”。

正在形成的正反馈

不止是技术要“探路”,市场也更是循序渐进式的。

“智能家居市场的需求是碎片化的,每个公司每个品牌都有不同的利益诉求,我们的做法是先做出一些爆款,在市场打响,相当于走到市场中教育了一部分用户,然后用户反馈来拉动更多厂家的加入,慢慢形成正反馈,从而达到反哺这一行业的目的。”鲁勇对离线NLP应用充满信心。

“从目前来看,灯具、空调、窗帘、风扇等应用的接受度都在肉眼可见的扩大,许多头部的大客户开始逐步进入批量出货阶段,这也意味着市场在真正起势。”鲁勇的话语透露出一股自豪。

探境科技合作伙伴包括美的、海尔、松下、欧普、奥克斯等知名厂商,从0到1的突破之后,从1到100也变得顺理成章。探境不仅客户层面形成了规模效应,芯片层面的布局也一一展现,探境拥有更强算力的722芯片已成功点亮,明年年初实现量产,面向超低功耗可穿戴市场的芯片也将面世。

鲁勇表示,今年探境的出货量在几百万片,凭借离线NLP等技术的加持,及多个芯片系列的推出,预计明年销量会实现指数型的上升。

鲁勇认为,家居场景下的智能化可分为三步。第一步是轻智能,赋予电子产品轻量级却实用性很高的语音控制功能,快速将单品智能化推向用户市场。

第二步是重智能,在终端AI芯片上升级更强大的算法,让单品变得更加智能,例如自然语义理解、多模态识别等,无需连接云端,就可以构建一个保护隐私且用户体验更好的智能家居整体场景。

第三步是进一步深化软硬件协同,实现深度智能,构建属于未来的AI产品,包括情感分析、对话、类人机器人等科幻级产品,将AI技术提高并融入生活。

探境的愿景其实很简单:让用户在家居场景下能够实现“想到-说到-做到”的自然交互过程,不必再看那些冗长繁琐的说明书,学习那些复杂的家电操作步骤,实现“有电就有智能化”的体验。

就像科幻电影钢铁侠的贾维斯,用户回到自己家里以后,不需要特意去寻找开关或者遥控器也好,他可以在屋子里的任意一个角落,边走边说,贾维斯把窗帘都打开,给我倒一杯柠檬水,这些设备就开始配合工作起来了。

柯林斯在《从优秀到卓越》提到过飞轮效应,有一个巨大的、无比沉重的轮子,想让它转起来,开始要费很大的劲,但只要你用力的方向正确,一直推下去,轮子会越转越快,到后面,你只要使很少的力,轮子依靠以往积聚的势能就可以转得飞快。

从离线NLP到更高级的深度智能,“飞轮效应”正在向我们驶来。

责编: 爱集微
来源:爱集微 #探境科技#
THE END

*此内容为集微网原创,著作权归集微网所有,爱集微,爱原创

关闭
加载

PDF 加载中...