思必驰:接入DUI平台,让IoT智能语音互联互通

文章转载来源:我爱音频网

2019年,5G的火热加速了智能时代的进程,智能语音的应用也使得人机交互的方式开始发生改变,基于此,智能语音也突破了传统的模式,积极提升自身自主研发能力,在提供自然语言交互解决方案的同时,也不断丰富后端服务资源,满足用户的多样化需求,为智能产品赋能。

而思必驰作为国内领先的对话式人工智能平台公司,在智能领域里面是全链路,从前端识别,到ASR,再到NLP,再到TTS,提供完整的智能语音的一套整体的算法和解决方案。

在2019(夏季)中国智能音频产业高峰论坛上,来自思必驰的王盱林先生发表了关于《智能语音在IoT产品的落地应用》的演讲。

sibi070201

以下为演讲实录,经我爱音频网编辑整理:

思必驰目前已经打通了全链路对话技术,深化软硬结合,借助DUI平台推进定制规模化,通过全渠道智能客服方案与虚拟助理机器人提供交互式信息服务,实现产品快速落地。

sibi070202

思必驰:深耕车载与IoT

sibi070203

思必驰业务分成两大块,第一块车载,第二块IoT。

车载包括前装和后装。我们在前装市场发力,汽车前装产品研发上市周期两到三年,甚至更长,我们基于这个,在整个的互联网汽车这块都有在合作,比如小鹏汽车、哈佛带的智能语音系统都是用的思必驰。在后装市场75%左右跟思必驰是相关的。

sibi070204

IoT的范畴除了车载以外,一般了解到的消费类电子涉及到语音的都归在IoT,包括智能音箱。目前来讲,我们在IoT分成六条产品线,服务到行业。

sibi070205

思必驰从技术到服务,推动智能语音在IOT产品的落地应用。在智能音箱领域,思必驰针对无屏/有屏的智能音箱设备,提供软硬一体化的语音交互解决方案,支持单麦/双麦/四麦/六麦等多种阵列,远场交互更方便

详解思必驰IoT的战略布局

思必驰在IoT领域专注方向主要为:第一个智能音箱,第二个TV类。

sibi070206

智能音箱、中枢控制面板

智能音箱,还有比较火热的中枢控制面板,基于大家谈智能家居概念,有些人把智能音箱作为智能家居控制中枢的定义。随着行业往前发展,也会衍生出来一些其他产品,比如大家会看到的一些控制面板。思必驰已经在这一领域拥有成熟的方案与成品案例。

智能儿童陪伴型的机器人

以故事机为例,中国的消费者对智能语音对话期望值很高,对于儿童使用时又有很多限制级或者不合适的内容一定要做屏蔽,思必驰从2014年就开始对这类产品进行研发布局,我们在行业里面打造的产品已经比较成熟。

彩电TV线

2019年彩电领域带智能远场语音已经成为标配,原来只是在摇控器上内置语音搜索功能,从今年开始所有的电视机厂商一定会具备智能语音功能,头部的几家彩电厂商已经内置思必驰的语音。

家电白电领域

比如空调、冰箱、洗衣机这种产品也会带上,最简单的语音控制类,更多的带一些播播音乐、新闻,在线交互的的语音功能。

智能穿戴

思必驰目前已经在智能穿戴产品进行布局,尤其是智能TWS耳机,直接用语音做操控,我们正在出整个解决方案。

思必驰语音技术优势

sibi070207

思必驰在语音技术方面的优势:远场交互,口语对话,有屏和无屏,第三方信源,技能丰富,数据可视化,还有OTA升级。

sibi070208

远场交互这块,从简单的一米到三米五米,从家居场来讲五米足够了,识别率做到92%以上。第二声源定位,五米的唤醒率,唤醒和识别是不同的概念,识别率在五米达到95%,识别率达到92%。

sibi070209

我们在目前麦克风阵列上面比较成熟或者比较量产化特别好的麦克风阵列,从环形6麦和环形4麦,华为是环形6麦,环形4麦主流比较多。

双麦阵列,线性6麦识别角度来讲,只是阵正向80度做线性的多。基于麦克风阵列有一套白皮书给到合作伙伴,也是我们在这个领域沉淀出来的一些经验。

口语对话在智能语音交互大家觉得有很大麻烦点,比如一个智能音箱交互,要不断的做唤醒式的交互,这种交互不像我们人与人之间的无缝交互。

比如你跟你的朋友在交互,你抬头、正向它知道你在跟交互,目前智能音箱还没有办法做到相对的智能,未来在技术上我们也在进一步用多模态去解决,唤醒以后在某些域里面实现多轮,包括我们也在做全双通一的技术解决掉目前智能音箱交互不够良好的问题。

包括声纹,未来会实现内容的千人千面,比如一台智能音箱成人交互和接入的内容,儿童使用时听到的语音需要区分,这块我们会慢慢做到千人千面,结合内容去推荐。

sibi070211

比如唤醒词,如果唤醒要求不高的话,我们有通用型,这个唤醒率70%、80%。如果你要唤醒率比较好,做一定的定制化,我们要用专门的设备做定制化录音。

同时,合成音,比如林志玲、郭德刚这种,有些企业也会用专属的,比如跟一汽合作的车载类,请了企业代言人的声音做播报声音,这块我们可以对合成音做定制化。包括方言相应的对话定制。

还有一个对话定制,我们基于这个在专属领域,有些产品会话精灵,智能客服,专对于销售和服务问答有一些定制化,根据定制化场景,比如卖家电卖消费的产品问的同样的问题,答的答案肯定不一样,我们根据产品做一些定制化。

sibi070212

我们会做无屏和有屏从识别模型、唤醒模型,再到每次打通和交互。目前接入的技能可以看到,比如音乐涵盖了音乐,新闻、教育,甚至健康类的东西,这些接入通过语音语义已经打通。

sibi070213

智能音箱目前来讲会成为家居的一个控制中枢,大家都在讲万物互联网核心的问题是所有的很多企业都在做自己的标准,连通这个事情是显得特别难,目前来讲,我们已经打通主流的十几家的物联网的协议,比如接入创维消费电子音响产品,苏宁平台产品,将来使用思必驰语音,我们这个技术直接可以控制相关的产品。

技能上我们有200多个技能接入,我们建立了一个DUI平台,只要做勾选,这些技能直接在你的产品上直接能做交互,通过思必驰语音做交互。

sibi070214

万物互联,我们通过物联网协议接入打通,未来在控制整个智能家居我们作为一个中间产品,像智能音箱、中控面板都可以中国控制中枢控制连产品。这是带屏的,接入爱奇艺主流的视频APP已经接入完。

sibi070215

专属领域的一些知识技能的服务,比如健康、医疗、教育,这些专属类你提的同样的问题得到的答案肯定是不一样,我们在专属领域,跟房地产商做定制化,跟用户管理、产品推荐有关系,包括银行类同样有些资讯不一样,我们会做到一些专属域的内容,打造个人或者企业级私域。

sibi070216

另外基于我们客户品牌商对用户数据管理,对于用户的语音类我们进行用户画像,这些数据我们也会提供给到客户。

在隐私管理方面,核心用户它的数据不能被公布,这个时候企业可以部署私有云,所有的用户数据停留在企业自己,这样能够有效的保护用户隐私。

sibi070211

OTA升级比较简单,我们不是简单做完交互,我们对整个算法模型做优化会保持持续的升级。

sibi070217

我们对于一些企业级的,比如类似像华为、OPPO、阿里,对用户的保护相对比较高,我们会跟它部署私有云的形式,包括所有用户行为在它企业私有云上面。

包括软的SDK的输出,包括全链路方式和链路的拆解方式我们都可以接受合作,我们会跟合作伙伴一起分析。

刚才也讲到跟软硬结合,同时输出这种方案,比较成熟的在儿童类产品,还有在白电控制面板,离线只需要二三十个控制池,通过语音做控制,这个对成本要求比较高一点。还有在线的控制面板要求,我们有软硬一体的解决方案。

我们对需要解决完整解决方案,包括产品解决方案,我们在智能音箱产品上也会有成熟的输出。合作方式有商务对接,跟售前解决相应的问题。

未经允许不得转载:数智网 » 思必驰:接入DUI平台,让IoT智能语音互联互通

分享到: