数智评测室丨语音生态系统构筑者,科大讯飞魔飞麦克风深度评测

[导读] 科大讯飞作为国家四大人工智能创新平台,拥有中文智能语音最前沿的技术实力,正在引领AIoT时代将语音产业推向新高潮,讯飞在AI领域全面的技术积累和引领示范,可以轻松支撑智能家居领域的市场需求。

评测工程师/Zorro

科大讯飞作为国家四大人工智能创新平台,拥有中文智能语音最前沿的技术实力,正在引领AIoT时代将语音产业推向新高潮,讯飞在AI领域全面的技术积累和引领示范,可以轻松支撑智能家居领域的市场需求。

随着5G+AIoT时代来临,语音交互成为人机交互最理想的实现方式,智慧家居语音需求逐渐成为大众化交互入口,为了将最优质的语音能力赋能给行业内的合作伙伴,缔造的魔飞麦克风成为科大讯飞智能家居生态系统的软硬件连接窗口。

严格意义上,科大讯飞魔飞虽然是成品但并不是终端产品,而是科大讯飞满足智慧家居语音需求的集大成者,具体来说是将讯飞前端语音核心技术的交互成果,延展到IoT成品硬件形态中,魔飞麦克风的使命是实现智慧家居领域的语音交互+AIoT+连接,给用户提供最好交互的感知与体验。

基于讯飞MORFEI智能麦克风提供的整套解决方案能力,打造出MORFEI LINK生态基因拥有强大的AI计算与连接能力,不仅整合至各种智能家居硬件形态中,实现家居语音控制的革命性提升,同时基于连接能力,实现上百家优质品牌间互联互通的连接能力。

人机语音交互——人类的交流方式

语音的精妙之处,在于直接穿透多层应用,一句直达。人机交互中,90%的信息输出依靠语音、80%的信息通过视觉交互,相比较为流行的APP触摸控制,语音交互体验突破空间限制,交互上不仅无界面式高效快速,而且老少皆宜普及率极高。随着AI语音人性化的自然塑造,更加促进人机情感上的细腻交流,让控制体验更和谐、真实与自然。

任何自然的交互必须要有硬件为载体,MORFEI智能麦克风是科大讯飞为开发者匠心打造的第一款语音交互硬件成品开发平台,旨在让人工智能交互能力接入产品、系统更便捷,让硬件领域接入AI能力的效率产生飞越式提升。简单来说,讯飞就是将最优秀的中文人机语音交互技术,装进硬件产品形态魔飞麦克风中,然后通过技术与产品持续打磨,实现超高标准的智能交互体验,在行业内树立最高语音产品标杆。

魔飞的里程碑

早在2015年的智能硬件热潮下,随着AI技术的发展,许多智能硬件都想要获得远场语音交互的能力,于是科大讯飞便在2015年3月份推出了麦克风阵列系列产品,开始将远场语音能力赋能硬件。随后为了满足业界对AI能力的深度需求,科大讯飞又在2016年6月推出AIUI开放平台,并推出配套的芯片与模组,以供行业客户选择使用。

如今从1.0到2.0再到超级魔飞麦克风,已经走过三个版本。随着AI的进一步引爆,不少厂商想要快速获得AI的能力,但自身又没有太多技术积淀,所以针对此类需求,科大讯飞于2017年6月正式推出成品级解决方案魔飞智能麦克风1.0版本。

伴随着智能音箱在国内的火热,2017年智能家居又迎来一波发展浪潮,此时智能家居厂商希望获得AI+IoT的解决方案能力,讯飞又应运构建IoT的连接能力,并于2018年5月推出魔飞智能麦克风2.0,提供AIoT的整体解决方案能力。

MORFEI的能力

讯飞智能硬件平台是科大讯飞消费者BG下的一块重要业务,以加速讯飞AIoT应用服务为目标,面向创新单品和智能家居场景,构建云端一体化、软硬一体化、技术服务一体化的解决方案,扮演着将AI+IoT能力落地的重要角色,其中MORFEI魔飞智能家居生态又是讯飞智能硬件平台的关键一部分。
魔飞因为依托于讯飞开放平台,所以拥有丰富的资源库以及强大的自定义功能,开发者可以在麦克风成品的基础上快速对接硬件,连接AIUI开放平台的各种技能和语义,让魔飞麦克风更加具有更强的场景适应性与用户需求的定制性。

拆箱——网红级黑科技产品

外包装盒侧面视角特写

魔飞麦克风是业界首款集成降噪、识别、语义等功能的双环八麦克风阵列成品级解决方案。

纸质保护套,外包装盒和内包装盒

外包装盒和内部侧视图

外包装盒和内部俯视图

打开包装盒,可以看到魔飞麦克风的用户手册和保修卡

外观配置

拿开说明书可以看到魔飞在盒子上半层,镶嵌摆放在黑色泡沫内,物流不会受到任何损伤,魔飞麦克风拥有黑色款和白色款。

小巧灵动的外形,直径仅60.4mm,不仅拥有业界最精致小巧尺寸,而且拾音距离更远、识别率更高、误唤醒率更低,足以见到科大讯飞的技术实力。

顶部有四个麦克孔,搭载八麦的4+4双环空间结构,实现了空间全方位拾音的功能。八个双环绕的拾音麦克风,理论能够拾取三维球型空间内半径5米范围的有效声源,识别率可高达95%,远远超过目前主流的智能音箱产品。

顶部物理按键极其简化,只有四个按键,手动唤醒按键、禁止录音按键(禁止设备拾音)、音量加/减物理按键。

魔飞拥有两个供电口,可以通过侧面USB Micro2.0口,又称为debug口,可以作为调试口,同时魔飞还拥有电源3.5mm音频孔。

魔飞的接口非常丰富,MORFEI智能麦克风支持多种协议对接,包括Wi-Fi、USB、RJ45、蓝牙、RS232/485接口,而且底部留有Uart串口,可以克服一切智能系统环境,可以快速对接其它智能硬件设备,为其提供语音交互的能力。

扬声器口

另一个电源接口在底座

硬件结构爆炸图

配件

顶部四个金属接点是魔飞的第二个供电电源接口和Uart串口通信,底部侧面是底座的UBS Micro供电口。

底座底面,可以看到供电信息是5V/2A,而且有APP的下载二维码。

魔飞放置在底座上的特写

MORFEI采用分体式设计,分为主体与底座,开发者还可以根据自己产品的实际需要,设计开发自己的底座,例如在底部集成红外转发器,可以用来控制家电等设备。

因为底座与魔飞之间有强磁铁吸引,所以可以墙面安装

灯光颜色

魔飞指示灯总共包含三种色系,分别为蓝黄红。其中蓝色系包含蓝色和淡蓝色两种情况,正常可用时,指示灯显示为蓝色,在开机以及设备升级时,指示灯显示为淡蓝色;在设备联网或断网的情况下,魔飞的指示灯显示为黄色;红色系也包含两种情况,在禁止录音模式下,指示灯显示为红色,在拒识的情况下,指示灯颜色显示为暗红色,拒识即表示魔飞对于用户的语音指令暂时无法识别。

长按进入配网模式,配网状态为黄色灯

唤醒交互状态:1、2号灯都为蓝色,用户可以持续交互

非接触式唤醒词是双音节“魔飞魔飞”,或者手动按压顶部的物理唤醒按键。

唤醒禁录状态,1号灯蓝色,2号灯红色,在任意模式下,都可以随时禁止声音的采集。

魔飞未识别语音,1、2号灯都会呈现红色

当给魔飞发语音指令时,显示红灯拒识,未任何应答。此时,可以到平台魔飞应用后台,打开体验窗口,输入文本指令,看看是不是因未添加相应技能而导致。

标准协议、分体设计,接入更简单

讯飞魔飞麦克风MORFEI是一款基于双环八麦的麦克风阵列成品,双环八个麦克风的最大优点是可以大幅度提升音频的拾音质量,以保证识别与交互效果,这样的设计可以让魔飞在整个三维空间范围内,实现全方位的拾音能力。

同时,魔飞的尺寸和重量都非常小,再加上双环八麦、360度精准拾音的能力,让魔飞拥有极强的空间适应性和场景适应性,可以实现墙面、天花板、桌面的安装方式,尤其是顶装方式是目前市面上所有mini智能音箱都难以达到的场景安装需求,可以大大满足智慧家居控制的施工与使用需求。

三种安装方式,拥有极强的空间适应性

官方魔飞墙面86底座

标准墙装深86底盒安装方式;标准POE供电方式,安装简便;用于将魔飞自带串口数据转化为TCP网络方式进行传输;适用于与传统中控系统对接;颜色:黑色。

APP配网

通过魔飞客户端(APP)——魔飞 AI 家,给魔飞配网并绑定。

 

账号注册

点击“语音控台”页面上的按钮“添加新设备”,在跳转页选择“讯飞魔飞”。

选择魔飞要连接的网络,魔飞同时也支持5G Wi-Fi,然后输入密码,点击“下一步”

长按魔飞顶部中间按键,直至指示灯呈现黄色闪烁状态,表示魔飞已进入配网状态,然后回到 APP,点击“下一步”。等待魔飞配网,配网成功之后,魔飞会进行语音提示,语音反馈很温馨友好。

一次对话与连续对话

个人中心设置

魔飞的配网和绑定是同步进行的,配网成功之后,魔飞即可被绑定,此时便能进行正常交互了,于此同时还可以在 APP 上对设备进行相关信息的设置。

可以将魔飞设定到任意场景中,还能在“智能家居”界面添加第三方智能家居设备。

支持的第三方设备,可以通过账户绑定的模式实现魔飞的语音控制。

技能中心

控制体验

魔飞麦克风的语音的处理逻辑是在线+离线,无论家里有网没网,智能语音面板均可执行用户的语音命令,即使在没有联网的状态下,仍然可以进行语音识别来控制智能家居设备,并且识别率达到95%。

多轮交互——持续交互

所谓多轮交互即一次唤醒后可以持续命令,例如连续问魔飞“合肥今天的天气/明天的天气/后天的天气”,不用再次唤醒“魔飞魔飞”。

魔飞APP 里对于单轮交互模式的时间是不能修改的,默认 15s,而持续交互模式时间是可以修改,默认 1min,最长 3min,在无有效交互 1min后,魔飞会自动进入休眠模式,若需要再发指令,则需说“魔飞魔飞”进行唤醒。

如果需要精细化修改,就需要在开发平台修改 aiui.cfg 文件中的唤醒时间。

自然交互

魔飞可以基于上下文内容进行语义理解,使交互更加自然。

魔飞拥有NLP自然语言处理的能力,当用户在家里使用搭载了MORFEI硬件平台的智能灯泡,并发出指令“玫瑰色”,经过自主学习的硬件会反馈不同的灯光颜色,比如火热的红玫瑰色会将房间装点的非常红亮,而粉玫瑰色的灯光则会显得特别温馨,反馈指令会不断进化。

语义上的理解,让魔飞拥有更强的是识别率和执行力,例如智能照明的语音控制,可以表达成“魔飞魔飞,帮我打开筒灯/把筒灯打开/打开客厅筒灯/打开二楼卧室灯/把客厅筒灯打开/把客厅筒灯打开/给我打开筒灯”等多种方式。

方言

得益于AIUI 拥有 21 种方言引擎,所以在方言的能力上,拥有绝对行业技术实力。

分布式拾音

用户发出唤醒词“魔飞,魔飞”后,分布式算法会精确定位指令发出的位置,且只会有最佳位置的那1个面板响应用户需求,消除用户一次唤醒所有同类型设备的尴尬。

声音如影随形

唤醒设备后,设备的拾音波束将自动跟随,用户所在位置,准确收集语音命令。

听音识人的声纹唤醒

声纹识别与唤醒词紧密结合在一起,唤醒之后立即可以辨别出用户身份,此功能可以满足上层应用对用户身份的强烈需求,主要可以用于用户权限控制,大大增强安全性。同时大大方便了对用户进行个性化分析,让人机交互更智能、更和谐。唤醒设备后,设备将迅速识别已注册的用户身份信息开放声纹接口,开发者可根据声纹信息,推送个性化服务。

应用场景

语音拥有全硬件连接的能力,MORFEI麦克风已经通过MORFEI Link平台的能力,打通了家电、音箱、照明、遮阳、安防、新风、地暖、能源管理、创新型硬件等多场景设备,完美覆盖了家中所有智能化场景。在厨房、客厅、卫生间、酒店、阳台等众多场景,涌现智能开关、智能晾衣架、自动调酒机、智能马桶、智能厨房等各类落地产品方案,以此丰富魔飞智能家居生态。

面对智慧家居行业,深挖语音需求,应用到细分场景中,目前除了围绕住宅、公寓、别墅提供专业可靠的智能化解决方案,构筑出语音回家场景、离家场景、休息场景、聚餐场景、灯全开/关场景、会客场景、影院模式等各成熟的应用场景,还包括酒店智慧客房、智能楼盘、智能会议室、智能展厅、智能看房、智能病房、智能养老房、智能楼盘、智慧客房、智能会议室、智能养老房、智能病房、智能VR看房、智能展厅等各种空间化AI应用。

生态

两年半的时间,讯飞魔飞MORFEI为核心的讯飞智能家居生态初具规模,魔飞以语音交互为主轴赋能,将AIUI全双工人机交互界面应用到智能家居的各子系统中,为用户搭建出全新的隔空式三维交互界面,改变了十多年来的触屏与机械式交互,大力推动智能家居全产业在技术、市场、商业模式方面的发展,全方位点爆智能家居集成生态下的全面语音对接。

繁荣的魔飞生态赋能,超100家设备品牌合作伙伴,生态搭建日趋完善

产品制造商、集成商、工程商、服务商、经销代理商、终端应用,打造以MORFEI为核心的“营销平台+智能硬件生态+设备供应商+线下服务”全产业链开放生态。

在大B端为智慧地产、智慧酒店持续赋能

魔飞能力输出下的AI+智能家居系统性应用,海量子系统与产品对于语音生态的规模延展,是用户需求与客户需求的共同迭代。科大讯飞的核心优势是算法,语音赋能的硬件载体并不挑剔,即便是魔飞内置到各语音终端产品中,通过语音完美构建设备之间的语音交互逻辑。

MORFEI LINK技术系统架构图,覆盖云、边缘侧的网关、设备端丰富的本地与云端接口,协议不仅完全开放,而且还支持二次开发。

二次开发

MORFEI智能麦克风内部注入了讯飞全球领先的智能语音前沿技术,并以高度成熟硬件成品产品形态呈现,这使得开发者可快速开发应用,数小时内完成上线测试,数天内完成设备联调。

换言之,即现有条件下需要耗时数月实施的人工智能行业解决方案,通过MORFEI仅需一周即可彻底完成,极大地缩减了开发者的人力成本和时间成本,也满足了智能硬件企业想要快速探测市场、攻占消费领域的迫切需求。

AIUI产品框架

魔飞其实一个硬件平台,讯飞将所有关于智能语音的强大功能,都赋能到讯飞魔飞上,魔飞的开发需要通过AIUI平台。现阶段 AIUI 提供以语音交互为核心的交互解决方案,全链路聚合了语音唤醒、语音识别、语义理解、内容(信源)平台、语音合成等模块。
得益于讯飞AIUI的能力,能开发出多样性技能,来构筑用户需求的魔飞及语音场景需求。开发者们可以在MORFEI LINK家居平台上通过账户注册——平台配置——产品创建——产品发布四步完成对接。

ADB 调试魔飞

通过数据线,连接魔飞debug口(电源1口),与电脑相连(不要连底座),通过对魔飞的调试,可以对魔飞的一些配置进行修改,如 Appid、情景模式、唤醒词、交互时间、发音人等。魔飞提供FaaS级云服务,无需服务器即可在云端编写业务逻辑。

应用配置

在 AIUI 平台完成魔飞应用的创建。注册并登录讯飞 AIUI 开放平台:https://aiui.xfyun.cn/

AIUI开放平台中找到讯飞魔飞麦克风应用窗口,选择“讯飞魔飞智能麦克风”应用平台,填写完,点击“保存”完成应用创建。

设备应用信息

应用配置中的语义识别能力配置

海量的应用技能商店

技能商店里的开放技能及问答,难以满足开发者需求,可以自定义技能或问答,保存发布后,可以添加到魔飞应用使用。

常用生活技能

 

智能家居应用技能

游戏娱乐技能应用

技能配置操作

配置唤醒词

魔飞支持个性化唤醒词,单个设备最高支持8个唤醒词同时使用,唤醒词分浅定制和深度定制,浅定制很快就能打包,但唤醒效果要差些,需慎重。深度定制,一般需要 3 个月的时间训练。魔飞默认唤醒词“魔飞魔飞”,就是经过长期深度学习训练过的。

配置发音人

魔飞是有默认发音人,如果想更换发音人,可到开发平台试听选择发音人。

输出魔飞日志

当遇到魔飞不能被使用,而无法去直观判断找到原因的时候,需要将魔飞日志打印出来,
供分析定位原因。首先 adb 生成日志文件,然后语音交互使得问题重现,方便日志记录定位问题。

扫码获得课程学习,可以快速学习到AIUI评估板和魔飞评估板套件的接入方法,迅速上手语音硬件开发,了解讯飞在各领域场景下的解决方案。

数智评测室观点

在高频交互的AI时代正在贴身满足亿万用户的定制化要求,也促进语音行业首战即决战的姿态,科大讯飞在智能家居领域,通过魔飞麦克风的领先技术输出,掀起并完成了智慧家居的“场景革命”,通过构筑新的智能家居商业生态系统,并用开放的心态与合作伙伴携手促进智能家居的AI产业化,共同迈入未来5-10年的AI时代红利期。

现在市场已经过了基础认知阶段,消费者使用时不会再眼前一亮,严格意义上已经进入普及初期,随着语音功能体验深化成为用户真正生活痛点的时候,便会追求更极致的品质体验。目前市面上的语音交互普遍可以做到95分的体验感,但是科大讯飞可以做到98分,3分的差距是多年技术的累积成果,讯飞正在引领整个物联网行业,迈向趋于100分的语音体验时代。

未经允许不得转载:数智网 » 数智评测室丨语音生态系统构筑者,科大讯飞魔飞麦克风深度评测

分享到: