[导读] 新基建浪潮下,伴随着自动驾驶和智能交互技术的发展,智能网联汽车将会成为全新的信息+服务交互平台。在此背景下,5月27日中关村举办“你好北区-2020自动驾驶产业生态沙龙”。会上,声智科技联合创始人、CTO冯大航分享了《下一代智能车载交互系统,AI感知新升级》主题演讲。

新基建浪潮下,伴随着自动驾驶和智能交互技术的发展,智能网联汽车将会成为全新的信息+服务交互平台。在此背景下,5月27日中关村举办“你好北区-2020自动驾驶产业生态沙龙”。会上,声智科技联合创始人、CTO冯大航分享了《下一代智能车载交互系统,AI感知新升级》主题演讲。

据市调机构BIIntelligence的预测,到2020年,全球联网汽车的市场保有量将达3.8亿辆, 智能网联汽车市场的规模可达到1000亿元以上。传统汽车向数字化、智能化方向升级,离不开两大核心技术:人工智能和车联网,AI解决感知、规划、决策和执行工作,车联网技术解决信息和联网问题。以AI语音交互技术为核心的智能车载交互,通过语音控制导航、空调、新闻搜索、娱乐系统等功能,真正解放司机双手,是自动驾驶中不可或缺的技术。

但现有车内语音交互却存在着诸多问题,如麦克风通常置于车内前排位置,由于距离和噪音的影响,后排座位的语音交互体验较差。而且当车内某一位置发出“开车门/开顶灯”的语音指令时,经常难以做到只开启该位置的设备,也容易干扰其它位置的用户。同时,无法准确识别用户特征信息,真正实现为用户提供个性化的功能服务。

为此,声智科技基于SoundAI Azero人工智能操作系统提供了多种层次的解决方案,通过先进的车载麦克风阵列和分布式麦克风阵列,突破传统麦克风阵列尺寸的限制,明显提升语音交互过程中唤醒率和识别率,提供更流畅、更自由的车载语音交互体验。同时,集成优质互联网资源,可为不同受众提供包括电话、微信、导航、娱乐、搜索、推送及设备控制等在内的定制化服务,实现车内感官体验全面升级。

同时,声智已与华为、盯盯拍、上汽等多家公司在智能网联、智慧出行等领域深度合作,推出了多款满足不同用户需求的智能车载产品。以声智、盯盯拍与华为联合打造的智能语音车载支架为例,通过简单的方式实现了车内语音交互,让人们不用动手就能操作,既满足了车内沟通、娱乐的需求,又兼顾了行车安全。内置双麦克风收音,支持语音指令获取包括地图导航、拨打电话等车内常用功能,以及音乐相声、儿歌故事、电台资讯等服务。

无惧嘈杂,精准响应

出于成本和功耗的考虑,现有车载支架少有能具备语音交互实现Hands-free 的体验,大多是通过触碰或者按键去实现操作或者触发手机上的语音交互,也没有真正释放出语音交互安全、高效的价值。

而声智联合盯盯拍打造智能语音车载支架,充分考虑驾车场景的用户需求,可以实现车内全语音控制。提供包括降噪、唤醒等在内的智能语音交互技术,进行针对性的降噪处理,在语音唤醒准确度、识别流畅度和抗噪声干扰等方面都进行了显著提升。通过对其包括识别模型、唤醒模型在内的语音交互性能的优化,使得即使在正常驾驶的嘈杂环境下,依然可以保持优于业内平均水平的高唤醒率。无论车内外再嘈杂都能清晰准确的接受用户语音指令,提供相应服务。

安全方便,驾车通话

驾车接电话造成的安全事故频发,开车时手动操作不方便而且存在风险,完全忽视来电又难以实现。语音指令实现通话,既保证了用户在驾驶时获取信息的及时性,又极大地提高了安全性。但是,当手机放在车载支架上,通话时面对的噪声干扰和信号拾取困难等问题尤为突出,车内空调、音响、发动机等设备噪声,风噪等环境噪声干扰以及人声交谈。而且,通话过程中还面临着网络传输过程中的语音丢帧、双工通话回声干扰等问题。

为此,声智提供了VoIP远场实时通话技术,通过远场双工通话解决方案,运用麦克风阵列、音频编解码、丢包补偿和语音重建、网络抖动缓冲等技术,在确保人声不失真的情况下实现流畅的通话体验,实现一句话指令即可自由通话。同时,还支持免唤醒词语音控制,尤其是拨打/接听电话场景中,可以直接通过语音指令接听、挂断电话,用户几乎没有学习门槛即可使用。

如今的汽车产品正在变得越来越“聪明”,也让越来越多的用户享受到便利。未来,声智将继续携手生态合作伙伴,解锁更多的智能生活场景,共建万物互联新未来。

免责声明:凡注明为其它来源的信息均转自其它平台,目的在于传递更多信息,并不代表本站观点及立场。若有侵权或异议请联系我们处理。

相关推荐