华为玩机技巧

华为黑科技!揭秘能被插嘴打断的智慧语音背后的技术

2019-11-30  本文已影响0人  包云东

你想插嘴打断就打断了?嘈杂环境下,怎么不被噪声干扰?本文来揭秘下,能被插嘴打断的智慧语音背后的技术。

过滤掉噪声,扫除基础障碍

实现插嘴打断的第一步,是让小艺在嘈杂环境下,清楚地识别出人声。声音本质是携带信息的能量波,为了把你的声音从茫茫的噪声海中pick出来,小艺通过音频降噪和语音识别降噪,共同抑制噪声能量、增强人声能量。

如果说在嘈杂的背景声中选出人声属于众里寻他千百度,那旁边有人在大声说话、能量波强度也相似的干扰场景就属于真假美猴王了。对于这个问题,小艺使用华为特有的VAD和ASR识别机制来解决。

普通的VAD技术可以识别出噪声和人声。而华为特有的VAD结合ASR识别机制,可以区分出噪声、无效人声、有效人声。做到噪音和无效人声不识别,当前有效人声才能识别。

消除播报的回音,清扫第二只拦路虎

既然能在嘈杂环境下识别出你的声音,那随时打断小艺,也就是小意思了。但插嘴打断是在播报时候进行的,那就不可避免的会把手机语音播报的内容给收进去。理想的方案是回声消除法:即用原始音消除播报回声的能量。

现实中,因为器件和声音外放的原因,声音的波形会发生变化,实际的回声声波和原始声波不能成线性,说人话就是不能消除。

这就轮到华为独特的AI消噪技术上场了。它引入深度神经网络来训练智能的语音识别声学模型,消除变形的能量。

不是对我说的话,我绝不会误解

过滤掉这两种干扰后,当你在小艺播报过程中打断它时,它都能准确识别出你的声音、理解你的意图,并做出回应。或许你还有一个疑问:小艺播报时我跟旁人的对话,岂不是也会打断小艺?

不会的。小艺引入了强大的意图分类模型,通过把文字识别成意图,可以分辨出你是否在对它讲话,从而避免被干扰。

经历了九九八十一难,你的语音在各种干扰的情况下,经历了语音转换和语义识别,实现了嘈杂环境、人声干扰、播报回声干扰中的识别,最终成功插嘴打断。

除了今天介绍的语音助手小技巧,还推荐关注其他EMUI10的小功能,如多屏协同、滚屏翻译、输入法快速打字、畅连高通通话。

欢迎关注 [包云东],搜寻更多信息,人人都做玩机达人。

上一篇下一篇

猜你喜欢

热点阅读