语音交互

语音命令识别的前端容错设置

2017-11-08  本文已影响11人  草珊瑚_6557

容错问题1:

因为每个人口音的不同,语音识别效果会差强人意。
比如把重置识别成同志通知通吃

解决这个问题,
普通做法是:
发音在谐音库范围内,统统识别成重置

文艺做法是:
1.提前人工打标。把同志通知通吃都当做重置
2.提供上下文。比如表单重置就比重置的识别率高。

2B做法是:
你只管发声就是了,我全部识别成重置

容错问题2:

环境噪音会影响你输入的内容。
比如重置的重置嘿

解决这个问题,
普通做法是:
不用笔记本内置麦克风,用耳麦。

文艺做法是:
编辑距离/文字个数。
0算是匹配OK。除0外,值越靠近1匹配越精确。

2B做法是:
你只管发声就是了,我全部识别成重置

容错问题3:

容错问题1和容错问题2的组合。
如果语音识别系统能把发音在谐音库范围内,统统识别成重置
解决方法其实就是容错问题2的做法。

上一篇 下一篇

猜你喜欢

热点阅读