语音命令识别的前端容错设置

2017-11-08 本文已影响11人草珊瑚_6557

因为每个人口音的不同，语音识别效果会差强人意。
比如把重置识别成同志，通知，通吃。

解决这个问题，
普通做法是：
发音在谐音库范围内，统统识别成重置。

文艺做法是：
1.提前人工打标。把同志，通知，通吃都当做重置。
2.提供上下文。比如表单重置就比重置的识别率高。

2B做法是：
你只管发声就是了，我全部识别成重置。

环境噪音会影响你输入的内容。
比如重置的，重置嘿。

解决这个问题，
普通做法是：
不用笔记本内置麦克风，用耳麦。

文艺做法是：
编辑距离/文字个数。
0算是匹配OK。除0外，值越靠近1匹配越精确。

2B做法是：
你只管发声就是了，我全部识别成重置。

容错问题1和容错问题2的组合。
如果语音识别系统能把发音在谐音库范围内，统统识别成重置。
解决方法其实就是容错问题2的做法。