语音命令识别的前端容错设置
2017-11-08 本文已影响11人
草珊瑚_6557
容错问题1:
因为每个人口音的不同,语音识别效果会差强人意。
比如把重置
识别成同志
,通知
,通吃
。
解决这个问题,
普通做法是:
发音在谐音库范围内,统统识别成重置
。
文艺做法是:
1.提前人工打标。把同志
,通知
,通吃
都当做重置
。
2.提供上下文。比如表单重置
就比重置
的识别率高。
2B做法是:
你只管发声就是了,我全部识别成重置
。
容错问题2:
环境噪音会影响你输入的内容。
比如重置的
,重置嘿
。
解决这个问题,
普通做法是:
不用笔记本内置麦克风,用耳麦。
文艺做法是:
编辑距离/文字个数。
0算是匹配OK。除0外,值越靠近1匹配越精确。
2B做法是:
你只管发声就是了,我全部识别成重置
。
容错问题3:
容错问题1和容错问题2的组合。
如果语音识别系统能把发音在谐音库范围内,统统识别成重置
。
解决方法其实就是容错问题2的做法。