思必驰语音唤醒,录音机噪音数据的处理
2018-03-20 本文已影响68人
meteos
思必驰语音唤醒LocalWakeup示例,使用思必驰内部录音机模式,我需要将音频数据导出存储,方便用户回放。
示例中的代码如下:
private class AISpeechListenerImpl implements AIWakeupListener {
@Override
public void onBufferReceived(byte[] buffer) {
//将buffer数据写入音频文件
storeToAudioFile(buffer);
}
}
写入的音频文件需要加wav头部信息才能使用普通的播放过器播放,参考
在获取wav音频文件后会发现几个问题:
- 有呲呲呲的噪音
- 人的说话声偏慢
- 定时录的1分钟的音频文件转化出来是1分钟12-15秒
onBufferReceived
回调方法基本上是每80ms执行一次,所以每分钟执行750次,每次buffer数据的长度为3200,所以每分钟数据为
750*3200=2400000byte
标准的16KHz,16bit,单声道音频文件的大小应该是
16000*16*1*60/8=1920000byte
思必驰的数据比标准音频数据多,所以转化的时候会多出来12~15秒数据
由于采样率
、采样大小
、声道
都是确定的,所以出问题的地方应该就是buffer数据的长度了,可能buffer数组的后面一部分为空数据
,1920000/750=2560byte
,标准音频每80ms只需要2560byte的数据,那么buffer数组后面可能有3200-2560=640
个空数据
验证:在onBufferReceived方法中将buffer的内容打印出来,大部分数据都是在索引为2560的地方开始,后面的数据全部为0
结论:在storeToAudioFile(buffer)方法中只取了前面2560byte的真实数据,后面的空数据不写入文件就行了。
补充:以上内容是在红米手机2上的测试结果,在小米6上每分钟执行600次,3200个byte的buff都是有效数据,所以需要自己封装方法检查buffer数据,删除后面的全0数据。