思必驰语音唤醒,录音机噪音数据的处理

2018-03-20  本文已影响68人  meteos
思必驰语音唤醒LocalWakeup示例,使用思必驰内部录音机模式,我需要将音频数据导出存储,方便用户回放。  
示例中的代码如下:
private class AISpeechListenerImpl implements AIWakeupListener {
    @Override
    public void onBufferReceived(byte[] buffer) {
        //将buffer数据写入音频文件
        storeToAudioFile(buffer);
    }
}

写入的音频文件需要加wav头部信息才能使用普通的播放过器播放,参考

  1. Wav数据格式的44个字节头部信息汇总
  2. android how can i write byte to wav file

在获取wav音频文件后会发现几个问题:

  1. 有呲呲呲的噪音
  2. 人的说话声偏慢
  3. 定时录的1分钟的音频文件转化出来是1分钟12-15秒

onBufferReceived回调方法基本上是每80ms执行一次,所以每分钟执行750次,每次buffer数据的长度为3200,所以每分钟数据为

750*3200=2400000byte

标准的16KHz,16bit,单声道音频文件的大小应该是

16000*16*1*60/8=1920000byte

思必驰的数据比标准音频数据多,所以转化的时候会多出来12~15秒数据
由于采样率采样大小声道都是确定的,所以出问题的地方应该就是buffer数据的长度了,可能buffer数组的后面一部分为空数据1920000/750=2560byte,标准音频每80ms只需要2560byte的数据,那么buffer数组后面可能有3200-2560=640个空数据

验证:在onBufferReceived方法中将buffer的内容打印出来,大部分数据都是在索引为2560的地方开始,后面的数据全部为0

结论:在storeToAudioFile(buffer)方法中只取了前面2560byte的真实数据,后面的空数据不写入文件就行了。
补充:以上内容是在红米手机2上的测试结果,在小米6上每分钟执行600次,3200个byte的buff都是有效数据,所以需要自己封装方法检查buffer数据,删除后面的全0数据。

上一篇下一篇

猜你喜欢

热点阅读