思必驰语音唤醒，录音机噪音数据的处理

2018-03-20 本文已影响68人 meteos

思必驰语音唤醒LocalWakeup示例，使用思必驰内部录音机模式，我需要将音频数据导出存储，方便用户回放。  
示例中的代码如下:
private class AISpeechListenerImpl implements AIWakeupListener {
    @Override
    public void onBufferReceived(byte[] buffer) {
        //将buffer数据写入音频文件
        storeToAudioFile(buffer);
    }
}

写入的音频文件需要加wav头部信息才能使用普通的播放过器播放，参考

在获取wav音频文件后会发现几个问题：

有呲呲呲的噪音
人的说话声偏慢
定时录的1分钟的音频文件转化出来是1分钟12-15秒

onBufferReceived回调方法基本上是每80ms执行一次，所以每分钟执行750次，每次buffer数据的长度为3200，所以每分钟数据为

750*3200=2400000byte

标准的16KHz,16bit,单声道音频文件的大小应该是

16000*16*1*60/8=1920000byte

思必驰的数据比标准音频数据多，所以转化的时候会多出来12~15秒数据
由于采样率、采样大小、声道都是确定的，所以出问题的地方应该就是buffer数据的长度了，可能buffer数组的后面一部分为空数据，1920000/750=2560byte,标准音频每80ms只需要2560byte的数据，那么buffer数组后面可能有3200-2560=640个空数据

验证：在onBufferReceived方法中将buffer的内容打印出来，大部分数据都是在索引为2560的地方开始，后面的数据全部为0

结论：在storeToAudioFile(buffer)方法中只取了前面2560byte的真实数据,后面的空数据不写入文件就行了。
补充：以上内容是在红米手机2上的测试结果，在小米6上每分钟执行600次，3200个byte的buff都是有效数据，所以需要自己封装方法检查buffer数据，删除后面的全0数据。

思必驰语音唤醒，录音机噪音数据的处理

猜你喜欢

热点阅读