Android音视频学习:音频的采集与播放
首先申请权限, 注意 Android 6.0 以后需要动态申请权限
<uses-permission android:name="android.permission.RECORD_AUDIO" />
<uses-permission android:name="android.permission.WRITE_EXTERNAL_STORAGE" />
<uses-permission android:name="android.permission.READ_EXTERNAL_STORAGE" />
采集
MediaRecord 较为上层的 API,可以直接录制成 mp3 等格式
AudioRecord 较底层的 API,可以得到 PCM 音频流数据
PCM : 脉冲编码调制(Pulse Code Modulation), 就是原始音频编码格式
音视频开发中一般需要对音频流做处理,所以用 AudioRecord 录制
AudioRecord(int audioSource, int sampleRateInHz, int channelConfig, int audioFormat,
int bufferSizeInBytes)
- audioSource 音频的输入源
-- AudioSource.DEFAULT (默认)
-- AudioSource.MIC (麦克风输入)
-- AudioSource.VOICE_COMMUNICATION (用于 VoIP 等) - sampleRateInHz 采样频率, 44100 支持所有的设备,用的最多
- channelConfig 声道
-- AudioFormat.CHANNEL_IN_MONO (单声道)
-- AudioFormat.CHANNEL_IN_STEREO (立体声) - audioFormat 采样格式,即一个采样点用几个字节表示
-- AudioFormat.ENCODING_PCM_16BIT
-- AudioFormat.ENCODING_PCM_8BIT
ENCODING_PCM_16BIT 兼容大部分手机 - bufferSizeInBytes 音频缓冲区大小
建议通过int getMinBufferSize(int sampleRateInHz, int channelConfig, int audioFormat)
方法获取, 不能小于 getMinBufferSize
构造完成后通过 getState
方法与 AudioRecord.STATE_INITIALIZED 对比,如果不相等说明构造失败
之后可调用 startRecording()
开始采集
final int sampleRateInHz = 44100;
final int channelConfig = AudioFormat.CHANNEL_IN_MONO;
final int audioFormat = AudioFormat.ENCODING_PCM_16BIT;
int bufferSize = AudioRecord.getMinBufferSize(sampleRateInHz, channelConfig, audioFormat);
audioRecord = new AudioRecord(MediaRecorder.AudioSource.MIC, sampleRateInHz, channelConfig, audioFormat, bufferSize);
if (audioRecord.getState() == AudioRecord.STATE_INITIALIZED) {
audioRecord.startRecording();
isRecording = true;
tvState.setText("录制中...");
new Thread(new RecordRunnable(bufferSize)).start();
}
开始录制后要及时把音频数据不断的读取出来,否则会导致缓冲区溢出出现 "overrun" 错误。 通过 read
方法读取
读取并写入文件
class RecordRunnable implements Runnable {
int bufferSize;
RecordRunnable(int bufferSize) {
this.bufferSize = bufferSize;
}
@Override
public void run() {
byte[] data = new byte[bufferSize];
FileOutputStream out = null;
try {
out = new FileOutputStream(pcmFile);
} catch (FileNotFoundException e) {
e.printStackTrace();
}
if (out == null) {
return;
}
try {
while (isRecording) {
int len = audioRecord.read(data, 0, bufferSize);
out.write(data, 0, len);
}
} catch (IOException e) {
e.printStackTrace();
} finally {
try {
out.close();
} catch (IOException e) {
e.printStackTrace();
}
}
}
}
停止录制,释放资源
isRecording = false;
audioRecord.stop();
audioRecord.release();
保存后的 PCM 文件播放器还不能直接播放,必须转换成 mp3、wav 等格式。我拷贝了网上转 wav 的代码转换成 wav (最前面添加 44 个字节的 wav 头部) 就能播放了。参考源码。
播放 (渲染)
MediaPlayer:上层 API,播放音视频,适合做播放器在后台长时间播放音视频
SoundPool: 适合播放比较短的音频片段,如游戏声音、按键声音、铃声等
AudioTrack: 较为底层的 API,适合流媒体,需要配合解码器工作。可以直接播放 PCM 流。
前面说播放器不能直接播放 PCM 流,但 AudioTrack 可以,这里用 AudioTrack 播放前面录制好的 PCM 文件。
public AudioTrack(AudioAttributes attributes, AudioFormat format, int bufferSizeInBytes,
int mode, int sessionId)
AudioTrack 参数跟 AudioRecord 很像,AudioTrack 有两种播放模式
AudioTrack.MODE_STATIC: 需要把 PCM 流一次性全部写入 AudioTrack 的缓冲区中,适合播放小文件。设置缓冲区大小时注意要大于等于播放文件的大小,否则存不下
AudioTrack.MODE_STREAM: 以流的形式不断写入 AudioTrack 的内部缓冲区进行播放,同理这里的 bufferSize 建议用 AudioTrack.getMinBufferSize
方法获取
以 MODE_STATIC 方式播放
byte[] data = file2Bytes();
Log.d(TAG, "data len " + data.length);
AudioAttributes attributes = new AudioAttributes.Builder().setContentType(AudioAttributes.CONTENT_TYPE_MUSIC).build();
AudioFormat audioFormat = new AudioFormat.Builder().setSampleRate(44100).setChannelMask(AudioFormat.CHANNEL_OUT_MONO).setEncoding(AudioFormat.ENCODING_PCM_16BIT).build();
audioTrack = new AudioTrack(attributes, audioFormat, data.length, AudioTrack.MODE_STATIC, AudioManager.AUDIO_SESSION_ID_GENERATE);
int ret = audioTrack.write(data, 0, data.length);
if (ret > 0) {
audioTrack.play();
} else {
Log.d(TAG, "error code is " + ret);
}
缓冲区大小设置为了文件的长度
以 MODE_STREAM 方式播放,需要不断把音频流写进去,这里不断循环写入录制好的 PCM 流
AudioAttributes attributes = new AudioAttributes.Builder().setContentType(AudioAttributes.CONTENT_TYPE_MUSIC).build();
AudioFormat audioFormat = new AudioFormat.Builder().setSampleRate(44100).setChannelMask(AudioFormat.CHANNEL_OUT_MONO).setEncoding(AudioFormat.ENCODING_PCM_16BIT).build();
int bufferSize = AudioTrack.getMinBufferSize(44100, AudioFormat.CHANNEL_OUT_MONO, AudioFormat.ENCODING_PCM_16BIT);
Log.d(TAG, "buffer size is " + bufferSize);
audioTrack = new AudioTrack(attributes, audioFormat, bufferSize, AudioTrack.MODE_STREAM, AudioManager.AUDIO_SESSION_ID_GENERATE);
// 先调用 Play 方法, 然后开启线程不断的将 PCM 流写入 AudioTrack 的 buffer
audioTrack.play();
isPlaying = true;
new Thread(new PlayStreamRunnable(bufferSize)).start();
class PlayStreamRunnable implements Runnable {
int bufferSize;
PlayStreamRunnable(int bufferSize) {
this.bufferSize = bufferSize;
}
@Override
public void run() {
byte[] data = file2Bytes();
int len = data.length;
int currentPosition = 0;
while (isPlaying) {
if (len > bufferSize) {
// 循环播放
audioTrack.write(data, currentPosition, bufferSize);
currentPosition += bufferSize;
if (currentPosition + bufferSize >= len) {
audioTrack.write(data, currentPosition, len - currentPosition);
currentPosition = 0;
}
} else {
audioTrack.write(data, 0, len);
}
}
}
}
停止播放,释放资源
isPlaying = false;
audioTrack.stop();
audioTrack.release();
源码:https://github.com/lesliebeijing/audio_video_learn/tree/master/AudioRecord