PCM数据的采集和播放
一、初识PCM
以下介绍来自百度百科
PCM 脉冲编码调制是Pulse Code Modulation的缩写。脉冲编码调制是数字通信的编码方式之一。主要过程是将话音、图像等模拟信号每隔一定时间进行取样,使其离散化,同时将抽样值按分层单位四舍五入取整量化,同时将抽样值按一组二进制码来表示抽样脉冲的幅值。
简而言之,语音、图像经过采样、量化之后进行二进制编码,最后得到的二进制码即为PCM数据。
二、Android平台上的实现
1、采集
对于音频的采集使用AudioRecord:
The AudioRecord class manages the audio resources for Java applications
to record audio from the audio input hardware of the platform
AudioRecord用于管理音频源,从音频输入硬件记录音频。
下面开始一步步来实现:
权限
<uses-permission android:name="android.permission.RECORD_AUDIO" />
<uses-permission android:name="android.permission.WRITE_EXTERNAL_STORAGE" />
创建文件
audioFile = new File(Environment.getExternalStorageDirectory().getAbsolutePath() +
"/test.pcm");
if (audioFile.exists()) {
audioFile.delete();
}
audioFile.createNewFile();
OutputStream os = new FileOutputStream(audioFile);
创建的PCM文件用于存储采集的音频,输出流用于将音频数据写入到文件。
创建AudioRecord对象
AudioRecord有两个构造方法,其中一个被@SystemApi标记,故一般使用另外一个:
public AudioRecord(int audioSource, int sampleRateInHz,
int channelConfig, int audioFormat,int bufferSizeInBytes)
- audioSource
记录源,在 MediaRecorder.AudioSource中可看到所有类型,此处传入MediaRecorder.AudioSource.MIC。 - sampleRateInHz
采样频率,单位Hz,常见的有44100,22050、16000,、和11025 ,其中44100可以保证在所有设备上正常工作,此处取该值。 - channelConfig
音频通道设置,有AudioFormat.CHANNEL_IN_MONOAudioFormat.CHANNEL_IN_STEREO,前者可以保证在所有设备上正常工作,此处取该值。 - audioFormat
音频格式,有AudioFormat.ENCODING_PCM_8BIT、AudioFormat.ENCODING_PCM_16BIT和AudioFormat.ENCODING_PCM_FLOAT,精度依次递增,此处取16bit。 - bufferSizeInBytes
缓冲区大小,单位是byte,可调用以下方法获取:
getMinBufferSize(int sampleRateInHz, int channelConfig, int audioFormat)
开始记录
audioRecord.startRecording();
byte bytes[] = new byte[minBufferSize];
while (isRecord) {
int length = audioRecord.read(bytes, 0, minBufferSize);
if (length > 0) {
os.write(bytes);
}
}
停止记录
audioRecord.stop();
audioRecord.release();
2、播放
创建播放器
使用AudioTrack播放PCM,在SDK23前后,创建的方法不一样:
int sampleRateInHz = 44100;
int channelConfig = AudioFormat.CHANNEL_OUT_MONO;
int audioFormat = AudioFormat.ENCODING_PCM_16BIT;
int minBufferSize = AudioTrack.getMinBufferSize(sampleRateInHz , channelConfig , audioFormat);
int length = minBufferSize + 1024;
if (Build.VERSION.SDK_INT >= 23) {
player = new AudioTrack.Builder()
.setAudioFormat(new AudioFormat.Builder()
.setEncoding(audioFormat)
.setSampleRate(sampleRateInHz)
.setChannelMask(channelConfig)
.build())
.setBufferSizeInBytes(length)
.build();
} else {
player = new AudioTrack(AudioManager.STREAM_MUSIC, sampleRateInHz,
channelConfig, audioFormat,
length, MODE_STREAM);
}
上面的几个参数与创建AudioRecord时是相似且对应的,但是注意channelConfig有in和out的区别。
关于length这个参数,最初使用的如下方式:
int length = (int) audioFile.length();
实测发现过大或者过小都有可能引发“play() called on uninitialized AudioTrack”的异常,现在的写法是借鉴了stackoverflow的解决方法。
给播放器写入数据
InputStream is = new FileInputStream(audioFile);
int read;
while ((read = is.read(bytes)) > 0) {
player.write(bytes, 0, read);
}
很眼熟吧,其实就是Java输入流的基本用法。
播放
调用player.play();
停止播放
if (player != null && player.getPlayState() == AudioTrack.PLAYSTATE_PLAYING) {
player.stop();
player.release();
}
把与停止无关的判断也一并写在这里了,因为实际开发时是很有必要进行这样的判断的。
后记
一直以来都对音视频领域比较感兴趣,奈何工作上一直没有机会基础,无意间看见Jhuster大神的Android 音视频开发入门指南,决定利用闲暇时间入坑,在此表示感谢。
源码
Thanks
Android 音视频开发入门指南
Android音频处理