第三十六节 mp3文件转pcm
2018-09-07 本文已影响106人
最美下雨天
知识点:pcm是音频文件最原始的格式,是没有经过任何压缩的,mp3文件是编码(压缩)后的音频文件
要实现的功能:将mp3文件解码为pcm文件
#include <jni.h>
#include <string>
#include <android/log.h>
#define LOGI(FORMAT, ...) __android_log_print(ANDROID_LOG_INFO,"jason",FORMAT,##__VA_ARGS__);
#define LOGE(FORMAT, ...) __android_log_print(ANDROID_LOG_ERROR,"jason",FORMAT,##__VA_ARGS__);
extern "C" {
//封装格式
#include "libavformat/avformat.h"
//解码
#include "libavcodec/avcodec.h"
//缩放
#include "libswscale/swscale.h"
//重采样
#include "libswresample/swresample.h"
};
extern "C"
{
JNIEXPORT void JNICALL
Java_com_dongnao_ffmpegmusicdemo_DavidPlayer_sound(JNIEnv *env, jobject instance, jstring input_,
jstring output_) {
const char *input = env->GetStringUTFChars(input_, 0);
const char *output = env->GetStringUTFChars(output_, 0);
av_register_all();
AVFormatContext *pFormatCtx = avformat_alloc_context();
//打开音频文件
if (avformat_open_input(&pFormatCtx, input, NULL, NULL) != 0) {
LOGI("%s", "无法打开音频文件");
return;
}
//获取输入文件信息
if (avformat_find_stream_info(pFormatCtx, NULL) < 0) {
LOGI("%s", "无法获取输入文件信息");
return;
}
//获取音频流索引位置
int i = 0, audio_stream_idx = -1;
for (; i < pFormatCtx->nb_streams; i++) {
if (pFormatCtx->streams[i]->codec->codec_type == AVMEDIA_TYPE_AUDIO) {
audio_stream_idx = i;
break;
}
}
//获取解码器
AVCodecContext *codecCtx = pFormatCtx->streams[audio_stream_idx]->codec;
//AVCodec是存储编解码器信息的结构体
//avcodec_find_decoder()用于查找FFmpeg的解码器,avcodec_find_encoder()用于查找FFmpeg的编码器
AVCodec *codec = avcodec_find_decoder(codecCtx->codec_id);
//打开解码器
if (avcodec_open2(codecCtx, codec, NULL) < 0) {
LOGI("%s", "无法打开解码器");
return;
}
//压缩数据
AVPacket *packet = (AVPacket *) av_malloc(sizeof(AVPacket));
//解压缩数据
AVFrame *frame = av_frame_alloc();
//frame->16bit 44100 PCM 统一音频采样格式与采样率
//SwrContext主要用于音频重采样,比如采样率转换,声道转换
SwrContext *swrContext = swr_alloc();
//重采样,也就是对已得到的数据进行重新的采样;比如,原先的PCM音频数据是2 个声道,44100采样率,32bit 单精度型(sample format采样格式)。
//那么通过重采样,我们改变它的声道数、采样率和采样格式。
// 音频格式 重采样设置参数
AVSampleFormat in_sample = codecCtx->sample_fmt;
// 输出采样格式
AVSampleFormat out_sample = AV_SAMPLE_FMT_S16;
// 输入采样率
int in_sample_rate = codecCtx->sample_rate;
// 输出采样率
int out_sample_rate = 44100;
// 输入声道布局
uint64_t in_ch_layout = codecCtx->channel_layout;
// 输出声道布局 一般来说用的比较多的是AV_CH_LAYOUT_STEREO(双声道)和AV_CH_LAYOUT_SURROUND(三声道)
uint64_t out_ch_layout = AV_CH_LAYOUT_STEREO;
/**
* struct SwrContext *swr_alloc_set_opts(struct SwrContext *s,
int64_t out_ch_layout, enum AVSampleFormat out_sample_fmt, int out_sample_rate,
int64_t in_ch_layout, enum AVSampleFormat in_sample_fmt, int in_sample_rate,
int log_offset, void *log_ctx);
*/
//Allocate SwrContext if needed and set/reset common parameters.
swr_alloc_set_opts(swrContext, out_ch_layout, out_sample, out_sample_rate, in_ch_layout,
in_sample, in_sample_rate, 0, NULL);
swr_init(swrContext);
int got_frame = 0;
int ret;
//Return the number of channels in the channel layout.
int out_channerl_nb = av_get_channel_layout_nb_channels(out_ch_layout);
LOGE("声道数量%d ", out_channerl_nb);
int count = 0;
// 设置音频缓冲区间 16bit 44100 PCM数据
uint8_t *out_buffer = (uint8_t *) av_malloc(2 * 44100);
FILE *fp_pcm = fopen(output, "wb");
while (av_read_frame(pFormatCtx, packet) >= 0) {
ret = avcodec_decode_audio4(codecCtx, frame, &got_frame, packet);
LOGE("正在解码%d", count++);
if (ret < 0) {
LOGE("解码完成");
}
// 解码一帧
if (got_frame > 0) {
/**
* int swr_convert(struct SwrContext *s, uint8_t **out, int out_count,
const uint8_t **in , int in_count);
*/
swr_convert(swrContext, &out_buffer, 2 * 44100,
(const uint8_t **) frame->data, frame->nb_samples);
/**
* int av_samples_get_buffer_size(int *linesize, int nb_channels, int nb_samples,
enum AVSampleFormat sample_fmt, int align);
*/
//buffer size alignment (0 = default, 1 = no alignment)
int out_buffer_size = av_samples_get_buffer_size(NULL, out_channerl_nb,
frame->nb_samples, out_sample, 1);
//size_t fwrite(const void* buffer, size_t size, size_t count, FILE* stream);
fwrite(out_buffer, 1, out_buffer_size, fp_pcm);
}
}
fclose(fp_pcm);
av_frame_free(&frame);
av_free(out_buffer);
swr_free(&swrContext);
avcodec_close(codecCtx);
avformat_close_input(&pFormatCtx);
env->ReleaseStringUTFChars(input_, input);
env->ReleaseStringUTFChars(output_, output);
}
}
看下fwrite的描述
size_t fwrite(const void* buffer, size_t size, size_t count, FILE* stream);
返回值:返回实际写入的[数据块]数目
(1)buffer:是一个[指针],对fwrite来说,是要获取数据的地址;
(2)size:要写入内容的单字节数;
(3)count:要进行写入size字节的[数据项]的个数;
(4)stream:目标[文件指针];
(5)返回实际写入的数据项个数count。