FFmpeg: 抽取音视频数据

2019-12-09 本文已影响0人神经骚栋

前言

上一篇博客我们聊了一下如何使用FFmpeg的命令来实现各种需求,从这篇博客我们将一起来看一下如何使用使用FFmpeg代码实现各种需求,而这一篇博客我们主要来说一下如何使用FFmpeg抽取音视频数据。

正文

说代码之前，我们先用一张流程图表明具体的操作过程。如下所示。

通过上图我们可以知道，我们需要两个流，一个输出流和一个空白输入流，我们把输入流中的数据拷贝到输出流中即可。但是里面所用到的函数较多，我们需要逐一分析，后面博客我们就不会对这些函数进一步讲解了。

注册所有的音视频编解码。(旧版中需要使用，在新版中加入会有警告。)

    av_register_all();

注：为什么在新版本中不需要通过av_register_all()来注册所有编码器呢？这是因为在新的版本中，解码器和编码器的初始化都是通过定义全局变量来初始化的。所以我们不需要使用av_register_all()来初始化所有的编解码。这里就不过多叙述了

具体的分析博客可以看新版本ffmpeg源码简单分析：av_register_all()

打开输入流文件。

    result = avformat_open_input(&fmt_ctx, inputFilePath, NULL, NULL);

在 avformat_open_input 函数中，返回值类型为int，如果返回值小于0，那么就是打开失败。第一个参数是类型为AVFormatContext的格式上下文。第二个参数是媒体的地址。第三个是输入格式参数，可以为NULL。第四个参数是选项参数，是一个类似于Key-Value形式的结构体。

寻找到最好的输出流下标，并且根据流的下标取到对应的流信息。

    best_steam_index = av_find_best_stream(fmt_ctx, AVMEDIA_TYPE_AUDIO, -1, -1, NULL, 0);
    //拿到文件中音频流
    inputSteam = fmt_ctx->streams[best_steam_index];

媒体中是有流的概念，一个媒体文件可能有多路流，比如视频流，音频流，弹幕流等等各种流。我们需要从中找出最合适的流。av_find_best_stream这个能帮助我们流文件的下标，然后我们可以从 fmt_ctx→steams 中找到我们所需要的流。

如果抽离音频就用 AVMEDIA_TYPE_AUDIO，如果抽取视频就用 AVMEDIA_TYPE_VIDEO，这样就能取到对应的流下标。

初始化输出上下文和输出流，以及配置一个最合适的媒体格式。

    ofmt_ctx = avformat_alloc_context();
    // 配置媒体格式
    output_fmt = av_guess_format(NULL, outFilePath, NULL);
    ofmt_ctx->oformat = output_fmt;
    // 初始化输出流
   outSteam = avformat_new_stream(ofmt_ctx, NULL);

这一步没有什么好说的，主要是对输出上下文和输出流进行初始化操作。并且要把媒体格式初始化，通过ofmt_ctx→oformat = output_fmt配置到输出上下文中。

将输入流的参数信息拷贝到输出流中。

    AVCodecParameters *in_codecpar = inputSteam->codecpar;
    
    if((result = avcodec_parameters_copy(outSteam->codecpar, in_codecpar)) < 0 ){
        av_log(NULL, AV_LOG_ERROR,"拷贝编码参数失败");
        return result;
    }

我们首先先从输入流中拿到参数信息，然后通过然后通过avcodec_parameters_copy函数将参数信息拷贝到输出流中。由于我们不需要做音视频的处理，所以我们只需要参数信息拷贝到输出流中即可。

初始化输出上下文中的AVIOContext。

    if((result = avio_open(&ofmt_ctx->pb, outFilePath, AVIO_FLAG_WRITE)) < 0) {
        av_log(NULL, AV_LOG_ERROR,"不能打开输出文件");
        return result;
    }

这一步操作主要是初始化输出上下文中的文件IO上下文。

往输出上下文中写入媒体头信息。

    if (avformat_write_header(ofmt_ctx, NULL) < 0) {
        av_log(NULL, AV_LOG_ERROR,"写入文件头失败");
        return result;
    }

通过avformat_write_header函数我们可以直接往输出上下文中写入媒体头信息。

🔆🔆🔆循环读取输入上下文中每一帧数据并把它写到输出上下文中。🔆🔆🔆

    while(av_read_frame(fmt_ctx, &pkt) >=0 ){
        if(pkt.stream_index == best_steam_index){
            //时间基计算，音频pts和dts一致
            pkt.pts = av_rescale_q_rnd(pkt.pts, inputSteam->time_base, outSteam->time_base, (AV_ROUND_NEAR_INF|AV_ROUND_PASS_MINMAX));
            pkt.dts = pkt.pts;
            pkt.duration = av_rescale_q(pkt.duration, inputSteam->time_base, outSteam->time_base);
            pkt.pos = -1;
            pkt.stream_index = 0;
            //将包写到输出媒体文件
            av_interleaved_write_frame(ofmt_ctx, &pkt);
            //减少引用计数，避免内存泄漏
            av_packet_unref(&pkt);
        }
    }

这是抽取音视频代码中最核心的一部分，也是最后一个步骤，那么就是循环把输入上下文中合适的包数据写到输出上下文中。同时要注意时间基的转化问题。

总结

本次的博客就到这里了，欢迎各位大佬批评指导，谢谢。

FFmpeg: 抽取音视频数据

前言

正文

总结

猜你喜欢

热点阅读