iOS技术交流收藏iOS音频、视频、直播相关

FFmpeg: 抽取音视频数据

2019-12-09  本文已影响0人  神经骚栋

前言


上一篇博客我们聊了一下如何使用FFmpeg的命令来实现各种需求,从这篇博客我们将一起来看一下如何使用使用FFmpeg代码实现各种需求,而这一篇博客我们主要来说一下如何使用FFmpeg抽取音视频数据。

正文


说代码之前,我们先用一张流程图表明具体的操作过程。如下所示。

通过上图我们可以知道,我们需要两个流,一个输出流和一个空白输入流,我们把输入流中的数据拷贝到输出流中即可。但是里面所用到的函数较多,我们需要逐一分析,后面博客我们就不会对这些函数进一步讲解了。

    av_register_all();

注:为什么在新版本中不需要通过av_register_all()来注册所有编码器呢?这是因为在新的版本中,解码器和编码器的初始化都是通过定义全局变量来初始化的。所以我们不需要使用av_register_all()来初始化所有的编解码。这里就不过多叙述了

具体的分析博客可以看 新版本ffmpeg源码简单分析:av_register_all()

    result = avformat_open_input(&fmt_ctx, inputFilePath, NULL, NULL);

avformat_open_input 函数中,返回值类型为int,如果返回值小于0,那么就是打开失败。第一个参数是类型为AVFormatContext的格式上下文。第二个参数是媒体的地址。第三个是输入格式参数,可以为NULL。第四个参数是选项参数,是一个类似于Key-Value形式的结构体。

    best_steam_index = av_find_best_stream(fmt_ctx, AVMEDIA_TYPE_AUDIO, -1, -1, NULL, 0);
    //拿到文件中音频流
    inputSteam = fmt_ctx->streams[best_steam_index];

媒体中是有流的概念,一个媒体文件可能有多路流,比如视频流,音频流,弹幕流等等各种流。我们需要从中找出最合适的流。av_find_best_stream这个能帮助我们流文件的下标,然后我们可以从 fmt_ctx→steams 中找到我们所需要的流。

如果抽离音频就用 AVMEDIA_TYPE_AUDIO,如果抽取视频就用 AVMEDIA_TYPE_VIDEO,这样就能取到对应的流下标。

    ofmt_ctx = avformat_alloc_context();
    // 配置媒体格式
    output_fmt = av_guess_format(NULL, outFilePath, NULL);
    ofmt_ctx->oformat = output_fmt;
    // 初始化输出流
   outSteam = avformat_new_stream(ofmt_ctx, NULL);

这一步没有什么好说的,主要是对输出上下文和输出流进行初始化操作。并且要把媒体格式初始化,通过ofmt_ctx→oformat = output_fmt配置到输出上下文中。

    AVCodecParameters *in_codecpar = inputSteam->codecpar;
    
    if((result = avcodec_parameters_copy(outSteam->codecpar, in_codecpar)) < 0 ){
        av_log(NULL, AV_LOG_ERROR,"拷贝编码参数失败");
        return result;
    }

我们首先先从输入流中拿到参数信息,然后通过 然后通过avcodec_parameters_copy函数将参数信息拷贝到输出流中。 由于我们不需要做音视频的处理,所以我们只需要参数信息拷贝到输出流中即可。

    if((result = avio_open(&ofmt_ctx->pb, outFilePath, AVIO_FLAG_WRITE)) < 0) {
        av_log(NULL, AV_LOG_ERROR,"不能打开输出文件");
        return result;
    }

这一步操作主要是初始化输出上下文中的文件IO上下文。

    if (avformat_write_header(ofmt_ctx, NULL) < 0) {
        av_log(NULL, AV_LOG_ERROR,"写入文件头失败");
        return result;
    }

通过avformat_write_header函数我们可以直接往输出上下文中写入媒体头信息。

    while(av_read_frame(fmt_ctx, &pkt) >=0 ){
        if(pkt.stream_index == best_steam_index){
            //时间基计算,音频pts和dts一致
            pkt.pts = av_rescale_q_rnd(pkt.pts, inputSteam->time_base, outSteam->time_base, (AV_ROUND_NEAR_INF|AV_ROUND_PASS_MINMAX));
            pkt.dts = pkt.pts;
            pkt.duration = av_rescale_q(pkt.duration, inputSteam->time_base, outSteam->time_base);
            pkt.pos = -1;
            pkt.stream_index = 0;
            //将包写到输出媒体文件
            av_interleaved_write_frame(ofmt_ctx, &pkt);
            //减少引用计数,避免内存泄漏
            av_packet_unref(&pkt);
        }
    }

这是抽取音视频代码中最核心的一部分,也是最后一个步骤,那么就是循环把输入上下文中合适的包数据写到输出上下文中。同时要注意时间基的转化问题。

总结


本次的博客就到这里了,欢迎各位大佬批评指导,谢谢。

上一篇下一篇

猜你喜欢

热点阅读