FFMPEG结构体:AVPacket解析
因为FFmpeg更新的比较快,API也会跟着有所变动,所以声明一下,本文使用的FFmpeg版本为V3.3.5。
1.AVPacket简介
AVPacket是FFmpeg中很重要的一个数据结构,它保存了解复用(demuxer)之后,解码(decode)之前的数据(仍然是压缩后的数据)和关于这些数据的一些附加的信息,如显示时间戳(pts),解码时间戳(dts),数据时长(duration),所在流媒体的索引(stream_index)等等。
对于视频(Video)来说,AVPacket通常包含一个压缩的Frame;而音频(Audio)则有可能包含多个压缩的Frame。并且,一个packet也有可能是空的,不包含任何压缩数据data,只含有边缘数据side data(side data,容器提供的关于packet的一些附加信息,例如,在编码结束的时候更新一些流的参数,在另外一篇av_read_frame会介绍)
AVPacket的大小是公共的ABI(Public ABI)一部分,这样的结构体在FFmpeg很少,由此也可见AVPacket的重要性,它可以被分配在栈空间上(可以使用语句AVPacket pkt;在栈空间定义一个Packet),并且除非libavcodec 和libavformat有很大的改动,不然不会在AVPacket中添加新的字段。
官方文档:
AVPacket is one of the few structs in FFmpeg,whose size is a part of public ABI.Thus it may be allocated on stack and no new fields can be added to it without libavcodec and libavformat major bump.
2.AVPacket字段说明
AVPacket中的字段可分为两部分:数据的缓存及管理和数据的属性。
关于数据的属性有以下字段:
pts: (int64_t)显示时间,结合AVStream->time_base转换成时间戳
dts: (int64_t)解码时间,结合AVStream->time_base转换成时间戳
size: (int)data的大小
stream_index: (int)packet在stream的index位置
flags: (int)标示,结合AV_PKT_FLAG使用,其中最低为1表示该数据是一个关键帧。
#define AV_PKT_FLAG_KEY 0x0001 //关键帧
#define AV_PKT_FLAG_CORRUPT 0x0002 //损坏的数据
#define AV_PKT_FLAG_DISCARD 0x0004 /丢弃的数据
side_data_elems: (int)边缘数据元数个数
duration: (int64_t)数据的时长,以所属媒体流的时间基准为单位,未知则值为默认值0
pos: (int64_t )数据在流媒体中的位置,未知则值为默认值-1
convergence_duration:该字段已deprecated,不在使用
关于数据缓存,AVPacket本身只是个容器,不直接的包含数据,而是通过数据缓存的指针引用数据。AVPacket包含两种数据
uint8_t *data:指向保存压缩数据的指针,这就是AVPacket的实际数据。
AVPacketSideData *side_data:容器提供的一些附加数据
AVBufferRef *buf:用来管理data指针引用的数据缓存,其使用在后面介绍。
3.AVPacket中的内存管理
AVPacket实际上可看作一个容器,它本身并不包含压缩的流媒体数据,而是通过data指针引用数据的缓存空间。所以将Packet作为参数传递的时候,就要根据具体的需求,对data引用的这部分数据缓存空间进行特殊的处理。当从一个Packet去创建另一个Packet的时候,有两种情况:
1)两个Packet的data引用的是同一数据缓存空间,这个时候要注意数据缓存空间的释放问题和修改问题(相当于iOS的retain)
2)两个Packet的data引用不同的数据缓存空间,每个Packet都有数据缓存空间的copy
第二种情况,数据空间的管理比较简单,但是数据实际上有多个copy造成内存空间的浪费。所以要根据具体的需求,来选择到底是两个Packet共享一个数据缓存空间,还是每个Packet拥有自己独立的缓存空间。值得注意的是:对于多个Packet共享同一个缓存空间,FFMPEG使用的引用计数的机制(reference-count)。当有新的Packet引用共享的缓存空间时,就将引用计数+1;当释放了引用共享空间的Packet,就将引用计数-1;引用计数为0时,就释放掉引用的缓存。
1) 共享同一个数据缓存 -----> av_packet_ref() 和 av_packet_unref() 引用计数管理
AVPacket中的AVBufferRef *buf;就是用来管理这个引用计数的,AVBufferRef有两个函数:av_packet_ref() 和av_packet_unref()增加和减少引用计数的,AVBufferRef的声明如下:
a) av_packet_ref()
创建一个src->data引用计数。
如果src已经设置了引用计数(src->buffer不为空);则直接将其引用计数+1;
若src没有设置引用计数(src->buffer为空),则dst创建一个新的引用计数buf,并复制src->data到buf->buffer中。
最后,复制src的其他字段到dst中。
b)av_packet_unref
将缓存空间的引用计数-1,并将Packet中的其他字段设为初始值。
如果引用计数为0,自动的释放缓存空间。
所以,两个Packet共享同一个数据缓存空间的时候可以这么用:
av_read_frame(pFormatCtx, &packet) // 读取Packet
av_packet_ref(&dst,&packet) // dst packet共享同一个数据缓存空间...
av_packet_unref(&dst);
2)创建独立的数据空间
传递Packet的时候,一般都是复制copy一个独立的数据缓存空间,每个Packet都拥有自己独立的数据缓存空间,放在AVPacket相关函数介绍。
3.AVPacket相关函数介绍
操作AVPacket的函数大约有30个,主要分为:AVPacket的创建初始化,AVPacket中的data数据管理(clone,free,copy),AVPacket中的side_data数据管理。
void av_init_packet(AVPacket *pkt);
初始化packet的值为默认值,该函数不会影响data引用的数据缓存空间和size,需要单独处理。
int av_new_packet(AVPacket *pkt, int size);
av_init_packet的增强版,不但会初始化字段,还为data分配了存储空间
AVPacket *av_packet_alloc(void);
创建一个AVPacket,将其字段设为默认值(data为空,没有数据缓存空间)。
void av_packet_free(AVPacket **pkt);
释放使用av_packet_alloc创建的AVPacket,如果该Packet有引用计数(packet->buf不为空),则先调用av_packet_unref。
AVPacket *av_packet_clone(const AVPacket *src);
其功能是av_packet_alloc和av_packet_ref
int av_copy_packet(AVPacket *dst, const AVPacket *src);
复制一个新的packet,包括数据缓存
int av_copy_packet_side_data(AVPacket *dst, const AVPacket *src);
初始化一个引用计数的packet,并指定了其数据缓存
int av_grow_packet(AVPacket *pkt, int grow_by);
增大Packet->data指向的数据缓存
void av_shrink_packet(AVPacket *pkt, int size);
减小Packet->data指向的数据缓存
3.1 废弃函数介绍 ------> av_dup_packet和av_free_packet
int av_dup_packet(AVPacket *pkt);
复制src->data引用的数据缓存,赋值给dst。也就是创建两个独立packet,这个功能现在可用使用函数av_packet_ref来代替
void av_free_packet(AVPacket *pkt);
释放packet,包括其data引用的数据缓存,现在可以使用av_packet_unref代替
3.2 函数对比 --------->av_free_packet和av_packet_free
void av_free_packet(AVPacket *pkt);
只是清空里边的数据内容,内存地址仍然在。我的版本是3.3已经废弃,所以用av_packet_unref替代。
如果不清空会发生什么情况呢,举个简单的例子,一个char数组大小为128,里面有100个自己的内容。第二次使用你没有清空第一次的内容,第二次的数据大小为60,那么第一次的最后40个字节的数据仍会保留,造成数据冗余,极大可能对你的处理造成影响(这个跟自己的处理有关系,并不一定)。
void av_packet_free(AVPacket **pkt);
类似于free(p); p = Null;不仅清空内容还清空内存(一般就是如果用了av_packet_alloc后就要调用av_packet_free来释放。但如果有引用计数,在调用av_packet_free前一般先调用av_packet_unref)
上源码:
4.AVPacket队列
主要是涉及到多次的AVPacket的传递问题,下面就播放音频的教程中的AVPacket队列实现,分析下在AVPacket作为参数传递的过程中,应该如何更好的管理其data引用的缓存空间。
从流中读取AVPacket插入队列
如果是音频流则将读到Packet调用packet_queue_put插入到队列,如果不是音频流则调用av_packet_unref释放已读取到的AVPacket数据。
下面代码是packet_queue_put中将Packet放入到一个新建的队列节点的代码片段
注意,在调用packet_queue_put时传递的是指针,也就是形参pkt和实参packet中的data引用的是同一个数据缓存。但是在循环调用av_read_frame的时候,会将packet中的data释放掉,以便于读取下一个帧数据。
所以就需要对data引用的数据缓存进行处理,保证在读取下一个帧数据的时候,其data引用的数据空间没有被释放。有两种方法,复制一份data引用的数据缓存或者给data引用的缓存空间加一个引用计数。
注释掉的部分是使用已废弃的APIav_dup_packet,该函数将pkt中data引用的数据缓存复制一份给队列节点中的AVPacket。
添加引用计数的方法则是调用av_apcket_ref将data引用的数据缓存的引用计数+1,这样其就不会被释放掉。
更好的管理其data引用的缓存空间。
从队列中取出AVPacket
注释掉的代码仍然是两个packet引用了同一个缓存空间,这样在一个使用完成释放掉缓存的时候,会造成另一个访问错误。所以扔给调用av_packet_ref将其引用计数+1,这样在释放其中一个packet的时候其引用的数据缓存就不会被释放掉,知道两个packet都被释放。