基于RTP的视频封装

2018-08-07  本文已影响0人  symonxiao

       WebRTC的视频和传统的视频会议类似,采用了RTP的封装方案,本文主要描述的是H.264视频裸码流如何封装成网络传输的RTP的数据包

一般的H.264视频帧的构成如下图所示:

       每个视频帧可以由一个或者多个切片(slice)组合而成。其中每个slice都是基于宏块的的组合。每个slice在编码之后被打包进入一个NAL单元。在拿到视频编码后的裸码流之后,WebRTC选择了使用RFC3984的non-Interleaved封装方案。

一. 为什么采用RFC3984 的non-Interleaved方案?

1.关于UDP的传输:

      WebRTC为了视频实时通话的低延迟,选择了UDP作为数据的网络传输默认的协议。UDP的传输会收到MTU的限制,一般低于1500个字节。

2.RTP的封装:

      H.264视频RTP传输方案是Single NAL Unit的方式进行的,这种方式进行UDP传输的时候限制了每个NAL Unit的大小,而每个NAL Unit又是基于slice进行封装的,进一步限制了slice的划分.也就是说在Single NAL Unit的封装方案下,要求每帧视频编码图像需要切分成多个slice进行编码,码率和分辨率越高,划分的slice会越多。

 3.多slice方案和单slice方案:

       多个slice优势是可以分片独立编码,但是视频质量弱与单slice的方案,目前大部分应用多采用的都是slice的编码的方案。

基于上面遇到的问题,在RF3984中提供了解决方案。

二. 基于RFC3984打包方案

Single NAL Unit是什么:

这个是RTP最基本的Single NAL打包方案,其中:

F:    forbidden_zero_bit, 占1位,在 H.264 规范中规定了这一位必须为 0

NRI: nal_ref_idc, 占2位,取值从0到3,指示这个 NALU 的重要性,取值越大约重要。

Type:nalu是指包含在 NAL 单元中的 RBSP 数据结构的类型,其中0未指,1-19在264协议中有定义,20-23为264协议指定的保留位。24-29在RFC3984中进行了指定。其中STAP-A为24,FU-A为28。可以参见下面两个图:

H.264协议中 对应nalu type的定义 RFC3984中对应nalu type的定义

Type后面的数据为RBSP的数据,需要注意的是编码器的每个slice或者,每帧头一般会有0x0001或者0x001作为起始头,在RTP封装中需要去掉。此外在H.264裸码流数据后面可能还会带有padding的数据由RTP头的padding位决定。

Single NAL 格式

STAP-A 是什么?

     STAP-A的作用是可以把连个nalu单元封装在一个RTP包里面进行传输,注意的是-A的格式都是不允许跨帧的,也就是两个nalu单元的时间戳必须是相同的。常见的场景是sps和pps两个小包被合并封装。

STAP-A格式

见上图,RTP头后面仅跟着STAP-A的头,这个格式F,NRI和Type组合而成,占一个字节,字段定义见前面Single NAL Unit的介绍,这里的Type为24。后面两个字节为第一个nalu单元的长度,后面跟个第一个nalu数据同Single NAL Unit的封装一致,第一个数据结束后,跟着第二个nalu的长度,占2个字节,依次类推。

FU-A是什么?

FU-A的作用是把一个原始的大的nalu切成多个数据包进行传输,主要场景在一个slice比较大的情况。FU-A会比较特殊,有FU-A起始包,FU-A包(如果只切两个包可能没有)和FU-A结束包组成。

FU-A格式

3.1 FU indicator

FU indicator

这个头已经很熟悉了,前面出现过多次,对于FU-A,type查前面的表可以知道是对应28.

 3.2 FU header

FU header

这个头占一个字节,其中

S: 占1位如果是1表示当前这个包是FU-A的起始包

E: 占1位如果是1表示当前这个包是FU-A的结束包

R: 占1位,保留位,为0

Type: 实际包含的nalu的类型,见前面的表格

总结一下:

以上就是出现在sdp协商中的mode 1方式所支持的RFC3984包,这种方式在3984协议叫做叫做non-Interleaved,非交错模式,简单理解就是在一次封装的单元中必须是同一帧的数据。在协议中还支持Interleaved模式,交错模式,这种模式允许不同的帧做打包,考虑到传输的实时性,出现的比较少,需要协商出mode 2的能力,这种情况打包和解包需要支持STAP-B,MTAP16,MTAP24以及FU-B格式,实际应用很少见,有需要可以参考协议文档。

参考文档:

1.RFC3984《RTP Payload Format for H.264 Video》

2.《Advanced video coding for generic audiovisual services》

上一篇下一篇

猜你喜欢

热点阅读