音视频基础知识

2017-12-29 本文已影响104人糊涂糊涂啊

原文地址:http://blog.csdn.net/fenglinfeiye/article/details/5608295 (主要进行了重新排版)

第一部分:基本概念讲解

媒体: 是表示,传输,存储信息的载体,常人们见到的文字、声音、图像、图形等都是表示信息的媒体.
多媒体: 是声音、动画、文字、图像和录像等各种媒体的组合,以图文并茂,生动活泼的动态形式表现出来,给人以很强的视觉冲击力,留下深刻印象
多媒体技术: 是将文字、声音、图形、静态图像、动态图像与计算集成在一起的技术.它要解决的问题是计算机进一步帮助人类按最自然的和最习惯的方式接受和处理信息.
流媒体: 流媒体是指采用流式传输的方式在Internet播放的连续时基媒体格式,实际指的是一种新的媒体传送方式,而不是一种新的媒体格式(在网络上传输音/视频等多媒体信息现在主要有下载和流式传输两种方式)流式传输分两种方法:实时流式传输方式(Realtime streaming)和顺序流式传输方式(progressive streaming).
多媒体文件: 是既包括视频又包括音频,甚至还带有脚本的一个集合,也可以叫容器；
媒体编码: 是文件当中的视频和音频所采用的压缩算法.也就是说一个avi的文件,当中的视频编码有可能是A,也可能是B,而其音频编码有可能是1,也有可能是2. 转码 :指将一段多媒体包括音频、视频或者其他的内容从一种编码格式转换成为另外一种编码格式
视频: 连续的图象变化每秒超过24帧(Frame)画面以上时,根据视觉暂留原理,人眼无法辨别单幅的静态画面,看上去是平滑连续的视觉效果,这样连续的画面叫做视频
音频: 人类能听到的声音都成为音频,但是一般我们所说到的音频时存储在计算机里的声音

第二部分:视频文件格式

基本视频概念讲解:

码率: 码率就是数据传输时单位时间传送的数据位数,一般我们用的单位是kbps即千位每秒. 通俗一点的理解就是取样率,单位时间内取样率越大,精度就越高,处理出来的文件就越接近原始文件,但是文件体积与取样率是成正比的,所以几乎所有的编码格式重视的都是如何用最低的码率达到最少的失真.但是因为编码算法不一样,所以也不能用码率来统一衡量音质或者画质.
码率一般指比特率,是指每秒传送的比特(bit)数.单位比特率越高,传送数据速度越快.声音中的比特率是指将模拟声音信号转换成数字声音信号后,单位时间内的二进制数据量,是间接衡量音频质量的一个指标. 视频中的比特率(码率)原理与声音中的相同,都是指由模拟信号转换为数字信号后,单位时间内的二进制数据量.
帧: 帧就是一段数据的组合,它是数据传输的基本单位.就是影像动画中最小单位的单幅影像画面,相当于电影胶片上的每一格镜头.一帧就是一副静止的画面,连续的帧就形成动画,如电视图像等.
帧率: 帧率即每秒显示帧数,帧率表示图形处理器处理场时每秒钟能够更新的次数.高的帧率可以得到更流畅、更逼真的动画.一般来说30fps就是可以接受的,但是将性能提升至60fps则可以明显提升交互感和逼真感,但是一般来说超过75fps一般就不容易察觉到有明显的流畅度提升了.如果帧率超过屏幕刷新率只会浪费图形处理的能力,因为监视器不能以这么快的速度更新,这样超过刷新率的帧率就浪费掉了.
关键帧: 相当于二维动画中的原画,指角色或者物体运动或变化中的关键动作所处的那一帧,它包含了图像的所有信息,后来帧仅包含了改变了的信息.如果你没有足够的关键帧,你的影片品质可能比较差,因为所有的帧从别的帧处产生.对于一般的用途,一个比较好的原则是每5秒设一个关键键.但如果时那种实时传输的流文件,那么要考虑传输网络的可靠度,所以要1到2秒增加一个关键帧.

目前我们经常见的视频格式无非就是两大类:

影像格式(Video)

在影像格式中还可以根据出处划分为三大种:

AVI格式:这是由微软(Microsoft)提出,具有"悠久历史"的一种视频格式

MOV格式:这是由苹果(Apple)公司提出的一种视频格式

MPEG/MPG/DAT:这是由国际标准化组织ISO(International Standards Organization)与IEC(International Electronic Committee)联合开发的一种编码视频格式.MPEG是运动图像压缩算法的国际标准,现已被几乎所有的计算机平台共同支持.

流媒体格式(Stream Video)

在流媒体格式中同样还可以划分为三种:

RM格式:这是由Real Networks公司开发的一种新型流式视频文件格式.

MOV/QT格式:MOV也可以作为一种流文件格式.QuickTime能够通过Internet提供实时的数字化信息流、工作流与文件回放功能,为了适应这一网络多媒体应用,QuickTime为多种流行的浏览器软件提供了相应的QuickTime Viewer插件(Plug－in),能够在浏览器中实现多媒体数据的实时回放.

ASF格式:这是由微软公司开发的流媒体格式,是一个在Internet上实时传播多媒体的技术标准.

FLV

具体视频文件格式详解:

.MPEG/.MPG/.DAT
　　MPEG也是Motion Picture Experts Group的缩写.这类格式包括了MPEG-1, MPEG-2, MPEG-4,MPEG-7,MPEG-21等在内的多种视频格式.MPEG-1相信是大家接触得最多的了,因为目前其正在被广泛地应用在VCD的制作和一些视频片段下载的网络应用上面,大部分的VCD都是用 MPEG-1格式压缩的( 刻录软件自动将MPEG-1转为.DAT格式),使用MPEG-1的压缩算法,可以把一部 120 分钟长的电影压缩到1.2 GB 左右大小.MPEG-2则是应用在DVD 的制作,同时在一些HDTV(高清晰电视广播)和一些高要求视频编辑、处理上面也有相当多的应用.使用MPEG-2的压缩算法压缩一部 120 分钟长的电影可以压缩到 5-8 GB的大小(MPEG-1的图像质量与MPEG-2的图像质量是无法比拟的)

.AVI
　　它的英文全称为Audio Video Interleaved,即音频视频交错格式.是将语音和影像同步组合在一起的文件格式.它对视频文件采用了一种有损压缩方式,但压缩比较高,因此尽管面面质量不是太好,但其应用范围仍然非常广泛.AVI支持256色和RLE压缩.AVI信息主要应用在多媒体光盘上,用来保存电视、电影等各种影像信息.它于1992年被Microsoft公司推出,随Windows3.1一起被人们所认识和熟知.所谓"音频视频交错",就是可以将视频和音频交织在一起进行同步播放.这种视频格式的优点是图像质量好,可以跨多个平台使用,其缺点是体积过于庞大,而且更加糟糕的是压缩标准不统一,最普遍的现象就是高版本Windows媒体播放器播放不了采用早期编码编辑的AVI格式视频,而低版本Windows媒体播放器又播放不了采用最新编码编辑的AVI格式视频,所以我们在进行一些AVI格式的视频播放时常会出现由于视频编码问题而造成的视频不能播放或即使能够播放,但存在不能调节播放进度和播放时只有声音没有图像等一些莫名其妙的问题,如果用户在进行AVI格式的视频播放时遇到了这些问题,可以通过下载相应的解码器来解决.是目前视频文件的主流. 这种格式的文件随处可见,比如一些游戏、教育软件的片头,多媒体光盘中,都会有不少的 AVI .现在,在WINDOWS 95或98里都能直接播放AVI,同一种格式的avi文件有可能采用不同的编码方式,最常见的有Intel Indeo(R)Video R3.2(像游戏过场动画等,是目前使用最广泛的一种avi编码技术)、Microsoft video 等.

.RA/RM/RAM
　　.RM,Real Networks公司所制定的音频/视频压缩规范Real Media中的一种,Real Player能做的就是利用Internet资源对这些符合Real Media技术规范的音频/视频进行实况转播.在Real Media规范中主要包括三类文件:RealAudio、Real Video和Real Flash(Real Networks公司与Macromedia公司合作推出的新一代高压缩比动画格式).REAL VIDEO(RA、RAM)格式由一开始就是定位就是在视频流应用方面的,也可以说是视频流技术的始创者.它可以在用56K MODEM 拨号上网的条件实现不间断的视频播放,从RealVideo的定位来看,就是牺牲画面质量来换取可连续观看性.其实RealVideo也可以实现不错的画面质量,由于RealVideo可以拥有非常高的压缩效率,很多人把VCD编码成RealVideo格式的,这样一来,一张光盘上可以存放好几部电影.REAL VIDEO存在颜色还原不准确的问题,RealVideo就不太适合专业的场合,但RealVideo出色的压缩效率和支持流式播放的特征,使得RealVideo在网络和娱乐场合占有不错的市场份额.

.MOV
　　MOV格式美国Apple公司开发的一种视频格式,默认的播放器是苹果的QuickTimePlayer.具有较高的压缩比率和较完美的视频清晰度等特点,但是其最大的特点还是跨平台性,即不仅能支持MacOS,同样也能支持Windows系列,在所有视频格式当中,也许MOV格式是最不知名的.也许你会听说过QuickTime,MOV格式的文件正是由它来播放的.在PC几乎一统天下的今天,从Apple移植过来的MOV格式自然是受到排挤的.它具有跨平台、存储空间要求小的技术特点,而采用了有损压缩方式的MOV格式文件,画面效果较AVI格式要稍微好一些.到目前为止,它共有4个版本,其中以 4.0 版本的压缩率最好.这种编码支持16位图像深度的帧内压缩和帧间压缩,帧率每秒10帧以上.现在这种格式有些非编软件也可以对它时行处理,其中包括ADOBE公司的专业级多媒体视频处理软件AFTEREFFECT和PREMIERE.

.ASF
　　ASF (Advanced Streaming format高级流格式).ASF是MICROSOFT 为了和现在的 Real player 竞争而发展出来的一种可以直接在网上观看视频节目的文件压缩格式.ASF使用了MPEG-4的压缩算法,压缩率和图像的质量都很不错.因为ASF是以一个可以在网上即时观赏的视频"流"格式存在的,所以它的图像质量比VCD差一点点并不出奇,但比同是视频"流"格式的RAM格式要好. ASF支持任意的压缩/解压缩编码方式,并可以使用任何一种底层网络传输协议,具有很大的灵活性.ASF流文件的数据速率可以在28.8Kbps到3Mbps之间变化.用户可以根据自己应用环境和网络条件选择一个合适的速率,实现VOD点播和直播.

.WMV
　　WMV是微软推出的一种流媒体格式,它是ASF的升级延伸,在同等视频质量下,WMV格式的体积非常小,因此很适合在网上播放和传输.微软希望用其取代QuickTime之类的技术标准以及WAV、AVI之类的文件扩展名.WMV的主要优点在于:可扩充的媒体类型、本地或网络回放、可伸缩的媒体类型、流的优先级化、多语言支持、扩展性等.

. NAVI
　　如果你发现原来的播放软件突然打不开此类格式的AVI文件,那你就要考虑是不是碰到了n AVI.n AVI是New AVI 的缩写,是一个名为Shadow Realm的地下组织发展起来的一种新视频格式.它是由Microsoft ASF压缩算法的修改而来的(并不是想象中的AVI),视频格式追求的无非是压缩率和图像质量,所以NAVI为了追求这个目标,改善了原始的ASF格式的一些不足,让 NAVI 可以拥有更高的帧率.可以这样说,NAVI是一种去掉视频流特性的改良型ASF格式.

.FLV
　　FLV 是 FLASH VIDEO的简称,是由Macromedia公司开发的属于自己的流式视频格式.FLV也就是随着Flash MX的推出发展而来的视频格式,是在sorenson公司的压缩算法的基础上开发出来的.FLV格式不仅可以轻松的导入Flash中,速度极快,并且能其到保护版权的作用,并且可以不通过本地的微软或者REAL播放器播放视频.Flash MX 2004对其提供了完美的支持,它的出现有效地解决了视频文件导入Flash后,使导出的SWF文件体积庞大,不能在网络上很好的使用等缺点.由于它形成的文件极小、加载速度极快,使得网络观看视频文件成为可能,它的出现有效地解决了视频文件导入Flash后,使导出的SWF文件体积庞大,不能在网络上很好的使用等缺点.

视频文件转换:

比较常见的视频格式转化有:

RM→ASF

AVI→RMVB

dat-->divx

mpg-->divx

vcd-->rm

dat-->rm

mpg,dat、avi、mov-->rm

*-->FLV
最近视频博客的兴起,导致了flv的快速发展

AVI→MPEG(MPEG－1)
例如有纪念性的家庭录影带,可以事先转换成AVI格式,再用软件将它转换成MPEG－1格式,然后用刻录器将MPEG－1格式文件刻录光盘片,得到的就是普通的VCD光盘了,可以拿到任何VCD播放器上播放.

MPEG(MPEG－1)→AVI
从MPEG到AVI文件之间的转换,为磁盘节省空间.

MPEG(MPEG－1)→ASF
将vcd文件转码后实现VOD点播和直播.

ASF→MPEG(MPEG－1)
由于ASF视频格式的先天限制,一般来说它的图像质量往往比不上MPEG－1,所以转换之前,请三思而后行.

DVD(MPEG－2)→VCD (MPEG－1)
由于DVD驱动器尚未普及以及DVD光盘成本昂贵等客观原因,DVD影片一直未能像VCD一样流行.但我们可以将喜爱的DVD影片转换成MPEG－1格式的视频文件,留在硬盘上观看或是刻成VCD光盘.

dat/mpg->mp3

CD-->wav,mp3,wma

rm-->mp3

mp3-->wma

以上列举的视频格式转化都是比较常见的,当然了,说到底,是有这方面的实际应用需求才会出现这方面的视频转化需要.比如说,要把一部VCD(也就是MPEG1编码的视频文件)制作成可以在线观看的影片,最大的瓶颈就在于文件尺寸的改变,并且要能够适应网络的特点,这样原始的格式就不能满足需要,必须要转化成互联网视频播放规范的流媒体格式才可以,比如说是RM或者ASF,这就是需要,所以针对影像格式转化为流媒体格式的软件也就应用而生了,还有现在非常流行的MPEG4视频压缩技术,它能够把一张DVD压缩到一张CD上去,并且视频效果也不会有太大的变化,至少在我们普通用户看来也是非常不错的,而文件体积则大大减小了,这就要求有能够把DVD转化成MPEG4文件的软件出现,但是如果有人想要把RM转化成MPEG1(VCD),就没有太大的实际意义了,因为这样并不能给视频效果带来太大的提升,反而文件尺寸大了许多,所以我们很少能够看到这样的转化软件,其他的也类似,所以,在视频转化领域,可以参照以下两个原则:

有明确的应用方向: 就是说一种视频格式转化成另一种视频格式,必须要有明确的应用方向,即目标格式能够有很广泛的应用价值,而不是说为了转化而转化,比如上文所说的VCD->RM,它的应用方向就是网络播放,因为现在在线电影是一个很大的市场和网络的应用方向.
能够提升播放价值: 就是说一种视频格式转化成另一种视频格式除了有明确的应用方向外,还要考虑转化是不是有价值,如果说转化后的文件播放效果没有明显提升,但是文件尺寸却大了一倍,我想这样亏本的买卖是没有人会去做的,RM转化成VCD就没有实际的意义,原因如前文所述,而DVD转化成MPEG4价值就很大,不说转化后的播放效果,单说成本就降低了不少.

音视频压缩编码标准:

多媒体编辑码方式就是指通过特定的压缩技术,将某个视频格式的文件转换成另一种视频格式文件的方式,现在主要的编码方式有:

MPEG系列: 视频编码方面主要是Mpeg1、Mpeg2、Mpeg4、Mpeg4 AVC；音频编码方面主要是MPEG Audio Layer 1/2、MPEG Audio Layer 3、MPEG-2 AAC、MPEG-4 AAC等等.

H.26X系列: 包括H261、H262、H263、H263+、H263++、H264、H265

微软windows media系列: 视频编码有Mpeg-4 v1/v2/v3、Windows Media Video 7/8/9/10；音频编码有Windows Media audeo v1/v2/7/8/9

Real Media系列: 视频编码有RealVideo G2、RealVideo 8/9/10；音频编码有RealAudio cook/sipro、RealAudio AAC/AACPlus等

QuickTime系列: 视频编码有Sorenson Video 3、Apple MPEG-4、Apple H.264；音频编码有QDesign Music 2、Apple MPEG-4 AAC

其它: 如:Ogg、On2-vpx、flash vidio,以及M-JPEG视频压缩方式

各视频编码的应用场合简要:

http://blog.csdn.net/luchy/archive/2007/03/27/1542478.aspx这里讲的挺详细的

MPEG-1较早的视频编码,质量比较差,主要用于 CD-ROM 存储视频,国内最为大家熟悉的就是 VCD(Video CD),他的视频编码就是采用 MPEG-1

在 MPEG-1 的基础上开发的一种视频编码,它的质量远远好于 MPEG-1,所以被运用在了 DVD-Video 上面,MPEG-2 是 DVD-Video 唯一指定的视频编码.MPEG-2 不光运用于 DVD-Video ,现在大部分 HDTV(高清电视)也采用 MPEG-2 编码,分辨率达到了 1920x1080.

MPEG-3是MPEG组织制定的视频和音频压缩标准.本来的目标是为HDTV提供20-40Mbps视频压缩技术.在标准制定的过程中,委员会很快发现MPEG-2可以取得类似的效果.随后,MPEG-3项目停止了.

MPEG-4是为了适应网络的需求,采用一系列新技术,以最少的数据获得最佳的图像质量为目标的新一代编码方式.主要应用在数字电视、动态图像、互联网、实时多媒体监控、移动多媒体通信、Internet／intranet上的视频流与可视游戏、DVD上的交互多媒体应用等方面.Divx,xvid,ms mpeg4都是采用mpeg-4视频编码的.对于普通用户来说,MPEG-4在目前来说最有吸引力的地方还在于它能在普通CD-ROM上基本实现DVD的质量；用MPEG-4压缩算法的ASF(Advanced Streaming format,高级格式流)可以将120分钟的电影压缩为300MB左右的视频流；采用MPEG-4压缩算法的DIVX视频编码技术可以将120分钟的电影压缩600MB左右

Mpeg4 AVC和 MPEG-4 是两种不同的编码,主要是在极低码率下 MPEG-4 表现并不好,而 AVC 更加适合低带宽传输.在高码率上,AVC 的表现也要好过 MPEG-4,所以现在大有取代 MPEG-4 的趋势.下一代 HD DVD 和 Blue Ray Disc 已经正式接纳 AVC 为视频编码方案之一,相信 AVC 的发展前途会非常好.AVC/H.264极有可能成为下一代视频格式,(avs,中国标准)

H.261是ITU-T为在综合业务数字网(ISDN)上开展双向声像业务(可视电话、视频会议)而制定的,它是最早的运动图像压缩标准,它详细制定了视频编码的各个部分,包括运动补偿的帧间预测、DCT变换、量化、熵编码,以及与固定速率的信道相适配的速率控制等部分.

H.262是由ITU-T的VCEG组织和ISO/IEC的MPEG组织联合制定的,所以制定完成后分别成为了两个组织的标准,正式名称是"ITU-T建议H.262"和"ISO/IEC 13818-2".这两个标准在所有的文字叙述上都是相同的.

H.263是ITU-T为低于64kb/s的窄带通信信道制定的视频编码标准,它是在H.261基础上发展起来的

H263+是H.263 的第二个版本,加入了许多新技术来扩展 H.263 的应用范围.

H.263++是在 H.263+ 上增加了几个选项,来增强码流在恶劣信道上的抗误码性能,同时提高增强编码效率.

H.264也就是前面提到的 MPEG-4 AVC.H.264是由ISO/IEC与ITU-T组成的联合视频组(JVT)制定的新一代视频压缩编码标准.在ISO/IEC中该标准命名为AVC (Advanced Video Coding),作为MPEG-4标准的第10个选项；在ITU-T中正式命名为H.264标准.

Microsoft MPEG-4 v1/v2/v3,最早的 ASF 采用的视频编码,基于 MPEG-4 技术开发,DivX3.11 就是基于 Microsoft MPEG-4 v3 破解出来的,后来才进行了重写.

Windows Media Video 7,Microsoft 正式开发的第一个 Windows Media Video,开始脱离了 MPEG-4,和 MPEG-4 不兼容,从这一点上可见微软的野心.可惜这个版本压缩效果非常烂,打破了微软一飞冲天的美梦,不过它在压缩速度上非常快,现在网络上有很多采用这种格式压缩的 WMV.

Windows Media Video 8,在 WMV7 基础上改进的版本,质量上面进不了不少

Windows Media Video 9,微软的重头戏,不光是这一个编码,V9 系列更是一个平台,让微软有足够的能力挑战 MPEG,ITU 等标准化组织.虽然这个版本并没有微软吹得那么厉害,特别是低码率下比较差,不过跟以前版本相比进步还是非常多的.特别是 WMV HD 的应用,让微软也跻身视频标准领域.

RealVideo G2,早期的 RealVideo 编码,质量比较糟糕,不过那时在网络上算是很先进了,毕竟当时能用网络看视频的人不多.

RealVideo 8,随着 RealPlayer 8 推出的视频格式,是现在主流的网络视频编码之一.编码速度较慢,质量也只能算一般.

RealVideo 9,RealNetworks 开发的新一代编码,质量进步了很多,特别是在底码率下,而且编码速度很快,做到了速与质的很好统一.

RealVideo 10,在 RealVideo 9 基础上加入了一些参数,如 EHQ 等,更加精确控制码率,和 RealVideo 9 兼容.

Sorenson Video 3,Sorenson Media 公司随 QuickTime 5 发布的编码器,质量很不错,已经成为 QuickTime 的标准视频编码,网络上大部分电影预告片都采用这种编码.

Apple MPEG-4,Apple 公司自己开发的 MPEG-4 编码器,随 QuickTime 6 发布,质量很差.

Apple H.264,Apple 公司自己开发的 H.264 编码器,随 QuickTime 7 发布,支持 HDTV.

Ogg 是 Xiph.org 基金会发起的一个开放源代码项目,包括视频音频,服务器,传输系统,客户端,硬件支持等,最为大家熟悉的就是音频 Ogg Vorbis,它被认为是迄今为止 128kbps 码率上最好的编码器.

On2 VPX系列,On2 公司开发了一系列优秀的视频编码,现在应用得最多的恐怕是 Nullsoft Video 的视频,它们就采用了 VP3,VP5,VP6 视频编码.

Flash Video,Macromedia 公司推出的多媒体格式,主要用于在 Flash 中压缩视频.视频采用 Sorenson 公司的 Spark 编码器,音频采用 MP3,质量比较差.传闻下一代 Flash Video 准备使用 On2 VP6 ,那将让视频质量得到一个量的提升.

M-JPEG(Motion-JoinPhotographicExpertsGroup)技术即运动静止图像(或逐帧)压缩技术,广泛应用于非线性编辑领域可精确到帧编辑和多层图像处理,把运动的视频序列作为连续的静止图像来处理,这种压缩方式单独完整地压缩每一帧,在编辑过程中可随机存储每一帧,可进行精确到帧的编辑,此外M-JPEG的压缩和解压缩是对称的,可由相同的硬件和软件实现.

四种主流的视频压缩编码标准:

Windows Media Video 9
　　相比起其他三种图像压缩技术,WMV可能是使用率最高的视频编码格式.原因十分简单,如果想使自己的影片直接给网上其他用户观看到的话,利用微软自身的视频编码标准是最简单的做法.因为只要用户的电脑中有Windows Media Player(媒体播放器),就能够播放WMV影片,而且不用额外安装Codec(编码),所以兼容性方面完全不用担心.借助Windows Media 9.0 Series的新技术,Windows Media Video 9.0比旧的8.0版有多达15-50%的压缩率提高.而且与MPEG-4画质相比时,其容量大小只需一半即可达到.加上配合Windows Media Service 9.0服务器,在Streaming media(流媒体)方面也有更佳的表现.　　
官方网站:http://www.microsoft.com

Real Video 9
　　玩电脑时间长的朋友都知道,Real Video是多年前市场上最普及的音乐、图像格式.不过随着MP3及WMV等的兴起,已经使Real Media格式的普及率大不如前.但现在全世界仍然有许多的电脑玩家是Real Video的支持者,网上供下载的影片很多也是RM或RMVB格式.
　　RealNetwork新推出了一套名为Helix Producer的工具(也就是Real Producer 9),其中的RealVideo 9在图像压缩编码技术方面作出重大优化,无论在下载或Streaming时都声称比Windows Media 9出色,能够以一半的比特速率(bitrate)达到MPEG-4级图像,在约500 Kbps时达到接近DVD的画质表现.同样地,配合服务器可获得更出色的效果.
官方网址:http://www.realnetworks.com

DivX
　　历史介绍: ISO公布了"超低比特率活动图像和语音压缩标准 ",排序MPEG-4,1998年10月批准第一版,1994年4月又公布了第二版及其校验模型(VM),MPEG－4正式编号是ISO/IEC国际标准14496,它是一种新型的多媒体标准,它与前标准一个重要区别就在于,是一个基于对象的视编码压缩标准,所定义的码率控制的目标就是获得在给定码率下的最优质量,它为互联网上传输高质量的多媒体视频提供了很好的技术平台.
1998年微软开发了第一个在PC上使用的MPEG－4编码器,它包括MS MPEG4V1、MS MPEG4V2、MS MPEG4V3的系列编码内码,其中V1和V2用来制作AVI文件,一直到现在它都是作为Windows的默认组件,不过V1和V2的编码质量不是很好,一直到MS　MPEG4V3才开始有好转,画质有了显著的进步,但是不知微软出于什么目的,却将这个MS　MPEGV3的视频编码内核封闭,仅仅使其应用于Windows Media流媒体技术上,也就是我们熟悉的ASF流媒体文件中.ASF文件虽然有一些优势,但是由于过分的封闭不能被编辑,末得到广泛应用,这便惹怒了那些个不怕天不怕地的视频黑客和致力于钻研视频编码的高手,后来,这些小组不仅破解了微软的视频编码,而且经过他们的修改,一种新的视频编码诞生了:那就是广为流传的MPEG编码器－DivX3.11.
　　DivX采用了MS的MPEGV3,改良后并加入自己功能称之为DivX3.11,也是目前互联网上普通采用的MPEG－4编码器之一.很快,DivX被传得红得发紫,几乎成了业界的标准,但是,同样很快地出现了,DivX的基础技术是非法盗用微软的,微软声称将对所有推动DivX发展的人、企业进行追究,可是DivX技术的创造者之一罗达(Rota)正全面申请将DivX合法化,这是基于DivX虽然是从Window的发明出来的,但却没有用过任何微软的技术,更组建新公司DivXNetworks全力推广DivX,看来DivX(俗称压缩电影)蓬勃发展的大潮是势不可挡了.
　　看来任何吸引眼球的故事在关键时刻都会发生转折,DivX的发展竟也不能脱离这一俗套,就在DivX顺利发展时期,DivX的技术逐渐成熟,商机无限的时候,一台好戏上演了,DivXNetworks成立初衷就是摆脱微软的技术封闭,因而发起一个完全开放源码的项目,名为 " Projet Mayo ",目标是开发一套全新的、开放源码的MPEG4编码软件,由于它完全符合ISO　MPEG标准,又是完全开放源代码,OpenDivXCODEC吸引了很多软件,视频高手参与,很快便开发出具有更高性能的编码器Encore2等等,就在DivX最辉煌的时期,DXN公司突然封闭了DivX的源代码,并在Encore2的基础上发布了自有产品DivX4,原来DXN早就给自己留了后门,DivX采取的是LGPL协议,而不是GPL协议,虽说它们都是公共许可证协议,保障自由使用和修改软件或源码的权利,但LGPL允许私有,DXN就是利用这一协议初其不备的耍出了大刀.
　　接着,很多被DXN公司狠狠涮了一回的软件、视频团体另起门户,逐渐重新聚拢开发力量,高举复仇大旗,在OpenDivX版本基础上,再次开发出一种新的MPEG－4编码--XviD,名字的顺序和DviX刚好相反,仅仅从名字就可以看出Xvid充满了复仇的力量.
　　DivX是近一两年来称霸网络视频的图像压缩编码标准.起初它是以微软MPEG 4视频编码标准为基础修改和开发的,并以免费方式发布.其特点是具有十分不错的压缩比率,可以将一整套DVD质量的影片压缩存放到一张CD-R光盘中.现在的DivX分为普通版和Pro版,其中后者还有收费版和Adware(广告)版两种,自带DivX Player程序进行播放.用户如果安装了免费的DivX Codec后,也可用Windows Media player观看DivX影片.
官方网站:http://www.divx.com

Koepi's XviD Codec
　　相比起前三种视频编码标准来说,Xvid推出市场的时间最迟.从其名字就知道这种标准是针对DivX而来的.原来,DivX由免费转为收费编码后,使部份原有开发人员不满,继而离开并组成一个新的开发小组,设计免费且开放源代码的XviD Codec.当前,Koepi和Nic的XviD都是比较活跃和最多人使用的版本,虽然两者在编译上有所不同,但实际做出的效果相差无几.Xivd与DivX一样,在编译后都是一个.AVI文件,播放时只要安装Xvid codec就能用Windows媒体播放器中播放.
官方网站:http://roeder.goe.net/~koepi

视频压缩基本概念:

有损和无损压缩: 在视频压缩中有损(Lossy)和无损(Lossless)的概念与静态图像中基本类似.无损压缩也即压缩前和解压缩后的数据完全一致.多数的无损压缩都采用RLE行程编码算法.有损压缩意味着解压缩后的数据与压缩前的数据不一致.在压缩的过程中要丢失一些人眼和人耳所不敏感的图像或音频信息,而且丢失的信息不可恢复.几乎所有高压缩的算法都采用有损压缩,这样才能达到低数据率的目标.丢失的数据率与压缩比有关,压缩比越小,丢失的数据越多,解压缩后的效果一般越差.此外,某些有损压缩算法采用多次重复压缩的方式,这样还会引起额外的数据丢失.

帧内和帧间压缩: 帧内(Intraframe)压缩也称为空间压缩(Spatial compression).当压缩一帧图像时,仅考虑本帧的数据而不考虑相邻帧之间的冗余信息,这实际上与静态图像压缩类似.帧内一般采用有损压缩算法,由于帧内压缩时各个帧之间没有相互关系,所以压缩后的视频数据仍可以以帧为单位进行编辑.帧内压缩一般达不到很高的压缩. 采用帧间(Interframe)压缩是基于许多视频或动画的连续前后两帧具有很大的相关性,或者说前后两帧信息变化很小的特点.也即连续的视频其相邻帧之间具有冗余信息,根据这一特性,压缩相邻帧之间的冗余量就可以进一步提高压缩量,减小压缩比.帧间压缩也称为时间压缩(Temporal compression),它通过比较时间轴上不同帧之间的数据进行压缩.帧间压缩一般是无损的.帧差值(Frame differencing)算法是一种典型的时间压缩法,它通过比较本帧与相邻帧之间的差异,仅记录本帧与其相邻帧的差值,这样可以大大减少数据量.

对称和不对称编码: 对称性(symmetric)是压缩编码的一个关键特征.对称意味着压缩和解压缩占用相同的计算处理能力和时间,对称算法适合于实时压缩和传送视频,如视频会议应用就以采用对称的压缩编码算法为好.而在电子出版和其它多媒体应用中,一般是把视频预先压缩处理好,尔后再播放,因此可以采用不对称(asymmetric)编码.不对称或非对称意味着压缩时需要花费大量的处理能力和时间,而解压缩时则能较好地实时回放,也即以不同的速度进行压缩和解压缩.一般地说,压缩一段视频的时间比回放(解压缩)该视频的时间要多得多.例如,压缩一段三分钟的视频片断可能需要10多分钟的时间,而该片断实时回放时间只有三分钟.

第三部分:音频文件格式

一些音频的参数含义:

声道: 目前人们所使用的各种声场技术规范非常多,但最常见的几乎都来自三家公司,他们是Dolby(杜比)、HTX和DTS.声卡所支持的声道数是衡量声卡档次的重要指标之一,从单声道到最新的环绕立体声,下面一一详细介绍:

单声道: 单声道是比较原始的声音复制形式,早期的声卡采用的比较普遍.当通过两个扬声器回放单声道信息的时候,我们可以明显感觉到声音是从两个音箱中间传递到我们耳朵里的.这种缺乏位置感的录制方式用现在的眼光看自然是很落后的,但在声卡刚刚起步时,已经是非常先进的技术了.

立体声: 单声道缺乏对声音的位置定位,而立体声技术则彻底改变了这一状况.声音在录制过程中被分配到两个独立的声道,从而达到了很好的声音定位效果.这种技术在音乐欣赏中显得尤为有用,听众可以清晰地分辨出各种乐器来自的方向,从而使音乐更富想象力,更加接近于临场感受.立体声技术广泛运用于自Sound Blaster Pro以后的大量声卡,成为了影响深远的一个音频标准.时至今日,立体声依然是许多产品遵循的技术标准.

准立体声: 准立体声声卡的基本概念就是:在录制声音的时候采用单声道,而放音有时是立体声,有时是单声道.采用这种技术的声卡也曾在市面上流行过一段时间,但现在已经销声匿迹了.

四声道环绕: 人们的欲望是无止境的,立体声虽然满足了人们对左右声道位置感体验的要求,但是随着技术的进一步发展,大家逐渐发现双声道已经越来越不能满足我们的需求.由于PCI声卡的出现带来了许多新的技术,其中发展最为神速的当数三维音效.三维音效的主旨是为人们带来一个虚拟的声音环境,通过特殊的HRTF技术营造一个趋于真实的声场,从而获得更好的游戏听觉效果和声场定位.而要达到好的效果,仅仅依靠两个音箱是远远不够的,所以立体声技术在三维音效面前就显得捉襟见肘了,但四声道环绕音频技术则很好的解决了这一问题.四声道环绕规定了4个发音点:前左、前右,后左、后右,听众则被包围在这中间.同时还建议增加一个低音音箱,以加强对低频信号的回放处理(这也就是如今4.1声道音箱系统广泛流行的原因).就整体效果而言,四声道系统可以为听众带来来自多个不同方向的声音环绕,可以获得身临各种不同环境的听觉感受,给用户以全新的体验.如今四声道技术已经广泛融入于各类中高档声卡的设计中,成为未来发展的主流趋势.

5.1声道: 5.1声道已广泛运用于各类传统影院和家庭影院中,一些比较知名的声音录制压缩格式,譬如杜比AC-3(Dolby Digital)、DTS等都是以5.1声音系统为技术蓝本的.其实5.1声音系统来源于4.1环绕,不同之处在于它增加了一个中置单元.这个中置单元负责传送低于80Hz的声音信号,在欣赏影片时有利于加强人声,把对话集中在整个声场的中部,以增加整体效果.相信每一个真正体验过Dolby AC-3音效的朋友都会为5.1声道所折服.千万不要以为5.1已经是环绕立体声的顶峰了,更强大的7.1系统已经出现了.它在5.1的基础上又增加了中左和中右两个发音点,以求达到更加完美的境界.由于成本比较高,没有广泛普及.

音频格式详细介绍:

WMA
　　WMA的全称是Windows Media Audio,是微软力推的一种音频格式.WMA格式是以减少数据流量但保持音质的方法来达到更高的压缩率目的,其压缩率一般可以达到1:18,生成的文件大小只有相应MP3文件的一半.此外,WMA还可以通过DRM(Digital Rights Management)方案加入防止拷贝,或者加入限制播放时间和播放次数,甚至是播放机器的限制,可有力地防止盗版.
　　优点 WMA 7之后的WMA支持证书加密,未经许可(即未获得许可证书),即使是非法拷贝到本地,也是无法收听的.同时,微软公司开始时宣称的:同文件比MP3体积小一倍而音质不变,也得到了兑现.事实上,这个说法,仅仅适用于低比特率的情况,另外,微软公司在WMA 9大幅改进了其引擎,实际上几乎可以在同文件同音质下比相同的MP3体积少1/3左右.缺点在高比率的渲染能力低下,同音源的一个320KBPS的MP3与比较192KBPS的WMA相比,音质和渲染力很容易分别出是前者较优.

VQF
　　VQF即TwinVQ(Transform－domain Weighted Interleave Vector Quantization),是由NTT(Nippon Telegraph and Telephone)与Yamaha共同开发的一种音频压缩技术.VQF的音频压缩率比标准的MPEG音频压缩率高出近一倍,可以达到18:1左右甚至更高.也就是说把一首4分钟的歌曲(WAV文件)压成MP3,大约需要4MB左右的硬盘空间,而同一首歌曲,如果使用VQF音频压缩技术的话,那只需要2MB左右的硬盘空间.因此,在音频压缩率方面,MP3和RA都不是VQF的对手.
　　但是VQF不支持"流",这可能也是为什么现在它完全被WMA压下去的一个主要原因.

MP3
　　MP3的全称是Moving Picture Experts Group Audio Layer III.简单的说,MP3就是一种音频压缩技术,由于这种压缩方式的全称叫MPEG Audio Layer3,所以人们把它简称为MP3.MP3是利用MPEG Audio Layer 3的技术,将音乐以1:10甚至1:12 的压缩率,压缩成容量较小的file,换句话说,能够在音质丢失很小的情况下把文件压缩到更小的程度.而且还非常好的保持了原来的音质.正是因为MP3体积小,音质高的特点使得MP3格式几乎成为网上音乐的代名词.每分钟音乐的MP3格式只有1MB左右大小,这样每首歌的大小只有3-4兆字节.使用MP3播放器对MP3文件进行实时的解压缩(解码),这样,高品质的MP3音乐就播放出来了.　　
　　MP3最受争议的就是音质问题(尤其是随着WMA的普及),其高频损失很大,很多MP3编码器粗糙的编码算法不但导致高频丢失,还丢失了许多细节,类似吉他擦弦的感觉在MP3中是找不到的.在对MP3快要失望时,偶发现了Lame,它支持根据人耳遮蔽效应原理来分析波形,配合VBR技术,可以让音质达到令人吃惊的地步;其独创的心理音响模型技术保证了CD音频还原的真实性,配合VBR(动态比特率)和ABR(平均比特率)参数,编码出来的MP3音色纯厚、空间宽广、低音清晰、细节表现良好,音质几乎可以媲美CD音频,但文件体积却非常小.很多网友在使用LAME后的反映就是:立刻删除硬盘上所有的MP3和其他编码器,全部用Lame重新来过.Lame提供EXE和DLL,其中DLL是作为标准的动态运行库供其他程序调用.EXE是Command Line程序,象DOS程序一样工作,两者彼此独立,互不关联.但大家很快能发现两者编码的质量是不一样的,那是由于dll可控性差,与具备丰富调节参数的EXE版相比,其压缩出来的MP3效果稍逊一筹.但EXE是一个命令行工具,操作很麻烦,幸亏有了WinLAMEr或lameGUIxp这些Shell.只要学会使用这些Shell(是傻瓜型的,一看即会),就可以用LAME压缩出最最精彩的MP3了.再说说APS,在LAME出现以前,APS就是最好的MP3编码器,它使用的Fraunhofer IIS编码算法,这比LAME使用的编码算法要先进,在192k Bitrate(CBR)下,甚至比LAME编码的曲子要优秀,细节明显要丰富一些,但APS本身不支持VBR,当Bitrate往上提高时,音质就要比LAME编码的要差了,大部分朋友的MP3的一般都是128-192K Bitrate的,因此APS仍旧有推荐的价值.特别是有很多MP3随身听不支持VBR和256K Bitrate以上的MP3,LAME就不一定合适这些朋友了,APS就成了不错的选择,由它编码的曲子,绝对不会辱没你昂贵的PLAYER.

MP3PRO
　　MP3PRO完全是基于传统MP3编码技术的一种改良,本身最大的技术亮点就在于SBR(Spectral Band Replication频段复制),这是一种新的音频编码增强算法.它提供了改善低位率情况下音频和语音编码的性能的可能.这种方法可在指定的位率下增加音频的带宽或改善编码效率,SBR最大的优势就是在低数据速率下实现非常高效的编码.如果在高数据速率的情况下,SBR将如同虚设.当制作MP3PRO文件时,编码器将音频分为两部分.一部分是将音频数据中的低频段部分分离出来,通过传统的MP3技术而编码得出的正常的MP3音频流,此举可令到MP3编码器可以专注于低频段信号从而获得更好的压缩质量,而且原来的MP3播放器也可播放MP3PRO文件.另一部分则是将分离出来的高频段信号进行编码并嵌入到MP3流中,传统的MP3播放器会将其忽略掉,而新的MP3PRO播放器则可从中还原出高频信号,并将两者进行组合,得到高质量的全带宽的声音.官方宣称通过这样的技术,使得MP3PRO能在64kbps的编码率便可提供与128kbps的mp3相同的质量.低比特率下MP3PRO的性能很明显地比MP3要高,但是它与WMA谁胜谁负就很难说了,根据一些发烧友的评测, MP3PRO似乎略胜一些.高比特率下很少有人用到MP3PRO.

OGG
　　OGG格式的全称应该是OGG Vobis.它是一种新的音频压缩格式,类似于MP3等现有的音乐格式.但有一点不同的是,它是完全免费、开放和没有专利限制的.OGG Vobis有一个很出众的特点,就是支持多声道,随着它的流行,以后用随身听来听DTS编码的多声道作品将不会是梦想.OGG Vobis在压缩技术上比MP3好,而且它的多声道,免费,开源这些特点,使它很有可能成为一个流行的趋势,这也正是一些MP3播放器对其支持的原因.
　　在高音质要求下,有损音频编码世界中是三足项立,分别为MP3、MPC、OGG.　
　　Ogg Vorbis中的主要算法还是利用MDCT(修饰离散余弦变换Modified Discrete Cosine Transform )而不是用现在比较时兴的小波(wavelet)技术.Ogg的多通道编码技术,统称为立体声通道耦合Stereo Channel Coupling.而该技术实际又是由两种不同的技术组成的:channel interleaving 和 square polar mapping,而这也是Ogg能成为免费制式的一个必要条件,以往的"联合立体声Joint Stereo"的编码模式是有专利限制的.据官方声称,与其他会造成立体空间感减弱的编码模型相比,这两种技术都可以在保持编码器的灵活性的同时而不损害本来的立体声空间影像――相信配合iRiver的3d音效会有更好的表现力,而且实现的复杂程度比联合立体声方式要低.
　　OGG Vorbis这种编码也远比90年代开发成功的MP3先进,它可以在相对较低的数据速率下实现比MP3更好的音质！――我认为Ogg很象MD的atrac格式,特别象新的lp2编码,它能在低别特率下有着很要的音质.此外,在编码上,Ogg Vorbis是使用了VBR(可变比特率)和ABR(平均比特率)方式进行编码,所以理论上,Ogg Vorbis带来的音乐可以比采用CBR文件有更好的声音表现,当然前提是两者使用同样比特率(Bit Rate)的压缩模式――这里可以知道.Ogg Vorbis的比特率缩放功能可以在不用重新编码的情况下调节文件的相关压缩率,与此同时,Ogg文件的单位编辑能力和超越左右声道的音频流技术可以带来更为奇妙的音乐享受.Vorbis还具有比特率缩放功能,可以不用重新编码便可调节文件的比特率.
　　Vorbis文件可以被分成小块并以样本粒度(granularity,专业术语,指数据可以被分割的最小尺寸)进行编辑；Vorbis支持多通道(大于2)音频流并使用了独创性的处理技术；这意味着什么？这意味着Ogg Vorbis在SACD、DTSCD、DVD AUDIO抓轨软件(目前这种软件还没有)的支持下,可以对所有的声道进行编码,而不是MP3只能编码2个声道.多声道音乐的兴起,给音乐欣赏带来了革命性的变化,尤其在欣赏交响时,会带来更多临场感.这场革命性的变化是MP3无法适应的.在以后的播放技术不断提高以后,而且人们对音质要求不断提高,Ogg的优势将更加明显.
　　
MPC
　　MusePaCk是由德国人Andree Buschmann开发的一种完全免费的高品质音频格式.在其问世之前,Lame MP3是公认音质最好的有损压缩方案,追求音质的人对它趋之若鹜.但现在这个桂冠无疑该让给MPC了,在中高码率下,MPC可以做到比MP3更好音质.在高码率下,MPC的高频要比MP3细腻不少,可以在节省大量空间的前提下获得最佳音质的音乐欣赏,是目前最适合用于音乐欣赏的有损编码.
　　MPC的编码方案是在MP2的基础上改进而来.它同样采用子带编码技术,但相比MP2,它所采用的心理声学模型要优秀得多,并加入了像ANS(Adaptive Noise Shaping)、CVD(ClearVoiceDetection)等技术,甚至改变了压缩时所用的Huffman(哈夫曼)编码,以得到更大的压缩率.另外,MPC采用的是可变码率进行编码.毫无疑问,可变码率的编码效率要高于固定码率,因为前者可以合理地分配数据量,在信号复杂(微弱)时提高(降低)比特率,在得到满意的效果又能确保不错的压缩率.为了保证高音质,MPC的瞬间最大码率甚至高达1.32Mbps,这已经快接近CD的1.41Mbps了
　　较高比特率下(250kbps左右),MPC表现非常的出众,甚至超过了MP3,很难分辨它和原始信号有多少区别,无论从频率保留还是细节保留,以及信号强度失真来说,MPC太优秀了.但MPC并非万能的,它无法编码48khz采样率的曲子,所幸的是,这样的曲子来源很少.可惜这种格式并没有像MP3或WMA那样流行.　
　
ATRAC
　　ATRAC(Adaptive TRansform Acoustic Coding自适应声学转换编码技术):是Sony的原创音乐压缩技术,主要用于MD Walkman的录音及播放方面.是一项基于听觉心理学领域的研究和不损伤可闻声质量的数码音频译码压缩技术,对音乐资讯有效的进行压缩,压缩的比率为原来的五分之一,因为MD使用了ATRAC压缩技术,这样的压缩大大节省了许多空间,所以 CD的碟片要120mm大小,而MD只需64mm就可以录下74分钟的音乐.
　　ATRAC压缩技术主要是利用了人耳的蔽遮效应,在心理声学原理上,在进行音频录入的同时,有许多外部的频段同时也会被录入,当人耳同时听到两个不同频率、不同音量的声音时,音量较小的低频及音量较小的高频连同不为人耳所察觉的频段信号都会被自动减弱或忽略不予记录,因此又可以称为适应性变换声码技术,由于近年來编码压缩技术(ATRAC的版本)越來越成熟,所以经过编码解码过程后的声音仍直逼CD,大家就不必担心音质差啦.
　　ATRAC将16比特44.1KHz的数字信号以频率响应轴分成52个区段(在低频时分割较细而在高频时分割较粗),根据声音心理学的原理,将声音信号中人耳听不到和对人的听力影响不大的信息给剔除出去而达到缩小声音文件的目的.利用这种原理,ATRAC可以将录音的资料量压缩为原来的五分之一(即压缩比为1:5).

APE
　　 APE的本质,其实它是一种无损压缩音频格式.庞大的WAV音频文件可以通过Monkey's Audio这个软件进行"瘦身"压缩为APE.很时候它被用做网络音频文件传输,因为被压缩后的APE文件容量要比WAV源文件小一半多,可以节约传输所用的时间.更重要的是,通过Monkey''s Audio解压缩还原以后得到的WAV文件可以做到与压缩前的源文件完全一致.所以APE被誉为"无损音频压缩格式",Monkey's Audio被誉为"无损音频压缩软件".与采用WinZip或者WinRAR这类专业数据压缩软件来压缩音频文件不同,压缩之后的APE音频文件是可以直接被播放的. Monkey''s Audio会向Winamp中安装一个"in_APE.dll"插件,从而使Winamp也具备播放APE文件的能力.
　　和上面介绍的几款编码不同的是,这个编码提供了最好的音质保证(无损压缩)！还提供了Winamp的插件支持,可以直接用Winamp来播放.所谓无损就是指压缩后的格式和源文件在音质上并无差异,而Mp3、WMA等的编码方案是基于有损的,在损失部分音质的前提下节约存贮空间,所以说音质再好的Mp3、WMA也只能是无限接近源文件的音质.APE非常适合来编码讲究细节的独奏曲目和大动态的交响曲.向各位音乐迷们(不是歌迷)作最强烈的推荐！它的压缩比约为2:1.

WAV
　　WAV是录音时用的标准的windows文件格式,文件的扩展名为".wav",WAVE文件作为最经典的Windows多媒体音频格式,应用非常广泛.声道有单声道和立体声之分,采样频率一般有11kHz、22kHz和44kHz三种.
WAVE文件所占容量=(采样频率×采样位数×声道)×时间/8(1字节=8bit).
　　WAV文件与MIDIMP3这类多媒体声音文件比较起来,所占的硬盘空间要大得多,但WAV文件的回放效果是最好的,WAV文件直接反映了一个声音在每个时刻的大小值,1分钟44khz采样率的WAV文件就会占用10M硬盘空间！
　　它通常作为制作高质量音乐的中间体

RM
　　Real Networks公司所制定的音频视频压缩规范称为Real Media,用户可以使用RealPlayer或RealOne Player对符合RealMedia技术规范的网络音频/视频资源进行实况转播并且RealMedia可以根据不同的网络传输速率制定出不同的压缩比率,从而实现在低速率的网络上进行影像数据实时传送和播放.这种格式的另一个特点是用户使用RealPlayer或RealOne Player播放器可以在不下载音频/视频内容的条件下实现在线播放.另外,RM作为目前主流网络视频格式,它还可以通过其Real Server服务器将其它格式的视频转换成RM视频并由Real Server服务器负责对外发布和播放.RM和ASF格式可以说各有千秋,通常RM视频更柔和一些,而ASF视频则相对清晰一些. RM格式一开始就定位在视频流应用方面,也可以说是视频流技术的始创者.它可以在用56 K Modem拨号上网的条件下实现不间断的视频播放,当然,其图像质量和MPEG2,DIVX等相比有一定差距,毕竟要实现在网上传输不间断的视频是需要很大带宽的.
　　RM已经是昨日黄花,没有任何新意,低Bitrate比不过WMA,高Bitrate比不过MP3,虽然新的RM导入了ATRAC3算法,但颓势已定,很难东山再起了.

各音频编码的应用场合简要:

MPEG Audio Layer 1典型数据压缩率是1:4,即每个立体声信号为384 kbps

MPEG Audio Layer 2典型数据压缩率是1:4---1:8,即每个立体声信号为256到192 kbps.MPEG Audio Layer1/2主要用于vcd,svcd的音频编码

MPEG Audio Layer 3,也就是大名鼎鼎的mp3,已经成为网络音频的主流格式,能在128kbps的码率下接近cd音质.典型数据压缩率是1:10---1:12,即每个立体声信号为128到112 kbps

MPEG-2 AAC(Advanced Audio Coding)是在1997年由以Bosi、Brandenburg、Johnston等为首的音频编码研究提出的,它总结了MPEG-1、MPEG-2和AC-3等的长处,在MPEG 系统上进一步改进了很多新的功能,大大增强了编码的灵活度,在保证音质的同时更大限度地压缩了码率.它和传统的mpeg audio不兼容,在理论上质量要高于mp3,并且支持多声道,在96kbps的码率范围内能接近cd音质,比mp3更加适合低码率传输；同时,MPEG-2 AAC已经成为MPEG-4标准中高质量音频编码的核心,是下一代音频压缩标准.

MPEG-4 AAC:是MPEG-4标准音频编码标准的一部分,apple公司自己开发有这种 AAC 编码器,质量非常好,是最优秀的 AAC 编码器之一,随 QuickTime 6 发布

杜比数字AC-3技术也就是5.1声道技术

Windows Media Audio v1/v2,微软最早的音频编码技术,用于 ASF 中,后来被破解也用在 DivX Audio 中,质量比较差.

Windows Media Audio 7/8/9,随着各种不同的 WMV 而推出的相应的音频编码,质量节节提升,不过还没有达到 64kbps CD音质的神化

Windows Media Audio 9 Professional,WMA9 中出现的新编码,主要用于多声道编码和高采样率音频的编码,质量不错.

RealAudio Cook,早期的音频编码,但是在现在看来,仍然质量不错,可惜最高码率 96kbps.应用到了两代音频编码中:RealAudio G2、RealAudio 8.

RealAudio Sipro,采用了 Sipro 语音编码技术,主要针对语音编码,应用在更早期的 RealAudio 4.0、RealAudio 5.0 中.

RealAudio AAC,AAC 音频编码,用于 RealAudio 10 中.

RealAudio aacPlus,aacPlus 音频编码,用于 RealAudio 10 中,不过并没有随 RealProducer 发行,需要单独购买.

QDesign Music 2,QDesign Music 的第二个版本,也是最后一个版本,在时下这些先进的音频编码面前,它已经没有生命力了,主要应用于网上的电影预告片.

Apple MPEG-4 AAC,Apple 公司自己开发的 AAC 编码器,质量非常好,是最优秀的 AAC 编码器之一,随 QuickTime 6 发布.