关于音视频 / 流媒体的简单介绍
2018-07-08 本文已影响0人
Manchangdx
一、基本概念
赫兹 / Hz
国际单位制中的频率单位,表示每秒时间内周期性变动的计量,就是每秒重复多少次
赫兹的名字来自于德国物理学家海因里希·鲁道夫·赫兹,符号是 Hz
120 Hz / 赫兹,就是每秒周期性变动 120 次
120 KHz / 千赫,就是每秒周期性变动 120 千次
120 MHz / 兆赫,就是每秒周期性变动 120 百万次
例如声音的三大特性(音色、音调、响度)之一的音调,就是由震动频率决定的
而震动频率的计量单位,就是 Hz
比特 / bit
计算机中最小的数据单位,存储单个的二进制数值 0 或 1
比特率 / bps
每秒传送的比特数,单位 bps(Bit Per Second)
比特率的单位还有一种常见的格式 Kb/s 或 Mb/s 它们等同于 kbps 或 mbps,常说的网速也是这个单位
比特率越高,传输数据的速度越快,其实就是单位时间内传输数据量越大
声音中的比特率是指将模拟声音信号转换成数字声音信号后,单位时间内传输 / 处理的二进制数据量
视频中的比特率也类似
采样率 / Data Rate
音视频的一个基本概念
以声音为例,把声波看成一条由点组成的曲线,采样率就是每秒钟声波长度中采样点的个数
所以采样率越高,声音的真实度就越高,音质就越好,同时音频文件的体积就越大
猜也猜得到,采样率的单位就是上面介绍的赫兹或千赫 / KHz
二、流媒体
简介
流媒体是采用流式传输技术在网络上连续实时播放的媒体格式
流式传输方式是将视频和音频等多媒体文件经过特殊的压缩方式分成一个个压缩包
由服务器向客户端连续、实时传送
客户端通过解压软件对这些数据进行解压后,多媒体就会像发送前那样显示出来
理解了流媒体,就不难理解直播了,因为直播也是一种流媒体
只不过相比视频、音乐网站这种传统的流媒体
直播流媒体的数据源是由客户端(主播)产生,然后实时推送到服务器的
因此,音视频就是流媒体的核心
音视频的组成
一个完整的视频文件,包括音频、视频和基础元件
我们常见的视频文件如 mp4、mov、flv、avi、rmvb 等
就是使用特定容器通过特定编码和算法对音频、视频进行封装的结果
因此,视频的生成需要三步:
对视频进行特定编码
对音频进行特定编码
选择容器进行封装
音频编码格式
常见的编码格式:
AAC
AMR
PCM
AC3(DVD 专用音频编码)
APE(monkey's 音频)
AU(Sun 格式)
MP3
WMA
各个编码格式的音质比较:
AAC+ > MP3PRO > AAC > RealAudio > WMA > MP3
视频编码格式
视频编码标准有两大系统: MPEG 和 ITU-T
国际上制定视频编解码技术的组织也有对应的两个:
一个是国际标准化组织(ISO),它制定的标准有 MPEG-1、MPEG-2、MPEG-4 等
另一个是国际电联(ITU-T),它制定的标准有 H.261、H.263、H.263+、H.264 等
常见的编码格式有:
Xvid(MPEG-4)
H.264 (目前最常用编码格式)
H.263
MPEG-2
AC-1
H.265(目前用得不多)
常见编码格式性能大致排序:
AVC/H.264 > Xvid/Divx > RM/RMVB > WMV7/8 > MPEG-2
存储封装格式
常用的封装格式:
AVI (.avi)
ASF(.asf)
WMV (.wmv)
QuickTime (.mov)
MPEG (.mpg / .mpeg)
MP4 (.mp4)
m2ts (.m2ts / .mts )
Matroska (.mkv / .mks / .mka )
RM (.rm / .rmvb)
TS/PS
三、音视频
音频
指人耳可以听到的,频率在 20HZ~20KHz 之间的声波
通常我们所说的音频,就是指数字音频,有采样频率、声音通道数 / 声道数、帧率等特性
采样频率:就是采样率,上面说过了
采样位数:即采样值,等同于声卡分辨率,是衡量声波变化的参数
采样率越大,发声能力越强
声道数:常有单声道和立体声之分
单声道只能用一个喇叭发生,立体声可以使用俩喇叭发不同的声音,当然还有更多声道
帧率:一帧就是一个声音单元,帧率 = 单位时间采样位数 × 声道数
视频
若干有联系的图像按一定的频率连续播放,形成动态视频图像,简称视频
视频的特性有码率、帧率、分辨率等
码率:也叫采样率、码流,跟音频的采样率概念类似
同分辨率下,码率越大
处理出来的文件越接近原始文件,压缩比越小,文件体积越大
画质越清晰,对设备的解码能力要求越高
同时码率越高,对带宽要求越高,就是网速要足够快
帧 / Frame :就是一张图嘛,24 帧就是 24 张图
帧率 / FPS(Frames Per Second):就是每秒播放的图的数量,游戏里常见的一个数值
根据视觉暂留原理,连续播放的图像超过 24 帧每秒,人眼就无法辨识单幅图像,看起来就是流畅的视频了
帧率越高,画面越流畅,CPU 消耗越大,越考验图形处理器的工作能力
分辨率:图像的规格
常见的有 640×480 、1024×768 ,指的是视频画面长度和宽度上的像素点数,单位是 px(pixel)
像素点就是不可再切分的单一正方形小格,以单一颜色填充
手机屏幕比是 18:9 指的就是屏幕长宽比,也就是像素点的比
2K 画质,就是 1920×1080 分辨率,长度上像素点的数量接近两千