iOS之音频开发系列之音频基础
在正式学习音频开发之前,我们要认识下关于音频的一些基础。这些知识会有助于我们后面学习iOS的音频框架。
基础知识
-
音调,音色,音量
音调,音色,音量俗称声音的三要素,众所周知,声音是一种声波,那么音调就是声波的频率,音量就是声波的振幅,音色就是波形。
而人的听觉发声的范围20Hz-20000Hz,低于20Hz属于次声波,高于20000Hz属于超声波 -
数字音频与模拟音频
人发出的声音属于模拟音频,而机器要想输入或输出音频,就要用数字音频,那么如何把模拟音频转化成数字音频呢?就是通过PCM脉冲编码调制来转换的,而PCM脉冲编码调制的原理就是靠采样、量化和编码来实现的
采样、量化和编码
-
采样率
对于高质量的音频信号,其频率范围(人耳能够听到的频率范围)是20Hz~20kHz,所以采样频率一般为44.1kHz,这样就可以保证采样声音达到20kHz也能被数字化,从而使得经过数字化处理之后,人耳听到的声音质量不会被降低。而所谓的44.1kHz就是代表1秒会采样44100次 -
采样大小/量化格式
采样大小和量化格式指的是同一个东西,量化是指在幅度轴上对信号进行数字化,比如用16比特的二进制信号来表示声音的一个采样,而16比特所表示的范围是[-32768,32767],共有65536个可能取值,因此最终模拟的音频信号在幅度上也分为了65536层,那么这个16比特就是采样大小或者量化格式 -
声道数
声道数是指支持能不同发声的扬声器的个数,单声道的声道数为1个声道;双声道的声道数为2个声道;立体声道的声道数默认为2个声道;立体声道(4声道)的声道数为4个声道。 -
码率/比特率
码率和比特率是同一种概念,以CD的音质为例:量化格式(有的地方描述为位深度)为16比特(2字节),采样率为44100,声道数为2,这些信息就描述了CD的音质。而对于声音格式,还有一个概念用来描述它的大小,称为数据比特率/码率,即1秒时间内的比特数目,它用于衡量音频数据单位时间内的容量大小。而对于CD音质的数据,比特率为多少呢?计算如下:
44.1kHz * 16byte * 2 = 1378.125kb/s -
压缩原理
压缩编码的原理实际上是压缩掉冗余信号,冗余信号就是人耳听觉范围外的音频信号以及被掩蔽(频域掩蔽和时域掩蔽)的音频信号
效果器
-
均衡效果器
均衡效果器又称为均衡器(Equalizer),其最大的作用就是决定声音的远近层次。我们时常听到别人说这首歌曲是重金属风格的歌曲,或者说这首歌曲是舞曲风格等,其实就与声音的远近层次有关。不同歌曲风格的区别在于声音在不同频段的提升或衰减。我们常常在音乐app里面可以找到调节EQ的地方。 -
压缩效果器
压缩效果器又称为压缩器(Compressor),是指在时域上对声音强度所进行的一个处理。压缩器也可以简单地理解为:当音频的音量剧增的时候,自动将音量调小一点。压缩器就是改变输入信号和输出信号电平大小比率的效果器 -
延时效果器
通过延长很短的一段时间(卡拉OK延迟时间可以从50毫秒到1秒以上)进行混合,使声音更加声音丰富、饱满、有空间感。 -
混响效果器
声波在传播时会被各种障碍物反射,且每次反射都被障碍物吸收部分。于是听到的声音往往混合了原始声音以及多次反射的声音,这种现象叫做混响。通过混响效果器可以让在家里体会到在影院的效果。
图像
-
频谱图
以横轴纵轴的波纹方式,记录画出信号在各种频率的图形。(有振幅频谱图和相位频谱图) -
傅里叶分析
可分为傅里叶级数(Fourier Serie)和傅里叶变换(Fourier Transformation)。
你能想到的任何波形都是可以如此方法用正弦波叠加起来。
傅里叶级数,在时域是一个周期且连续的函数,而在频域是一个非周期离散的函数。
傅里叶变换,将时域信号变换为频域信号。
其他
-
MIDI格式
是20 世纪80 年代初为解决电声乐器之间的通信问题而提出的。MIDI是编曲界最广泛的音乐标准格式,可称为“计算机能理解的乐谱”。它用音符的数字控制信号来记录音乐。一首完整的MIDI音乐只有几十KB大,而能包含数十条音乐轨道。几乎所有的现代音乐都是用MIDI加上音色库来制作合成的。MIDI 传输的不是声音信号, 而是音符、控制参数等指令, 它指示MIDI 设备要做什么,怎么做, 如演奏哪个音符、多大音量等。
-
参考资料
《音视频开发进阶指南》—— 读书笔记
百度百科
《音视频开发进阶指南》书籍