1期_音频基本概念
2023-09-09 本文已影响0人
萧修
声音频率
声音频率一般用赫兹表示,记为Hz,指每秒周期性震动的次数
频率:音调越高,频率越大,音调越低,频率越小。(弦乐器中,越细的炫振动频率越高,音调越高,人耳听起来,声音较为尖锐)
波长:音调越高,波长越短,音调越低,波长越长
振幅:音量(响度)越大,振幅越大,音量越小,振幅越小
人耳感知的声音在20Hz~20000Hz,
基本概念
录制音频就是对连续音频信号的采样,以0和1记录,所以PCM不是连续的音频(脉冲编码调制,无损的音频编码格式,直接记录音频信号的样本值。)
-
采样(Sample):
将连续的模拟信号转换为离散的数字信号的过程, -
采样率(Sample Rate)一个很重要的概念,每秒钟对音频采样的次数,44.1khz
-
声道(Channel):声道数可以理解为有多少采样点采样,采样点越多,表示越多的表达方式
单声道在声音处理过程中,只有单数据流,而立体声则需要左,右两个数据流,显然,立体省的效果最好,但相应的数据量比单声道多
-
采样位数(Audio bit depth):使用脉冲编码调制(PCM)的数字音频中,bit depth表示每个采样点占用的位数。并直接对应每个采样的分辨率
-
比特率(Bit Rate):比特率是指每秒传送的比特数,单位为bps(bit per second)比特率越高,传送速度越快,声音中的比特率是指将模拟信号转为数字信号后,单位时间内的二进制数据量,是衡量音频质量的一个标准
Bit Rate(sample rate * Audio bit depth * Channel)
比特率= 采样率 * 采样位数 * 声道数
- Frame:frame是离散采样的集合,例如一个linear PCM stereo sound文件中每个frame有两个采样,分别来自左右声道。
frame是最小单位时间点包含的一个或多个声音采用,最小单位时间点取决于采样设备,是一个时间点多个采用的集合
- Packet:是一个或多个连续Frame的集合,对于一个给定的音频格式,Packet定义了最小有意义的frame集合,并且是最小的可测量时间单位
iOS录音基本单位
AudioStreamBasicDescription audioFormat;
audioFormat.mSampleRate = 44100;
audioFormat.mFormatID = kAudioFormatLinearPCM;
audioFormat.mFormatFlags = kAudioFormatFlagIsSignedInteger | kAudioFormatFlagIsPacked;
audioFormat.mFramesPerPacket = 1;
audioFormat.mChannelsPerFrame = 1;//声道数
audioFormat.mBitsPerChannel = 16;//采样位数
audioFormat.mBytesPerFrame = 2;//每一帧的字节数 mBitsPerChannel * mChannelsPerFrame/8
audioFormat.mBytesPerPacket = 2;//每一个包下字节数 mBytesPerFrame/mFramesPerPacket