【白水日记】关于音频（二）

2021-03-02 本文已影响0人 d2665f7588cb

音频在传输和使用的过程中，需要进行压缩，压缩的方向一般是压缩的比例和压缩的速度。

常用的思路就是消除冗余信息，因为人耳能听到的频率只有20hz-20000hz，采集到此频段之外的信息，可以全部剔除，一般用于有损压缩，不可逆，无损压缩类似zip,7z等压缩方案。

另外音频是冗余信息，一般听到的声音都是多个声音复合在一起，声音之间存在遮蔽。声音的遮蔽分为频域遮蔽和时域遮蔽。

频域遮蔽：两个声音同时播放，同时掩蔽，两个声音频率越相近，互相影响越大，相近的频率，声音高的声源会屏蔽声音低的声源。

时域屏蔽：由于大脑处理声音也需要时间，两个时间相邻的声音，也有遮蔽效应，前遮蔽较短，后遮蔽较长。

音频编码过程：时域转频域->心理声学->量化编码

常用的音频编码器有：opus，aac，ogg

opus：一般用于实时通信，压缩率高，延迟小，WebRTC默认

aac：为了取代mp3而设计，应用广，可以使用硬件编码

ogg：收费

Speex:一般用于消除回音

G.711：固定电话，窄带音频，损耗严重，失真