直播软件语音前处理介绍

本贴最后更新于 1367 天前,其中的信息可能已经东海扬尘

一、什么是语音前处理?
QQ和微信在音视频通话时,麦克风除实时采集用户声音外,周围环境噪声也会被采集、同时用户说话音量也可能会忽大忽小,而噪声、回声以及音量大小都会影响到对端收听到语音质量,因此在麦克风采集后,音频数据编码前会有噪声、回声、音量调节的预处理过程,来提高语音的通话质量,这个处理过程就叫语音前处理。

二、如何进行语音前处理?
语音前处理包括:语音增益放大AGC、回声抵消AEC、噪声抑制NS,多人通话中还会增加VAD(静音检测选路),以下先简要介绍3A前处理:

AGC:语音增益控制(Automatic Gain Control)

用户在语音通话时,麦克风和说话者距离经常会改变,导致对端听到的声音忽大忽小,为了改善上述情况的通话效果,AGC可以调节麦克风的收音量(模拟信号放大)或调节数字信号的强度,使收听到的语音音量变化平稳。

AEC:回声抵消(Acoustic Echo Canceller)
用户在语音通话时,收到的语音通过扬声器播放出来后,声音经过周围环境的反射,又会被麦克风采集到,使得对端在说话时还会听到自己的说话声音,这就是语音通话的回声,如果某些设备的扬声器和麦克风距离比较近,那么对端听到自己说话的回声可能比交流声音还大,导致无法听清。

ANS:噪声抑制(Automatic Noise Suppression)
语音通话时,背景通常都会有风扇、空调声等噪声,这些声音也同样会被麦克风采集,从而影响语音的清晰度,因此ANS可以探测出干扰人声的杂音频率然后进行消除。

2 回帖
请输入回帖内容 ...