杰理通话调试-1(概念)

杰理通话调试-1(概念)

通话算法各模块原理简介

AEC

AEC(Acoustic Echo Cancellation,声学回声消除)是通话算法中用于消除声学回声的核心技术。AEC通过自适应滤波器估计声学回声路径,并从麦克风信号中减去估计的回声信号,从而实现回声消除。

NLP

NLP(Nonlinear Processing,非线性压制)是一种在音频信号处理中常用的算法,主要用于消除或抑制残留回声和噪声。它通常与声学回声消除(AEC)结合使用,以进一步改善通话质量。NLP的核心思想是通过检测和抑制非线性失真部分的信号,从而减少回声和噪声对语音通信的影响。

DMS(ENC)

ENC (Environmental Noise Cancellation)降噪技术,是通过双/多麦克风阵列,精准计算通话者说话的方位,在保护主方向目标语音的同时,去除环境中的各种干扰噪声,例如其他人的讲话声、交通工具产生的噪音、风噪声等等。

DMS 双 mic 降噪系统属于 ENC 的一种。通过双 mic 相互作用,通话过程,给到远端接听的人以清晰语音。

顺便提一下,ANC 和 ENC 的区别:

ANC(Active Noise Cancellation,主动降噪)耳机系统通过麦克风采集环境噪声,并将此噪声反相叠加到喇叭端,人耳听到的是相位相反的两种噪声叠加结果,于是达到了消噪的目的。

ANC 的受益人是耳机使用者本人,通过 ANC 功能,让用户自己减少受到环境噪声的影响。

ENC 的受益人是通话的另一方,通过 ENC 功能,减少环境噪声对通话的影响,让对方听到清晰语音。

ANC 让自己听感环境更加安静,ENC 让通话的另一端听感环境更加安静。

降噪 NS 模块,可以选择传统降噪 ANS,也可以选择神经网络降噪 DNS,二选一。

ANS

ANS(Acoustic Noise Suppression,声学噪声抑制)是一种经典的音频信号处理技术,主要用于减少通话过程中背景噪声对语音质量的影响。与基于深度学习的DNS(Deep Noise Suppression)不同,ANS通常依赖于传统的信号处理方法,如频谱减法、维纳滤波等。

DNS

DNS(Deep Noise Suppression,深度噪声抑制)是一种基于深度学习的降噪技术,广泛应用于语音通话、视频会议和语音识别等场景中。其核心思想是利用深度神经网络(DNN)从混合信号中分离出干净的语音信号,同时抑制背景噪声。

ANS与DNS的区别

特性 ANS DNS
基础方法 传统信号处理 深度学习(CNN、RNN、Transfer等)
计算复杂度 较低 较高
适应性 对平稳噪音效果较好 对复杂噪声场景效果更好
训练要求 不需要训练数据 需要大量带噪音的语音数据

AGC

AGC(Automatic Gain Control,自动增益控制)是一种用于调节音频信号幅度的技术,广泛应用于语音通话、语音识别和音频处理等领域。其主要目标是动态调整输入信号的增益,使得输出信号的幅度保持在一定范围内,从而提高语音的可懂度和质量。

EQ

考虑到有些 mic 的物理特性,采集到的声音比较低沉或者其他比较让人不舒服的声音,可以适当的

对声音做 eq 处理。具体什么 eq 参数合适,根据实际情况进行修改。

远端和近端

连接测试产品(蓝牙耳机)的一段为近端

未接测试产品的一段为远端

回音

img