【论文翻译】An optimization framework for designing robust cascade biquad feedback controllers on active noise cancellation headphones

发布时间 2023-03-24 19:00:04作者: lulu_yeah

下载地址:An optimization framework for designing robust cascade biquad feedback controllers on active noise cancellation headphones

Abstract

本文提出了一种直接在有源降噪耳机上利用实测二次路径(secondary path)频响设计固定反馈控制器的有效方法。所设计的控制器由多个双二阶滤波器(biquad filters)组成,采用遗传算法和单纯形法相结合的两阶段优化策略对其参数进行求解。该优化的损失函数构造采用传统的$H_2/H_\infty$方法,综合考虑了降噪水床效应鲁棒性。仿真和实验结果表明,该方法优化后的控制器在保证对植物变化的鲁棒性的同时,能在可接受的水床提升条件下实现较好的降噪效果。

1. Introductuin

主动降噪耳机(ANC)作为最受欢迎的个人听力保护设备之一,已广泛应用于噪声环境中。ANC耳机的控制器向降噪扬声器产生信号。这样鼓膜上的噪音就可以通过这个扬声器发出的声波来减少。根据滤波器系数是否时变,该控制器可分为固定控制器和自适应控制器。固定控制器的滤波系数保持不变,因此可以节省计算和电池寿命。根据控制结构,控制器可分为前馈控制器和反馈控制器,后者仅依靠误差传声器来降低声压级[1]。但是,受波德灵敏度积分定理(Bode’s sensitivity integral theorem)[2]的限制,低频段的噪声降低伴随着其他频率的噪声放大,这种现象被称为水床效应(the waterbed effect)。在实际应用中,理想的固定反馈控制器应该是低阶的,并在降噪、提升水床和鲁棒性之间做出合理的权衡。它的设计仍然具有挑战性,具有理论和商业价值,在过去的几十年里吸引了许多研究者。

早期的研究利用内部模型控制(IMC)结构,也称为Q参数化(Q-parameterization),将反馈结构转化为前馈结构,并选择有限脉冲响应(FIR)滤波器作为内部模型控制器,使优化问题凸化[3,4]。因此,可以采用序列二次规划等凸优化方法寻求唯一最优解[5,6]。Zhang等[7]尝试省略内部模型分支,直接设计反馈控制器。利用FIR滤波器实现控制器的频率响应,并利用最小二乘设计准则计算控制器的频率响应系数。所有这些都可以实现良好的降噪性能,并具有对环境变化的鲁棒性。然而,FIR控制器的阶数普遍较高,计算成本也相对较高,这促使我们寻找一种低复杂度的控制器用于实际应用。

耳与耳机形成的腔体可以看作是一系列亥姆霍兹谐振器,是一个具有多种模态的弱阻尼系统。在这种情况下,无限脉冲响应(IIR)滤波器作为控制器比FIR滤波器[1]更有效和优雅。这是因为差分方程中的回归项可以有效地对腔内的回波信号进行建模。这意味着用低阶IIR滤波器可以实现理想的控制器。没有内部模型分支的IIR控制器结构简单,计算成本小,节省了有限的处理能力,最大限度地延长了电池寿命。因此,它以模拟[8-11]或数字电路的形式广泛应用于实际生产中。然而,IIR控制器的稳定性并不能总是得到保证,这需要仔细设计。此外,由于忽略了模型内部分支[12],引入了非凸性,因此最优解的获取具有挑战性。

Bai和Lee[8]采用基于两个Riccati方程的H1鲁棒控制理论[13]进行控制器综合,并采用传递矩阵框架方法[14]保证控制器具有标称性能和鲁棒稳定性。然后采用一阶和二阶滤波器组成的级联模拟滤波器实现控制器。通过调整极点和零点的位置来拟合控制器的传递函数。这种间接设计方法还需要选择合适的加权函数来保证鲁棒性,在实际设计中比较复杂。

Yu和Hu[15]采用递归二次规划的方法找到了次优解,即滤波系数向量$b,a$的直接IIR控制器。众所周知,直接结构带来了极点半径提取的困难,因此采用Lienard-Chipart准则来保证控制器的稳定性,这增加了优化的复杂性。Seo et al.[16]首先尝试设计一个高阶FIR内模控制器,然后利用平衡模型截断近似和频率翘曲方法,用精确级联二阶截面(SOSs) IIR滤波器代替原有控制器。间接设计方法解决了直接优化的非凸性和困难,但转换不完善降低了降噪性能。

作为群智能算法的典型代表,遗传算法[17]已被应用于非线性有源噪声控制中,取代了filter-X算法,在不识别次要路径的情况下更新控制器的滤波系数[18,19],同时防止了局部极小值问题。

在有源噪声控制领域,采用Nelder-Mead (NM)单纯形方法[20],利用其良好的局部寻优能力对控制器参数进行整定。Kataja et al.[21]采用NM单纯形法优化固定反馈控制器中的双四块系数,并与遗传算法进行性能比较。NM优化器高度依赖于初始化,因此必须对随机选择的不同初始点应用多次,才能有机会找到全局最优。注意,GA和NM单纯形法的优点在[21]中没有得到充分利用。实际上,遗传算法可以为NM单纯形法提供一个很好的初始解。在有源噪声控制[22]中讨论了类似的两阶段混合优化策略。此外,在优化过程中没有鲁棒性约束准则,可能导致系统不稳定。

本文提出了一种直接优化的方法来设计用于ANC耳机的鲁棒级联双二阶反馈控制器。本文的其余部分组织如下:第2节建立了反馈控制的框架,定义了级联二阶控制器中SOS的具体形式,并描述了损失函数和两阶段优化策略。第三节详细介绍了ANC耳机系统的参数优化设置和实验结果。最后,第四部分给出了结论,并对今后的工作提出了一些挑战。

2. Method

2.1 Feedback control framework

一些定义:

  1. \(\mathbf{D}(z)\):主要路径噪声

  2. \(\mathbf{P}(z)\):次级路径传递函数

  3. \(\mathbf{E}(z)\):误差信号

图1a显示了当ANC耳机戴在人耳上时的模型。注意,为了简化,没有画出耳廓。图1b为典型反馈有源噪声控制系统示意图,其中$P(z)$为二次路径传递函数。$P(z)$可以用一个复向量表示,其长度等于离散频率点的个数,并在实验中进行了测量。$C(z)$是控制器的传递函数。$d(n)$和$e(n)$分别表示离散时域的主噪声信号和误差信号。本设计的总体目标是找到一种鲁棒控制器,在可接受的水床提升和足够的稳定裕度下实现良好的降噪性能。

误差信号是一次噪声信号和二次噪声信号的和:

$\begin{matrix} \mathbf{E} (z)=\mathbf{D} (z)+\mathbf{E} (z)\mathbf{C} (z)\mathbf{P} (z)&(1) \end{matrix}$

闭环灵敏度函数表示误差信号与主噪声信号之间的传递函数:

$\begin{matrix} \mathbf{S} (z)=\frac{\mathbf{E} (z)}{\mathbf{D} (z)}= \frac{1}{1-\mathbf{L} (z)}&(2) \end{matrix}$

开环传递函数

$\begin{matrix} \mathbf{L} (z)=\mathbf{C} (z)\mathbf{P} (z)&(3) \end{matrix}$

互补灵敏度函数是次级路径噪声信号与主要路径噪声信号的比值:

$\begin{matrix} \mathbf{T} (z)=\frac{\mathbf{E} (z)\mathbf{C} (z)\mathbf{P} (z)}{\mathbf{D} (z)}=1-\mathbf{S} (z)&(4) \end{matrix}$

一些补充解释:

  • 开环传递函数:开环传递函数是指在没有反馈的情况下,控制系统输出与输入之间的传递函数关系。

  • 闭环灵敏度:闭环灵敏度是指控制系统输出对于干扰信号的敏感程度。是一个反映系统稳定性和鲁棒性的重要指标。闭环灵敏度越,系统对干扰信号的抑制能力就越强。

  • 互补灵敏度:互补灵敏度是指控制系统输出对于参考信号的灵敏度。是一个反映系统跟踪性能的重要指标。互补灵敏度越,系统对参考信号的跟踪能力就越强。

次级噪声信号受次级路径的影响,次级路径的不确定性源于佩戴松紧度的不同以及耳廓和耳道的人际变化。在低频段,开环传递函数,即$\angle \mathbf{L} (z)$的相频响应可维持在$\pm 180^。$左右,因此二次路径的变化对鲁棒性的潜在威胁不大。在中频段和高频段,次要路径的细微差异可能导致系统不稳定。因此,$\left | \mathbf{T}(z) \right |$ 在中高频波段应该很小。

受Eq.(4)的约束,在整个频段同时降低$\left | \mathbf{S}(z) \right |$和$\left | \mathbf{T}(z) \right |$是不现实的。幸运的是,在不同的频段可以设计不同的设计目标。换句话说,在低频段,即感兴趣的频段,首要任务是最小化$\left | \mathbf{S}(z) \right |$以实现高降噪性能。在高频段,由于反馈控制中降噪带宽的限制,没有必要最小化$\left | \mathbf{S}(z) \right |$,在较宽的频段上,实际上很难将$\angle \mathbf{L} (z)$保持在$\pm 180^。$左右。因此,最小化$\left | \mathbf{T}(z) \right |$对于增强对$\mathbf{P} (z)$在高频段变化的鲁棒性变得更加重要。但设计的难点,有时被称为“根本困境”,在于中频波段,由于$\mathbf{S} (z)$和$\mathbf{T} (z)$之间的关系难以协调,经常导致水床抬升甚至嚎叫。

在ANC中,产生二次噪声信号的额外延迟直接限制了性能。可以应用反馈控制的带宽B(以赫兹为单位)满足以下关系:

$\begin{matrix} B<\frac{1}{6\tau} &(5) \end{matrix}$

其中$\tau$(秒)为辅助路径的总时延,由两部分组成。一是从消噪扬声器到误差麦克风的声学路径,二是误差麦克风的电气元件、抗混叠滤波器、模数转换器(ADC)、数字控制器、数模转换器(DAC)、平滑(或重构)滤波器、消噪扬声器[23]。在本文中,我们将绘制$\mathbf{P} (z)$随不同附加延迟的相位频响曲线,并在第3节中通过仿真分析其对性能的影响。

2.2 Parametric filters

二阶IIR滤波器有以下形式:

$\mathbf{H} _n(z)=\frac{b_{n,0}+b_{n,1}z^{-1}+b_{n,2}z^{-2}}{a_{n,0}+a_{n,1}z^{-1}+a_{n,2}z^{-2}} $

级联双四控制器的传递函数为:

$\mathbf{C}(z)=G\prod_{n=1}^{N}\mathbf{H}_n(z)$

其中G为控制器的线性增益。在级联结构中,不同SOSs之间的顺序不会改变控制器的滤波性能。虽然引入了非凸性问题,但搜索空间具有对称性,增加了找到最优解的概率。如果每个SOS是一个可调参数滤波器,如均衡时使用的low-shelf filter和peaking EQ filter,则其参数满足表1所示的关系[24]。

2.3 Loss function and two-stage optimization strategy

在设计反馈控制器时,我们需要综合考虑包括降噪、水床升降、鲁棒性等多个因素。通过这样做,该设计成为一个多目标优化问题,适合用$H_2/H_{\infty}$混合方法来解决。一个$H_2$-norm被用来作为最小化残余误差加权功率的措施,其他关于鲁棒性和水床升降的约束由两个$H_{\infty}$-norm表示。因此,完整的设计标准可以写为:

$\begin{matrix} \min_\mathbf{x} {\left \| \mathbf{S\circ W_1} \right \|_2^2 } &(10) \end{matrix}$

$s.t. \left\{\begin{matrix}{\left \| \mathbf{T\circ W_2} \right \|_\infty } \le 1 &(11a) \\\gamma _s{\left \| \mathbf{S} \right \|_\infty } \le 1&(11b)\end{matrix}\right.$

其中$\circ $表示Hadamard积。$\mathbf{W_1}$和$\mathbf{W_1}$是低通和高通实数权重向量,其长度等于离散频率点的数量。请注意,在不产生混淆的情况下,为了简短起见,z被省略了。在低频段,W1的值统一设置为1,其他频点的值为0.01。公式(11a)可以着重于抑制$\left | \mathbf{T} (z) \right | $以确保稳健性。因为稳健性可以通过其他设计标准来实现,例如,以图形方式显示增益余量和相位余量,公式(11a)将被$\mathbf{T} (z) $的约束条件所取代,见公式(13)。增益边际(GM)和相位边际(PM)描述了封闭系统变得不稳定的增益和相位的额外上限。当公式(11b)中的$\gamma_s $等于$10^{-\frac{5}{20} }$时,意味着水床的提升被限制在5分贝以下,即使人的听力非常敏感,也可以承受。

开环传递函数的约束条件如图2所示。这个想法来自于所谓的环路整形技术[27],它使用$\mathbf{P} (z) $的测量频率响应数据来调整$\mathbf{C} (z) $的参数,直到获得$\mathbf{L} (z) $在性能和稳健性方面的理想形状。如图2所示,在$20log_{10}\left | \mathbf{L}(z) \right | $的低、中、高频率下设置了不同的上限。通过设置三个阶梯状的上限,$20log_{10}\left | \mathbf{L}(z) \right | $被强制从中频向高频滚落。在设$\angle \mathbf{L}(z)$的约束条件之前,我们要考虑以下情况:两个等振幅的信号具有相同的角频率$\omega $,它们的相位差$\beta $是一个常数。干扰结果可以通过使用和差乘积公式得出,具体如下:

$\begin{matrix} \sin (\omega t)=\sin (\omega t+\beta )=2\cos(\frac{\beta }{2} )\sin(\omega t+\frac{\beta }{2} )&(12) \end{matrix}$

图3a显示了干扰的结果。当相位差小于$60^{\circ} $远离$\pm 180^{\circ} $时,干扰是破坏性的,相位仍在 "安全区"。这个约束条件其实有点严格,所以可以适当放宽,在图2中反映为低频段的$90^{\circ} $ ,在中频段,$10^{\circ} $被设定为过渡值。尽管$20log_{10}\left | \mathbf{L}(z) \right | $可能大于0dB,但在相位上有一个 "禁区",可以尽可能地抑制建设性干扰。在高频段的起始频率点(图2中的2kHz),$20log_{10}\left | \mathbf{L}(z) \right | $已经下降,小于0dB,但 $\angle \mathbf{L}(z)$仍然大于$10^{\circ} $。正是$20log_{10}\left | \mathbf{L}(z) \right | $和$\angle \mathbf{L}(z)$在这个关键频率点上的限制条件保证了增益裕量和相位裕量同时存在。而对于频率较高的点,相位不再受约束,即如图2所示的[Don 't care region]

综上所述,$\mathbf{L} (z) $的约束条件可以写成如下:

$\left\{\begin{matrix} \gamma _1{\left \| \mathbf{L_1} \right \|_\infty } \le 1& (13a)\\ \gamma _2{\left \| \mathbf{L_2} \right \|_\infty } \le 1& (13b)\\ \gamma _3{\left \| \mathbf{L_3} \right \|_\infty } \le 1& (13c)\\ \gamma _4{\left \| \angle (\mathbf{L_1})^{-1} \right \|_\infty } \le 1& (13d)\\ \gamma _5{\left \| \angle (\mathbf{L_2})^{-1} \right \|_\infty } \le 1& (13e) \end{matrix}\right.$

如图2所示$\gamma _1,\gamma _2,\gamma _3,\gamma _4,\gamma _5$等于$10^{-\frac{25}{20} },10^{-\frac{10}{20} },10^{-\frac{0}{20} },\frac{\pi }{2} ,\frac{\pi }{18} $。这个参数设置不是通用的,可以根据不同的情况进行调整。拉格朗日乘数法被用来将这些约束作为惩罚项目加入损失函数中:

$\begin{matrix} J(\mathbf{x})=\lambda {\left \| \mathbf{S\circ W_1} \right \|_2^2 } +p(\gamma _1{\left \| \mathbf{L_1} \right \|_\infty }) +p(\gamma _2{\left \| \mathbf{L_2} \right \|_\infty }) +p(\gamma _3{\left \| \mathbf{L_3} \right \|_\infty }) +p(\gamma _4{\left \| \mathbf{(\angle L_4)^{-1}} \right \|_\infty }) +p(\gamma _5{\left \| \mathbf{(\angle L_5)^{-1}} \right \|_\infty }) &(14) \end{matrix}$

其中$p(x)=xu(x-1)$,$u(x)$是阶梯函数。图3b显示了$p(x)$函数图。与通常的拉格朗日法构造目标函数不同,拉格朗日乘数被放在目标项的前面,而不是惩罚项。k应根据仿真结果灵活调整,使损失值下降时目标项小于1。这样,损失值与1之间的关系可以反映出方案是否满足约束条件。

为了处理优化问题的非凸性并获得准确的解决方案,GA和NM单线法被结合起来构成优化器。首先,GA产生一个庞大的群体,以平行方式搜索潜在的最优解。其次,在MATLAB中采用NM单线法,即名为$fminsearch()$的函数,具有精确调整参数的能力,在最后一代中选择最佳个体进一步优化。有了GA提供的良好的初始解,NM sim-plex方法可以避免落入 "浅层 "的局部最小值,而在潜在的全局最小值周围进行 "深层 "搜索。简而言之,GA和NM simplex方法分别用于粗略的全局探索和深入的局部搜索。

3. Experiment validation

本节将通过实验来验证所提出的方法。实验中的ANC耳机平台如图4a所示。一个扬声器被用作外部噪声源。一个使用ADAU1772作为编解码器的低延迟控制器拾取错误信号并将其复制到两个通道:一个由控制器过滤,另一个直接传输到计算机,以便观察。一个没有电子部分的耳机硬件被整合到实验系统中。它包含一个错误的麦克风和一个降噪的扬声器。所有的测量都是用一个假头进行的。采样率为44.1kHz。

对于每个SOS,$f_n$在20和22050赫兹之间产生。高的Q值会产生接近单位圆的极点,由于圆周效应和次级路径的变化,在实施中可能会产生可听的振铃,所以所有的$Q_n$值都限制在$[0.05,3]$,其中0.05是允许输入支持软件SigmaStudio的最小值。$g_n$和$G$的限制值范围为$[-30,30],[0,2]$,分别。$\lambda$设置为0:01。遗传算法的第一代种群在指定的区间内均匀分布。在优化过程中,遗传算法的参数值为:种群规模= 1000 N,代数= 20,交叉率= 0.5,突变率= 0.5。然后对上一代最优个体进行十次NM单纯形方法迭代。

Fig4b图示了优化过程中的损失曲线。由于GA强大的全局优化能力,损失曲线以类似于楼梯的形状下降,在早期几代中损失值可以有效降低。然而,由于GA的局部优化能力较弱,它在后期难以进一步下降。正如预期的那样,NM simplex方法显示了局部优化的能力,并进一步降低了损失值。虽然NM simplex方法具有较强的局部优化能力,但它没有全局优化能力。因此,GA和NM单工法分别起着粗调和微调的作用。GA主要用于克服优化问题的非凸性,定位潜在最优解在搜索空间中的近似位置,然后NM单纯法有助于获得性能更好的精确解。基于这些事实,两阶段优化策略可以充分利用GA和NM单线法的优点,避免它们的缺点。优化的运行时间在个人电脑上约为3分钟。

图4c显示了奈奎斯特曲线,该曲线绘制了$ \mathbf{L}$在Z平面上的频率响应。从20到1000Hz的频率点都在以Nyquist点$[1,0j]$为中心的单位圆之外。因此,理论上在这个频段可以实现正向降噪。图5a中清楚地显示了控制器和每个SOS的频率响应。为了获得一个紧凑的搜索空间并加速损失曲线的收敛,选择一个低架滤波器作为SOSs链的第一节。其余两个SOSs都是峰值-均衡滤波器。它们的零点和极点显示在图4d中,颜色顺序与图5a相同。第一个SOS可以同时提高低频段的降噪和降低高频段的$20log_{10}\left | \mathbf{L}(z) \right | $,并且只在低频段引入一个小的相位变化。因此,一个低阶滤波器可以大致塑造控制器,而几个峰值-EQ滤波器则用来提高控制器的性能。第二个SOS起到了抑制水床升降和增强稳健性的作用。第三个SOS修补了图5b所示的$\left | \mathbf{P}(z) \right | $在大约600Hz的谷底,以确保在这里可以获得正的降噪。线性增益G被用来上下移动$\left | \mathbf{C}(z) \right | $。G和均衡参数的准确值见表2。

次级路径的测量频率响应如图5b所示。耳机具有良好的声学结构,这为反馈控制器的设计提供了足够的空间。通过分析系统的Bode图,即图5b中开环传递函数的频率响应,该控制器实现了$GM= 10.5 dB$和$PM=30^{\circ} $。请注意,公式(2)中$\mathbf{L}(z) $前面的符号是一个负号,所以Bode图应该以0为基准值来确定GM和PM,而不是$180^{\circ} $。

如果我们把$f_p$表示为频率点,在这个频率点上 $\angle \mathbf{P}(z) =0^{\circ} $。如图6a所示,其值与次级路径的总延迟有关。具有高$f_p$值的低延迟二级路径不仅可以扩大公式(5)所规定的理论最大控制带宽,而且还可以为鲁棒性设计留出足够的空间。如果误差麦克风离降噪扬声器太远,或者由于ADC/DAC的采样率太低,电子延迟太大,$f_p$会很小。因此,设计具有满意降噪性能的稳健控制器的空间较小。我们把具有不同延迟的二级路径作为所提出方法的输入,其他参数设置保持不变。二级路径延迟对降噪性能的影响如图6b所示。可以看出,理论上的降噪量随着二级路径延时的增加而减少。

图7显示了三种操作方法的最终损失值的箱形图。每个方法都运行了10次。为了进行公平的比较,除了优化方法不同,其他参数设置完全相同。GA和NM简单方法可以看作是文献[21]的再现。[21],只是敏感度函数的加权函数不同,允许的最大水床抬升量不同,以及对$\mathbf{L}(z) $的额外约束。由于缺乏GA提供的合适的初始解,NM单线法容易陷入各种局部最小值,不能保证满足所有的约束条件,因此其损失值非常分散,基本上远远大于1。如果没有NM单线法的进一步精细搜索,虽然GA基本满足所有的约束条件,但与混合优化方法相比,其最终解不够好。所提方法的最终解具有最低的损失值和最小的方差,这被证明是一种有效和可靠的优化策略。

外部噪声源产生的粉红噪声作为实验的主要噪声。控制前后的误差信号在时域和频域的示意图分别显示在图8a和图8b。图8c显示了降噪的绝对量,并与灵敏度函数得到的降噪量相比较,可以看出它们大致相同。在实践中,在测量了次级路径的频率响应后,应将耳机放在假人头上。否则,由于头带的长度变化,佩戴的松紧度会不同,这将改变腔体的共振特性。因此,测量的降噪量和理论的降噪量之间会有差异。

4. Conclusion

这项工作提出了一个优化框架,用于设计ANC耳机上的稳健级联双阙反馈控制器。通过使用传统的$H_2/H_\infty$方法和自行设计的笔数函数,损失函数可以将降噪、水床升降和鲁棒性全部考虑在内。由于适当地选择了变量代码和优化策略,优化后的控制器实现了良好的性能和稳健性。所提出的方法具有简单、高效、快速和可靠的优点,可以取代人工耗时的优化过程。对水床升降的约束和稳健性不再是猜测,而是有理论依据来保证。对于进一步的工作,如果想把噪声控制点从误差麦克风移到鼓膜上,应进一步引入虚拟麦克风技术来实现这一目的。