精华内容
下载资源
问答
  • 麦克风阵列语音增强matlab源程序,使用固定的波束形成算法
  • 基于波束形成法的麦克风阵列语音增强技术研究 波束形成法 麦克风阵列 语音增强技术
  • 基于延迟-求和的麦克风阵列语音增强算法研究.pdf 延迟-求和 麦克风阵列 语音增强
  • 为了加快基于广义旁瓣相消器的麦克风阵列语音增强系统的收敛速度,将其自适应模块的输入信号分解到子带以进行处理,并将多通道维纳滤波器引入广义旁瓣相消器的非自适应支路,以更有效地抑制非相干噪声。实际测试结果...
  • 麦克风阵列语音增强(一)

    万次阅读 多人点赞 2018-07-26 11:05:10
      对于语音增强的研究,基本上可以划分成两大分支:单通道的语音增强算法和麦克风阵列语音增强算法。麦克风阵列语音增强方法的优势在于考虑了声源的位置信息,可以实现空间滤波,所以对具有方向性的噪声具有较...

    1. 引言

      对于语音增强的研究,基本上可以划分成两大分支:单通道的语音增强算法和麦克风阵列的语音增强算法(也称为,多通道的语音增强算法)。麦克风阵列的语音增强方法的优势在于考虑了声源的位置信息,可以实现空间滤波,所以对具有方向性的噪声具有较好的抑制效果。因此,麦克风阵列的技术在抑制一些具有方向性的干扰语音上应用较广。波束形成,这个词也就是这么来的。因为对期望方向的语音信号进行保留,抑制非期望方向的信号,其实就是在做语音信号的波束形成。对于麦克风阵列波束形成的研究主要可分成三类:固定波束形成、自适应波束形成和后置滤波算法,如下图1-1所示。

    这里写图片描述
    图 1-1 麦克风阵列波束形成算法分类

      固定波束形成,适用于稳定不变的噪声干扰环境,可以对某一方向的声源进行抑制,抑制的强度不变,因此灵活性较低。当环境中的噪声信号发生变化时,固定波束形成的算法并不能跟随着作出调整,鲁棒性不好,但其运算复杂度低,算法的可实现性强。自适应波束形成的方法,可以利用信号的输出来自适应地调整滤波的权重系数,其抑制性能可以对环境信号的变化作出调整,鲁棒性更好,波束形成更加灵活。但是波束形成的方法不仅会残留一部分噪声,而且对有些噪声的抑制能力不强,所以就有了把单通道的方法和麦克风阵列相结合的方法,也就是图1-1中所示的后置滤波算法。下面将分别介绍一下三种不同类型的波束形成方法。

    2. 固定波束形成

      最早也是最经典的固定波束形成算法,是由Flanagan提出的。他借鉴了天线阵列信号处理中的思想,利用简单的延时-求和的方法,来实现对噪声的抑制。其基本的算法框图如下图1-2所示。

    这里写图片描述
    图1-2 Flanagan 提出的固定波束形成算法

      首先,不同的麦克风由于位置不同,所以接收的语音信号必定存在着时间偏差。所以,所有的麦克风阵列算法要做的第一件事,就是信号对齐,也就是图1-2中的时延补偿部分所实现的。其次,在Flanagan的算法中,只采用了固定的单个权重来约束每一路麦克风通道的信号(最简单的情况是,所有的权重系数w都取这里写图片描述),因此其消噪能力十分有限,只能实现对非相干噪声的抑制,对于相干噪声基本没有什么抑制能力,并且消噪能力的强弱主要取决于麦克风的数量M,输出的信噪比可提高这里写图片描述,所以局限性很大,成本也相对较高。那么,针对这些问题,固定波束形成的语音增强算法也有相应的改善措施,那就是利用抽头延迟线结构(TDLs,Tapped Delay-lines)来实现对宽带语音信号的波束形成,其具体结构如下图1-3所示。

    这里写图片描述
    图 1-3 TDLs结构的固定波束形成

      TDLs结构的固定波束形成算法,通过多抽头的延迟来产生不同频率的分量,然后通过滤波系数这里写图片描述来约束各麦克风的输入信号,使得期望方向上的信号得到保留,并在非期望方向上形成零陷,从而实现对固定声源方向的波束形成。这种方法可以对固定噪声源方向的信号进行抑制,并且对相干和非相干噪声都能实现有效地抑制。TDLs的算法思想可以用下面的方程(2-1)进行描述:

    这里写图片描述 (2-1)

      在式(2-1)中,矩阵D为方向矩阵,用来对不同角度的语音信号进行频域对齐(也就是图1-3中的时延补偿部分),其中用虚线隔开的部分分别为不同入射角度的语音信号,这里写图片描述这里写图片描述,…,这里写图片描述分别代表了不同的频率分量,这里写图片描述这里写图片描述,…,这里写图片描述代表了不同的麦克风所对应是时间延迟。矩阵F是目标响应矩阵,同样地,用虚线隔开的部分分别对应着不同入射角度信号的目标响应。通过设置目标响应矩阵F,就可以决定固定波束形成结构对哪些方向的语音信号进行保留,又对哪些方向的语音信号进行抑制。矩阵W是权重系数矩阵,也是TDLs结构需要设计的部分,通过求解方程(2-1),得到的矩阵系数解这里写图片描述,便是最终需要的设计的滤波器系数。

    3. 自适应波束形成

      自适应波束形成的主要思想是利用信号的输出来自适应地调整类似TDLs结构中的权重系数这里写图片描述,来达到对声学环境的变化具有一定鲁棒性的目的。在自适应的波束形成算法中,主要由两种典型的实现结构:LCMV结构和GSC结构,两种结构均有时域和频域的实现方法。由于时域的实现方法更加简单,且具有较好的实时性,所以下面重点介绍LCMV和GSC结构的经典时域实现方法。

       Frost 最早提出了经典的时域LCMV自适应波束形成结构,如下图1-4所示。

    这里写图片描述
    图 1-4 时域LCMV自适应波束形成结构

      时域LCMV算法的基本思想可以用式(3-1)和(3-2)进行描述:

    这里写图片描述 (3-1)
    这里写图片描述 (3-2)

    其实,LCMV的方法就是在TDLs固定波束形成的基础上,增加了式子(3-2)中的自适应系数调整部分。其中,这里写图片描述为输入信号Y的自相关矩阵的期望(一般用这里写图片描述来进行估算),通过最小化输出功率来自适应地调整权重系数W。而这里式(3-1)的作用和TDLs结构的固定波束形成是一样的,可以保证目标方向的信号得到保留,干扰目标方向的信号得到抑制。求解方程(3-1)和(3-2),便可以得到系数矩阵W的值:

    这里写图片描述 (3-3)

    为了进一步避免矩阵求逆,可以采用LMS的方法进行迭代求解,如下所示:

    这里写图片描述 (3-4)

    其中,I为单位矩阵,D是设计的方向矩阵,F是目标响应矩阵,这里写图片描述为迭代步长。当然为了进一步简化方向矩阵D的设计,Frost 在最小方差无畸变准则(MVDR)的基础上,提出了如下所示的方向矩阵D和目标响应矩阵F设计形式:

    这里写图片描述 (3-5)

      除了上述的时域LCMV自适应波束形成结构,Griffiths 在LCMV结构的基础上进行改进,得到了一种无约束的时域GSC结构,如下图1-5所示。

    这里写图片描述
    图 1-5 时域GSC自适应波束形成结构

      上图所示的GSC算法主要由三部分构成:固定波束形成部分(这里写图片描述)、阻塞矩阵部分(这里写图片描述)和自适应波束形成部分(这里写图片描述)。其中,固定波束形成部分只能让特定方向的信号通过,而阻塞矩阵部分可以阻止特定方向的信号通过,让其他方向的信号通过。这么设计的原因是,固定波束形成部分的输出中肯定会残留一部分其他方向的信号,那么可以通过对阻塞矩阵(这里写图片描述)的输出进行权重调整(这里写图片描述)来估计出固定波束形成部分(这里写图片描述)残留的噪声,最后进行减法操作,便可以得到最终的纯净语音信号的估计。那么,对于自适应矩阵这里写图片描述的求解就转化成了如下所示的无约束求解问题:

    这里写图片描述 (3-6)

    同样地,为了避免矩阵求逆运算,采用LMS自适应迭代的方法进行求解,得到如下表达式:

    这里写图片描述(3-7)

    其中,这里写图片描述这里写图片描述是阻塞矩阵这里写图片描述的输出,满足:这里写图片描述。此外,Griffiths采用级联差分方法(CCD)和MVDR准则来对阻塞矩阵和固定波束形成部分进行了简化,得到了如下的设计形式:

    这里写图片描述 (3-8)
    这里写图片描述 (3-9)

    通常情况下,这里写图片描述这里写图片描述,那么就得到了类似Flanagan形式的固定波束形成结构。此外,Griffiths提出的时域GSC算法,可以有效地抑制相干噪声的影响,但是对非相干噪声的抑制能力有限,因为非相干噪声的抑制只能依靠类似Flanagan的固定波束形成部分,所以抑制能力不强。但是,相较于固定波束形成的算法,GSC的方法使用较少的麦克风就能取得十分不错的噪声抑制效果,并且算法运算复杂度也不高,所以在工程中的应用较广泛,在麦克风阵列语音增强专题(二)中将详细介绍这种算法的优缺点。

    4. 后置滤波算法

      后置滤波算法是为了进一步对固定波束形成和自适应波束形成结构的残余噪声进行处理所设计的算法,它可以有效地弥补之前结构存在的不足,去除残留的相干和非相干噪声。最早利用后置滤波思想的是,Zelinski提出的一种对延时-求和波束形成进行改进的后置滤波算法,如下图1-6所示。

    这里写图片描述
    图 1-6 Zelinski 提出的后置滤波算法结构

      如上图1-6所示,Zelinski提出的后置滤波算法以维纳滤波算法为基础,利用多通道的信息,求解Wiener-Hopf方程得到如下所示的增益函数表达式:

    这里写图片描述 (4-1)

    其中,这里写图片描述是第 i 个和第 j 个麦克风信号之间的互功率谱,这里写图片描述 是第 i 个麦克风信号的自功率谱。这样,就得到了多通道维纳滤波的频域增益函数表达形式,再利用IFFT将其变化到时域来实现最后的滤波。虽然Zelinski的这种多通道后置滤波的方法可以有效地去除延时-求和的固定波束形成算法中残留的非相干噪声,但是并不能消除环境中的相干噪声。所以,就有了将GSC自适应结构和后置滤波器相结合的方法(Cohen 和 Gannot 于2004年提出的),如下图1-7所示。

    这里写图片描述
    (a)
    这里写图片描述
    (b)
    图 1-7 (a) 为频域的GSC自适应算法实现方法,(b)是其后置滤波的改善方法

       Gannot 和 Cohen 提出的这种后置滤波结构,将频域GSC算法和Log-MMSE的单通道算法相结合。不同的是,这里后置的log-MMSE估计器,利用了GSC算法中阻塞矩阵输出的多通道信息来进行log-MMSE增益函数的估计。这种结构的后置滤波算法,不仅仅可以有效地去除具有明确方向性的相干和非相干噪声残留,甚至对于无方向性的散漫噪声也具有很好的抑制作用。

       除了上述两种利用多通道信息去计算单通道增益函数的方法,在后置滤波的研究中,还有一类直接级联单通道语音增强算法的方法(也就是,在麦克风阵列算法处理后得到的单通道输出基础上,直接级联第二级单通道后置滤波器的方法),通常级联的是维纳滤波器,除此之外,还有一些直接级联谱减法、MMSE估计器的方法,如下图1-8所示(王冬霞,级联谱减法的后置滤波方法)。

    这里写图片描述
    图 1-8 王冬霞提出的基于固定波束形成的后置谱减算法

      这类直接级联后置滤波器的方法,最大的好处是:单通道的降噪算法对所有的噪声(无论是相干噪声还是非相干噪声,有方向性的还是无方向性的噪声)都有抑制有用。也就意味着,无论前面的麦克风阵列部分残留的是哪种噪声,直接级联的单通道算法都可以进行抑制。虽然这种后置滤波方法的思想比较简单,但效果比较显著,因此在实际工程中也很有用武之地。

    参考文献:

    1. Liu W, Weiss S. Wideband Beamforming: Concepts and Techniques[M]. Wiley Publishing, 2010:26-29.
    2. Flanagan J L, Johnston J D, Zahn R, et al. Computer-steered microphone arrays for sound transduction in large rooms[J]. Acoustical Society of America Journal, 1985, 78(5):S52-S52.
    3. Frost, O. An Algorithm For Linearly Constrained Adaptive Array Processing[J]. IEEE, 1972, 60(8):926–935.
    4. Griffiths L J, Jim C W. An alternative approach to linear constrained adaptive beamforming[J]. IEEE Trans Antennas & Propag, 1982, 30(1):27-34.
    5. Zelinski R. A microphone array with adaptive post-filtering for noise reduction in reverberant rooms[C]. IEEE International Conference on Acoustics, Speech, and Signal Processing, 1988(5):2578-2581.
    6. Gannot S, Cohen I. Speech enhancement based on the general transfer function GSC and postfiltering[J]. IEEE Transactions on Speech & Audio Processing, 2004, 12(6):561-571.
    7. 王冬霞, 殷福亮. 联合波束形成与谱减法的麦克风阵列语音增强算法[J]. 大连理工大学学报, 2006, 46(1):121-126.
    展开全文
  • 基于近场波束形成的麦克风阵列语音增强算法
  • 盲分离, 语音增强 ,好资源一起分享吧 ,去噪声很好的资料
  • 麦克风阵列语音增强(二)   版权声明:本文为博主原创文章,未经博主允许不得转载。 https://blog.csdn.net/zhanglu_wind/article/details/81217093 1. 时域GSC自适应波束形成算法(Griffiths-Jim)     图...

    麦克风阵列语音增强(二)

     

    版权声明:本文为博主原创文章,未经博主允许不得转载。 https://blog.csdn.net/zhanglu_wind/article/details/81217093

    1. 时域GSC自适应波束形成算法(Griffiths-Jim)

     

    这里写图片描述 
    图 2-1 Griffiths-Jim的时域GSC自适应波束形成算法

     

       在这个专题中,将对Griffiths于1982年提出的经典时域GSC算法进行实现,并利用爱丁堡大学语音实验室开发的麦克风阵列仿真环境(之前已经单独介绍过了)进行实验测试。首先是,GSC算法的设计,算法结构框图如上图2-1所示。根据其结构,我们需要设计的部分是三个矩阵部分:固定波束形成部分的静止矩阵(这里写图片描述)、阻塞矩阵(这里写图片描述)和自适应抵消部分的权重矩阵(这里写图片描述)。对于静止矩阵和阻塞矩阵,Griffiths已经进行了简化设计,如下所示:

     

    这里写图片描述 (1-1) 

    这里写图片描述 (1-2)

     

      如上式(1-1)和(1-2)所示,对于阻塞矩阵采用的是 [1,-1] 形式的相邻麦克风对减方式,静止矩阵采用的是求和平均的方式(这里写图片描述这里写图片描述)。这种简化方式具有计算简单,运算量低的优点,当然,相应的噪声抑制性能也不高。除了上述提到的静止矩阵和阻塞矩阵的设计,还有一个很重要的矩阵需要进行设计,也就是自适应权重系数矩阵这里写图片描述。对于这里写图片描述的设计,本来是需要进行矩阵的求逆运算才能计算得到的,这里为了进一步降低运算量,采用了LMS自适应迭代的方法,求解过程如下所示: 

    这里写图片描述 (1-3)

     

    其中,这里写图片描述为迭代步长,这里写图片描述这里写图片描述是阻塞矩阵这里写图片描述的输出,满足这里写图片描述。这便是Griffiths-Jim 的GSC算法的设计过程,但是对于其中时延补偿部分的设计还没有涉及,实现方法通常两种:时域对齐和频域对齐。下面介绍一种最简单的方法,也就是时域采样点延迟的方法。如下图2-2所示,在知道目标语音信号入射方向的前提下(一般是由声源定位算法估计得到),以最左侧或者最右侧的麦克风接收的信号为基准,调整其他麦克风的时域采样点向后或者向前调整几个点即可。因为麦克风之间的间距和声源入射方向是已知的,所以根据声速340m/s,可以计算出来每个麦克风需要调整的点数。 

    这里写图片描述 
    图 2-2 平面波入射模型

     

    2. 实验仿真测试

      利用之前介绍的麦克风阵列仿真环境,模拟了一个长宽高为3m *4m *3m 的密闭房间,房间混响为0.1s,采用4个麦克风的均匀线性阵列(麦克风间距5cm),将其放置在房间的正中央,目标声源位于麦克风阵列正前方方向(省去了时延补偿的工作),距离麦克风阵列1.4m。另外,对具有明确方向性的语音干扰、点噪声源干扰和无方向性的散漫噪声情况进行实验测试。语音干扰和点噪声源干扰都来自麦克风阵列的右侧90度方向,且距离麦克分1m,散漫噪声以球形场的形式均匀分散在房间中,如下图2-3所示。

     

    这里写图片描述 
    图 2-3 实验仿真环境设置

     

    2.1 语音干扰情况

      在麦克风阵列的一些应用场景中,语音干扰的情况十分常见,比如说,在一个房间内正在进行多媒体远程会议,这时就希望麦克风阵列只捕捉我们想要的目标声源(会议发言人),抑制那些来自干扰方向的噪声(例如,非发言人的干扰语音)。针对这种情况进行实验测试,结果如下图2-4所示。其中,图2-4中的(a)和(b)是目标声源和干扰声源分别说话时的算法处理前后的结果(目标源先说话,干扰源再说话),(c)和(d)是同时说话时的算法处理前后的结果。从时域波形图的结果可以看出,干扰声源的幅度被明显地降低了,由此可见,GSC算法可以实现有效地空间滤波性能。

     

    这里写图片描述 
    图 2-4 语音干扰情况的时域波形图

     

    2.2 点噪声源干扰情况

      点噪声源和语音干扰的情况类似,只是干扰信号不是语音而是固定方向传过来的噪声,例如在房间内有一个窗户,窗外有一辆汽车经过,那么从窗户传进来的汽车噪声就是点噪声源。对于点噪声源的情况,实验测试了白噪声的情况(0dB的输入信噪比),如图2-5所示。其中,(a)是纯净语音的时域波形图,(b)和(c)分别是点噪声源干扰的语音和算法处理后的去噪语音。显然,GSC算法可以有效地抑制具有明确方向性的点噪声源干扰,使得点噪声源的信号幅度被衰减。

     

    这里写图片描述这里写图片描述 
    图 2-5 点噪声源干扰情况的时域波形图

     

    2.3 散漫噪声源干扰情况

      对于散漫噪声,采用的是球形噪声场的数学模型模拟产生,因此它并没有明确的方向性,在整个房间内均匀存在,是实际生活中比较常见的噪声类型。这里仍然采用白噪声作为散漫噪声源(输入信噪比为0dB),实验测试结果如下图2-6所示。其中(a)为纯净语音信号的时域波形图,(b)是被散漫噪声源污染的语音信号,(c)为GSC算法处理后的去噪语音信号。从实验结果中发现,GSC算法对散漫噪声的抑制能力比较弱,也就是说,当空间中的噪声不具有方向特性时,GSC算法的空间滤波优势将大大减弱,这也是麦克风阵列波束形成算法的缺陷所在。

     

    这里写图片描述这里写图片描述 
    图 2-6 散漫噪声源干扰情况的时域波形图

     

    参考文献:

    Griffiths L J, Jim C W. An alternative approach to linear constrained adaptive beamforming[J]. IEEE Trans Antennas & Propag, 1982, 30(1):27-34.

    展开全文
  •   对于语音增强的研究,基本上可以划分成两大分支:单通道的语音增强算法和麦克风阵列语音增强算法(也称为,多通道的语音增强算法)。麦克风阵列语音增强方法的优势在于考虑了声源的位置信息,可以实现空间...

    1. 引言

      对于语音增强的研究,基本上可以划分成两大分支:单通道的语音增强算法和麦克风阵列的语音增强算法(也称为,多通道的语音增强算法)。麦克风阵列的语音增强方法的优势在于考虑了声源的位置信息,可以实现空间滤波,所以对具有方向性的噪声具有较好的抑制效果。因此,麦克风阵列的技术在抑制一些具有方向性的干扰语音上应用较广。波束形成,这个词也就是这么来的。因为对期望方向的语音信号进行保留,抑制非期望方向的信号,其实就是在做语音信号的波束形成。对于麦克风阵列波束形成的研究主要可分成三类:固定波束形成、自适应波束形成和后置滤波算法,如下图1-1所示。 

    这里写图片描述
    图 1-1 麦克风阵列波束形成算法分类

     

      固定波束形成,适用于稳定不变的噪声干扰环境,可以对某一方向的声源进行抑制,抑制的强度不变,因此灵活性较低。当环境中的噪声信号发生变化时,固定波束形成的算法并不能跟随着作出调整,鲁棒性不好,但其运算复杂度低,算法的可实现性强。自适应波束形成的方法,可以利用信号的输出来自适应地调整滤波的权重系数,其抑制性能可以对环境信号的变化作出调整,鲁棒性更好,波束形成更加灵活。但是波束形成的方法不仅会残留一部分噪声,而且对有些噪声的抑制能力不强,所以就有了把单通道的方法和麦克风阵列相结合的方法,也就是图1-1中所示的后置滤波算法。下面将分别介绍一下三种不同类型的波束形成方法。

    2. 固定波束形成

      最早也是最经典的固定波束形成算法,是由Flanagan提出的。他借鉴了天线阵列信号处理中的思想,利用简单的延时-求和的方法,来实现对噪声的抑制。其基本的算法框图如下图1-2所示。 

    这里写图片描述 
    图1-2 Flanagan 提出的固定波束形成算法

     

      首先,不同的麦克风由于位置不同,所以接收的语音信号必定存在着时间偏差。所以,所有的麦克风阵列算法要做的第一件事,就是信号对齐,也就是图1-2中的时延补偿部分所实现的。其次,在Flanagan的算法中,只采用了固定的单个权重来约束每一路麦克风通道的信号(最简单的情况是,所有的权重系数w都取这里写图片描述),因此其消噪能力十分有限,只能实现对非相干噪声的抑制,对于相干噪声基本没有什么抑制能力,并且消噪能力的强弱主要取决于麦克风的数量M,输出的信噪比可提高这里写图片描述,所以局限性很大,成本也相对较高。那么,针对这些问题,固定波束形成的语音增强算法也有相应的改善措施,那就是利用抽头延迟线结构(TDLs,Tapped Delay-lines)来实现对宽带语音信号的波束形成,其具体结构如下图1-3所示。

     

    这里写图片描述 
    图 1-3 TDLs结构的固定波束形成

     

      TDLs结构的固定波束形成算法,通过多抽头的延迟来产生不同频率的分量,然后通过滤波系数这里写图片描述来约束各麦克风的输入信号,使得期望方向上的信号得到保留,并在非期望方向上形成零陷,从而实现对固定声源方向的波束形成。这种方法可以对固定噪声源方向的信号进行抑制,并且对相干和非相干噪声都能实现有效地抑制。TDLs的算法思想可以用下面的方程(2-1)进行描述: 

    这里写图片描述 (2-1)

     

      在式(2-1)中,矩阵D为方向矩阵,用来对不同角度的语音信号进行频域对齐(也就是图1-3中的时延补偿部分),其中用虚线隔开的部分分别为不同入射角度的语音信号,这里写图片描述这里写图片描述,…,这里写图片描述分别代表了不同的频率分量,这里写图片描述这里写图片描述,…,这里写图片描述代表了不同的麦克风所对应是时间延迟。矩阵F是目标响应矩阵,同样地,用虚线隔开的部分分别对应着不同入射角度信号的目标响应。通过设置目标响应矩阵F,就可以决定固定波束形成结构对哪些方向的语音信号进行保留,又对哪些方向的语音信号进行抑制。矩阵W是权重系数矩阵,也是TDLs结构需要设计的部分,通过求解方程(2-1),得到的矩阵系数解这里写图片描述,便是最终需要的设计的滤波器系数。

    3. 自适应波束形成

      自适应波束形成的主要思想是利用信号的输出来自适应地调整类似TDLs结构中的权重系数这里写图片描述,来达到对声学环境的变化具有一定鲁棒性的目的。在自适应的波束形成算法中,主要由两种典型的实现结构:LCMV结构和GSC结构,两种结构均有时域和频域的实现方法。由于时域的实现方法更加简单,且具有较好的实时性,所以下面重点介绍LCMV和GSC结构的经典时域实现方法。

       Frost 最早提出了经典的时域LCMV自适应波束形成结构,如下图1-4所示。

     

    这里写图片描述 
    图 1-4 时域LCMV自适应波束形成结构

     

      时域LCMV算法的基本思想可以用式(3-1)和(3-2)进行描述:

     

    这里写图片描述 (3-1) 

    这里写图片描述 (3-2)

     

    其实,LCMV的方法就是在TDLs固定波束形成的基础上,增加了式子(3-2)中的自适应系数调整部分。其中,这里写图片描述为输入信号Y的自相关矩阵的期望(一般用这里写图片描述来进行估算),通过最小化输出功率来自适应地调整权重系数W。而这里式(3-1)的作用和TDLs结构的固定波束形成是一样的,可以保证目标方向的信号得到保留,干扰目标方向的信号得到抑制。求解方程(3-1)和(3-2),便可以得到系数矩阵W的值: 

    这里写图片描述 (3-3)

     

    为了进一步避免矩阵求逆,可以采用LMS的方法进行迭代求解,如下所示: 

    这里写图片描述 (3-4)

     

    其中,I为单位矩阵,D是设计的方向矩阵,F是目标响应矩阵,这里写图片描述为迭代步长。当然为了进一步简化方向矩阵D的设计,Frost 在最小方差无畸变准则(MVDR)的基础上,提出了如下所示的方向矩阵D和目标响应矩阵F设计形式: 

    这里写图片描述 (3-5)

     

      除了上述的时域LCMV自适应波束形成结构,Griffiths 在LCMV结构的基础上进行改进,得到了一种无约束的时域GSC结构,如下图1-5所示。

     

    这里写图片描述 
    图 1-5 时域GSC自适应波束形成结构

     

      上图所示的GSC算法主要由三部分构成:固定波束形成部分(这里写图片描述)、阻塞矩阵部分(这里写图片描述)和自适应波束形成部分(这里写图片描述)。其中,固定波束形成部分只能让特定方向的信号通过,而阻塞矩阵部分可以阻止特定方向的信号通过,让其他方向的信号通过。这么设计的原因是,固定波束形成部分的输出中肯定会残留一部分其他方向的信号,那么可以通过对阻塞矩阵(这里写图片描述)的输出进行权重调整(这里写图片描述)来估计出固定波束形成部分(这里写图片描述)残留的噪声,最后进行减法操作,便可以得到最终的纯净语音信号的估计。那么,对于自适应矩阵这里写图片描述的求解就转化成了如下所示的无约束求解问题: 

    这里写图片描述 (3-6)

     

    同样地,为了避免矩阵求逆运算,采用LMS自适应迭代的方法进行求解,得到如下表达式: 

    这里写图片描述(3-7)

     

    其中,这里写图片描述这里写图片描述是阻塞矩阵这里写图片描述的输出,满足:这里写图片描述。此外,Griffiths采用级联差分方法(CCD)和MVDR准则来对阻塞矩阵和固定波束形成部分进行了简化,得到了如下的设计形式: 

    这里写图片描述 (3-8) 

    这里写图片描述 (3-9)

     

    通常情况下,这里写图片描述这里写图片描述,那么就得到了类似Flanagan形式的固定波束形成结构。此外,Griffiths提出的时域GSC算法,可以有效地抑制相干噪声的影响,但是对非相干噪声的抑制能力有限,因为非相干噪声的抑制只能依靠类似Flanagan的固定波束形成部分,所以抑制能力不强。但是,相较于固定波束形成的算法,GSC的方法使用较少的麦克风就能取得十分不错的噪声抑制效果,并且算法运算复杂度也不高,所以在工程中的应用较广泛,在麦克风阵列语音增强专题(二)中将详细介绍这种算法的优缺点。

    4. 后置滤波算法

      后置滤波算法是为了进一步对固定波束形成和自适应波束形成结构的残余噪声进行处理所设计的算法,它可以有效地弥补之前结构存在的不足,去除残留的相干和非相干噪声。最早利用后置滤波思想的是,Zelinski提出的一种对延时-求和波束形成进行改进的后置滤波算法,如下图1-6所示。 

    这里写图片描述 
    图 1-6 Zelinski 提出的后置滤波算法结构

     

      如上图1-6所示,Zelinski提出的后置滤波算法以维纳滤波算法为基础,利用多通道的信息,求解Wiener-Hopf方程得到如下所示的增益函数表达式: 

    这里写图片描述 (4-1)

     

    其中,这里写图片描述是第 i 个和第 j 个麦克风信号之间的互功率谱,这里写图片描述 是第 i 个麦克风信号的自功率谱。这样,就得到了多通道维纳滤波的频域增益函数表达形式,再利用IFFT将其变化到时域来实现最后的滤波。虽然Zelinski的这种多通道后置滤波的方法可以有效地去除延时-求和的固定波束形成算法中残留的非相干噪声,但是并不能消除环境中的相干噪声。所以,就有了将GSC自适应结构和后置滤波器相结合的方法(Cohen 和 Gannot 于2004年提出的),如下图1-7所示。 

    这里写图片描述 
    (a) 

    这里写图片描述 
    (b) 
    图 1-7 (a) 为频域的GSC自适应算法实现方法,(b)是其后置滤波的改善方法

     

       Gannot 和 Cohen 提出的这种后置滤波结构,将频域GSC算法和Log-MMSE的单通道算法相结合。不同的是,这里后置的log-MMSE估计器,利用了GSC算法中阻塞矩阵输出的多通道信息来进行log-MMSE增益函数的估计。这种结构的后置滤波算法,不仅仅可以有效地去除具有明确方向性的相干和非相干噪声残留,甚至对于无方向性的散漫噪声也具有很好的抑制作用。

       除了上述两种利用多通道信息去计算单通道增益函数的方法,在后置滤波的研究中,还有一类直接级联单通道语音增强算法的方法(也就是,在麦克风阵列算法处理后得到的单通道输出基础上,直接级联第二级单通道后置滤波器的方法),通常级联的是维纳滤波器,除此之外,还有一些直接级联谱减法、MMSE估计器的方法,如下图1-8所示(王冬霞,级联谱减法的后置滤波方法)。

     

    这里写图片描述 
    图 1-8 王冬霞提出的基于固定波束形成的后置谱减算法

     

      这类直接级联后置滤波器的方法,最大的好处是:单通道的降噪算法对所有的噪声(无论是相干噪声还是非相干噪声,有方向性的还是无方向性的噪声)都有抑制有用。也就意味着,无论前面的麦克风阵列部分残留的是哪种噪声,直接级联的单通道算法都可以进行抑制。虽然这种后置滤波方法的思想比较简单,但效果比较显著,因此在实际工程中也很有用武之地。

    参考文献:

    1. Liu W, Weiss S. Wideband Beamforming: Concepts and Techniques[M]. Wiley Publishing, 2010:26-29.
    2. Flanagan J L, Johnston J D, Zahn R, et al. Computer-steered microphone arrays for sound transduction in large rooms[J]. Acoustical Society of America Journal, 1985, 78(5):S52-S52.
    3. Frost, O. An Algorithm For Linearly Constrained Adaptive Array Processing[J]. IEEE, 1972, 60(8):926–935.
    4. Griffiths L J, Jim C W. An alternative approach to linear constrained adaptive beamforming[J]. IEEE Trans Antennas & Propag, 1982, 30(1):27-34.
    5. Zelinski R. A microphone array with adaptive post-filtering for noise reduction in reverberant rooms[C]. IEEE International Conference on Acoustics, Speech, and Signal Processing, 1988(5):2578-2581.
    6. Gannot S, Cohen I. Speech enhancement based on the general transfer function GSC and postfiltering[J]. IEEE Transactions on Speech & Audio Processing, 2004, 12(6):561-571.
    7. 王冬霞, 殷福亮. 联合波束形成与谱减法的麦克风阵列语音增强算法[J]. 大连理工大学学报, 2006, 46(1):121-126.
    展开全文
  • 麦克风阵列语音增强(二)

    千次阅读 2018-07-26 17:05:04
      在麦克风阵列的一些应用场景中,语音干扰的情况十分常见,比如说,在一个房间内正在进行多媒体远程会议,这时就希望麦克风阵列只捕捉我们想要的目标声源(会议发言人),抑制那些来自干扰方向的噪声(例如,非...

    1. 时域GSC自适应波束形成算法(Griffiths-Jim)

    这里写图片描述
    图 2-1 Griffiths-Jim的时域GSC自适应波束形成算法

       在这个专题中,将对Griffiths于1982年提出的经典时域GSC算法进行实现,并利用爱丁堡大学语音实验室开发的麦克风阵列仿真环境(之前已经单独介绍过了)进行实验测试。首先是,GSC算法的设计,算法结构框图如上图2-1所示。根据其结构,我们需要设计的部分是三个矩阵部分:固定波束形成部分的静止矩阵(这里写图片描述)、阻塞矩阵(这里写图片描述)和自适应抵消部分的权重矩阵(这里写图片描述)。对于静止矩阵和阻塞矩阵,Griffiths已经进行了简化设计,如下所示:

    这里写图片描述 (1-1)
    这里写图片描述 (1-2)

      如上式(1-1)和(1-2)所示,对于阻塞矩阵采用的是 [1,-1] 形式的相邻麦克风对减方式,静止矩阵采用的是求和平均的方式(这里写图片描述这里写图片描述)。这种简化方式具有计算简单,运算量低的优点,当然,相应的噪声抑制性能也不高。除了上述提到的静止矩阵和阻塞矩阵的设计,还有一个很重要的矩阵需要进行设计,也就是自适应权重系数矩阵这里写图片描述。对于这里写图片描述的设计,本来是需要进行矩阵的求逆运算才能计算得到的,这里为了进一步降低运算量,采用了LMS自适应迭代的方法,求解过程如下所示:

    这里写图片描述 (1-3)

    其中,这里写图片描述为迭代步长,这里写图片描述这里写图片描述是阻塞矩阵这里写图片描述的输出,满足这里写图片描述。这便是Griffiths-Jim 的GSC算法的设计过程,但是对于其中时延补偿部分的设计还没有涉及,实现方法通常两种:时域对齐和频域对齐。下面介绍一种最简单的方法,也就是时域采样点延迟的方法。如下图2-2所示,在知道目标语音信号入射方向的前提下(一般是由声源定位算法估计得到),以最左侧或者最右侧的麦克风接收的信号为基准,调整其他麦克风的时域采样点向后或者向前调整几个点即可。因为麦克风之间的间距和声源入射方向是已知的,所以根据声速340m/s,可以计算出来每个麦克风需要调整的点数。

    这里写图片描述
    图 2-2 平面波入射模型

    2. 实验仿真测试

      利用之前介绍的麦克风阵列仿真环境,模拟了一个长宽高为3m *4m *3m 的密闭房间,房间混响为0.1s,采用4个麦克风的均匀线性阵列(麦克风间距5cm),将其放置在房间的正中央,目标声源位于麦克风阵列正前方方向(省去了时延补偿的工作),距离麦克风阵列1.4m。另外,对具有明确方向性的语音干扰、点噪声源干扰和无方向性的散漫噪声情况进行实验测试。语音干扰和点噪声源干扰都来自麦克风阵列的右侧90度方向,且距离麦克分1m,散漫噪声以球形场的形式均匀分散在房间中,如下图2-3所示。

    这里写图片描述
    图 2-3 实验仿真环境设置

    2.1 语音干扰情况

      在麦克风阵列的一些应用场景中,语音干扰的情况十分常见,比如说,在一个房间内正在进行多媒体远程会议,这时就希望麦克风阵列只捕捉我们想要的目标声源(会议发言人),抑制那些来自干扰方向的噪声(例如,非发言人的干扰语音)。针对这种情况进行实验测试,结果如下图2-4所示。其中,图2-4中的(a)和(b)是目标声源和干扰声源分别说话时的算法处理前后的结果(目标源先说话,干扰源再说话),(c)和(d)是同时说话时的算法处理前后的结果。从时域波形图的结果可以看出,干扰声源的幅度被明显地降低了,由此可见,GSC算法可以实现有效地空间滤波性能。

    这里写图片描述
    图 2-4 语音干扰情况的时域波形图

    2.2 点噪声源干扰情况

      点噪声源和语音干扰的情况类似,只是干扰信号不是语音而是固定方向传过来的噪声,例如在房间内有一个窗户,窗外有一辆汽车经过,那么从窗户传进来的汽车噪声就是点噪声源。对于点噪声源的情况,实验测试了白噪声的情况(0dB的输入信噪比),如图2-5所示。其中,(a)是纯净语音的时域波形图,(b)和(c)分别是点噪声源干扰的语音和算法处理后的去噪语音。显然,GSC算法可以有效地抑制具有明确方向性的点噪声源干扰,使得点噪声源的信号幅度被衰减。

    这里写图片描述这里写图片描述
    图 2-5 点噪声源干扰情况的时域波形图

    2.3 散漫噪声源干扰情况

      对于散漫噪声,采用的是球形噪声场的数学模型模拟产生,因此它并没有明确的方向性,在整个房间内均匀存在,是实际生活中比较常见的噪声类型。这里仍然采用白噪声作为散漫噪声源(输入信噪比为0dB),实验测试结果如下图2-6所示。其中(a)为纯净语音信号的时域波形图,(b)是被散漫噪声源污染的语音信号,(c)为GSC算法处理后的去噪语音信号。从实验结果中发现,GSC算法对散漫噪声的抑制能力比较弱,也就是说,当空间中的噪声不具有方向特性时,GSC算法的空间滤波优势将大大减弱,这也是麦克风阵列波束形成算法的缺陷所在。

    这里写图片描述这里写图片描述
    图 2-6 散漫噪声源干扰情况的时域波形图

    参考文献:

    Griffiths L J, Jim C W. An alternative approach to linear constrained adaptive beamforming[J]. IEEE Trans Antennas & Propag, 1982, 30(1):27-34.

    展开全文
  • 麦克风阵列语音增强beamforming算法

    万次阅读 2017-11-27 17:34:16
    delay and sum 关键步骤在于计算延时, 可以...VAD算法具体可以采用, 计算语音段的能量与设置的某一阈值T0比较, 若连续N段语音是超过阈值T0的, 则确定为语音段, 否则为静音段. gsc广义旁瓣消除 GSC算法分析
  • 用麦克风阵列,在机器人的身上放置多个麦克风从而实现语音定位,通过麦克风阵列语音增 强与语音识别相结合能更精确地“理解”指令。  3、应用于视频会议及大型会场  参加视频会议的人很多时,欲发言讨论者也...
  • 基于等边三角形麦克风阵列语音增强.pdf 等边三角形 麦克风阵列 语音增强
  • 基于相干性滤波器的广义旁瓣抵消器麦克风阵列语音增强方法
  • 基于麦克风阵列语音增强研究

    千次阅读 2020-10-30 10:02:16
    本文介绍了一种采用麦克风阵列波束形成和语音增强算法的系统设计与实现。该系统的目标是提高主语音信号的质量,波束形成器的工作方式是通过利用阵列信号信息而不是物理移动阵列,将一组麦克风转向所需要的观察方向。...
  • 一种适用于近场麦克风阵列后滤波语音增强方法
  • 本文为美国马奎特大学(作者:HeatherElaine Ewalt)的硕士论文,共125页。本文介绍了一种采用麦克风阵列波束形成和语音增强算法的系统设计与实现。该系统的...
  • 关于麦克风阵列的基本概念写完了,很多公式令人眼花缭乱,其实麦克风阵列问题归根而言只不过在不同约束条件下求解不同的滤波器系数,比如使得Directivity Index最大的MaxDF阵列,比如使得WNG最大的Delay and Sum,搞...
  • 针对α琢稳定分布噪声和谐波信号在频域均表现为异常值这一特性,提出了一种新的频域预滤波估计方法。通过分数低阶共变将信号转换到频域,在频域利用自适应加权Myriad滤波器滤除尖锐脉冲,提取稳定分布噪声的共变谱,...
  • 麦克风阵列仿真环境的搭建

    千次阅读 多人点赞 2018-03-24 11:26:41
      之前,我在语音增强一文中,提到了有关麦克风阵列语音增强的介绍,当然,麦克风阵列能做的东西远远不只是在语音降噪上的应用,它还可以用来做声源定位、声源估计、波束形成、回声抑制等。个人认为,麦克风阵列在...
  • 麦克风阵列(Microphone Array),从字面上,指的是麦克风的排列。也就是说由一定数目的声学传感器(一般是麦克风)组成,用来对声场的空间特性进行采样并处理的系统。麦克风按照指定要求排列后,加上相应的算法...
  •   之前,我在语音增强一文中,提到了有关麦克风阵列语音增强的介绍,当然,麦克风阵列能做的东西远远不只是在语音降噪上的应用,它还可以用来做声源定位、声源估计、波束形成、回声抑制等。个人认为,麦克风阵列在...
  • 麦克风阵列入门

    万次阅读 多人点赞 2018-09-25 18:01:46
    麦克风按照指定要求排列后,加上相应的算法(排列+算法)就可以解决很多房间声学问题,比如声源定位、去混响、语音增强、盲源分离等。 【注】:在深入理解概念之前,我们先理解一下麦克风的知识 什么是麦克风的指向...
  • 麦克风阵列设计

    万次阅读 2016-09-24 21:07:40
    语音增强和语音识别网页书 语音识别准确率反映在ASR上,ASR准确率一方面依赖于语音训练集和训练模型,另一方面依赖于语音信号获取的质量。这里主要讨论获取到的语音质量对ASR的影响。以此来指导麦克风阵列的设计。 ...
  • 麦克风阵列

    千次阅读 2017-03-18 15:47:20
    麦克风阵列处理的研究主要包括声源定位、语音增强、音源分离、去混响以及鸡尾酒会效应。 麦克风阵列较单麦克风在时域和频域的基础上增加了空域,可对空间来之不同方向的信号进行空时频联合处理,弥补单麦克风在去噪...
  • 现在已有的麦克风阵列采集处理系统中,大多采用4路麦克风阵列,这类系统虽然在一定程度上能解决语音增强、噪音抑制、声源定位和回声抵消等问题,但由于4个麦克风个数较少,只能组成一字线阵,十字阵等几种特定的阵列...
  • ANF(Adaptive Null-Forming,自适应零点形成)是双麦克风阵列处理中实现语音增强的一种方法。ANF算法适用的场景是目标信号来自于端射(endfire)方向,比如通话时的蓝牙耳机,说话人嘴的位置大致在两个麦克风连线的...
  • 麦克风阵列语音增强方法研究 两篇博士论文 用caj浏览器查看
  • 什么是麦克风阵列: 所谓麦克风阵列其实就是一个声音采集的系统,该...麦克风按照指定要求排列后,加上相应的算法(排列+算法)就可以解决很多房间声学问题,比如声源定位、去混响、语音增强、盲源分离等。 【注...
  • 现在已有的麦克风阵列采集处理系统中,大多采用4路麦克风阵列,这类系统虽然在一定程度上能解决语音增强、噪音抑制、声源定位和回声抵消等问题,但由于4个麦克风个数较少,只能组成一字线阵,十字阵等几种特定的阵列...

空空如也

空空如也

1 2 3 4 5
收藏数 86
精华内容 34
关键字:

麦克风阵列语音增强