精华内容
下载资源
问答
  • 麦克风阵列语音增强matlab源程序,使用固定的波束形成算法
  • 麦克风阵列语音增强技术已在语音信号处理中得到广泛研究.但在智能家居等领域中,当说话人等声源移动导致声源方向相对麦克风阵列发生变化时,由此产生的信号泄露将严重影响消噪性能.本文提出了一种基于麦克风阵列...
  • 基于波束形成法的麦克风阵列语音增强技术研究 波束形成法 麦克风阵列 语音增强技术
  • 麦克风阵列语音增强(一)

    万次阅读 多人点赞 2018-07-26 11:05:10
      对于语音增强的研究,基本上可以划分成两大分支:单通道的语音增强算法和麦克风阵列语音增强算法。麦克风阵列语音增强方法的优势在于考虑了声源的位置信息,可以实现空间滤波,所以对具有方向性的噪声具有较...

    1. 引言

      对于语音增强的研究,基本上可以划分成两大分支:单通道的语音增强算法和麦克风阵列的语音增强算法(也称为,多通道的语音增强算法)。麦克风阵列的语音增强方法的优势在于考虑了声源的位置信息,可以实现空间滤波,所以对具有方向性的噪声具有较好的抑制效果。因此,麦克风阵列的技术在抑制一些具有方向性的干扰语音上应用较广。波束形成,这个词也就是这么来的。因为对期望方向的语音信号进行保留,抑制非期望方向的信号,其实就是在做语音信号的波束形成。对于麦克风阵列波束形成的研究主要可分成三类:固定波束形成、自适应波束形成和后置滤波算法,如下图1-1所示。

    这里写图片描述
    图 1-1 麦克风阵列波束形成算法分类

      固定波束形成,适用于稳定不变的噪声干扰环境,可以对某一方向的声源进行抑制,抑制的强度不变,因此灵活性较低。当环境中的噪声信号发生变化时,固定波束形成的算法并不能跟随着作出调整,鲁棒性不好,但其运算复杂度低,算法的可实现性强。自适应波束形成的方法,可以利用信号的输出来自适应地调整滤波的权重系数,其抑制性能可以对环境信号的变化作出调整,鲁棒性更好,波束形成更加灵活。但是波束形成的方法不仅会残留一部分噪声,而且对有些噪声的抑制能力不强,所以就有了把单通道的方法和麦克风阵列相结合的方法,也就是图1-1中所示的后置滤波算法。下面将分别介绍一下三种不同类型的波束形成方法。

    2. 固定波束形成

      最早也是最经典的固定波束形成算法,是由Flanagan提出的。他借鉴了天线阵列信号处理中的思想,利用简单的延时-求和的方法,来实现对噪声的抑制。其基本的算法框图如下图1-2所示。

    这里写图片描述
    图1-2 Flanagan 提出的固定波束形成算法

      首先,不同的麦克风由于位置不同,所以接收的语音信号必定存在着时间偏差。所以,所有的麦克风阵列算法要做的第一件事,就是信号对齐,也就是图1-2中的时延补偿部分所实现的。其次,在Flanagan的算法中,只采用了固定的单个权重来约束每一路麦克风通道的信号(最简单的情况是,所有的权重系数w都取这里写图片描述),因此其消噪能力十分有限,只能实现对非相干噪声的抑制,对于相干噪声基本没有什么抑制能力,并且消噪能力的强弱主要取决于麦克风的数量M,输出的信噪比可提高这里写图片描述,所以局限性很大,成本也相对较高。那么,针对这些问题,固定波束形成的语音增强算法也有相应的改善措施,那就是利用抽头延迟线结构(TDLs,Tapped Delay-lines)来实现对宽带语音信号的波束形成,其具体结构如下图1-3所示。

    这里写图片描述
    图 1-3 TDLs结构的固定波束形成

      TDLs结构的固定波束形成算法,通过多抽头的延迟来产生不同频率的分量,然后通过滤波系数这里写图片描述来约束各麦克风的输入信号,使得期望方向上的信号得到保留,并在非期望方向上形成零陷,从而实现对固定声源方向的波束形成。这种方法可以对固定噪声源方向的信号进行抑制,并且对相干和非相干噪声都能实现有效地抑制。TDLs的算法思想可以用下面的方程(2-1)进行描述:

    这里写图片描述 (2-1)

      在式(2-1)中,矩阵D为方向矩阵,用来对不同角度的语音信号进行频域对齐(也就是图1-3中的时延补偿部分),其中用虚线隔开的部分分别为不同入射角度的语音信号,这里写图片描述这里写图片描述,…,这里写图片描述分别代表了不同的频率分量,这里写图片描述这里写图片描述,…,这里写图片描述代表了不同的麦克风所对应是时间延迟。矩阵F是目标响应矩阵,同样地,用虚线隔开的部分分别对应着不同入射角度信号的目标响应。通过设置目标响应矩阵F,就可以决定固定波束形成结构对哪些方向的语音信号进行保留,又对哪些方向的语音信号进行抑制。矩阵W是权重系数矩阵,也是TDLs结构需要设计的部分,通过求解方程(2-1),得到的矩阵系数解这里写图片描述,便是最终需要的设计的滤波器系数。

    3. 自适应波束形成

      自适应波束形成的主要思想是利用信号的输出来自适应地调整类似TDLs结构中的权重系数这里写图片描述,来达到对声学环境的变化具有一定鲁棒性的目的。在自适应的波束形成算法中,主要由两种典型的实现结构:LCMV结构和GSC结构,两种结构均有时域和频域的实现方法。由于时域的实现方法更加简单,且具有较好的实时性,所以下面重点介绍LCMV和GSC结构的经典时域实现方法。

       Frost 最早提出了经典的时域LCMV自适应波束形成结构,如下图1-4所示。

    这里写图片描述
    图 1-4 时域LCMV自适应波束形成结构

      时域LCMV算法的基本思想可以用式(3-1)和(3-2)进行描述:

    这里写图片描述 (3-1)
    这里写图片描述 (3-2)

    其实,LCMV的方法就是在TDLs固定波束形成的基础上,增加了式子(3-2)中的自适应系数调整部分。其中,这里写图片描述为输入信号Y的自相关矩阵的期望(一般用这里写图片描述来进行估算),通过最小化输出功率来自适应地调整权重系数W。而这里式(3-1)的作用和TDLs结构的固定波束形成是一样的,可以保证目标方向的信号得到保留,干扰目标方向的信号得到抑制。求解方程(3-1)和(3-2),便可以得到系数矩阵W的值:

    这里写图片描述 (3-3)

    为了进一步避免矩阵求逆,可以采用LMS的方法进行迭代求解,如下所示:

    这里写图片描述 (3-4)

    其中,I为单位矩阵,D是设计的方向矩阵,F是目标响应矩阵,这里写图片描述为迭代步长。当然为了进一步简化方向矩阵D的设计,Frost 在最小方差无畸变准则(MVDR)的基础上,提出了如下所示的方向矩阵D和目标响应矩阵F设计形式:

    这里写图片描述 (3-5)

      除了上述的时域LCMV自适应波束形成结构,Griffiths 在LCMV结构的基础上进行改进,得到了一种无约束的时域GSC结构,如下图1-5所示。

    这里写图片描述
    图 1-5 时域GSC自适应波束形成结构

      上图所示的GSC算法主要由三部分构成:固定波束形成部分(这里写图片描述)、阻塞矩阵部分(这里写图片描述)和自适应波束形成部分(这里写图片描述)。其中,固定波束形成部分只能让特定方向的信号通过,而阻塞矩阵部分可以阻止特定方向的信号通过,让其他方向的信号通过。这么设计的原因是,固定波束形成部分的输出中肯定会残留一部分其他方向的信号,那么可以通过对阻塞矩阵(这里写图片描述)的输出进行权重调整(这里写图片描述)来估计出固定波束形成部分(这里写图片描述)残留的噪声,最后进行减法操作,便可以得到最终的纯净语音信号的估计。那么,对于自适应矩阵这里写图片描述的求解就转化成了如下所示的无约束求解问题:

    这里写图片描述 (3-6)

    同样地,为了避免矩阵求逆运算,采用LMS自适应迭代的方法进行求解,得到如下表达式:

    这里写图片描述 (3-7)

    其中,这里写图片描述这里写图片描述是阻塞矩阵这里写图片描述的输出,满足:这里写图片描述。此外,Griffiths采用级联差分方法(CCD)和MVDR准则来对阻塞矩阵和固定波束形成部分进行了简化,得到了如下的设计形式:

    这里写图片描述 (3-8)
    这里写图片描述 (3-9)

    通常情况下,这里写图片描述这里写图片描述,那么就得到了类似Flanagan形式的固定波束形成结构。此外,Griffiths提出的时域GSC算法,可以有效地抑制相干噪声的影响,但是对非相干噪声的抑制能力有限,因为非相干噪声的抑制只能依靠类似Flanagan的固定波束形成部分,所以抑制能力不强。但是,相较于固定波束形成的算法,GSC的方法使用较少的麦克风就能取得十分不错的噪声抑制效果,并且算法运算复杂度也不高,所以在工程中的应用较广泛,在麦克风阵列语音增强专题(二)中将详细介绍这种算法的优缺点。

    4. 后置滤波算法

      后置滤波算法是为了进一步对固定波束形成和自适应波束形成结构的残余噪声进行处理所设计的算法,它可以有效地弥补之前结构存在的不足,去除残留的相干和非相干噪声。最早利用后置滤波思想的是,Zelinski提出的一种对延时-求和波束形成进行改进的后置滤波算法,如下图1-6所示。

    这里写图片描述
    图 1-6 Zelinski 提出的后置滤波算法结构

      如上图1-6所示,Zelinski提出的后置滤波算法以维纳滤波算法为基础,利用多通道的信息,求解Wiener-Hopf方程得到如下所示的增益函数表达式:

    这里写图片描述 (4-1)

    其中,这里写图片描述是第 i 个和第 j 个麦克风信号之间的互功率谱,这里写图片描述 是第 i 个麦克风信号的自功率谱。这样,就得到了多通道维纳滤波的频域增益函数表达形式,再利用IFFT将其变化到时域来实现最后的滤波。虽然Zelinski的这种多通道后置滤波的方法可以有效地去除延时-求和的固定波束形成算法中残留的非相干噪声,但是并不能消除环境中的相干噪声。所以,就有了将GSC自适应结构和后置滤波器相结合的方法(Cohen 和 Gannot 于2004年提出的),如下图1-7所示。

    这里写图片描述
    (a)
    这里写图片描述
    (b)
    图 1-7 (a) 为频域的GSC自适应算法实现方法,(b)是其后置滤波的改善方法

       Gannot 和 Cohen 提出的这种后置滤波结构,将频域GSC算法和Log-MMSE的单通道算法相结合。不同的是,这里后置的log-MMSE估计器,利用了GSC算法中阻塞矩阵输出的多通道信息来进行log-MMSE增益函数的估计。这种结构的后置滤波算法,不仅仅可以有效地去除具有明确方向性的相干和非相干噪声残留,甚至对于无方向性的散漫噪声也具有很好的抑制作用。

       除了上述两种利用多通道信息去计算单通道增益函数的方法,在后置滤波的研究中,还有一类直接级联单通道语音增强算法的方法(也就是,在麦克风阵列算法处理后得到的单通道输出基础上,直接级联第二级单通道后置滤波器的方法),通常级联的是维纳滤波器,除此之外,还有一些直接级联谱减法、MMSE估计器的方法,如下图1-8所示(王冬霞,级联谱减法的后置滤波方法)。

    这里写图片描述
    图 1-8 王冬霞提出的基于固定波束形成的后置谱减算法

      这类直接级联后置滤波器的方法,最大的好处是:单通道的降噪算法对所有的噪声(无论是相干噪声还是非相干噪声,有方向性的还是无方向性的噪声)都有抑制有用。也就意味着,无论前面的麦克风阵列部分残留的是哪种噪声,直接级联的单通道算法都可以进行抑制。虽然这种后置滤波方法的思想比较简单,但效果比较显著,因此在实际工程中也很有用武之地。

    参考文献:

    1. Liu W, Weiss S. Wideband Beamforming: Concepts and Techniques[M]. Wiley Publishing, 2010:26-29.
    2. Flanagan J L, Johnston J D, Zahn R, et al. Computer-steered microphone arrays for sound transduction in large rooms[J]. Acoustical Society of America Journal, 1985, 78(5):S52-S52.
    3. Frost, O. An Algorithm For Linearly Constrained Adaptive Array Processing[J]. IEEE, 1972, 60(8):926–935.
    4. Griffiths L J, Jim C W. An alternative approach to linear constrained adaptive beamforming[J]. IEEE Trans Antennas & Propag, 1982, 30(1):27-34.
    5. Zelinski R. A microphone array with adaptive post-filtering for noise reduction in reverberant rooms[C]. IEEE International Conference on Acoustics, Speech, and Signal Processing, 1988(5):2578-2581.
    6. Gannot S, Cohen I. Speech enhancement based on the general transfer function GSC and postfiltering[J]. IEEE Transactions on Speech & Audio Processing, 2004, 12(6):561-571.
    7. 王冬霞, 殷福亮. 联合波束形成与谱减法的麦克风阵列语音增强算法[J]. 大连理工大学学报, 2006, 46(1):121-126.
    展开全文
  • 基于延迟-求和的麦克风阵列语音增强算法研究.pdf 延迟-求和 麦克风阵列 语音增强
  • 为了加快基于广义旁瓣相消器的麦克风阵列语音增强系统的收敛速度,将其自适应模块的输入信号分解到子带以进行处理,并将多通道维纳滤波器引入广义旁瓣相消器的非自适应支路,以更有效地抑制非相干噪声。实际测试结果...
  • 为了加快基于广义旁瓣相消器的麦克风阵列语音增强系统的收敛速度,将其自适应模块的输入信号分解到子带以进行处理,并将多通道维纳滤波器引入广义旁瓣相消器的非自适应支路,以更有效地抑制非相干噪声。实际测试结果...
  • 麦克风阵列语音增强(二)

    千次阅读 2018-07-26 17:05:04
      在麦克风阵列的一些应用场景中,语音干扰的情况十分常见,比如说,在一个房间内正在进行多媒体远程会议,这时就希望麦克风阵列只捕捉我们想要的目标声源(会议发言人),抑制那些来自干扰方向的噪声(例如,非...

    1. 时域GSC自适应波束形成算法(Griffiths-Jim)

    这里写图片描述
    图 2-1 Griffiths-Jim的时域GSC自适应波束形成算法

       在这个专题中,将对Griffiths于1982年提出的经典时域GSC算法进行实现,并利用爱丁堡大学语音实验室开发的麦克风阵列仿真环境(之前已经单独介绍过了)进行实验测试。首先是,GSC算法的设计,算法结构框图如上图2-1所示。根据其结构,我们需要设计的部分是三个矩阵部分:固定波束形成部分的静止矩阵(这里写图片描述)、阻塞矩阵(这里写图片描述)和自适应抵消部分的权重矩阵(这里写图片描述)。对于静止矩阵和阻塞矩阵,Griffiths已经进行了简化设计,如下所示:

    这里写图片描述 (1-1)
    这里写图片描述 (1-2)

      如上式(1-1)和(1-2)所示,对于阻塞矩阵采用的是 [1,-1] 形式的相邻麦克风对减方式,静止矩阵采用的是求和平均的方式(这里写图片描述这里写图片描述)。这种简化方式具有计算简单,运算量低的优点,当然,相应的噪声抑制性能也不高。除了上述提到的静止矩阵和阻塞矩阵的设计,还有一个很重要的矩阵需要进行设计,也就是自适应权重系数矩阵这里写图片描述。对于这里写图片描述的设计,本来是需要进行矩阵的求逆运算才能计算得到的,这里为了进一步降低运算量,采用了LMS自适应迭代的方法,求解过程如下所示:

    这里写图片描述 (1-3)

    其中,这里写图片描述为迭代步长,这里写图片描述这里写图片描述是阻塞矩阵这里写图片描述的输出,满足这里写图片描述。这便是Griffiths-Jim 的GSC算法的设计过程,但是对于其中时延补偿部分的设计还没有涉及,实现方法通常两种:时域对齐和频域对齐。下面介绍一种最简单的方法,也就是时域采样点延迟的方法。如下图2-2所示,在知道目标语音信号入射方向的前提下(一般是由声源定位算法估计得到),以最左侧或者最右侧的麦克风接收的信号为基准,调整其他麦克风的时域采样点向后或者向前调整几个点即可。因为麦克风之间的间距和声源入射方向是已知的,所以根据声速340m/s,可以计算出来每个麦克风需要调整的点数。

    这里写图片描述
    图 2-2 平面波入射模型

    2. 实验仿真测试

      利用之前介绍的麦克风阵列仿真环境,模拟了一个长宽高为3m *4m *3m 的密闭房间,房间混响为0.1s,采用4个麦克风的均匀线性阵列(麦克风间距5cm),将其放置在房间的正中央,目标声源位于麦克风阵列正前方方向(省去了时延补偿的工作),距离麦克风阵列1.4m。另外,对具有明确方向性的语音干扰、点噪声源干扰和无方向性的散漫噪声情况进行实验测试。语音干扰和点噪声源干扰都来自麦克风阵列的右侧90度方向,且距离麦克分1m,散漫噪声以球形场的形式均匀分散在房间中,如下图2-3所示。

    这里写图片描述
    图 2-3 实验仿真环境设置

    2.1 语音干扰情况

      在麦克风阵列的一些应用场景中,语音干扰的情况十分常见,比如说,在一个房间内正在进行多媒体远程会议,这时就希望麦克风阵列只捕捉我们想要的目标声源(会议发言人),抑制那些来自干扰方向的噪声(例如,非发言人的干扰语音)。针对这种情况进行实验测试,结果如下图2-4所示。其中,图2-4中的(a)和(b)是目标声源和干扰声源分别说话时的算法处理前后的结果(目标源先说话,干扰源再说话),(c)和(d)是同时说话时的算法处理前后的结果。从时域波形图的结果可以看出,干扰声源的幅度被明显地降低了,由此可见,GSC算法可以实现有效地空间滤波性能。

    这里写图片描述
    图 2-4 语音干扰情况的时域波形图

    2.2 点噪声源干扰情况

      点噪声源和语音干扰的情况类似,只是干扰信号不是语音而是固定方向传过来的噪声,例如在房间内有一个窗户,窗外有一辆汽车经过,那么从窗户传进来的汽车噪声就是点噪声源。对于点噪声源的情况,实验测试了白噪声的情况(0dB的输入信噪比),如图2-5所示。其中,(a)是纯净语音的时域波形图,(b)和(c)分别是点噪声源干扰的语音和算法处理后的去噪语音。显然,GSC算法可以有效地抑制具有明确方向性的点噪声源干扰,使得点噪声源的信号幅度被衰减。

    这里写图片描述 这里写图片描述
    图 2-5 点噪声源干扰情况的时域波形图

    2.3 散漫噪声源干扰情况

      对于散漫噪声,采用的是球形噪声场的数学模型模拟产生,因此它并没有明确的方向性,在整个房间内均匀存在,是实际生活中比较常见的噪声类型。这里仍然采用白噪声作为散漫噪声源(输入信噪比为0dB),实验测试结果如下图2-6所示。其中(a)为纯净语音信号的时域波形图,(b)是被散漫噪声源污染的语音信号,(c)为GSC算法处理后的去噪语音信号。从实验结果中发现,GSC算法对散漫噪声的抑制能力比较弱,也就是说,当空间中的噪声不具有方向特性时,GSC算法的空间滤波优势将大大减弱,这也是麦克风阵列波束形成算法的缺陷所在。

    这里写图片描述 这里写图片描述
    图 2-6 散漫噪声源干扰情况的时域波形图

    参考文献:

    Griffiths L J, Jim C W. An alternative approach to linear constrained adaptive beamforming[J]. IEEE Trans Antennas & Propag, 1982, 30(1):27-34.

    展开全文
  • 考虑到封闭环境的散射噪声场中,传统波束形成方法及单通道谱减法对噪声抑制的局限性,提出一种将波束形成方法与谱减法相结合的麦克风阵列语音增强方法.该方法首先通过波束形成器的空间滤波作用,将波达方向不同的语音...
  • 盲分离, 语音增强 ,好资源一起分享吧 ,去噪声很好的资料
  • 基于麦克风阵列语音增强研究

    千次阅读 2020-10-30 10:02:16
    本文介绍了一种采用麦克风阵列波束形成和语音增强算法的系统设计与实现。该系统的目标是提高主语音信号的质量,波束形成器的工作方式是通过利用阵列信号信息而不是物理移动阵列,将一组麦克风转向所需要的观察方向。...

    本文为美国马奎特大学(作者:HeatherElaine Ewalt)的硕士论文,共125页。

    本文介绍了一种采用麦克风阵列波束形成和语音增强算法的系统设计与实现。该系统的目标是提高主语音信号的质量,波束形成器的工作方式是通过利用阵列信号信息而不是物理移动阵列,将一组麦克风转向所需要的观察方向。通过最小化非视线方向上的干扰源和噪声能量,同时增强视线方向上信号的能量来实现这一目的。本文研究了两种波束形成方法:延迟求和DS波束形成器和最小方差无失真响应MVDR波束形成器。首先将输入信号分解为多个频带,以便采用窄带波束形成技术。两种波束形成方法分别采用多源维纳滤波和多源谱减增强算法,这些算法利用从初始波束形成算法获得的每个信号源的信号估计作为输入,这些多源增强算法可以通过迭代技术实现,以改进信号估计效果,同时提高主源的信噪比。

    本文提出的实验装置由两个和三个使用线性麦克风输入系统的语音源组成,该算法既适用于模拟实验装置,也适用于语音处理的室内数据采集。为了衡量增强后语音信号质量的提高,对原始信号、波束形成信号和增强信号进行了整体信噪比和分段信噪比的测量比较。除了这些质量改进指标之外,还进行了听众意见的主观测试

    This thesis describes the design andimplementation of a speech enhancement system that uses microphone arraybeamforming and speech enhancement algorithms applied to a speech signal in amultiple source environment. The goal of the system is to improve the qualityof the primary speech signal. Beamformers work by means of steering an array ofmicrophones towards a desired look direction through utilizing signalinformation rather than physically moving the array. They accomplish this throughminimizing the energy of interference sources and noise in non-look directionswhile increasing the energy of the signal in the look direction. In thisresearch, two beamforming methods are examined: the delay and sum (DS)beamformer and the minimum variance distortionless response (MVDR) beamformer.The input signals are first split into frequency bands so that narrowbandbeamforming techniques can be used. Multiple source Wiener filtering andmultiple source spectral subtraction enhancement algorithms are incorporatedinto the two methods of beamforming. The algorithms utilize signal estimates ofeach source obtained from the initial beamforming algorithms as inputs. Thesemultiple source enhancement algorithms result in iterative techniques to improvethose estimates while improving the signal to noise ratio of the primarysource.

    The experimental setup presented hereconsists of both two and three speech sources using a linear microphone inputsystem. The algorithms are performed on both simulated experimental setups andon data obtained from a data acquisition system in an acoustically treatedsound room. To measure the improvement in quality of the enhanced signal,overall SNR and segmental SNR improvement is determined for the original,beamformed, and enhanced signal. In addition to these quality improvementmetrics, listener opinion testing is performed.

    1 引言

    1.1 论文声明

    1.2 论文概述

    2 项目背景

    2.1 麦克风阵列基础

    2.2 波束形成器基础

    2.3 波束形成器的具体实现

    2.4 语音增强基础

    2.5 语音增强的测量基础

    3 迭代的多源增强方法

    3.1 多源谱减增强

    3.2 多源维纳滤波增强

    3.3 耦合函数

    4 实验设置

    4.1 实验设备

    4.2 多个说话者的输入信号

    4.3 算法处理细节

    5 数据采集系统

    5.1 多个说话者的输出系统

    5.2 多输入系统

    5.3 音响设置

    6 实验结果

    7 讨论

    8 结论

    附录A 模拟数据的实验结果

    附录B MOS测试

    完整资料领取

     

    展开全文
  • 麦克风阵列语音增强beamforming算法

    万次阅读 2017-11-27 17:34:16
    delay and sum 关键步骤在于计算延时, 可以...VAD算法具体可以采用, 计算语音段的能量与设置的某一阈值T0比较, 若连续N段语音是超过阈值T0的, 则确定为语音段, 否则为静音段. gsc广义旁瓣消除 GSC算法分析

    delay and sum

    关键步骤在于计算延时, 可以通过GCC-PHAT方法进行计算, 即广义互相关-相位变换方法.

    • GCC-PHAT(广义互相关-相位变换)

    x(n) y(n) 的互相关函数是将 x(n) 保持不动, y(n) 左移m个样本点, 两个序列逐个相乘的结果, 顺序不能互换.
    但是, 按照时域卷积的方式求互相关函数的方法计算复杂度较大, 所以将在频域进行操作(FFT和IFFT), 即线性卷积的FFT算法.

    两个信号的互相关函数的频域等于x信号频域的共轭乘以Y信号的频域.

    mvdr最小方差无失真响应滤波

    • MVDR主瓣约束自适应算法.

    即在信号方向上的增益保持不变的情况下, 在非信号方向上试波束输出的功率最小. 实现方式是选择一组权矢量. 最优权矢量为:

    wopt=R1xxCCHR1xxC

    具体推导过程在文章MVDR自适应波束形成算法研究 中可以得出.其中, Rxx 是自相关函数, C是约束矩阵.

    • 参考相关代码, MVDR之前会进行VAD静音检测.

    VAD算法具体可以采用, 计算语音段的能量与设置的某一阈值T0比较, 若连续N段语音是超过阈值T0的, 则确定为语音段, 否则为静音段.

    gsc广义旁瓣消除

    GSC算法分析

    展开全文
  • 基于近场波束形成的麦克风阵列语音增强算法
  • 本文为美国马奎特大学(作者:HeatherElaine Ewalt)的硕士论文,共125页。本文介绍了一种采用麦克风阵列波束形成和语音增强算法的系统设计与实现。该系统的...
  • 基于等边三角形麦克风阵列语音增强.pdf 等边三角形 麦克风阵列 语音增强
  •   对于语音增强的研究,基本上可以划分成两大分支:单通道的语音增强算法和麦克风阵列语音增强算法(也称为,多通道的语音增强算法)。麦克风阵列语音增强方法的优势在于考虑了声源的位置信息,可以实现空间...
  • 用麦克风阵列,在机器人的身上放置多个麦克风从而实现语音定位,通过麦克风阵列语音增 强与语音识别相结合能更精确地“理解”指令。  3、应用于视频会议及大型会场  参加视频会议的人很多时,欲发言讨论者也...
  • 基于相干性滤波器的广义旁瓣抵消器麦克风阵列语音增强方法
  • 麦克风阵列语音增强(二)   版权声明:本文为博主原创文章,未经博主允许不得转载。 https://blog.csdn.net/zhanglu_wind/article/details/81217093 1. 时域GSC自适应波束形成算法(Griffiths-Jim)     图...
  • 语音增强或识别的语音源数据 麦克风阵列信号处理 语料数据库
  • 麦克风阵列技术名词解释背景介绍远场拾音声源定位麦克风及音频信号什么是麦克风麦克风的分类麦克风的对比选型麦克风阵列简介语音交互的优势人机交互痛点近场语音和远场语音麦克风阵列的功能麦克风阵列构型 ...
  • 一种适用于近场麦克风阵列后滤波语音增强方法
  • 目录麦克风阵列的原理麦克风阵列的功能麦克风阵列解决噪声干扰存在的干扰算法1.多通道降混响算法(室内)2.多通道点干扰抑制算法(室外)3.多通道目标说话人提取算法(声纹,不适用)麦克风阵列常用技术1.自动增益...
  • 网络游戏-基于分布式麦克风阵列网络的语音增强方法.zip
  • 在免提通信系统中,麦克风阵列往往用于噪声和混响环境下的语音拾取。...仿真试验结果验证了理论分析的结论,即麦克风阵列的拓扑结构的确影响着语音增强系统的性能,优化的麦克风阵列摆放可以在一定程度上改善语音质量。
  • 远场拾音设备是一款基于麦克风阵列的高性能语音远场拾音解决方案。拾音器利用麦克风阵列的空域滤波特性,通过多个麦克风同时拾音,高性能处理器将环境噪音及有效声音进行处理,增强有效声音并抑制环境噪音,去除声音...
  • 基于麦克风阵列增强语音识别,与单通道语音识别相比麦克风阵列可以利用多通道的语音信息,通过波束形成算法来增强语音信号的质量,这样提取的特征参数能更好的反应语音的特征,从而提高语音识别的效果。...
  • 麦克风阵列增强技术

    2012-07-23 21:57:30
    麦克风阵列增强技术,想学习麦克风阵列技术的一定要看哦,亲
  • 阵列麦克风对人工智能的意义: 空间选择性:通过电扫阵列等空间定位技术可以获取声源的有效位置,智能设备在获取精准的声源位置信息,让我们的语音更加智能,通过算法获取高品质的语音信号质量
  • 麦克风阵列入门

    万次阅读 多人点赞 2018-09-25 18:01:46
    麦克风按照指定要求排列后,加上相应的算法(排列+算法)就可以解决很多房间声学问题,比如声源定位、去混响、语音增强、盲源分离等。 【注】:在深入理解概念之前,我们先理解一下麦克风的知识 什么是麦克风的指向...

空空如也

空空如也

1 2 3 4 5 ... 20
收藏数 817
精华内容 326
关键字:

麦克风阵列语音增强