精华内容
下载资源
问答
  • A, B 俩咖啡店只卖'焦糖玛奇朵'和'卡布奇诺'两种. 且并不接受订单, 随机给出一杯咖啡. 小明刚来到 S 小城镇,  想喝'卡布奇诺', 你会推荐他去一家店? 曾人想摸透 A, B两家店给出 '卡布奇诺'的概率, 召集了9个...

    极大似然估计


    mongoo

    2013-09-25


      S 小城镇只有 A, B 俩咖啡店. A, B 俩咖啡店只卖'焦糖玛奇朵'和'卡布奇诺'两种. 且并不接受订单, 随机给出一杯咖啡. 小明刚来到 S 小城镇, 

    想喝'卡布奇诺', 你会推荐他去哪一家店?

    曾有人想摸透 A, B两家店给出 '卡布奇诺'的概率, 召集了9个朋友一起轮班去两家喝咖啡, 并给出了以下7组数据 

    序号 店铺 喝到'卡布奇诺'人数
    1 A 9
    2 B 5
    3 A 6
    4 A 8
    5 B 3
    6 A 9
    7 B 4

    他们已经喝不动了. 这时有人提出这样一个结论去 A 店随机给出一杯'卡布奇诺'的概率高.

    一共去了A店4次. 一共喝到了 9 + 6 + 8 + 9 = 28杯 '卡布奇诺'  28/4 = 7, 所以在A店可以喝道 '卡布奇诺'的概率为 0.7

    同理, B点可以喝道 '卡布奇诺'的概率为 0.4

    所以他们推荐 小明去 A 点喝咖啡.


    这个科学不?

    我们以数学语言去描述这一件事请. 

    首先, 我们使用变量 X 表示喝到'卡布奇诺'人数 Z 表示在哪个店铺喝的.




    A,B 店随机给出 '卡布奇诺'的概率分别记为  和 .

    我们的目标是通过这7组数据来估计 的数值.

    有人提出 0.7, 0.4的概率可以这样描述:




    其实, 实际上这样的估计就是 maximum likelihood estimation ( 极大似然估计 ).

    上面的事件在概率统计上可以以  , 参数为  的 X,Z的联合概率分布来表示.

    问题就变为, 求满足这样的 X,Z的 . 因为 X,Z 可以通过统计可得出, 如 .

    可以写成关于  的函数: .

    函数  叫做  的 likelihood function (似然函数). 


    我们求对  的偏导并令偏导数为0,


    可以得出


    个人理解: 

    此题为例, 观察可得X,Z. 想要找出 ( 在A,B店喝到 '卡布奇诺'的概率 ), 且与X,Z之间有联系. 

    于是假设出一个函数  , 且找出使  值最大的 .

    为什么  要求使其最大, 这是为什么呢?

    先来看一下  具体表达意义何在.

     描述    : "在A,B店中喝到 '卡布奇诺'的概率", 

     描述: "在A,B店中喝到 '卡布奇诺'的概率为 的概率".

    但事件2 为"真实事件", 即概率为1. 所以  越大, 越真实.

    所以求满足  最大的 .

    : likelihood function, 似然函数, 也是为一个已发生的真实事件的发生的概率函数.

    因为投掷硬币中, 若投掷2次, 都出现正面. 则投掷硬币出现正面的  使其最大的  为 1. 即 .

    所以极大似然估计描述已发生的真实事件的发生的概率函数,对于样本大小依赖很大.


    到此, 本文结束. 

    具体计算似然函数求偏倒为0, 看分割线之后部分.

    =======================华丽的分割线=======================


    有人会想计算验证, 可乍一看肯麻烦 ( 像我数学功底不好的同学 ), 好那举一个例子来计算一下, 验证上面计算所得确实是一样.

    为了简化式子, 这伙人一家只去了一次, 如下

    序号 店铺 喝到'卡布奇诺'人数
    1 A 9
    2 B 5

    则, 



    即A, B 两家店喝到 '卡布奇诺'的概率各为 0.9, 0.5


    得  , 同理 


    展开全文
  • 先验概率的估计相对来说比较简单,一般有两种方法,其一可以用训练数据中各类出现的频率来估计得到;其二可以依靠经验,不管种方法都不会很难,而对于类条件概率密度来说,估计往往会难得多,因此对于它的估计会是

    转载出处:http://blog.csdn.net/eternity1118_。


     回顾下贝叶斯决策,它的终极目标是要获取后验概率,而后验概率又可以由先验概率和类条件概率密度两个量估计得到。先验概率的估计相对来说比较简单,一般有两种方法,其一可以用训练数据中各类出现的频率来估计得到;其二可以依靠经验,不管哪种方法都不会很难,而对于类条件概率密度来说,估计往往会难得多,因此对于它的估计会是贝叶斯决策的重点。

           有关概率密度函数的估计,统计类的书籍(像概率论与概率统计)中介绍的比较全面,这里只做简要的回顾和温习。另外除了特别说明,我们均假定所有样本都是来自同一类别,即利用同一类的样本来估计本类的类条件概率密度(以下简称PDF)。

            PDF的估计方法主要有两大类,参数估计和非参数估计;前者,PDF形式确定,部分或全部参数不确定,因此要利用样本来估计这些未知参数,主要方法有大家都知道的最大似然估计和贝叶斯估计;后者,不仅参数未知,就连PDF的形式也不知道,换句话说,就是当前我们知道的几种分布模型,高斯分布啊,瑞利分布啊神马的,它都不服从,这个情形下,我们就不能单单估计出参数了,而是要首要估计出PDF的数值化模型,这是后面学习的重点,会放在下篇博客学习。

            首先,回想下以前大学学概率论时老师讲的参数估计,神马点估计啊,区间估计啊,对比下我们的问题,显然应该用点估计,对不对,上面也说了大家最熟悉的最大似然估计和贝叶斯估计了。

            最大似然估计:在参数空间中找到一个能够使得似然函数l(theta)极大化的theta值,把它当做最大似然估计量,其中,最大化的方法当然是求偏导;

           贝叶斯估计:尽管很多实际情况下它与最大似然估计相同,但是他们处理问题的view是不同的;根本区别就是,前者将待估计的参数当做一个确定量,而后者却把它当做一个随机量。这里提一下贝叶斯学习(Bayesian Learning)这个概念,意思就是利用贝叶斯估计对PDF直接进行迭代估计的一种学习策略。回到贝叶斯估计上来,为什么要叫他贝叶斯估计,它跟贝叶斯决策又有什么区别和联系,哈哈,联系当然很大,其实在贝叶斯估计中,我们是把对参数的估计当做是一个贝叶斯决策的,不同的只是这里决策的不是离散的类别,而是参数的value,并且是在一个连续的参数空间里做决策。

      (注意:贝叶斯估计中,我们本来的目的并不是估计PDF的参数,而是估计概率密度函数p(x|theta)本身,当只有在问题的PDF形式已知时,才转化为估计参数。另外在估计参数时,与最大似然估计不同,并非直接把似然函数最大或者是后验概率最大的值拿来当做对样本PDF参数的估计,而是根据把所有可能的参数值都考虑进来,用他们的似然函数作为加权来平均出一个对参数的估计值。)

           非参数估计,是模式识别中比较重要的知识点,它是一种model-free的估计方法,简单好用,并且适合高维估计,这篇博客不准备复习它,留在下一篇吧,给自己留点动力。。


    展开全文
  • 并确保在同一事务处理对相同数据的次查询看到的是相同的值。 值范围: TRUE | FALSE 默认值: FALSE row_locking: 说明: 指定在表已更新或正在更新时是否获取行锁。如果设置为 ALWAYS, 只有在表被更新后才获取...
  • 语音增强

    千次阅读 2020-09-28 15:11:20
    随着人们对语音增强知识的认识和发展,各种各样的语音增强算法都相应的发展起来。如前所述,由于噪声特性各异,总...至于到底侧重与一方面,就要看算法内部的参数选取了。 其中,噪声对消法的基本原理是从带噪语...

    随着人们对语音增强知识的认识和发展,各种各样的语音增强算法都相应的发展起来。如前所述,由于噪声特性各异,总的来说,现在比较流行的算法主要有以下几种:

    1. 小波分解法;
    2. 听觉屏蔽法;
    3. 噪声对消法;
    4. 谐波增强法;
    5. 基于语音生成模型的增强算法;
    6. 基于短时谱估计的增强算法;

    以上的各种语音增强算法虽然在具体实现上是有差别的,但从另一个方面来说,它们都不得不在语音的可懂度和主观度量这两个方向上做一番权衡。至于到底侧重与哪一方面,就要看算法内部的参数选取了。

           其中,噪声对消法的基本原理是从带噪语音中减去噪声。这一原理是显而易见的,但问题是如何得到噪声的复制品。如果可以用两个麦克风(或多个麦克风)的信号采集系统,一个采集带噪语音,另一个(或多个)采集噪声,则这一任务比较容易得到解决。并且在强噪声环境下,这种方法可以得到很好的消除噪声结果。如果采集到的噪声足够“逼真”,甚至可以与带噪语音在时域上直接进行相减。噪声对消法可以用于平稳噪声相消,也可以用于准平稳噪声。采用噪声对消法时,两个话筒之间必须要有相当的隔离度,但采集到的两路信号之间不可避免地会有时间差,因此实时采集到的两路信号中所包含的噪声段是不同的,回声及其它可变衰减特性也将影响所采集噪声的“纯净”性。因而,采集到的噪声必须经过数字滤波器,以得到尽可能接近带噪语音中的噪声。通常,这就需要采用自适应滤波器曰,使相减噪声与带噪语音中的噪声一致,其原理类似于回波抵消器。自适应滤波器通常采用FIR滤波器,其系数可以采用最小均方(LMS)法进行估计,使如下信号的能量最小。

    语音的声音按照其激励形式的不同可以分为三类:第一类是浊音,当气流通过声门时,如果声带的张力刚好使声带发生张弛振荡式的振动,那么就可以产生准周期的空气脉冲,这一空气脉冲激励声道得到浊音,对应于图中就是u(n)为间隔是基音周期T的脉冲串;第二类是摩擦音或清音,如果声道在某处发生收缩,同时迫使空气以高速冲过这一收缩部分而产生湍流,就得到这种音,此时建立的宽带噪声源激励了声道,对应于图中就是u(n)为宽带噪声;如果使声道完全闭合,在闭合后产生气压,然后突然释放,这就得到爆破音。一般而言,语音信号可以看作是由浊音、清音以及它们之间的过渡组成的。

    1.语音信号的频谱分量比较集中

    通过对语音信号发声过程的研究以及观察记录的各种语音波形,人们发现语音信号的频谱分量主要集中在300~3400Hz的范围内,这是因为人的声道的变化不可能太快。这一点给我们的语音研究和计算带来了很大的便利,我们只要把注意力放在这一区域就可以了。

    2.语音是一个时变的、非平稳的随机过程

    人类发声系统的生理结构的变化速度是有一定的限度的,在一段短时间内(5-50ms)人的声带和声道形状有相对稳定性,可近似认为其特征不变,因而语音的短时谱分析也有相对稳定性。短时谱的这种平稳性是很多语音处理算法和技术的基础。

    3.语音大体上可以分为清音和浊音两大类

    一般而言,人类的语音信号往往在有些时段表现出明显的周期性(浊音),这种语段在频域上有共振峰结构,其能量大部分集中在较低频段内;而在另一些时段表现出完全的随机性(清音),这种语段在频域上没有明显的共振峰结构,其频谱类似于白噪声;其余的就是由两者相混合而成。这一点反映在图2-1就是:激励源u(n)要么就是由脉冲发生器发出,要么就是由白噪声发生器发出,要么就是由两者按一定比例混合后发出。

    4.作为一个随机过程,语音信号可以用统计分析特性来描述

    在高斯模型假设下,傅立叶展开系数被认为是独立的高斯随机变量,均值为0,而方差是时变的。这种高斯模型应用于有限帧长时只是一种近似的描述,在宽带噪声污染的带噪语音的语音增强中,这种假设可用于分析的前提。

    1)初始操作:

    x=wavread('samples.wav');

    n=wavread('white.wav');

    [p,q]=size(x);

    [a,b]=size(n);

    x1=x(150000:250000,1);

    n1=n(1:length(x1),1);

    y=x1+n1;

    其中,wavread('filename.wav',k)函数把文件名为filename的.wav文件的前k个采样点读入当前工作空间中。在未说明情况下,读入全部数值。分别用数组x、n储存纯净语音与高斯白噪声数据。size( )函数返回数组维数大小p,q。在这之前,由于我们引入的是双通道语音,所以q=2,p=语音长度。为了在计算机仿真时,算法程序不至于因为占用过多内存而导致系统瘫痪,我们截取数组x的第150000~250000个点进行操作,同样为了保证数组间操作的维数的一致性,对噪音数据采取同类操作。

    2)核心谱减部分:

           aa=2;

    bb=6;

    anglen=angle(fft(n1));

    ampn=abs(fft(n1));

    ampy=abs(fft(y));

    angley=angle(fft(y));

    cn=bb*(ampn.^aa);

    xx=(ampy.^aa-cn).^(1/aa);

    ifftx=real(ifft(xx.*exp(j*angley)));

    本段程序是对基本谱减法的改进程序,其中aa、bb分别相当于式2-10中的和。当前值是经过反复实验后得到的经验值。程序中主要用到的函数说明如下:

    y为纯净语音信号,fft(y,N)为快速傅立叶变换函数,其中y为操作对象信号,N为进行多少点傅立叶变换系数(默认情况下,N取256)。abs和 angle函数分别对256点傅立叶变换后的y取绝对值和相角,ifft (x,N)为逆傅立叶变换的标准函数,x为操作对象,N为逆变换点数。real对傅立叶反变换后的复数进行取实部操作所得ifftx即为增强结果,采用soundview(‘filename’,Fs)回放。Fs为采样频率。

           整个语音信号的端点检测可以分为4段:静音、过度段、语音段、结束。程序中使用一个变量status来表示当前所处的状态。在静音段,由于参数的数值比较小,不能确信是否处于真正的语音段,因此只要两个参数的数值都回落到低门限以下,就将当前状态恢复到静音状态。而如果在过渡段中两个参数中的任一个超过了高门限,就可以确定进入语音段了。

    三种定义的短时能量分别用下面三行MATLAB命令实现:

    amp1=sum(abs(y),2);

    amp2=sum(y.*y,2);

    amp3=sum(log(y.*y+eps),2);%加上浮点小数eps,是为了防止log运算中可能出现的溢出。

    过零率的计算:

    zcr=zeros(size(y,1),1);

    delta=0.02;

    for  i=1:size(y,1)

           x=y(i,:);

           for  j=1:length(x)-1

                  if     x(j)*x(j+1)<0&abs(x(j)-x(j+1))>delta

                         zcr(i)=zcr(i)+1;

                  end

           end

    end

    其中,delta=0.02为门限,这个值是我们经过许多实验得到的经验值,可以进行细微的调整。由于毕业设计的时间所限,目前的端点检测仅能针对单个数字发音的识别,应用到整段较长数据的话会引入较大失真,还需要对算法做进一步改进。

    原始纯净语音波形如下图所示:

    当加载2倍白噪声信号,即系统输入信号为Y=x1+2*n1时,采用各算法后所得波形依次如下(显示先后顺序:带噪语音、基本谱减、STFT谱减、维纳滤波、小波变换):

    图4-2  带噪语音波形

    图4-3     基本谱减法操作后波形

    图4-4     STFT谱减操作后波形

    图4-5     维纳滤波后波形

    图4-6   小波处理后波形

    同样是在系统输入信号为Y=x1+2*n1时,采用各算法后所得语谱图依次如下(显示先后顺序:纯净语音、带噪语音、基本谱减、STFT谱减、维纳滤波、小波变换):

    纯净语音的语谱图

    带噪语音的语谱图

    基本谱减后的语谱图

    STFT谱减后的语谱图

    维纳滤波后的语谱图

    小波变换后的语谱图

    展开全文
  • c语言编写单片机技巧

    2009-04-19 12:15:17
    答: MCU从生产出来到封装出货的每个不同的阶段会不同的测试方法,其中主要会有两种:中测和成测。 所谓中测即是WAFER的测试,它会包含产品的功能验证及AC、DC的测试。项目相当繁多,以HOLTEK-p....
  • vector遍历有哪方式(尽可能多) cv:Mat 有几访问方式 map容器增删改查,和unorder_map区别,map底层如何实现 c++智能指针 c++14/17新特性 c++和c语言区别 c++如何实现多态,有几方式,动态多态和...

空空如也

空空如也

1 2 3 4
收藏数 61
精华内容 24
关键字:

参数估计有哪两种