精华内容
下载资源
问答
  • 参数估计和假设检验

    2019-10-22 11:00:53
    统计学方法包括统计描述统计推断两种方法,其中,推断统计又包括参数估计和假设检验。 1.参数估计就是用样本统计量去估计总体的参数的真值,它的方法有点估计区间估计两种。 点估计就是直接以样本统计量直接...

    统计学方法包括统计描述和统计推断两种方法,其中,推断统计又包括参数估计和假设检验。


    1.参数估计就是用样本统计量去估计总体的参数的真值,它的方法有点估计和区间估计两种。

    点估计就是直接以样本统计量直接作为相应总体参数的估计值。点估计的缺陷是没法给出估计的可靠性,也没法说出点估计值与总体参数真实值接近的程度。

    区间估计是在点估计的基础上给出总体参数估计的一个估计区间,该区间是由样本统计量加减允许误差(极限误差)得到的。在区间估计中,由样本统计量构造出的总体参数在一定置信水平下的估计区间称为置信区间。

    在其它条件相同的条件下,区间估计中置信度越高,置信区间越大。置信水平为1-a, a(显著性水平)为小概率事件或者不可能事件,常用的置信水平值为99%,95%,90%,对应的a为0.01, 0.05, 0.1

    置信区间是一个随机区间,它会因样本的不同而变化,而且不是所有的区间都包含总体参数。

    一个总体参数的区间估计需要考虑总体是否为正态分布,总体方差是否已知,用于估计的样本是大样本还是小样本等

    (1)来自正态分布的样本均值,总体方差已知,不论抽取的是大样本还是小样本,均服从正态分布。

    (2)总体不是正态分布,总体方差已知或未知,大样本的样本均值服从正态分布,小样本的不能进行参数估计。

    (3)来自正态分布的样本均值,如果总体方差未知,原则上都按t 分布来处理(但在大样本的情况下,可近似按正态分布处理)。

    2. 假设检验假是根据样本统计量来检验对总体参数的先验假设是否成立,是推断统计的另一项重要内容,它与参数估计类似,但角度不同,参数估计是利用样本信息推断未知的总体参数,而假设检验则是先对总体参数提出一个假设值,然后利用样本信息判断这一假设是否成立。

    假设检验的基本思想:先提出假设,然后根据资料的特点,计算相应的统计量,来判断假设是否成立,如果成立的可能性是一个小概率的话,就拒绝该假设,因此称小概率的反证法。最重要的是看能否通过得到的概率去推翻原定的假设,而不是去证实它。

    3.参数估计与假设检验之间的相同点、联系与区别:
    (1)相同点:

    a.都是根据样本信息对总体的数量特征进行推断;
    b.都以抽样分布为理论依据,建立在概率论基础之上的统计推断,推断结果都有一定的可信程度或风险。

    (2)联系:

    二者可相互转换,形成对偶性。对同一问题的参数进行推断,由于二者使用同一样本、同一统计量、同一分布,因而二者可以相互转换。区间估计问题可以转换成假设问题,假设问题也可以转换成区间估计问题。区间估计中的置信区间对应于假设检验中的接受区域,置信区间以外的区域就是假设检验中的拒绝域。

    (3)主要区别:

    a.参数估计是以样本资料估计总体参数的真值,假设检验是以样本资料检验对总体参数的先验假设是否成立;
    b.参数估计中的区间估计是求以样本统计量为中心的双侧置信区间,假设检验既有双侧检验,也有单侧检验;
    c.参数估计中的区间估计是以大概率为标准,通常以较大的把握程度(置信水平)1-α去保证总体参数的置信区间。而假设检验是以小概率原理为标准,通常是给定很小的显著性水平α去检验对总体参数的先验假设是否成立或对总体的分布的形式的假设进行判断。

    展开全文
  • 集中趋势离散趋势的度量: 众数、中位数平均数: 方差标准差: 相对离散程度:离散系数的作用: 怎样理解置信区间 影响区间宽度的因素 解释95%的置信区间 ...参数估计和假设检验的区别联系 假设检验的步骤
  • 参数估计与假设检验的区别联系

    万次阅读 2019-05-11 18:09:08
    参数估计与假设检验的区别联系 统计学方法包括统计描述统计推断两种方法,其中,推断统计又包括参数估计和假设检验参数估计 参数估计就是用样本统计量去估计总体的参数的真值,它的方法有点估计区间估计...

    参数估计与假设检验的区别和联系

    统计学方法包括统计描述和统计推断两种方法,其中,推断统计又包括参数估计和假设检验。

    参数估计

    参数估计就是用样本统计量去估计总体的参数的真值,它的方法有点估计和区间估计两种。

    点估计就是直接以样本统计量直接作为相应总体参数的估计值。点估计的缺陷是没法给出估计的可靠性,也没法说出点估计值与总体参数真实值接近的程度。

    区间估计是在点估计的基础上给出总体参数估计的一个估计区间,该区间是由样本统计量加减允许误差(极限误差)得到的。在区间估计中,由样本统计量构造出的总体参数在一定置信水平下的估计区间称为置信区间。

    在其它条件相同的条件下,区间估计中置信度越高,置信区间越大。置信水平为1-a,  a(显著性水平)为小概率事件或者不可能事件,常用的置信水平值为99%,95%,90%,对应的a为0.01,   0.05,  0.1

    置信区间是一个随机区间,它会因样本的不同而变化,而且不是所有的区间都包含总体参数。

    一个总体参数的区间估计需要考虑总体是否为正态分布,总体方差是否已知,用于估计的样本是大样本还是小样本等

    (1)来自正态分布的样本均值,总体方差已知,不论抽取的是大样本还是小样本,均服从正态分布。

    (2)总体不是正态分布,总体方差已知或未知,大样本的样本均值服从正态分布,小样本的不能进行参数估计。

    (3)来自正态分布的样本均值,如果总体方差未知,原则上都按t 分布来处理(但在大样本的情况下,可近似按正态分布处理)。

     

    假设检验

     假设检验假是根据样本统计量来检验对总体参数的先验假设是否成立,是推断统计的另一项重要内容,它与参数估计类似,但角度不同,参数估计是利用样本信息推断未知的总体参数,而假设检验则是先对总体参数提出一个假设值,然后利用样本信息判断这一假设是否成立。

    假设检验的基本思想:先提出假设,然后根据资料的特点,计算相应的统计量,来判断假设是否成立,如果成立的可能性是一个小概率的话,就拒绝该假设,因此称小概率的反证法。最重要的是看能否通过得到的概率去推翻原定的假设,而不是去证实它。

     

    参数估计与假设检验之间的相同点、联系与区别:

    (1)相同点:

      a.都是根据样本信息对总体的数量特征进行推断;

      b.都以抽样分布为理论依据,建立在概率论基础之上的统计推断,推断结果都有一定的可信程度或风险。

    (2)联系:  
    二者可相互转换,形成对偶性。对同一问题的参数进行推断,由于二者使用同一样本、同一统计量、同一分布,因而二者可以相互转换。区间估计问题可以转换成假设问题,假设问题也可以转换成区间估计问题。区间估计中的置信区间对应于假设检验中的接受区域,置信区间以外的区域就是假设检验中的拒绝域。

    (3)主要区别:

    a.参数估计是以样本资料估计总体参数的真值,假设检验是以样本资料检验对总体参数的先验假设是否成立;

    b.参数估计中的区间估计是求以样本统计量为中心的双侧置信区间,假设检验既有双侧检验,也有单侧检验;

    c.参数估计中的区间估计是以大概率为标准,通常以较大的把握程度(置信水平)1-α去保证总体参数的置信区间。而假设检验是以小概率原理为标准,通常是给定很小的显著性水平α去检验对总体参数的先验假设是否成立或对总体的分布的形式的假设进行判断。 

     

    https://blog.csdn.net/u013015687/article/details/45937027?utm_source=blogxgwz1

    展开全文
  • 推断统计:参数估计和假设检验

    千次阅读 多人点赞 2020-03-03 00:35:24
    目录 ...  3、参数估计(点估计区间估计)    1)参数估计、点估计区间统计的概念    2)点估计说明    3)区间估计说明   4、中心极限定理    1)中心极限定理的概念    2...

    目录

      1、总体、个体、样本和样本容量
       1)总体、个体、样本和样本容量的概念
       2)本文章使用的相关python库
      2、推断统计的概念
       1)推断统计的概念
       2)为什么要进行推断统计?
      3、参数估计(点估计和区间估计)
       1)参数估计、点估计和区间统计的概念
       2)点估计说明
       3)区间估计说明
      4、中心极限定理
       1)中心极限定理的概念
       2)中心极限定理的推导(手写推导)
       3)由中心极限定理得出的几个结论
       4)python实现中心极限定理
      5、参数估计中置信区间的推导
       1)什么是小概率事件?
       2)随机变量的分布的概念
       3)标准正态分布的概率密度函数和和分布函数
       4)随机变量的α分位数的概念
       5)标准正态的分位数表怎么得到的呢?
       6)区间估计的定义
       7)置信水平1-α的解释
       8)枢轴法求置信区间的步骤(手写推导)
      6、假设检验
       1)假设检验的概念
       2)假设检验的理论依据
       3)P-Value值与显著性水平
       4)假设检验的步骤
       5)单边检验和双边检验
       6)常用的假设检验

    1、总体、个体、样本和样本容量

    1)总体、个体、样本和样本容量的概念
    • 总体:我们所要研究的问题的所有数据,称为总体。
    • 个体:总体中的某个数据,就是个体。总体是所有个体构成的集合。
    • 样本:从总体中抽取的部分个体,就构成了一个样本。样本是总体的一个子集。
    • 样本容量:样本中包含的个体数量,称为样本容量。
    2)本文章使用的相关python库
    import numpy as np
    import pandas as pd
    import matplotlib as mpl
    import matplotlib.pyplot as plt
    import seaborn as sns
    import warnings
    from sklearn.datasets import load_iris
    from scipy import stats
    
    sns.set(style="darkgrid")
    mpl.rcParams["font.family"] = "SimHei"
    mpl.rcParams["axes.unicode_minus"] = False
    warnings.filterwarnings("ignore")
    

    2、推断统计的概念

    1)推断统计的概念

      “推断统计”研究的是用样本数据去推断总体数量特征的一种方法。它是在对样本数据进行描述的基础上,对统计总体的未知数量特征做出以概率形式表述的推断。

    2)为什么要进行推断统计?

      在实际研究中,总体数据的获取往往是比较困难的,总体参数一般也是未知的。因此,我们就需要利用总体的某个样本,通过样本统计量去估计总体参数。基于这个需求,我们就需要学习推断统计。
      通过上述叙述,我们给推断统计做一个说明。“推断统计”就是利用样本统计量,去推断总体参数的一种方法。
      

    3、参数估计(点估计和区间估计)

    1)参数估计、点估计和区间统计的概念
    • 参数估计:用样本统计量去估计总体的参数。比如,用样本均值去估计总体均值,用样本方差去估计总体方差。
    • 点估计:用样本统计量的某个取值,直接作为总体参数的估计值。
    • 区间估计:在点估计的基础之上,给出总体参数估计值的一个区间范围,该区间通常由样本统计量加减估计误差得到。
    2)点估计说明
    ① 怎么求鸢尾花的平均花瓣长度?

      事实上,世界上鸢尾花千千万,我们总不能说把所有的鸢尾花的数据信息,都统计出来。因此,这就需要我们用样本均值去估计总体均值。

    iris = load_iris()
    dt = np.concatenate([iris.data,iris.target.reshape(-1,1)],axis=1)
    df = pd.DataFrame(dt,columns=iris.feature_names + ["types"])
    display(df.sample(5))
    # 计算鸢尾花花瓣长度的均值
    df["petal length (cm)"].mean()
    

    结果如下:
    在这里插入图片描述
    结果分析:点估计有点简单粗暴,容易受到随机抽样的影响,很难保证结果的准确性。但是,点估计也不是一无是处,样本值是来自总体的一个抽样,在一定程度上还是可以反映出总体的一部分特征。同时,样本容量越接近总体容量,点估计值也会越准确。
      

    3)区间估计说明
    ① 什么是区间估计?

      当你碰到一个陌生人,我让你判断出这个人的年龄是多少?这里有两种方式完成你的推断。第一,这个人25岁。第二,这个人20-25岁之间。哪种结果更让你信服呢?很明显第二种更让人信服。对于第一种说法,相当于上述的点估计。第二种,相当于区间估计,就是给定一个区间,这个区间包含真值。
      统计学中对区间估计的定义:在点估计的基础之上,给出总体参数估计的一个区间范围,该区间通常由样本统计量加减估计误差得到。

    ② 问题:获取一个抽样样本后,如何确定置信区间和置信度?

    要确定置信区间和置信度,就需要知道样本和总体,在分布上有怎样的联系。中心极限定理给出了这个问题很好的回答。上述疑问将在下面为您一一揭晓。
      

    4、中心极限定理

    1)中心极限定理的概念

      设从均值为μ,方差为σ²的任意一个总体中,抽取样本量为n的样本。当n充分大的时候,样本均值X拔近似服从均值为μ,方差为σ²/n的正态分布。
    在这里插入图片描述
    注意:中心极限定理要求n充分大,但是多大才叫充分大呢?一般在统计学中n>=30称之为大样本(统计学中的一种经验说法)。因此在实际生产中,不用多想,肯定都是大样本。

    2)中心极限定理的推导(手写推导)

      设X1,X1,…,Xn是从总体中抽取出来的样本容量为n的随机样本,假设总体均值为μ,方差为σ²。那么很显然这n个样本是独立同分布的,“独立”指的就是每个个体被抽到的概率是相同的,每个球被抽到也不会影响其它球被抽到,“同分布”指的是每一个个体都和总体分布一样,均值为μ,方差为σ²。
      基于上述叙述,下面我们来推导样本均值X拔的分布。
    在这里插入图片描述

    3)由中心极限定理得出的几个结论
    • 不管进行多少次抽样,每次抽样都会得到一个均值。当每次抽取的样本容量n足够大时,样本均值总会围绕总体均值附近,呈现正态分布。
    • 当样本容量n足够大时,样本均值构成正态分布,样本均值近似等于总体均值μ,而样本方差等于总体方差σ²除以n,即σ²/n。
    • 样本均值分布的标准差,我们称之为标准误差,简称“标准误”。
    4)python实现中心极限定理
    # 设置一个随机种子,保证每次产生的随机数都是一定的
    np.random.seed(3)
    # 产生均值为50,标准差为80,大小为100000的一个总体
    all_ = np.random.normal(loc=50,scale=80,size=100000)
    # 创建一个样本均值数组
    mean_array = np.zeros(10000)
    for i in range(len(mean_array)):
        mean_array[i] = np.random.choice(all_,size=64,replace=True).mean()
    
    display("样本的均值:",mean_array.mean())
    display("样本的标准差:",mean_array.std())
    display("偏度:",pd.Series(mean_array).skew())
    sns.distplot(mean_array)
    

    结果如下:
    在这里插入图片描述
    从图中可以看出:样本均值近似等于总体均值50,而样本方差等于总体方差80除以8,即10。

    5、参数估计中置信区间的推导

      我们要知道什么是α值,什么是置信度,什么是置信区间,以及怎么求置信区间。首先要了解以下几方面的知识,才能有一个比较透彻的了解。

    • 1)什么是小概率事件?
    • 2)随机变量的分布的概念。
    • 3)标准正态分布的概率密度函数和和分布函数
    • 4)随机变量的α分位数的概念。
    • 5)标准正态的分位数表怎么得到的呢?
    • 6)区间估计的概念。
    • 7)置信水平1-α的解释
    • 8)枢轴法求置信区间的步骤。
    1)什么是小概率事件?
    • “小概率事件”指的就是在一次随机试验中,几乎不可能发生。
    • 假定参数是射击靶上10环的位置,随机进行一次射击,打在靶心10环的位置上的可能性很小,但是打中靶子的可能性确很大。然后用打在靶上的这个点画出一个区间,这个区间包含靶心的可能性就很大,这就是区间估计的基本思想。
    2)随机变量的分布的概念

    在这里插入图片描述

    3)标准正态分布的概率密度函数和和分布函数

    在这里插入图片描述

    4)随机变量的α分位数的概念

    在这里插入图片描述

    5)标准正态的分位数表怎么得到的呢?
    ① 标准正态分位数表的公式推导

    在这里插入图片描述
    注意:红色方框中的公式,就是标准正态分布分位数表的由来。

    ② 标准正态分布分位数表

    在这里插入图片描述

    6)区间估计的定义

    在这里插入图片描述

    7)置信水平1-α的解释

      对总体样本进行反复抽样(每次抽取到的样本容量都为n),那么每个样本均值都会确定一个区间(a,b),每个这样的区间要么包含总体参数,要么不包含总体参数,不能说成“以多大的概率包含总体的参数”。其中包含总体参数的区间有1-α个,而只有α个区间不包含总体参数,如下图所示(红色表示该样本构成的区间估计不包含总体参数,白色表示该样本构成的区间估计包含总体参数)。
      用一个详细的案例说明:如果对总体返回抽样10000次,每次抽样的样本量都是n,每个样本都会得到一个区间估计,那么10000次抽样,就会得到10000个区间。当置信水平1-α=95%时,那么就表示10000个区间中包含总体参数的有9500个抽样样本,只有500个样本不包含总体参数,这个不包含总体参数的样本就相当于我们估计错误。这个概率只有5%。这个5%在统计学中,就叫做小概率事件,也就是说在一次随机试验中,这个小概率事件不可能发生。
      即:当我们随机抽取一个样本容量为n的抽样样本,并且利用这个样本构造总体参数的置信区间,当指定了置信水平1-α=95%时,那么这个样本,基本就可以认为是包含了总体参数,也就是说,总体参数就在这个置信区间内。
    在这里插入图片描述

    8)枢轴法求置信区间的步骤(手写推导)
    ① 什么是枢轴量?
    • 枢轴量指的就是包含待估计参数,而不包含其它未知参数,并且分布已知的一个量。
    • 枢轴量设计到三个重要点:1、包含估计参数。2、不包含其它未知参数。3、该枢轴量的分布已知。
    ②以总体μ的置信区间为例(方差σ²已知),讲述枢轴量求置信区间的步骤。

    在这里插入图片描述

    6、假设检验

    1)假设检验的概念

      假设检验,也称为显著性检验,指通过样本的统计量,来判断与总体参数之间是否存在差异(差异是否显著)。我们事先对总体参数进行一定的假设,然后通过收集到的数据,来验证我们之前作出的假设(总体参数)是否合理。
      在假设检验中,我们会建立两个完全对立的假设,分别为原假设H0与备择假设H1。然后根据样本信息进行分析判断,是选择接受原假设,还是拒绝原假设(接受备择假设)。假设检验基于“反证法”。首先,我们会假设原假设为真,如果在此基础上,得出了违反逻辑与常理的结论,则表明原假设是错误的,我们就接受备择假设。否则,我们就没有充分的理由推翻原假设,此时我们选择去接受原假设。

    2)假设检验的理论依据(小概率事件)

      在假设检验中,违反逻辑与常规的结论,就是小概奉事件。我们认为,小概率事件在一次试验中是不会发生的。我们首先认为原假设为真,如果在此基础上,小概率事件发生,则我们就拒绝原假设,否则,我们就选择去接受原假设。
      假设检验遵循“疑罪从无”的原则,接受原假设,并不代表原假设一定是正确的,只是我们没有充分的证据,去证明原假设是错误的,因此只能维持原假设。那么,假设检验中的小概率事件是怎么得出的呢?想想之前讲到的置信区间,是不是一切都验然开朗了?
      “疑罪从无”很形象的说明的假设检验向我们传达的含义。也就是说,当我们没有充分的理由拒绝原假设,就必须接受原假设,即使原假设是错误的,但是你找不到证据证明原假设是错误的,你就只能认为原假设是对的。反之,经过一次随机试验,你如果找到了某个理由拒绝了原假设,那么原假设肯定就是错误的,这个是一定的。

    3)P-Value值与显著性水平

      假设检验,用来检验样本的统计量与总体参数,是否存在显著性差异。那么如何才算显著呢?我们就可以计算一个概率值(P-Value),该概率值可以认为就是支持原假设的概率,因为在假设检验中,通常原假设为等值假设,因此,P-Value也就表示样本统计量与总体参数无差异的概率。然后,我们再设定一个阈值,这个阈值叫做“显著性水平 ” (使用α表示),通常α的取值为0.05(1-α叫做置信度)。当P-Value的值大于α时,接受原假设。当P-Value的值小于α时,拒绝原假设。简单记为:p值越小越拒绝原假设。软件中一般都会展示这个p值,那里的p值,指的就是我们这里所叙述的p值。
      假设检验和参数估计是推断统计的两个组成部分,都是利用样本对总体进行某种推断,但是两者进行推断的角度不同。参数估计讨论的是用样本统计量估计总体参数的一种方法,总体参数在估计前是未知的。而假设检验,则是对总体参数先提出一个假设,然后用样本信息去检验这个假设是否成立。

    4)假设检验的步骤
    • ① 根据实际问题的要求,提出原假设和备择假设。
    • ② 给出显著性水平α以及样本容量n。
    • ③ 确定检验统计量和拒绝域。
    • ④ 计算出检验统计量的值,并作出决策。
    5)单边检验和双边检验

    在这里插入图片描述

    6)常用的假设检验
    ① 单个正态总体均值的假设检验法(Z检验:方差已知)

      Z检验用来判断样本均值是否与总体均值具有显著性差异。Z检验是通过正态分布的理论来推断差异发生的概率,从而比较两个均值的差异是否显著。Z检验适用于:

    • 总体呈正态分布。
    • 总体方差已知。
    • 样本容量较大。
      在这里插入图片描述
    ② 案例如下

    在这里插入图片描述

    ③ 有个人说:鸢尾花的平均花瓣长度为3.5cm,这种说法可靠吗?假设经过长期大量验证,鸢尾花花瓣长度总体的标准差为1.8cm,我们就可以使用Z检验来验证了。
    from scipy import stats
    
    iris = load_iris()
    dt = np.concatenate([iris.data,iris.target.reshape(-1,1)],axis=1)
    df = pd.DataFrame(dt,columns=iris.feature_names + ["types"])
    display(df.sample(5))
    
    mean = df["petal length (cm)"].mean()
    n = len(df)
    sigma = 1.8
    
    z = (mean - 3.5) / (sigma / np.sqrt(n))
    display(z)
    

    结果如下:
    在这里插入图片描述

    ④ 单个正态总体均值的假设检验法(t检验:方差未知)

      t检验,与Z检验类似,用来判断样本均值是否与总体均值具有显替性差异。不过,t检验是基于t分布的。检验适用于:

    • 总体呈正态分布。
    • 总体方差未知。
    • 样本容量较小。
      在这里插入图片描述
    ⑤ 案例说明

    在这里插入图片描述

    ⑥ 代码演示
    # 方法一
    iris = load_iris()
    dt = np.concatenate([iris.data,iris.target.reshape(-1,1)],axis=1)
    df = pd.DataFrame(dt,columns=iris.feature_names + ["types"])
    display(df.sample(5))
    
    mean = df["petal length (cm)"].mean()
    std = df["petal length (cm)"].std()
    n = len(df)
    display(mean,std)
    t = (mean - 3.5) / (std / np.sqrt(n))
    display(t)
    
    # 方法二
    from scipy import stats
    stats.ttest_1samp(df["petal length (cm)"],3.5)
    

    结果如下:
    在这里插入图片描述

    展开全文
  • 掌握参数估计和假设检验这两个数理统计的最基本方法,方能有效地对数据进行描述分析。在本文中,我们对这两种基本方法及它们在MATLAB中的运用进行简要介绍。

    参数估计和假设检验

    统计所研究的对象是受随机因素影响的数据,是以概率论为基础的一门应用学科。统计推断的基础是描述性统计,也就是搜集整理加工分析统计数据,使其系统化和条理化,以显示出数据资料的趋势、特征和数量关系的过程。

    掌握 参数估计假设检验 这两个数理统计的最基本方法,方能有效地对数据进行描述和分析。



    参数估计

    参数估计包括 点估计区间估计.

    1. 点估计

    点估计是使用单个数值作为参数的一种估计方式。点估计在抽样推断中 不考虑抽样误差 ,直接以抽样指标代替全体指标。因为个别样本的抽样指标不等于全体指标,因此用抽样指标直接代替全体指标不可避免的会有误差。目前使用较多的点估计方法是最大似然法和矩法。

    1. 最大似然法

    最大似然法是在待估参数的可能取值范围内,挑选使似然函数值最大的参数值作为最大似然估计量。

    最大似然估计法得到的估计量通常不仅仅满足无偏性、有效性等基本条件,还能保证其为充分统计量,因此一般建议在点估计和区间估计中使用最大似然法。

    MATLABMATLAB 使用函数 mle 进行最大似然估计:

    phat = mle('dist',data)
    

    使用 datadata 向量中的样本数据,返回 distdist 指定的分布的最大似然估计。


    2. 矩法

    矩估计,就是利用样本矩来估计总体中相应的参数的方法。我们首先推导涉及感兴趣的参数的总体矩(即所考虑的随机变量的幂的期望值)的方程。然后取出一个样本并从这个样本估计总体矩。接着使用样本矩取代(未知的)总体矩,解出感兴趣的参数。从而得到那些参数的估计。

    待估参数通常作为总体原点矩或原点矩的函数,此时可以用该总体样本的原点矩或样本原点矩的函数值作为待估参数的估计,称这种方法为矩法。

    例如:样本均值总是总体均值的矩估计量、样本方差是总体方差的矩估计量,样本标准差是总体标准差的矩估计量。

    MATLABMATLAB 中计算矩的函数为 moment(X,order).


    2. 区间估计

    区间估计是在点估计的基础上,通过给出总体参数估计的一个区间范围(该区间通常由样本统计量加减估计误差得到)从而减少误差的估计方法。

    求参数的区间估计,首先需要求出该参数的点估计,随后构造一个含有该参数的随机量,并根据一定的置信水平求该估计值的范围。

    MATLABMATLAB 中使用 mle 函数进行最大似然估计时,有如下几种调用格式:

    1. [phat,pci] = mle('dist',data)
    2. [phat,pci] = mle('dist',data,alpha)
    3. [phat,pci] = mle('dist',data,alpha,p1)
    
    1. 返回最大似然估计和 95%95\% 置信区间。
    2. 返回指定分布的最大似然估计值和 100(1alpha)%100(1-alpha)\% 置信区间。
    3. 该形式只用于二项分布,其中 p1p1 为试验次数。

    假设检验

    在总体分布函数完全或部分未知时,为推断总体的某些性质,我们需要提出关于总体的假设。为了确定所提出的假设是否合理,我们还需要对其进行检验。

    1. 方差已知时的均值假设检验

    在给定方差的条件下,我们可以使用 ztest 函数检验单样本数据是否服从给定均值的正态分布。

    1. h = ztest(x,m,sigma)
    2. h = ztest(x,m,sigma,alpha)
    3. [h,sig,ci,zval] = ztest(x,m,sigma,alpha,tail)
    
    1. 0.050.05 的显著性水平下进行 zz 检验,以确定服从正态分布的样本均值是否为 mm,其中 sigmasigma 为标准差。
    2. 给出显著性水平的控制参数 alphaalpha. 若 alpha=0.01alpha = 0.01,则当结果为 h=1h = 1 时,可在 0.010.01 的显著性水平上拒绝零假设;若 h=0h = 0,则不能在该水平上拒绝零假设。
    3. 允许指定是进行单侧检验还是进行双侧检验。

      tail=0tail = 0both'both' 时表示指定备择假设均值不等于 mm
      tail=1tail = 1right'right' 时表示指定备择假设均值大于 mm
      tail=1tail = -1left'left' 时表示指定备择假设均值小于 mm
      cici 为均值真值的 1alpha1-alpha 置信区间,zvalzval 是统计量 z=xmσ/nz = \frac{\overline{x}-m}{\sigma / \sqrt{n}} 的值。

    2. 正态总体均值假设检验

    在数理统计中,正态总体均值检测包括方差未知时单个正态总体均值的假设检验和两个正态总体均值的假设检验。

    1. 方差未知时单个正态总体均值的假设检验

      tt 检验的特点是:在均方差未知的情况下,用小样本检验总体参数,可检验样本平均数的显著性。

      MATLABMATLAB 中,使用 ttest 进行样本均值的 tt 检验。
     1. h = ttest(x,m)
     2. h = ttest(x,m,alpha)
     3. [h,sig,ci] = ttest(x,m,alpha,tail)
    
    1. 0.050.05 的显著性水平下进行 tt 检验,以确定在标准差未知的情况下取自正态分布的样本均值是否为 mm .
    2. 给定显著性水平的控制参数 alphaalpha.
    3. 指定是进行单侧检验还是进行双侧检验.

    1. 方差未知时两个正态总体均值的假设检验

      在比较两个独立正态总体的均值时,可根据方差齐不齐的情况,应用不同的统计量进行检验。下面仅对方差齐的情况进行分析:

      我们使用 ttest2 函数对两个样本的均值差异进行 tt 检验:
    1. h = ttest2(xy)
    2. [h,significance,ci] = ttest2(x,y,alpha)
    3. ttest2 = (x,y,alpha,tail)
    
    1. 假设 xxyy 是取自服从正态分布的两个样本,在它们标准差未知但相等时检验它们的均值是否相等。当 h=1h = 1 时,可在 0.050.05 的水平下拒绝零假设;h=0h = 0 时,不能在该水平下拒绝零假设.
    2. 给定显著性水平的控制参数 alphaalpha.
    3. 允许指定进行单侧检验或双侧检验。
    展开全文
  • 参数估计: 在很多实际问题中,为了进行某些统计推断,需要确定总体服从的分布,通常根据问题的实际背景或适当的统计方法可以判断总体分布的类型,但是总体分布中往往含有未知参数,需要用样本观测数据进行估计。即...
  • 1、normfit函数求正态总体参数的最大似然估计和置信区间 x = [15.14 14.81 15.11 15.26 15.08 15.17 15.12 14.95 15.05 14.87]; % 定义样本观测值向量 % 调用normfit函数求正态总体参数的最大似然估计和置信区间 % ...
  • 参数估计与假设检验

    千次阅读 2017-10-22 21:26:29
    首先是抽样,抽样解决了用少量估计大量。...参数估计估计的是一个范围,参数估计总体参数是定死的,置信区间在总体参数上浮动。点估计一般有矩估计极大似然估计。矩估计?当n->无穷大时,我们认为样本
  • 参数检验与非参数检验

    千次阅读 2015-06-15 14:28:03
    2)非参数检验:不依赖总体分布的具体形式检验分布(如位置)是否相同。 参数检验与非参数检验的优缺点。 1)参数检验:优点是符合条件时,检验效率高;其缺点是对资料要求严格,如等级数据、非确定数据(>50mg...
  • 概率论与数理统计张宇9讲 第九讲 参数估计和假设检验 易错题难题记录
  • 描述性统计所提取的统计的信息称为统计量,包括频数与频率,反映集中趋势的均值、中位数、众数分位数,反映离散程度的极差、方差标准差,反映分布形状(相对于正态分布)的偏度峰度。 变量分为类别变量数值...

空空如也

空空如也

1 2 3 4 5 ... 20
收藏数 740
精华内容 296
关键字:

参数检验和参数估计