精华内容
下载资源
问答
  • 《非参数统计:方法应用》作为该课题的一个成果1996年奉献给读者。第一,作者在承担国家教委人文社会科学研究八五规划项目博士点基金项目年代我国居民消费结构及倾向的研究过程中,感到在很多情况下,参数统计方法...
  • 这本参考教材对学习非参数者有很大帮助,思路清晰,内容详细,不是高清版本,但是基本上能顺利阅读,所以上传希望能帮助到大家!
  • 参数统计概述

    千次阅读 多人点赞 2019-11-16 22:48:05
    文章目录非参数统计概述引言非参数方法举例Wilcoxon 符号秩检验Wilcoxon秩和检验 引言 非参数统计(nonparametric statistics)是相对于参数统计而言的一个统计学分支,是数理统计的重要内容。在参数统计中,我们往往...

    非参数统计概述

    引言

    非参数统计(nonparametric statistics)是相对于参数统计而言的一个统计学分支,是数理统计的重要内容。在参数统计中,我们往往碰到的是这样的情况:

    • 总体分布的数学形式已知(例如正态分布、指数分布等)。
    • 总体分布的概率密度函数中含有有限个参数。

    然而实际情况往往不是这样,我们通常不知道总体分布的数学形式,或者虽然已知总体的分布但却不能用有限个参数去刻画,我们只能对总体做出一些简单的假定(例如总体分布是连续的或者离散的,总体分布是否对称),这时如果我们要对总体的某些性质进行估计或者假设检验,就需要使用非参数方法

    非参数方法是一种不依赖于总体分布具体形式的统计推断方法,构造统计量通常与总体分布无关,也就是说,非参数方法与总体分布无关,因此,非参数方法也被称为自由分布(distribution-free)方法。非参数方法具有如下的特点:

    • 适用面广但针对性较差
    • 对变量的量化要求很低。无论是分类变量和数值变量,都可以使用非参数方法进行估计或检验。
    • 非参数方法对于数据的要求不如参数方法严格
    • 非参数方法具有较好的鲁棒性,不容易受数据中极端值和离群点的影响。
    • 对于符合参数方法条件的数据,使用非参数方法会使犯第二类错误的概率增大,即统计功效会更小。

    由以上的特点,我们可以总结出选用参数方法和非参数方法的原则:

    • 如果中位数(而不是均值)更能反应数据的集中趋势时(极端值较多),应当选用非参数方法。
    • 如果数据为定序变量(如优良中)时,应当采用非参数方法。
    • 如果数据符合参数方法的条件时,应当优先选用参数方法

    接下来我们来详细讨论一些非参数方法的例子。

    非参数方法举例

    Wilcoxon 符号秩检验

    Wilcoxon符号秩检验(signed-rank test)对应着参数方法中的单样本t检验法和配对样本t检验法。接下来我们通过一个例子来讲解Wilcoxon符号秩检验的步骤。

    假设我们研究的课题是上培训班是否会提升学生成绩,我们收集到的数据如下:

    BeforeAfter
    7260
    6286
    7083
    6053
    7575
    5565
    7189
    4856

    根据这一张表格,我们可以进一步得到这样的另一张表格。

    DiffSigned-rank
    -12-4
    247
    135
    -7-1
    0
    103
    186
    82

    其中,Diff是拿右边一列减去左边一列得到的数据,而得到Signed-rank略显复杂,首先我们将Diff的绝对值从小到大进行排名(rank),分别编上1-n的编号,然后根据Diff的实际符号,给排名也添加上相同的符号,我们就得到了样本的符号秩(signed-rank),我们就由符号秩来构造统计量。

    需要注意的是,我们进行Wilcoxon符号秩检验时,不考虑Diff=0的情况,我们要将Diff=0的数据去除。

    接下来我们用符号秩来构造统计量 Z Z Z Z = ∑ i = 1 n S R i ∑ i = 1 n S R i 2 Z = \frac{\sum^n_{i=1}SR_i}{\sqrt{\sum^n_{i=1}SR_i^2}} Z=i=1nSRi2 i=1nSRi
    与参数方法中的 Z Z Z统计量一样, Z Z Z~ N ( 0 , 1 ) N(0,1) N(0,1),于是我们算得 Z Z Z统计量之后,就可以通过标准正态分布来计算p值,在上面这个例子中: Z = 1.52 Z=1.52 Z=1.52
    我们进行一个双尾检验,查表可得 p − v a l u e = 2 ∗ ( 1 − 0.9357 ) = 0.1286 > 0.05 p-value=2*(1-0.9357)=0.1286>0.05 pvalue=2(10.9357)=0.1286>0.05
    得出结论:应当接受零假设,成绩与是否上辅导班无关。

    Wilcoxon秩和检验

    Wilcoxon秩和检验(rank-sum test)用于检验两个总体的中位数是否相等,适用于中位数能更好的反应总体集中趋势的情况,对应了参数方法中的Two sample t-test,同样我们通过一个例子来讲解Wilcoxon秩和检验的过程。

    我们仍然使用上面的表格,只不过我们这次研究的题目是成绩是否与性别有关。(实际上,两列数据的样本容量可以不同)可以发现,这样一来,数据中的行不再是一一对应关系。

    MaleFemale
    7260
    6286
    7083
    6053
    7575
    5565
    7189
    4856

    我们将两列数据合在一起,进行从小到大的排序,求出它们的秩(秩的英文为rank,也可以翻译为排名)。

    Rank(Male)Rank(Female)
    115.5
    714
    913
    5.52
    12.512.5
    38
    1015
    14

    需要注意的是,当出现多个样本值相同时,它们的秩应当等于它们占用的秩的位置的平均值。接下来我们来构造统计量,首先我们将每一列元素的秩进行求和:
    S u m 1 = ∑ i n 1 R 1 Sum1 = \sum_i^{n_1}{R_1} Sum1=in1R1 S u m 2 = ∑ i n 2 R 2 Sum2 = \sum_i^{n_2}{R_2} Sum2=in2R2
    设两个变量的样本容量分别是 n 1 n_1 n1, n 2 n_2 n2,我们构造下面的统计量:
    W = S u m 1 − n 1 ∗ ( n 1 + 1 ) 2 W=Sum1 - \frac{n_1*(n_1+1)}{2} W=Sum12n1(n1+1)
    同样的,利用 S u m 2 Sum2 Sum2也可以构造一个这样的统计量,但实际上检验一个即可。我们同样避开直接寻找 W W W的分布,我们选择再构造一个统计量:
    Z = W − n 1 n 2 / 2 n 1 n 2 ( n 1 + n 2 + 1 ) / 12 Z=\frac{W-n_1n_2/2}{\sqrt{n_1n_2(n_1+n_2+1)/12}} Z=n1n2(n1+n2+1)/12 Wn1n2/2
    同样的, Z Z Z~ N ( 0 , 1 ) N(0,1) N(0,1),接下来我们就可以在标准正态分布中查找到 P − v a l u e P-value Pvalue,从而做出是否拒绝零假设的判断。

    在上面这个例子中,我们计算得到:
    W = 23 W=23 W=23 Z = − 0.945 Z=-0.945 Z=0.945
    查表得到对应的p值为:
    p − v a l u e = 2 ∗ ( 1 − 0.8289 ) = 0.3422 > 0.05 p-value=2*(1-0.8289)=0.3422>0.05 pvalue=2(10.8289)=0.3422>0.05所以我们应当接受零假设,成绩与性别无关。

    斯皮尔曼相关性检验

    在参数统计中,我们学习过一个相关系数 ρ x y \rho_{xy} ρxy,它的定义如下: ρ x y = C o v ( X , Y ) S X S Y \rho_{xy}=\frac{Cov(X,Y)}{S_XS_Y} ρxy=SXSYCov(X,Y)实际上,我们把这个相关系数称为皮尔逊相关系数(Pearson Correlation),而接下来我要介绍的是另一个相关系数,称为斯皮尔曼相关系数(Spearman Correlation)。

    首先举一个例子,假设我们研究的课题是学生考试分数与课堂满意度是否相关,我们采集到了这样一组数据:

    ScoreHappiness
    30不满意
    40一般
    50不满意
    60一般
    70满意
    80满意
    90满意
    100满意

    可以看到,这里的Happiness数据是定序变量,我们没有办法计算它的方差和它与定距变量的协方差,但我们可以对它们进行排序,参考前两种方法,我们这两列数据分别排序并求出它们的秩。

    Rank(Score)Rank(Happiness)
    11.5
    23.5
    31.5
    43.5
    56.5
    66.5
    76.5
    86.5

    同样的,对于相同的样本值,我们也要采用取平均值的方法求它们的秩。接下来我们对这两列秩求它们的皮尔逊相关系数,得到的就是原数据的斯皮尔曼相关系数:
    ρ = C o v ( R 1 , R 2 ) S R 1 S R 2 \rho=\frac{Cov(R_1,R_2)}{S_{R_1}S_{R_2}} ρ=SR1SR2Cov(R1,R2)另外还有一个简便计算公式,设样本容量为 n n n
    ρ = 1 − 6 ∑ d i 2 n ( n 2 − 1 ) \rho=1-\frac{6\sum{d_i^2}}{n(n^2-1)} ρ=1n(n21)6di2然后,与参数方法中的皮尔逊相关性检验类似,有:
    ρ 1 − ρ 2 / n − 2 ∼ t ( n − 2 ) \frac{\rho}{\sqrt{1-\rho^2}/\sqrt{n-2}}\sim t(n-2) 1ρ2 /n2 ρt(n2)
    然后在 t t t分布中计算 p − v a l u e p-value pvalue,做出判断。

    Bootstrap

    Bootstrap简单的来说,我们已有一个容量为 n n n的原始样本,利用随机数等方式进行放回抽样得到一个容量同样为 n n n的样本,这种样本就称为Bootstrap样本或自助样本。

    我们反复地、独立地从原始样本中抽取很多很多个Bootstrap样本(通常不少于1000个),利用这些样本对总体进行统计推断,这种方法被称为非参数Bootstrap方法,又称为自助法。

    我们使用成绩与性别关系的数据:

    MaleFemale
    7260
    6286
    7083
    6053
    7575
    5565
    7189
    4856

    我们对两列数据进行有放回抽样,得到了1000个Bootstrap样本,记作 D 1 D_1 D1- D 1000 D_{1000} D1000。我们需要分析的是两个样本之间的中位数是否有差异,因此我们将每一个Bootstrap样本的中位数差值求出来,用这1000个数据的中位数差构成一个统计分布,用直方图表示:
    在这里插入图片描述
    然后我们再根据已知的中位数差值,在这个统计分布中计算p值、置信区间等,做出统计推断。

    Bootstrap是一种非常重要的方法,常常应用于各种玄学建模 。需要注意的是Bootstrap方法也有参数版本的方法,在这里并不讨论。

    Bootstrap实现的Python代码如下:

    # -*- coding: UTF-8 -*-
    import numpy as np
    import matplotlib.pyplot as plt
    def bootstrap(data):
        temp = []
        while len(temp) != len(data):
            r = np.random.randint(0,len(data))
            temp.append(data[r])
        temp = np.array(temp)
        return temp
    
    
    if __name__ == "__main__":
        male = np.array([72,62,70,60,75,55,71,48])
        female = np.array([60,86,83,53,75,65,89,56])
        v = []
        for i in range(2000):
            mbootstrap = bootstrap(male)
            fbootstrap = bootstrap(female)
            v.append(np.median(mbootstrap) - np.median(fbootstrap))
        v = np.array(v)
        plt.hist(v,bins=50)
        plt.show()
    

    Permutation

    Permutation,翻译为中文就是排列、置换的意思。在参数方法中进行假设检验,我们一般是假设或者已知总体的分布,然后构造统计量,得到这个统计量在零假设为真时的抽样分布,然后在抽样分布中计算p值,做出推断。而Permutation使得我们可以得到对任意统计量在零假设为真时的抽样分布,从而进行统计推断。接下来我们举例说明Permutation的过程。

    我们仍然使用成绩与性别的关系数据:

    MaleFemale
    7260
    6286
    7083
    6053
    7575
    5565
    7189
    4856

    H 0 : 男 女 成 绩 中 位 数 没 有 差 异 H_0:男女成绩中位数没有差异 H0: H 1 : 男 女 成 绩 中 位 数 有 差 异 H_1:男女成绩中位数有差异 H1:
    Permutation与Bootstrap类似,我们也需要将以下的步骤重复1000次以上:

    1. 把所有数字随机分配给Male( n 1 = 8 n_1=8 n1=8)和Female( n 2 = 8 n_2=8 n2=8)
    2. 计算Male和Female的中位数
    3. 计算并保存median(M)-median(F)

    重复1000次以上之后,我们就可以得到两组数据中位数差的近似分布,用直方图表示:
    在这里插入图片描述
    这样我们就获得了中位数差统计量的统计分布,然后我们根据这个分布和实际的中位数差,我们就可以计算出p值,从而进行统计推断。
    Permutation的Python代码如下:

    # -*- coding: UTF-8 -*-
    import numpy as np
    import matplotlib.pyplot as plt
    
    
    def permutation(data):
        perm = []
        num = set([])
        while len(perm) != len(data):
            r = np.random.randint(0, 16)
            if r not in num:
                perm.append(data[r])
                num.add(r)
        perm = np.array(perm)
        return perm
    
    
    if __name__ == "__main__":
        data = np.array([72, 62, 70, 60, 75, 55, 71, 48, 60, 86, 83, 53, 75, 65, 89, 56])
        diff = []
        for i in range(3000):
            temp = permutation(data)
            df = np.median(temp[:8]) - np.median(temp[8:])
            diff.append(df)
        diff = np.array(diff)
        plt.hist(diff, bins=50)
        plt.show()
    

    小结

    在这一篇博文中,我主要介绍以下几种非参数统计方法:

    • Wilcoxon符号秩检验
    • Wilcoxon秩和检验
    • Spearman相关性检验
    • Bootstrap
    • Permutation

    但无论是参数方法还是非参数方法都属于频率论的范畴,它们都存在着一个致命的缺陷:它们的检验过程是在假定零假设成立的情况下进行的,为了解决这个问题,需要把目光投向另一个统计学领域——贝叶斯统计。

    展开全文
  • 文章目录内容介绍参数数据非参数数据排名数据使用排序数据 内容介绍 统计和统计方法领域的很大一...在本教程中,您将发现非参数统计及其在应用机器学习中的作用。 阅读本文后您将了解: 参数数据与非参数数据的区别。

    内容介绍

    统计和统计方法领域的很大一部分专门用于已知分布情况的数据。

    我们已经知道或能够很容易地识别数据分布的数据样本称为参数数据。通常,参数用于指从常用的高斯分布中提取的数据。其中分布未知或不易识别的数据称为非参数数据。

    在使用非参数数据的情况下,可以使用专门的非参数统计方法来丢弃有关分布的所有信息。因此,这些方法通常被称为无分布方法.

    在本教程中,您将发现非参数统计及其在应用机器学习中的作用。

    阅读本文后您将了解:

    • 参数数据与非参数数据的区别。
    • 如何对数据进行排序,以丢弃有关数据分布的所有信息。
    • 可用于排序数据的统计方法示例。

    启动你的项目用我的新书机器学习统计,包括一步一步的教程而Python源代码所有示例的文件。

    我们开始吧。本教程分为四个部分:参数数据、非参数数据、排名数据、使用排序数据

    展开全文
  • 参数统计

    千次阅读 2017-08-23 21:56:39
    参数统计 出自 MBA智库百科(http://wiki.mbalib.com/) 非参数统计(Nonparametric statistics) 目录 [隐藏] 1 什么是非参数统计2 非参数统计的适用范围3 非参数统计的特点4 非参数统计...

    非参数统计

    出自 MBA智库百科(http://wiki.mbalib.com/)

    非参数统计(Nonparametric statistics)

    目录

    [隐藏]
    [ 编辑]

    什么是非参数统计

      非参数统计是统计学的一个重要分支,它在实践中有着广泛的应用。所谓统计推断,就是由样本观察值去了解总体,它是统计学的基本任务之一。若根据经验或某种理论我们能在推断之前就对总体作一些假设,则这些假设无疑有助于提高统计推断的效率。这种情况下的统计方法称为“参数统计”。如果我们所知很少,以致于在推断之前不能对总体作任何假设,或仅能作一些非常一般性(例如连续分布、对称分布等)的假设,这时如果仍然使用参数统计方法,其统计推断的结果显然是不可信的,甚至有可能是错的。在对总体的分布不作假设或仅作非常一般性假设条件下的统计方法称为“非参数统计”。

      由于非参数统计方法与总体究竟是什么分布几乎没有什么关系,所以它的应用范围很广,它在社会学、医学、生物学、心理学、教育学等领域都有着广泛的应用。由于有关于总体的假设,所以参数统计的推断方法是针对这个假设的。相对而言,非参数统计的推断方法是很一般的,它仅应用样本观察值中一些非常直观(例如次序)的信息。所以非参数统计分析含有丰富的统计思想

    [ 编辑]

    非参数统计的适用范围

      非参数统计最常用于具备下述特征的情况:

      1、待分析数据不满足参数检验所要求的假定,因而无法应用参数检验。例如,我们曾遇到过的非正态总体小样本,在t-检验法也不适用时,作为替代方法,就可以采用非参数检验

      2、仅由一些等级构成的数据,不能应用参数检验。例如,消费者可能被问及对几种不同商标饮料的喜欢程度,虽然,他们不能对每种商标都指定一个数字来表示他们对该商标的喜欢程度,却能将几种商标按喜欢的顺序分成等级。这种情形也宜采用非参数检验。

      3、所提的问题中并不包含参数,也不能用参数检验。例如,我们想判断一个样本是否为随机样本,采用非参数检验法就是适当的。

      4、当我们需要迅速得出结果时,也可以不用参数统计方法而用非参数统计方法来达到目的。一般说来,非参数统计方法所要求的计算与参数统计方法相比,完成起来既快且易。有些非参数统计方法的计算,就算对统计学知识不熟练的人,也能在收集数据时及时予以完成。

    [ 编辑]

    非参数统计的特点

      非参数统计问题中对总体分布的假定要求的条件很宽,因而针对这种问题而构造的非参数统计方法,不致因为对总体分布的假定不当而导致重大错误,所以它往往有较好的稳健性(见稳健统计),这是一个重要特点。但因为非参数统计方法需要照顾范围很广的分布,在某些情况下会导致其效率的降低。不过,近代理论证明了:一些重要的非参数统计方法,当与相应的参数方法比较时,即使在最有利于后者的情况下,效率上的损失也很小。

      由于非参数统计中对分布假定要求的条件宽,因而大样本理论(见大样本统计)占据了主导地位。第二次世界大战前,非参数统计的大样本理论已有了一些结果,从20世纪50年代直到现代,更有了显著的进展,尤其是关于秩统计量与U统计量的大样本理论,及基于这种理论的大样本非参数方法,研究成果很多。

    [ 编辑]

    非参数统计的优缺点

      非参数统计与传统的参数统计相比,有以下优点:

      1、非参数统计方法要求的假定条件比较少,因而它的适用范围比较广泛。

      2、多数非参数统计方法要求的运算比较简单,可以迅速完成计算取得结果,因而比较节约时间。

      3、大多数非参数统计方法在直观上比较容易理解,不需要太多的数学基础知识和统计学知识。

      4、大多数非参数统计方法可用来分析如象由等级构成的数据资料,而对计量水准较低的数据资料,参数统计方法却不适用。

      5、当推论多达3个以上时,非参数统计方法尤具优越性。

      但非参数统计方法也有以下缺点:

      1、由于方法简单,用的计量水准较低,因此,如果能与参数统计方法同时使用时,就不如参数统计方法敏感。若为追求简单而使用非参数统计方法,其检验功效就要差些。这就是说,在给定的显著性水平下进行检验时,非参数统计方法与参数统计方法相比,第Ⅱ类错误的概率β要大些。

      2、对于大样本,如不采用适当的近似,计算可能变得十分复杂。

    展开全文
  • 参数统计检验

    千次阅读 2018-11-28 12:59:20
    参数统计分析

    非参数统计的方法用于总体分布未知的情形,其目的在于检验一个变量的分布在不同组中是否具有相同的位置参数。

    NPAR1WAY语句

    功能

    格式:

    proc npar1way data=数据集名 [选项];
    by 变量名;
    class 变量名;
    var 变量名;
    run;
    

    注:
    proc的选项:
    i.wilcoxon:指定使用Wilcoxon秩和分析方法;
    ii.noprint:结果输出窗口不显示计算结果;

    单个样本的非参数检验

    此情形使用Univariate过程。
    目的: 检验某个样本均值是否等于特定值。

    某产品标注的净含量为1kg,现对该产品进行抽样统计分析,试判断该产品重量是否与标注一致?

    代码:

    data test;              /*创建数据集*/
    input x @@;
    cards;
    0.998 0.997 0.995 0.994 0.990 0.981 0.986 0.995
    0.976 0.986 0.996 0.976 0.965 0.986 0.992 1.001
    0.985 1.002 0.999 0.993 0.994 0.995 0.993 0.991
    0.975 0.984 0.976 0.954 0.987 0.986 0.985 0.976
    ;
    run;
    proc univariate data=test mu0=1;   /*设置mu0为1,检验其*均值是否为1/
    var x;
    run;
    
    

    结果:
    给出了一些基本统计信息:

    下图显示秩检验的p值<0.05的显著水平,应拒绝原假设:

    两样本的非参数检验

    概述: 当两个独立样本来自正态分布和具有相同的方差时,一般采用T检验比较均值。当样本不满足这两个条件时,则采用Wilcoxon秩和检验。

    对某校高一高二学生的英语学习能力作评价,主要测试学生的口语能力,测试分数如下,分析两个年级的学生英语口语能力是否有显著差异?

    代码:

    data test;                        /*创建数据集*/
    input x type$;
    cards;
    78 1
    67 1
    88 1
    98 1
    78 1
    77 1
    65 1
    85 1
    70 1
    67 2
    78 2
    69 2
    87 2
    85 2
    87 2
    90 2
    65 2
    77 2
    ;
    run;
    proc npar1way data=test wilcoxon;    /*进行wilcoxon检验*/
    class type;                   /*指定分组变量*/
    var x;                        /*指定非参数检验变量*/
    run;
    

    结果:
    t检验双边概率值为1,故可接受原假设,认为这两个年级的口语能力是无显著差别的。

    多个样本的非参数检验

    概述: 当多个样本数据满足正态分布且具有相等的方差时,比较它们的均值可以采用方差分析。当数据不满足上述条件时,可采用多样本均值比较的非参数Kruskal-Wallis秩和检验。此检验的目的是分析某个变量在另一分类变量取不同值时,它的取值(用位置统计量衡量)是否有显著不同。
    编程实现: NPAR1WAY过程可以实现,与两样本情形不同的是,class语句的分类变量它有两个以上的取值水平。

    成对样本的非参数检验

    类似于单样本的非参数检验,使用Univariate过程,成对的数据作差处理,检验其均值是否显著为0。

    现对某培训机构的培训后的学员的基础能力是否有提高进行抽样调查,学生培训前后的成绩如下表。

    代码:

    data test;                           /*创建数据集*/
    input x y;
    d=x-y;
    cards;
    89 95
    78 88
    96 95
    78 87
    74 80
    75 83
    84 90
    79 76
    80 83
    85 88
    ;
    run;
    proc univariate data=test;            /*配对样本的符号检验*/
    var d;
    run;
    

    结果:
    符号检验的p值大于0.05,说明应该接受原假设,即认为培训前后的成绩没有显著差别。

    展开全文
  • SPSS 统计分析方法应用(SPSS数据文件的建立和管理、SPSS数据的预处理、SPSS基本统计分析、SPSS的参数检验、SPSS的方差分析、SPSS的非参数检验、SPSS的信度分析、SPSS的对数线性模型、SPSS的时间序列分析)
  • 统计学习方法总结、应用对比

    千次阅读 2017-12-03 20:53:10
    下面主要从模型、策略、算法、应用四方面来对10种统计学习方法,进行归类总结。 方法 模型 策略 算法 应用 感知机 超平面模型 极小化误分点距离 随机梯度下降法 二类分类 朴素贝叶斯法 对条件概率分布作...
  • Spss用于统计学分析运算、数据挖掘、预测分析和决策支持任务的软件产品及相关服务。...第20章 SPSS综合应用案例 spss统计分析基础教程-大数据教程百度盘地址 http://www.xuexiluxian.net/spss-jiaocheng.html
  • 应用数理统计学习笔记

    千次阅读 多人点赞 2018-11-12 21:09:47
    本篇为研究生用应用数理统计学习笔记,参考教材有: 《应用数理统计》施雨 著 《概率论与数理统计》吴翊 著 《程序员的数学2 概率统计》 平冈和幸 著 链接:假设检验专题可以看:假设检验专题 复习 概率论...
  • 统计学习方法第二版 李航

    千次阅读 多人点赞 2020-08-02 19:33:27
    以后我会在博客记录自己学习《统计学习方法》第二版这本书的笔记,其实也就是我自己认为比较重要或者有用的内容,以及部分python代码的实现。 第一章 统计学习及监督学习概论 这一章主要都是些概念,所以我可能更多...
  • 统计学中的Bootstrap方法介绍及其应用

    万次阅读 多人点赞 2018-01-25 15:34:42
    最近的论文写作中,需要用到Bootstrap方法,即所谓的“自举法”、“靴带法”。Bootstrap在英语中作为一个名词的话,其的意思是“拔靴带”,也就是通过自身的 力量,自己把自己抬起来。注意这个限定——“通过自身的...
  • 本书主要介绍非高斯信号处理(包括基于高阶统计量和分数低阶统计量的信号处理)的理论、方法及其应用。全书分为9章,内容包括:高斯过程与二阶统计量,高阶累积量和高阶谱,Alpha稳定分布与分数低阶统计量,基于以上...
  • ***以下答案为7~9章统计部分的答案 **** 第7章 数理统计的基本概念 习题7.1、7.2答案: 第8章 参数估计 知识点总结 1、矩法估计步骤 2、极大似然估计步骤 3、参数的区间估计 习题8.1、8.2、8.3、8.5、8.6、8.8、...
  • 将各个手册单元多维度的信息,使用统计方法简化成一维的数值,是为倾向值,然后据之进行匹配,匹配的目的就是要找寻实验组和对照组样本中拥有相同(或者相似)倾向值的样本,它们之间的差异,就是因果效用。...
  • 参数估计有点估计(point estimation)和区间估计(interval estimation)两种。 点估计是依据样本估计总体分布中所含的未知参数或未知参数的函数。通常它们是总体的某个特征值,如数学期望、方差和相关系数等。点...
  • 编写一个Java应用程序,该程序包括3个类: 定义一个学生类,Student有姓名,学号,选学的课程列表 定义一个课程类:课程名称,课程分数 (1)初始化一个学生,选择了三门课程,并添加到学生的属性中 (2)实现统计...
  • 参数估计方法和非参数估计方法

    万次阅读 2018-09-04 14:10:13
    以PLSA和LDA为代表的文本语言模型是当今统计自然语言处理研究的热点问题。这类语言模型一般都是对...有了语言模型和相应的模型参数,我们可以有很多重要的应用,比如文本特征降维、文本主题分析等等。本文主要介绍...
  • Android 5.0 应用使用情况统计信息

    千次阅读 2017-09-14 17:49:20
    Android 5.0 应用使用情况统计信息概述在Android 5.0以前,我们使用ActivityManager.getRecentTasks()方法来获取最近使用过的应用程序信息集合,此方法不需要用户授权,任何应用都可以获取用户最近使用应用的信息,...
  • 硬件性能的革命再一次掀起了人工智能狂潮,而以机器学习为核心的人工智能领域又源于众多数学理论。概率论与数理统计无疑在其中发挥着...另外,本文以深度学习中诸多重要方法为例,介绍了概率论与数理统计的具体应用
  • 时间序列分析之ADF检验

    万次阅读 多人点赞 2019-02-06 18:59:09
    在使用很多时间序列模型的时候,如 ARMA、ARIMA,都会要求时间序列是平稳的,所以一般在研究一段时间序列的时候,第一步都需要进行平稳性检验,除了用肉眼检测的方法,另外比较常用的严格的统计检验方法就是ADF检验...
  • SPSS软件中常见的统计分析方法有哪些 大概如下: 卡方检验 (Pearson法、似然比法、精确检验、线性和线性组合等); T检验 (单样本t检验、独立样本t检验、配对样本t检验); 非参数检验 单样本非参数检验:Kolmogorov...
  • 概率论与数理统计(第四版) 课后习题解析 盛骤、谢式千 编 高等教育出版社 第1章 概率论的基本概念 第2章 随机变量及其分布 第3章 多维随机变量及其分布 第4章 随机变量的数字特征 第5章 大数定律及中心极限定理...
  • 系统学习机器学习之非参数方法

    千次阅读 2015-12-18 13:21:35
    前面的章节中,我们介绍了参数和半参数方法,这两种方法在实际训练前都需要对数据遵从的模型进行一个假定,这个假定可以是一个已知的概率分布或混合分布。参数方法的优点是把估计概率密度、判别式或回归函数问题归结...
  • 卷积神经网络综述

    千次阅读 2019-02-25 14:51:38
    下面来简单介绍和归纳总结一下国内外卷积神经网络的结构,分析一下卷积神经网络的基本原理,阐述一下卷积神经网络在图像识别中的相关应用及取得的最新研究成果。 卷积神经网络是人工神经网络与深度学习相结合,通过...
  • 入门学习Linux常用必会60个命令实例详解doc/txt

    千次下载 热门讨论 2011-06-09 00:08:45
    umount 命令是mount命令的逆操作,它的参数和使用方法和mount命令是一样的。Linux挂装CD-ROM后,会锁定CD—ROM,这样就不能用CD- ROM面板上的Eject按钮弹出它。但是,当不再需要光盘时,如果已将/cdrom作为符号链接...
  • 而在用样本数据对正态总体参数做出统计推断(例如参数估计和假设检验)时,还要附加一个要求:样本数据应服从正态分布,这种数据分布类型已知的总体参数的假设称为参数假设检验。与参数假设检验相对应的还有非参数...
  • 假设检验与常见的统计检验方法

    千次阅读 2019-06-08 01:41:56
    小概率反证法思想,小概率思想认为小概率事件在一次试验中基本上不可能发生,在这个方法下,我们首先对总体作出一个假设,这个假设大概率会成立,如果在一次试验中,试验结果和原假设相背离,也就是小概率事件竟然...
  • [机器学习篇]机器学习知识总结篇

    万次阅读 热门讨论 2017-03-08 22:36:48
    机器学习的一般方法和横向比较 数学是有用的:以SVD为例 机器学习的角度看数学 复习数学分析 直观解释常数e 导数/梯度 随机梯度下降 Taylor展式的落地应用 gini系数 凸函数 Jensen不等式 ...
  • 三大参数估计方法(MLE, MAP, BOA)

    千次阅读 2018-10-01 11:21:36
    有了语言模型和相应的模型参数,我们可以有很多重要的应用,比如文本特征降维、文本主题分析等等。本文主要介绍文本分析的三类参数估计方法-最大似然估计MLE、最大后验概率估计MAP及贝叶斯估计。   1、最大似然...

空空如也

空空如也

1 2 3 4 5 ... 20
收藏数 403,784
精华内容 161,513
关键字:

参数统计方法应用