精华内容
下载资源
问答
  • 非参数统计[释意]

    2009-10-29 10:46:00
    非参数统计区别于传统的参数统计的基本 特点是:非参数统计分析模型通常对模型数据的假定更为宽松 。一般而言,非参数统计是对数据分布的具体形式不做细致假定,尽量从数据本身获得数据的结构关系,逐渐建立对研究...

           非参数统计是应用统计学的重要分支之一。非参数统计区别于传统的参数统计的基本 特点是:非参数统计分析模型通常对模型和数据的假定更为宽松 。一般而言,非参数统计是对数据分布的具体形式不做细致假定,尽量从数据本身获得数据的结构关系,逐渐建立对研究对象的数学模型和统计模型的方法。

         非参数统计是 19 世纪 40 年代以后兴起的。 1942 年, J.Wolfowitz 首先使用非参数统计一词,早期的非参数统计主要是扩充参数检验的内容,以使得传统的检验过程可以应用于小样本和不同类型和分布的数据,比如常用的非参数检 验有符号检验、双样本 wilcoxon 检验,多样本 Kruskal-Wallis 检验、 检验等,主要利用的工具有秩和格点概率分析等,这些检验方法至今仍然在各个领域广泛应用。近年来,由于统计理论的进一步发展和计算机收集处理数据能力的提 高,使得发展随数据结构不同而灵活变化的模型成为可能。在统计研究领域一些非常有意义的新的研究方向正成为研究热点,非参数统计也是其中之一,非参数密 度、非参数回归以及非参数学习等内容正在成为新的研究和应用主题,研究人员利用统计逼近理论突破参数回归和模型估计原有理论框架,利用各种算法改进模型的 计算过程,通过调整预测偏差和方差的比例来发展适应性更强,解释更为精练、拟合优度适中和计算更为有效的模型。从非参数研究角度来看,今天的非参数统计是 统计和计算的交叉产物。非参数将模型建立在坚实的数据基础上的建模观点,使得非参数统计有着更广泛的应用前景。

    如果在一个统计问题中,其总体分布不能用有限个实参数来刻画,只能对它作一些诸如分布连续、有密度、具有某阶矩等一般性的假定,则称之为非参数统计 问题。例如,检验“两个总体有相同分布”这个假设,若假定两总体的分布分别为正态分布N(μ1,σ2)和N(μ2,σ2),则问题只涉及三个实参数 μ1,μ2,σ2,这是参数统计问题。若只假定两总体的分布为连续,此外一无所知,问题涉及的分布不能用有限个实参数刻画,则这是非参数统计问题。又如, 估计总体分布的期望μ,若假定总体分布为正态 N(μ,σ2),则问题是参数性的;若只假定总体分布的期望值存在,则问题是非参数性的。不过参数统计与非参数统计之间并没有泾渭分明的界线。有的统计问 题,从不同的角度,可以理解为参数性的,也可以理解为非参数性的。例如线性回归(见回归分析)问题,若关心的是估计回归系数,它只是有限个实参数,因而可 以看成是参数性的。但是,如果对随机误差的分布类型没有作任何假定,则从问题的总体分布这个角度看,也可以看成是非参数性的。
      重要的非参数统计方法   秩方法是基于秩统计量(见统计量)的一类重要的非参数统计方法。设有样本X1,X2,…,Xn,把它们由小到大排列,若Xi在这个次序中占第Ri个位置 (最小的占第1个位置), 则称Xi的秩为Ri(i=1,2,…,n)。1945年F.威尔科克森提出的"两样本秩和检验"是一个有代表性的例子。设X1,X2,…,Xm和 Y1,Y2,…,Yn分别是从分布为 F(x)和 F(x-θ)的总体中抽出的样本,F连续但未知,θ也未知,检验假设 H:θ=0,备择假设为θ>0(见假设检验)。记Yi在混合样本(X1,X2,…,Xm,Y1,Y2,…,Yn)中的秩为Ri,且为诸秩的和,当W >C时,否定假设H,这里C决定于检验的水平。这是一个性能良好的检验。秩方法的一个早期结果是C.斯皮尔曼于1904年提出的秩相关系数。设 (X1,Y1),(X2,Y2),…,(Xn,Yn)是从二维总体(X,Y)中抽出的样本,Ri为Xi在(X1,X2,…,Xn)中的秩,Qi为Yi在 (Y1,Y2,…,Yn)中的秩,定义秩相关系数为(Ri,Qi)(i=1,2,…n)的通常的相关系数(见相关分析)。它可以作为X、Y之间相关程度的 度量,也可用于检验关于X、Y独立性的假设。
      次序统计量和U 统计量在非参数统计中也有重要应用。前者可用于估计总体分布的分位数(见概率分布)、检验两总体有相同的分布及构造连续总体分布的容忍限和容忍区间(见区 间估计)等。后者主要用于构造总体分布的数字特征的一致最小方差无偏估计(见点估计)及基于这种估计的假设检验。
      苏联数学家Α.Η.柯尔莫哥洛夫和Β.И.斯米尔诺夫在20世纪30年代的工作开辟了非参数统计的一个方面,他们的方法基于样本X1,X2,…,Xn 的经验分布函数Fn(x)(见样本)。柯尔莫哥洛夫考察 Fn(x)与理论分布F(x)的最大偏差墹n,当墹n超过一定限度时,否定这个理论分布F(x)。这就是柯尔莫哥洛夫检验。斯米尔诺夫则考察由两个分布为 F(x)和g(x)的总体中抽出的样本X1,X2,…,Xm和Y1,Y2,…,Yn计算其经验分布Fm(x)和gn(x)的最大偏差墹mn,当墹mn超过 一定限度时,否定“F与g相等”这个假设。这就是斯米尔诺夫检验。
      在非参数性估计方面,有关于估计分布的对称中心、概率密度函数和回归函数等比较重要的成果。
      非参数统计的特点  非参数统计问题中对总体分布的假定要求的条件很宽,因而针对这种问题而构造的非参数统计方法,不致因为对总体分布的假定不当而导致重大错误,所以它往往 有较好的稳健性(见稳健统计),这是一个重要特点。但因为非参数统计方法需要照顾范围很广的分布,在某些情况下会导致其效率的降低。不过,近代理论证明 了:一些重要的非参数统计方法,当与相应的参数方法比较时,即使在最有利于后者的情况下,效率上的损失也很小。
      由于非参数统计中对分布假定要求的条件宽,因而大样本理论(见大样本统计)占据了主导地位。第二次世界大战前,非参数统计的大样本理论已有了一些结 果,从20世纪50年代直到现代,更有了显著的进展,尤其是关于秩统计量与U 统计量的大样本理论,及基于这种理论的大样本非参数方法,研究成果很多。



    展开全文
  • 数 学 实 验 概率统计问题 Matlab 求解 ?... 对实际问题能够进行样本分析得出服 从哪种分布预测依该分布进行参数估计 假设检验 实验目的 I 实验目的 II ? 熟练掌握 Matlab 编程中线性回归线性回 归逐
  • 一、概述Cruskal-Wallis秩检验类似于方差分析,用于检验各个样本总体是否相同,当正太假设方差齐性不能满足时,可用该检验。二、问题某人搜集了三大公司股票每股所能获利钱数,是比较三家公司所挣钱是否...

    一、概述

    Cruskal-Wallis秩和检验类似于方差分析,用于检验各个样本的总体是否相同,当正太假设和方差齐性不能满足时,可用该检验。

    二、问题

    某人搜集了三大公司股票每股所能获利的钱数,是比较三家公司所挣的钱是否相同。

    SPSS版本为20。

    三、统计操作

    SPSS变量视图

    SPSS数据视图

    选择菜单:

    进入如下的对话框,该选项卡不需要手动设置

    进入“字段”选项卡,将“获利”选入“检验字段”框,将“公司”选入分组

    进入“设置”选项卡,选择“Kruskal-Wallis单因素ANOVA(k样本)”检验,在下方“多重比较”下拉菜单中,可选“所有成对比较”(类似于方差分析多重比较中的LSD),也可选“逐步降低”(类似于S-N-K法),这里选择“逐步降低”。

    点击运行即可。

    四、结果解读

    上表是主要输出结果,拒绝原假设,认为三个公司的获利能力有统计学差异。

    双击该表,可获得更多的信息,如下图:

    在下方的“视图”下拉菜单中选择“逐步降低”,可进入下面的多重比较界面:

    这类似于方差分析中多重比较的S-N-K法,将样本分为几个子集,同一子集内的样本无统计学差异,不同子集内的样本有统计学差异。本题中,药品公司与计算机公司、服务公司这两个公司之间有统计学差异,计算机公司、服务公司之间无统计学差异。

    展开全文
  • # -*- coding: utf-8 -*-"""Created on Sun Jul 21 14:26:22 2019《Python数据分析基础》中国统计出版社@author: User"""#import numpy as npfrom scipy import statsimport pandas as pd#import statsmodels.api as...

    # -*- coding: utf-8 -*-

    """

    Created on Sun Jul 21 14:26:22 2019

    《Python数据分析基础》中国统计出版社

    @author: User

    """

    #import numpy as np

    from scipy import stats

    import pandas as pd

    #import statsmodels.api as sm

    #import statsmodels.formula.api as smf

    #import matplotlib.pyplot as plt

    #from statsmodels.stats.multicomp import pairwise_tukeyhsd

    #from statsmodels.graphics.api import interaction_plot

    #from matplotlib.font_manager import FontProperties

    #myfont=FontProperties(fname='data\msyh.ttc')

    sales_district = pd.read_csv(u'data/ch8/sales_district.csv',encoding = "gbk")

    print(sales_district.head())

    aa = stats.ranksums(sales_district[sales_district['district']==1]['Sales'],

    sales_district[sales_district['district']==2]['Sales'])

    print(aa)

    运行:

    district  Sales

    0         1  87.17

    1         1  88.45

    2         1  93.52

    3         1  96.17

    4         1  92.68

    RanksumsResult(statistic=-3.6377197716407874, pvalue=0.0002750624589981112)

    展开全文
  • 前段时间审稿人给我文章审稿意见中有要求对实验结果做假设性检验,我做了一番学习,网上这方面资料也比较少,记录如下。...Wilcoxon秩检验是一种常见用于判断两个分布列是否有显著区别的非参数检验方...

    前段时间审稿人给我文章的审稿意见中有要求对实验结果做假设性检验,我做了一番学习,网上这方面资料也比较少,记录如下。

    假设性检验是说我们能够以多大的置信度去相信某个命题,或者作出某个断言的出错概率是多少。

    我们统计课学过的卡方检验什么的都属于参数检验,它们事先假定未知量服从正态分布;非参数检验是指未知量的分布也是未知的。Wilcoxon秩和检验是一种常见的用于判断两个分布列是否有显著区别的非参数检验方法,matlab调用非常简单。

    x=[0.8587,0.8591,0.8591,0.8569,0.8555,0.8390];
    y=[0.8583,0.8589,0.8637,0.8589,0.8613,0.8616];
    ranksum(x,y)
    ans =
    
        0.0823
    

    假设存在两个分布未知的变量x和y,各有一组观测值如上所示,ranksum是matlab自带的Wilcoxon秩和检验方法,用于判断两变量是否有显著性区别。输出结果就直接是p值,为0.0823,表示:认为x与y有显著性区别,这一断言的犯错概率是8.23% (at the default 8.23%).

    参考资料:
    ranksum文档
    关于假设性检验,你想要的都在这儿了!
    百度文库:非参数检验
    百度文库:参数假设检验

    展开全文
  • Stats (统计学) vs MFE (金融工程)专业解析统计学(硕士)侧重方面:统计学相关知识技能数学功底统计学核心课程:随机过程,数理统计,概率论,回归分析,非参数检验,时间序列分析,多元统计分析… 如果本科背景是...
  • 订阅↑↑期待ing01描述性统计描述性统计是一类统计方法汇总,揭示了数据分布特性。它主要包括数据频数分析、数据集中趋势分析、数据离散程度分析、数据...常用方法:非参数检验K-量检验、P-P图、Q-Q图、...
  • 上面那篇文章,简单总结了李航老师《统计机器学习》上面SVM问题。其中软间隔SVM主要指是对那些线性不可分样本集构建SVM分类问题,允许一定误分类,所以优化问题引入了参数C;作为惩罚因子,C越大...
  • 李康、贺佳,人民卫生出版社)列举了对于不同类型资料,可以使用包括t检验、方差分析、卡方检验、非参数检验、直线回归与相关等在内不同方法处理资料,本期内容我们将对这些检验方法进行详细对比和区别。...
  • 李康、贺佳,人民卫生出版社)列举了对于不同类型资料,可以使用包括t检验、方差分析、卡方检验、非参数检验、直线回归与相关等在内不同方法处理资料,本期内容我们将对这些检验方法进行详细对比和区别。...
  • 表2.3中各种RCS模型一个基本区别是概率密度函数是否包含一个或两个自由参数。 One fundamentaldifference among the various RCS models of Table 2.3 is whether the probabilitydensity function has one or two...
  • 第三章习题 部分证明题未给出答案 1. 表3.4中,零假设是指三种形式的广告对TV的销量没什么影响...KNN回归KNN近分类都是典型的非参数方法。这两者的区别在于,前者的输入输出均为定量值;而后者的输入输入...
  • 异常检测的统计学方法有两种,参数方法和非参数方法。两者的区别在于参数方法要求假定数据服从某个参数分布,而非参数方法并不需要假定先验统计模型,但非参数方法并不是说模型是完全无参的,只是可以灵活假设参数...
  • 在回顾总结已有滤波算法基础上,将统计学中偏度与峰度概念引入到算法中,提出了一种新基于偏度平衡地面点与地面点监督分类方法,利用统计矩原理从LiDAR点云数据生成DSM中有效地提取DTM。该方法区别...
  • 第7章 外文和非罗马文本 157 7.1 Web上非罗马文字 157 .2 文字、字符集、字体和字形 161 7.2.1 文字字符集 161 7.2.2 字符集字体 161 7.2.3 字符集输入法 161 7.2.4 操作系统和应用软件 162 7.3传统字符集 ...
  •  5 宏与子程序的区别  9.2 宏参数的特殊运算符  1 连接运算符  2 字符串整体传递运算符  3 字符转义运算符  4 计算表达式运算符  9.3 与宏有关的伪指令  1 局部标号伪指令  2 取消宏定义伪指令  3 ...
  •  5 宏与子程序的区别  9.2 宏参数的特殊运算符  1 连接运算符  2 字符串整体传递运算符  3 字符转义运算符  4 计算表达式运算符  9.3 与宏有关的伪指令  1 局部标号伪指令  2 取消宏定义伪指令  3 ...
  •  5 宏与子程序的区别  9.2 宏参数的特殊运算符  1 连接运算符  2 字符串整体传递运算符  3 字符转义运算符  4 计算表达式运算符  9.3 与宏有关的伪指令  1 局部标号伪指令  2 取消宏定义伪指令  3 ...
  •  5 宏与子程序的区别  9.2 宏参数的特殊运算符  1 连接运算符  2 字符串整体传递运算符  3 字符转义运算符  4 计算表达式运算符  9.3 与宏有关的伪指令  1 局部标号伪指令  2 取消宏定义伪指令  3 ...
  •  5 宏与子程序的区别  9.2 宏参数的特殊运算符  1 连接运算符  2 字符串整体传递运算符  3 字符转义运算符  4 计算表达式运算符  9.3 与宏有关的伪指令  1 局部标号伪指令  2 取消宏定义伪指令  3 ...
  • 基于成本Oracle优化法则

    热门讨论 2012-08-01 13:27:48
    Clarke曾经说过,任何足够高级技术几乎都魔术没有什么区别。我完全相信这种说法是正确。在此之后,有人也说过,任何知识足够丰富技术人员几乎与魔术师没有什么区别。牢记这一点,眼下这本书实际上就是讲...
  • 通过学习本文档,用户可以深入地掌握理解线性报表模型,掌握动态参数和动态宏的应用及两者的区别,可以理解掌握报表组的业务背景设计方法,可以更加充分地理解各种高级统计图的业务背景使用方
  • template/user/ 为系统会员中心模版及相关cssjs ****************************模板规范化管理 结束**************************** ****************************系统内置JS、CSS说明 开始*******************...
  • 本书针对过程工业变量多、藕合强的特点,侧重介绍多元统计类方法在过程工业故障诊断中的应用,详细介绍主元分析法、Fisher判据分析、部分最小二乘法、独立元分析等分析方法之间的区别和联系;针对一般多元统计方法...
  • 5.5.1 ODB与RDB概念设计的区别 99 5.5.2 EER模式到ODB模式的映射 100 小结 101 复习题 102 练习题 102 参考文献 102 第6章 对象-关系扩展-关系系统 104 6.1 SQL及其对象-关系特性概述 104 ...
  • count()聚合计算 count()是聚合函数,对于返回的结果集,一行...count()聚合函数统计非NULL与NULL值的区别: 1、count(字段)不统计NULL记录,即表示满足条件的数据行里参数字段不为NULL的行 2、count(1)co...
  • count()聚合计算count()是聚合函数,对于返回的结果...count()聚合函数统计非NULL与NULL值的区别:1、count(字段)不统计NULL记录,即表示满足条件的数据行里参数字段不为NULL的行2、count(1)count(*)会记录NULL值...
  • count()聚合计算count()是聚合函数,对于返回的结果...count()聚合函数统计非NULL与NULL值的区别:1、count(字段)不统计NULL记录,即表示满足条件的数据行里参数字段不为NULL的行2、count(1)count(*)会记录NULL值...

空空如也

空空如也

1 2 3 4 5 ... 10
收藏数 184
精华内容 73
关键字:

参数统计和非参数统计的区别