-
2022-01-19 14:08:11
一文了解参数检验和非参数检验:
前言
假设检验
概念:是一种根据样本数据来推断总体的分布或均值、方差等总体统计参数的方法。
根据样本来推断总体的原因:
- 总体数据不可能全部收集到。如:质量检测问题
- 收集到总体全部数据要耗费大量的人力和财力
假设检验包括:
- 参数检验
- 非参数检验
基本原理: 利用小概率原理进行反证明。小概率事件在一次实验中不可能发生。
基本步骤:
- 根据检验的目标,对有待推断的总体参数或分布作一个零假设 H 0 H_0 H0
- 构造检验统计量, 且该统计量服从某种已知分布.(卡方分布、t分布、F分布)
- 利用收集到的样本数据和基本假设计算检验统计量的值,并得到相应的相伴概率 P P P 值,即:检验统计量在某个特定的极端区域取值在 H 0 H_0 H0 成立时的概率.
- 给定显著性水平,如果概率 P P P 值小于用户给定的显著性水平 α \alpha α (一般取0.05或0.01),则拒绝零假设 H 0 H_0 H0 而接受备择假设 。否则,不拒绝零假设 H 0 H_0 H0 (类似一种反证法)。显著性水平指的是零假设正确却被错误拒绝的概率,一般取 0.01 0.01 0.01 或 0.05 0.05 0.05,即零假设正确且正确接受的概率为 99 99% 99 或 95 95% 95.
区别
简而言之,若可以假定样本数据来自具有特定分布的总体,也就是在总体分布形式已知的情况下,对总体分布的参数如均值、方差等进行推断, 则使用参数检验。如果不能对数据集作出必要的假设, 或者在总体方差未知或知道甚少的情况下,无法对总体分布形态作简单假定,则使用非参数检验。其中非参数的意思是推断过程中不涉及有关总体分布的参数.
1、定义不同:
参数检验:假定数据服从某分布(一般为正态分布),通过样本参数的估计量(x±s)对总体参数(μ)进行检验,比如t检验、u检验、方差分析。
非参数检验:不需要假定总体分布形式,也就是当总体分布未知时, 直接对数据的分布进行检验。由于不涉及总体分布的参数,故名「非参数」检验。比如,卡方检验。
2、趋势的衡量
参数检验的集中趋势的衡量为均值,而非参数检验为中位数。
3、总体分布信息
参数检验需要关于总体分布的信息;非参数检验不需要关于总体的信息。
4、适用性
参数检验只适用于变量,而非参数检验同时适用于变量和属性。
5、测量两个定量变量之间的相关程度
参数检验用Pearson相关系数,非参数检验用Spearman秩相关。
6、优缺点
参数检验:优点是符合条件时,检验效率高;其缺点是对资料要求严格,如等级数据、非确定数据(>50mg)不能使用参数检验,而且要求资料的分布型已知和总体方差相等。
非参数检验:优点是应用范围广、简便、易掌握;缺点是若对符合参数检验条件的资料用非参数检验,则检验效率低于参数检验。如无效假设是正确的,非参数法与参数法一样好,但如果无效假设是错误的,则非参数检验效果较差,如需检验出同样大小的差异的差异往往需要较多的资料。另一点是非参数检验统计量是近似服从某一部分,检验的界值表也是有近似的(如配对秩和检验)因此其结果有一定近似性。
参数检验
常见方法:
1.正态总体均值的假设检验(t检验)
检验1组数据样本的均值是否等于,大于或小于某个值,或者检验两组数据样本的均值的大小情况。其中的统计量Z一般服从t分布。
2.正态总体方差的假设检验
检验1组数据样本的方差是否等于,大于或小于某个值,或者检验两组数据样本的方差的大小情况。其中单样本检验的统计量X2一般服从卡方分布。双样本检测的统计量F一般服从F分布。
3.二项分布总体的假设检验(非正态总体的假设检验)
非正态总体的假设检验有很多,二项分布总体的假设检验相对较为常用。常用于随机抽样实验的成功概率的检验。非参数检验
常见方法:
-
Wilcoxon Signed Ranks test:也称配对符号秩检验,适用于连续型资料,用来检验配对资料的差值是否来自于中位数为0的总体,也可推断总体中位数是否等于某个指定值,该方法利用配对资料差值大小的信息,检验效率高于符号检验。
-
Sign test:也称差数秩检验,根据配对资料差值正负号检验其效果有无差异,由于检验效能较低,当配对设计资料不满足非参数检验时可考虑使用。
-
McNemar test:在卡方检验时学习过,该方法适用于计数资料,指标变量为二分类,可用来检验配对设计资料处理前后的结果是否存在差异或者配对组之间的频率有无差异。
-
Marginal Homogeneity test: McNemar 检验的扩展,适用于指标变量为多分类的有序或无序资料,即平方表格资料(R×R列联表资料)。
-
Neyman-Pearson χ2 拟合优度检验
检验样本数据是否符合某种分布,Neyman-Pearson 拟合优度检验是非常重要的非参数检验方法, 既可以用于检验数据的分布特性,又可以检验不同组数据之间的分布关系(是否是同一分布)。 -
Kolmogorov-Smirnov检验
也是一个相当重要的检验方法,和Pearson方法一样属于拟合优度检验方法。但是Kolmogorov-Smirnov方法无需对要检验的数据分组,且使用经验累积分布函数(ECDF)来定义统计量,可以用于任何分布的检验。但Kolmogorov-Smirnov只适用于一元分布的情况。因此适用面与Pearson方法相比稍小。 -
独立性检验
很重要的检验方法,具体有Pearson卡方检验,Fisher精确独立性检验。这些检验方法通常用于检验数据的分布和假设影响因素的关系。 -
符号检验和秩和检验
检验样本与总体的情况,或样本总体间的差异。
适用情形
(1)等级顺序资料。
(2)偏态资料。当观察资料呈偏态或极度偏态分布而有未经变量变换,或虽经变量变换但仍未达到正态或近似正态分布时,宜用非参数检验。
(3)未知分布型资料
(4)要比较的各组资料变异度相差较大,方差不齐,且不能变换达到齐性。
(5)初步分析。有些医学资料由于统计工作量过大,可采用非参数统计方法进行初步分析,挑选其中有意义者再进一步分析(包括参数统计内容)(6)对于一些特殊情况,如从几个总体所获得的数据,往往难以对其原有总体分布作出估计,在这种情况下可用非参数统计方法。
reference
@online{BibEntry2022Jan,
title = {{参数检验与非参数检验_donrivers的专栏-CSDN博客_参数检验和非参数检验的区别}},
year = {2022},
month = {1},
date = {2022-01-19},
urldate = {2022-01-19},
language = {chinese},
hyphenation = {chinese},
note = {[Online; accessed 19. Jan. 2022]},
url = {https://blog.csdn.net/donrivers/article/details/46503433},
keywords = {参数检验和非参数检验的区别},
abstract = {{参考网友的资料进行总结:参数检验与非参数检验的区别。1)参数检验:以已知分布(如正态分布)为假定条件,对总体参数进行估计或检验。2)非参数检验:不依赖总体分布的具体形式和检验分布(如位置)是否相同。参数检验与非参数检验的优缺点。1)参数检验:优点是符合条件时,检验效率高;其缺点是对资料要求严格,如等级数据、非确定数据(>50mg)不能使用参数检验,而且要求资料的分布}}
}@online{BibEntry2022Jan,
title = {{参数检验和非参数检验的区别_百度知道}},
year = {2022},
month = {1},
date = {2022-01-19},
urldate = {2022-01-19},
note = {[Online; accessed 19. Jan. 2022]},
url = {https://zhidao.baidu.com/question/679885674445667932.html}
}@online{BibEntry2022Jan,
title = {{参数检验和非参数检验(结合SPSS分析)_只猪会上树的博客-CSDN博客_用参数检验和非参数检验结果不一致}},
year = {2022},
month = {1},
date = {2022-01-19},
urldate = {2022-01-19},
language = {chinese},
hyphenation = {chinese},
note = {[Online; accessed 19. Jan. 2022]},
url = {https://blog.csdn.net/qq_48211069/article/details/119221363?spm=1001.2101.3001.6650.1&utm_medium=distribute.pc_relevant.none-task-blog-2%7Edefault%7ECTRLIST%7Edefault-1.pc_relevant_paycolumn_v2&depth_1-utm_source=distribute.pc_relevant.none-task-blog-2%7Edefault%7ECTRLIST%7Edefault-1.pc_relevant_paycolumn_v2&utm_relevant_index=2},
keywords = {用参数检验和非参数检验结果不一致},
abstract = {{假设检验参数检验平均值检验单样本t检验两独立样本t检验配对样本t检验非参数检验卡方检验单样本K-S检验两独立样本的非参数检验多个独立样本的非参数检验两配对样本检验多匹配样本的非参数检验总体数据不可能全部收集到。如:质量检测问题收集到总体全部数据要耗费大量的人力和财力假设检验包括:参数检验非参数检验基本原理:利用小概率原理进行反证明。小概率事件在一次实验}}
}更多相关内容 -
非参数检验
2020-12-24 03:42:04三百六十行,行行出状元,但状元也是需要查找和学习非参数检验的,欢迎大家下载非参数检验参考使用。PS:...该文档为非参数检验,是一份很不错的参考资料,具有较高参考价值,感兴趣的可以下载看看 -
MK_mannkendall_manner-kendall(m-k)_K._m-k检验法_Mk非参数检验_
2021-09-29 00:46:40Mann Kendall(M-K)法是一种非参数趋势检验方法,它考虑了异常值并接受独立数据,不受少数异常值的影响,无需数据服从一定的分布。对于非正态分布的数据分析具有突出的适用性 -
spss-非参数检验-K多个独立样本检验(Kruskal-Wallis检验)案例解析.pdf
2021-11-09 03:17:19spss-非参数检验-K多个独立样本检验(Kruskal-Wallis检验)案例解析.pdf -
SPSS视频教程3——非参数检验
2019-02-27 19:58:16SPSS视频教程3——非参数检验,视频讲解清晰、详细、完整。 -
用matlab编出的Manner-Kendall(M-K)程序非参数检验法
2019-04-03 16:42:44用matlab编的Manner-Kendall(M-K)程序非参数检验法常用于分析降水、径流、气温等要素时间序列的趋势变化,其优点在于样本不需要遵循某一特定的分布,而且很少受到异常值的的干扰,计算简便。 -
spss-非参数检验-K多个独立样本检验(Kruskal-Wallis检验)案例解析.docx
2021-11-06 20:59:28spss-非参数检验-K多个独立样本检验(Kruskal-Wallis检验)案例解析.docx -
非参数检验及matlab实现.pdf
2020-10-05 01:10:11非参数检验及 matlab 实现 Kolmogorov-Smirnov test 检验两个样本是否有相同分布 Kstest Test statistics max F (x) G(x) [h,p,ksstat,cv] = kstest(x,CDF,alpha,type) x 被测试的数据样本以列向量输入continuous ... -
两个独立样本的4种非参数检验方法.pdf
2021-11-10 12:55:28两个独立样本的4种非参数检验方法.pdf -
DRE年龄性质的非参数检验
2021-03-02 12:02:41之后利用核密度估计的相关知识构造了一个渐近无偏的U统计量来估计该参数, 该检验统计量的值过大时接受随机变量是DRE 的假设. 在一定条件下证明了检验统计量的渐近正态性, 从而得到检验的渐近临界值. 最后确定了核... -
基于聚类分析和非参数检验的房地产预警指标体系选择* (2006年)
2021-05-09 16:52:19为了寻求一种有效的房地产预警指标选择方法,基于定量方法并与定性方法相结合,在现有房地产指标数据库的基础上,通过聚类分析和非参数检验,建立了一套预警指标体系,然后利用它对上海市房地产市场进行了扩散指数... -
基于R语言的非参数检验研究
2019-12-29 09:22:04基于R语言的非参数检验研究,叶飞武,齐滨,非参数检验是统计推断的重要组成内容,因其在总体分布未知时的优越性使得该方法得到广泛的运用。而R作为一款编程语言灵活、方便� -
常用的参数检验和非参数检验方法对比
2022-04-06 05:11:19常用的参数检验和非参数检验方法对比目录
一、基本概念
- 参数检验是在总体分布形式已知的情况下,对总体分布的参数如均值、方差等进行推断的方法。但是,在数据分析过程中,由于种种原因,我们往往无法对总体分布形态作简单假定,此时参数检验的方法就不再适用了。
- 非参数检验正是一类基于这种考虑,在总体方差未知或知道甚少的情况下,利用样本数据对总体分布形态等进行推断的方法。
二、对比
参数检验
非参数检验
检验指标
均值
中位数
总体分布情况
已知
未知
针对的对象
参数
分布情况
优点
符合条件时,
检验效率高
应用范围广、
简便、易掌握
缺点
对数据要求严格,要求数据连续性、分布型已知和总体方差相等
若对符合参数检验条件的数据用非参数检验,则检验效率低于参数检验
- 参数检验的集中趋势的衡量为均值,而非参数检验更适合为中位数,比如收入情况,如果在样本中加入几个亿万富翁,即使一般人的收入没有变化,平均值也会大幅度增加,但中位数没有显著差异。
- 优缺点对比:1)参数检验:优点是符合条件时,检验效率高;其缺点是对数据要求严格,如等级数据、非确定数据不能使用参数检验,而且要求数据的分布型已知和总体方差相等。
2)非参数检验:优点是应用范围广(没有正态分布的假设)、简便、易掌握;缺点是若对符合参数检验条件的数据用非参数检验,则检验效率低于参数检验。如无效假设是正确的,非参数法与参数法一样好,但如果无效假设是错误的,则非参数检验效果较差。 - 当样本量足够大时,参数检验的方法对非正态分布的数据也能够很好地进行处理,因为样本均值的分布根据中心极限定理是近似正态分布。当样本量较小且分布未知时,通常会考虑使用非参数检验。
- 各类方法对比:
三、具体方法对比
1、参数检验
- t检验:它适用于计量数据、正态分布、方差具有齐性的两组间小样本比较。包括样本与均数间、两样本均数间、配对数据间的比较三种,分别对应的是单一样本t检验,独立样本t检验和配对样本t检验,三者的计算公式是不同的。T检验需要满足正态分布性和方差齐性,在不满足方差齐性时,需要使用t‘检验。
- U检验,也称Z检验,应用条件与t检验基本一致,只是当大样本(N>30)时用U检验,而小样本(N<30)时则用t检验。
- 方差分析:用于正态分布、方差齐性的多组间计量比较。常见的有单因素、双因素、多因素的均数比较,“因素”指影响未知变量的行为(事件)。方差分析首先是比较各组间总的差异,如总差异有显著性,再进行组间的两两比较。
我们提到不论是t检验还是方差分析必须满足两条假设,分别是正态性和方差齐性。因此,在一个完整的统计工程中,必须首先检测数据的正态性和方差齐性,matlab里有对应的函数可以直接调用,lillietest正态检验函数和vartestn方差齐性检验。
2、非参数检验
非参数检验我们一般用的不多,简单列举了几个,非参数检验检验的是分布而不是参数,所以总体分布是未知的。
- 符号检验:符号检验还可用于配对样本的比较检验,符号检验法是通过两个相关样本的每对数据之差的符号进行检验,从而比较两个样本的显著性。具体地讲,若两个样本差异不显著,正差值与负差值的个数应大致各占一半。
- Wilcoxon符号秩检验:符号检验只考虑的分布在中位数两侧的样本数据的个数,并没有考虑中位数两侧数据分布的疏密程度,这就使得符号检验的结果比较粗糙,检验功率较低。统计学家维尔科克森在1945年,提出了一种更为精细的“符号秩检验法”,该方法是在配对样本的符号检验基础上发展起来的,比传统的单独用正负号的检验更加有效。它适用于单个样本中位数的检验,也适用于配对样本的比较检验,但并不要求样本之差服从正态分布,只要求对称分布即可。
- 卡方检验: 就是统计样本的实际观测值与理论推断值之间的偏离程度,以卡方分布为基础,实际观测值与理论推断值之间的偏离程度就决定卡方值的大小,卡方值越大,越不符合;卡方值越小,偏差越小,越趋于符合,若两个值完全相等时,卡方值就为0,表明理论值完全符合。
- K-S检验: 是基于累计分布函数的,检验一个样本是否服从既定的分布,或者检验两个样本是否来自同一个分布。
- 曼·惠特尼检验,是比较两个独立样本的非参数检验。
- K-W检验,又称“H检验”,用以检验两个以上样本是否来自同一个概率分布的一种非参数方法。被检验的几个样本必须是独立的或不相关的。与此检验对等的参数检验是单因素方差分析,但与之不同的是,K-W检验不假设样本来自正态分布。它的原假设是各样本服从的概率分布具有相同的中位数。
- Friedman 福里德曼检验: 又被称之为双因素秩方差分析,是非参数版的anova2。同anova2一样,待检验的数据也必须是均衡的。但是福里德曼检验和anova2检验不完全相同,anova2同时注意两个因素对待检验数据的影响,但是,福里德曼检验只注重2个因素中的其中一个对待检验数据的影响,而另一个因素则是用来区分区组用的。(有4名美食评委1234对来自于四个地区ABCD的厨子做的烤冷面做出评价打分,现在我们想知道,这四个地方的烤冷面品质是否相同,那么同一个评委对四个地区厨师的打分就具有可参考性,而不同地区评委之间对同一个厨师的打分参考性几乎没有(受评委自己的主观意识影响太强)。因此,我们只考虑地区因素,而评委因素是区组因素,不同区组之间的数据没有可比较性。)
-
SAS系统讲义-非参数检验1-2实例.zip
2021-09-07 15:25:14SAS系统讲义-非参数检验1-2实例 -
参数检验和非参数检验(结合SPSS分析)
2021-07-29 21:37:08假设检验参数检验平均值检验单样本t检验两独立样本t检验配对样本t检验非参数检验卡方检验单样本K-S检验两独立样本的非参数检验多个独立样本的非参数检验两配对样本检验多匹配样本的非参数检验 总体数据不可能全部...假设检验
概念:是一种根据样本数据来推断总体的分布或均值、方差等总体统计参数的方法。
根据样本来推断总体的原因:
-
总体数据不可能全部收集到。如:质量检测问题
-
收集到总体全部数据要耗费大量的人力和财力
假设检验包括:
-
参数检验
-
非参数检验
基本原理:利用小概率原理进行反证明。小概率事件在一次实验中不可能发生。
基本步骤:
-
根据检验的目标,对有待推断的总体参数或分布作一个零假设 H 0 H_0 H0
-
构造检验统计量,且该统计量服从某种已知分布.(卡方分布、t分布、F分布)
-
利用收集到的样本数据和基本假设计算检验统计量的值,并得到相应的相伴概率P值,即:检验统计量在某个特定的极端区域取值在 H 0 H_0 H0成立时的概率.
-
给定显著性水平,如果概率P值小于用户给定的显著性水平 α \alpha α(一般取0.05或0.01),则拒绝零假设 H 0 H_0 H0而接受备择假设 。否则,不拒绝零假设 H 0 H_0 H0 (类似一种反证法)。显著性水平指的是零假设正确却被错误拒绝的概率,一般取0.01或0.05,即零假设正确且正确接受的概率为99%或95%
参数检验
参数检验方法
- 平均值检验
- 单样本t检验
- 两独立样本t检验
- 两配对样本t检验
平均值检验
计算一个或多个自变量类别中因变量的子组平均值与相关的单变量统计,也可以通过比较两个样本的均值来判断两个总体的均值是否相等。零假设:两个样本的均值,没有显著差异。
实例
问题:判断男女生数学成绩的均值是否具有显著差异
操作:
点击>分析>比较平均值>平均值
将性别拖到自变量列表,数学成绩拖到因变量列表。
点击选项按钮,勾选Anova表和eta、线性相关度检验
(如果自变量的个数少于3或者含有字符串,则无法进行线性相关度检验,因此此选项也可不必勾选)
分析结果:
从ANOVA表中可以看出,显著性为0.36,大于0.05,说明男生和女生之间的数学成绩均值没有显著差异。
从相关性测量表中看出Eta的平方为0.02
单样本t检验
H 0 H_0 H0: u = u 0 u=u_0 u=u0,总体均值与检验值之间不存在显著差异.
构造检验统计量.从样本均值的分布出发,即:~ N ( u 0 , σ 2 / n ) N(u_0,\sigma^2/n) N(u0,σ2/n).于是:
-
总体方差未知时构造t统计量 t = D ‾ S / n t=\frac{\overline D}{S/\sqrt{n}} t=S/nD
-
D = X − u 0 D=X- u_0 D=X−u0
-
t统计量服从n-1个自由度的t分布
计算t统计量和对应的相伴概率P(绝对值大于等于 α \alpha α的双侧概率)
结论: P ≤ α P\leq\alpha P≤α,则拒绝 H 0 H_0 H0,认为总体均值与检验值之间有显著差异. P > α P>\alpha P>α,不能拒绝 H 0 H_0 H0,认为总体均值与检验值之间没有显著差异
两独立样本t检验
含义: 在两个样本相互独立的前提下,检验两个样本的总体均值是否存在显著差异。零假设:两个样本数据的均值不存在显著差异。
例如:男生和女生的计算机平均成绩有显著差异吗?
要求:
-
两样本必须相互独立,即:抽取其中一批样本对抽取另一批样本没有任何影响.(如:北京周岁儿童与上海儿童的平均身高)
-
两总体服从正态分布
基本思路:
-
零假设 H 0 : u 1 − u 2 = 0 H_0:u_1-u_2=0 H0:u1−u2=0,两总体均值无显著差异。
-
构造检验统计量.从两样本均值差的分布出发,即:~ N ( u 1 − u 2 , σ x 1 − x 2 2 ) . N(u_1-u_2,\sigma^2_{x_1-x_2} ). N(u1−u2,σx1−x22).于是两总体均方差未知时构造t统计量:
-
两总体均值差的抽样分布标准差:
- 方差相等:用合并方差
- 方差不等:
- 计算t统计量和对应的相伴概率P (绝对值大于等于该值的双侧概率)
利用方差齐性(Levene)F检验确定两总体方差是否齐性。给定零假设 H 0 H_0 H0:两总体方差无显著差异。
首先计算每个个案与所属组均值之差并取绝对值.然后对其进行单因素方差分析.
如果已假设方差齐性行 F检验的 P ≤ α P\leq\alpha P≤α,则拒绝F检验的 H 0 H_0 H0,认为方差不齐性;其次看未假设方差齐性(Unequal)行的t检验概率.如果 ≤ α \leq\alpha ≤α,则拒绝t检验的 H 0 H_0 H0,认为两总体均值有显著差异;如果 > α >\alpha >α,则不拒绝t检验的 H 0 H_0 H0
如果F检验的 P > α P >\alpha P>α,则不能拒绝F检验的 H 0 H_0 H0,认为方差齐性;其次看已假设方差齐性(equal)行的t检验概率,t检验概率如果 ≤ α \leq\alpha ≤α,则拒绝t检验的 H 0 H_0 H0,认为两总体均值有显著差异;如果 > α >\alpha >α,则不拒绝t检验的 H 0 H_0 H0
实例:
问题:判断男女生数学成绩是否具有显著差异
SPSS操作:
点击>分析>比较平均值>独立样本T检验
点击>定义组
分析结果:
在“列表方差相等性检验”框中,显著性为0.256,大于0.05,两组的总体方差齐性,则选择“已假设方差齐性”这一行的t检验结果。在“平均值相等性的t检验”中显著性(双尾)为0.346,大于0.05,说明两组数据的均值不存在显著差异。
配对样本t检验
含义: 根据配对样本对两总体均值是否有显著差异进行推断。零假设:两个配对样本数据的均值不存在显著差异。
例如: 某种减肥茶是否有效
要求:
-
两样本数据必须两两配对,即:样本个数相同,个案顺序相同.如:减肥茶的效果、不同广告形式对销售额的影响.(控制了个案自身的影响)
-
两总体服从正态分布
非参数检验
卡方检验
目的:通过样本数据的分布来检验总体分布与期望分布或某一理论是否一致,零假设是样本的总体与期望没有显著差异。
基本思想:如果从一个随机变量X中随机抽取若干个样本均值,当这些样本落在 X X X的 k k k个互不相关的子集中的观察频数服从一个多项分布,当k趋于无穷时,这个多项分布服从卡方分布。
卡方检验的零假设是:两个变量之间没有显著差异。若两种检验(皮尔逊卡方、似然比)的渐进显著性水平(双向)都小于0.05,则拒绝零假设,若两种检验的双向显著性水平都大于0.05,则不能拒绝零假设。
即:若卡方的渐进显著性小于0.05,表明变量之间有显著差异,若卡方的渐进显著性大于0.05,表明变量之间没有显著差异。
基本方法:
-
根据已知总体的构成比计算出样本中各类别的期望频数,计算实际观察频数与期望频数的差距,即:计算卡方值 χ 2 = ∑ i = 1 k ( 观测频数 − 预测频数 ) 2 预测频数 \chi^2=\sum_{i=1}^{k}\frac{(\text{观测频数}-\text{预测频数})^2}{\text{预测频数}} χ2=∑i=1k预测频数(观测频数−预测频数)2
-
卡方值越小,则实际频数和期望频数相差越小.如果P大于显著性水平 α \alpha α,不能拒绝 H 0 H_0 H0,认为总体分布与已知分布无显著差异。
单样本K-S检验
**目的:**利用样本数据推断总体是否服从某个理论分布(正态分布、均匀分布、指数分布和泊松分布)。
例如:周岁儿童的身高是否服从正态分布
基本假设: H 0 H_0 H0:总体分布与指定的理论分布无显著差异(总体服从指定的分布)
基本方法:
-
根据用户指定检验的总体分布,构造出一理论的频数分布,并计算相应的累计频率.
-
与样本在相同点的累计频率进行比较.如果相差较小,则认为样本所代表的总体符合指定的总体分布.
实例:
问题:判断班里语文成绩是否服从正态分布或泊松分布
SPSS操作:
点击>分析>非参数检验>旧对话框>1-样本K-S检验
勾选常规、泊松按钮
(如下图所示:常规是指正态分布,相等是指均匀分布)
分析结果:
正态分布检验统计量为0.051,渐进显著性为0.009,小于0.05,拒绝零假设,认为班上语文成绩不服从正态分布。
泊松分布检验统计量为0.038,渐进显著性为0.560,大于0.05,不能拒绝零假设,认为班上以为成绩服从泊松分布。
两独立样本的非参数检验
目的:由独立样本数据推断两总体的分布是否存在显著差异(或两样本是否来自同一总体)。
例如:两种不同生产工艺产品使用寿命分布的差异性
基本假设: H 0 H_0 H0:两总体分布无显著差异(两样本来自同一总体)
基本方法:
- 曼-惠特尼U检验(Mann-Whitney U):平均秩检验
-
将两样本数据混合并按升序排序
-
求出其秩
-
对两样本的秩分别求平均
-
如果两样本的平均秩大致相同,则认为两总体分布无显著差异
- k-s检验(保证有较大的样本数)
-
将两样本混合并按升序排序
-
分别计算两个样本在相同点上的累计频数和累计频率
-
两个累计频率相减
-
如果差距较小,则认为两总体分布无显著差异
- 游程检验(Wald-Wolfowitz runs)
-
将两样本混合并按升序排序
-
计算分组标志序列的游程数
-
如果游程数较大,则说明是由于两类样本数据充分混合的结果,即:认为两总体分布无显著差异.
-
如果两样本中有相同的样本值,则会使游程数发生变化.系统会作出提示.
多个独立样本的非参数检验
目的:检验多个独立样本之间是否具有相同分布,零假设是多个独立样本来自的总体分布无显著差异
基本方法:
- Kruskal-Wallis H检验(推广的平均秩检验)
-
将多个样本数混合并按升序排序,求出其秩
-
对多个样本的秩分别求平均秩序
-
如果各样本的平均秩大致相等,渐进显著性大于0.05,则认为多个总体分布无显著差异
- 相同中位数检验(median)
-
判断多个总体是否是具有相同的中位数
-
将多个样本数混合并按升序排序
-
求出混合样本序列的中位数
-
如果各独立样本中大于此中位数的个案数和小于此中位数的个案数大致相同,渐进显著性大于0.05,则认为总体有相同的中位数。
- Jonckheere-Terpstra检验(适用于行和列皆有序的R*C列联表)
- 计算统计量的值J
- 跟读统计量J值得到p值
- 将p值与给定的显著性水平进行比较。若p值小于显著性水平,则拒绝零假设,接受备择假设。
两配对样本检验
基本方法:
- 变化显著性检验(McNemar)(要求数据只能是二分值)
-
将研究对象作为自身的对照者检验其“前后”的变化是否显著
- 例如:领导培训前后,群众对他们的评价
-
关心的是发生变化的两格中的频数变化.如果频数变化相当,则认为无显著变化.
- 正负符号检验(sign)
-
将样本2的各样本值减去样本1的各样本值.如果差值为正,则记为正号;如果差值为负,则记为负号
-
如果正号的个数与负号的个数相当,则认为无显著变化.否则,认为有显著变化
-
例如:采用新训练方法前后的最好成绩比较
3.符号平均秩检验(wilcoxon)
正负符号检验只考虑了两总体数据变化的性质,而没有注意其变化的程度.符号平均秩检验注意到了这点
-
将样本2的各样本值减去样本1的各样本值.如果差值为正,则记为正号;如果差值为负,则记为负号.
-
将差值按升序排序,并求其秩.分别计算正号秩和负号秩总和
-
如果正秩和负秩相当,认为正负变化程度相当,两总体无显著差异.
多匹配样本的非参数检验
基本方法
- 推广的平均秩检验(双向Friedman检验)
-
将每个个案的变量值数据按升序排序,并求其秩
-
求各样本的平均秩
-
如果平均秩相当,则认为各总体分布无显著差异
2.谐同系数检验(Kendall W检验)
-
谐同系数检验方法与推广的平均秩检验方法相同
-
主要用在分析评判者的评判标准是否一致和公平
-
通过谐同系数W进行判定.W表示了横向各样本数据之间相关的强弱程度,取值在0和1之间.越接近1,则表示相关性越强,即:评判者的评判标准一致
参考书目:
《SPSS22.0统计分析·从入门到精通》 -
-
参数检验与非参数检验
2019-11-05 20:53:27参数检验:若样本所来自的总体为分布已知的数学形式(如正态分布),对其总体参数进行假设检验,则称为参数检验。 参数检验的特点: 分析目的:对总体参数(μ π)进行估计或检验。 分 布:要求总体分布已知,如:...参数检验:若样本所来自的总体为分布已知的数学形式(如正态分布),对其总体参数进行假设检验,则称为参数检验。
参数检验的特点:分析目的: 对总体参数 ( μ π ) 进行估计或检验。分 布: 要求总体分布已知,如:• 连续性资料 —— 正态分布• 计 数 资 料 —— 二项分布、 POISSON 分布等统 计 量: 有明确的理论依据( t 分布、 u 分布)有严格的适用条件 ,如:• 正态分布 Normal• 总体方差齐 Equal Variance• 数据间相互独立 Independent非参数检验:对总体分布不做严格假定,也不对总体参数进行统计推断,而是直接对总体分布的位置进行假设检验。由于这类方法不受总体参数的限制,故称非参数检验,又称任意分布检验(distribution-free test)
非参数检验适用的范围:
① 总体分布形式未知或分布类型不明(尤其小样本);
② 偏态分布的资料(非正态分布的资料)不满足参数检验条件的资料:各组方差明显不齐。
③ 等级资料:不能精确测定,只能以严重程度、优劣等级、次序先后等表示 ——单向有序行×列表资料
④ 数据一端或两端是不确定数值, (必选)如“>50kg”等。
非参数检验的优缺点:
优点:
适用范围广对数据要求不严方法简便、易于理解和掌握缺点:
损失信息、检验效能低凡符合或经过变换后符合参数检验条件的资料,最好用参数检验。当资料不具备参数检验的条件时,非参数检验是一种有效的分析方法。
对符合用参数检验的资料,如用非参数检验,会丢失信息,导致检验效率下降,犯Ⅱ类错误的可能性比参数检验大。
当拒绝H0时,可能拒绝了实际上成立的H0,这类错误称为Ⅰ类错误(“弃真”),其概率大小用α表示。常称之为检验水准
当不拒绝H0时,没有拒绝实际上不成立的H0,这类错误称为Ⅱ类错误(“存伪”),其概率大小用β表示。
-
非参数检验及matlab实现
2021-04-25 11:05:38非参数检验及matlab实现Kolmogorov-Smirnov test:检验两个样本是否有相同分布KstestTest statistics:()-max()()F xG x[h,p,ksstat,cv] = kstest(x,CDF,alpha,type)x:被测试的数据样本,以列向量输入(continuous ... -
参数检验与【非参数检验】及Python/SPSS/R/Stata实现
2020-12-28 20:20:15文章目录1 参数检验与非参数检验2 非参数检验方法2.1 单样本总体分布检验2.1.1 卡方检验2.1.2 二项分布检验2.1.3 游程检验2.1.4 Kolmogorov—Smirnov检验2.2 两独立样本差异性检验2.2.1 Kolmogorov—Smirnov检验... -
数据分析之参数检验与非参数检验(百炼之志,当我问鼎)
2021-12-07 13:19:291、参数检验和非参数检验的区别 定义不同: 参数检验:假定数据服从某分布(一般为正态分布),通过样本参数的估计量(x±s)对总体参数(μ)进行检验,比如t检验、u检验、方差分析。 非参数检验:不需要假定... -
参数检验与非参数检验的区别
2019-05-11 18:21:10参数检验与非参数检验的区别 1,参数检验是针对参数做的假设,非参数检验是针对总体分布情况做的假设,这个是区分参数检验和非参数检验的一个重要特征。 2,二者的根本区别在于参数检验要利用到总体的信息(总体... -
R语言-非参数检验
2022-01-11 17:06:23非参数检验(Nonparametric tests)是统计分析方法的重要组成部分,在数据分析过程中,由于种种原因,人们往往无法对总体分布形态作简单假定,此时参数检验的方法就不再适用了。非参数检验基于这种考虑,在总体方差... -
非参数检验页非参数检验的过程PPT学习教案.pptx
2021-10-06 04:19:51非参数检验页非参数检验的过程PPT学习教案.pptx -
非参数检验统计量分析
2021-12-29 11:20:35非参数检验用于研究定类数据与定量数据之间的关系情况。例如研究人员想知道不同性别学生的购买意愿是否有显著差异。如果购买意愿呈现出正态性,则建议使用方差分析,如果购买意愿没有呈现出正态性特质,此时建议可... -
提高非参数检验功效的潜在方法
2019-11-17 00:38:31如何提高非参数检验的功效,这是个不容易的问题。Wilcoxon是一个特异度很高的检验方法,但小样本时灵敏度较低。如果简单放宽检验水准,将会迅速损失特异度,并不是上上策。小样本的差异分析一直是个头疼的问题,对于... -
参数检验和非参数检验
2018-05-22 21:34:33一、参数检验1、基本思想2、两类错误3.、检验步骤4、检验的p值在一个假设检验问题中, 拒绝原假设H0的最小显著性水平称为检验的p值.5、单正态总体参数的检验(1)(2)(3)6、两正态总体参数的检验(1)(2)7、成对... -
参数检验和非参数检验的区别
2018-10-11 16:46:47非参数检验是针对总体分布情况做的假设,这是区分的一个重要特征; 2、根本区别在于,参数检验要利用到总体的信息(总体的分布、总体的一些参数特征,如方差),以总体分布和样本信息对总体参数做出推断; 非参数...