精华内容
下载资源
问答
  • 根据界值表又会查出一个数,这个数和t值比较,得出大小,判断是否接受原假设。感觉p值一直都没有什么作用? 解答:在进行t检验时,会计算出一个t值,而在选定显著性水平后,可以找到相比较的t值,两者可以比较,...

    t检验中的t值和p值是什么关系_t检验和p值的关系

    t检验中通过样本均值 总体均值 样本标准差 样本量 可以计算出一个t值,这个t值和p值有什么关系?
    根据界值表又会查出一个数,这个数和t值比较,得出大小,判断是否接受原假设。感觉p值一直都没有什么作用?

    解答:在进行t检验时,会计算出一个t值,而在选定显著性水平后,可以找到相比较的t值,两者可以比较,判断显著性。p值代表的是不接受原假设的最小的显著性水平,可以与选定的显著性水平直接比较。例如取5%的显著性水平,如果p值大于5%,就接受原假设,否则不接受原假设。这样不用计算t值,不用查表了。

    准问:其实是不是可以理解成  就是按照自由度和0.05来查表看p值的范围。例如 自由度是34的话,t〈t 0.05,34,则表示P >0.05,按α=0.05水准,接受原假设H0。
    可以这么理解么?

    回答:可以这么理解,t值其实就相当于确定的了一个置信区间,在这个区间内,接受原假设,而p表示的是置信区间之外的那部分;在确定t值时置信区间已经确定了,p值也就确定了,p值作为一个标准,你可以选的是显著性水平,只要比较一下就可以。两者在本质上时一样的。

    其他解答:你这样理解是有偏误的。p值是根据统计量值计算出来的,跟显著性水平是没有关系。只能说根据计算出来的p值来和显著性水平比较,当p值小于显著性水平是拒绝原假设。而不能说根据显著性水平确定p值的范围。简言之,p值是根据样本计算出来的,而显著性水平则是认为规定的

    解答:同意你的观点,p value is usually based on sample, and it is a calculated value, but significant level is usually set by statisticians subjectively…

    其他疑问:这样啊~
    基础知识不好  其实我应该是压根都不知道p值是怎么算出来的  例如 通过样本均值  总体均值 样本标准差 计算出了 t=1.77,自由度=34,查t界值表可以获得一个对应值 2.032,那p值是根据2.032计算出来的么?还是其他的方法?
    多谢啦~

    解答:不对。你这个2.032是根据给定的显著性水平计算出来的吧。p值不依赖于这个,p值就是在给定的自由度下(注意这里不要求显著性水平),通过计算出来的统计量值t=1.77,结合t分布求出当T>1.77是的概率 ,这个概率就是p值,如果是双侧检验的话还要乘以2

    当显著性水平为0.05,自由度为34的时候,查t界值表得到一个对应数据2.032。这个值的意义主要是什么呢?数据分析培训

    p值能直接跟显著性水平比较;而t值想要跟显著性水平比较,就得换算成p值,或者将显著性水平换算成t值。就是这么简单粗暴。

    转载于:https://www.cnblogs.com/amengduo/p/9587242.html

    展开全文
  • 已知T值P值代码

    2017-03-07 14:28:59
    已知T值和自由度求P值
  • 如何理解T检验和P值

    千次阅读 2020-08-29 17:32:15
    接下来是我转自知乎上的一个通过一个例子来详尽的解析T检验及P值的文章,我看完颇有启发。 关于T检验以及各种假设检验的操作方法,网络上有很多详细讲解。今天我们不谈具体的步骤,而是通过案例全方面地将T检验的...
    • t检验是通过比较不同数据的均值,研究两组数据之间是否存在显著差异。
    • p值是一组数据的均值(以及比这种数据更极端的数据的均值)在另一组数据的均值所代表的总体中出现的概率。当p值越小,说明两者差异越显著,因为这说明一组数据是另一组数据所代表的总体中的样本的可能越小(因为两者的均值差异)。

    接下来是我转自知乎上的一个通过一个例子来详尽的解析T检验及P值的文章,我看完颇有启发。


    转载自知乎T检验和其他假设检验的P值怎么理解

    关于T检验以及各种假设检验的操作方法,网络上有很多详细讲解。今天我们不谈具体的步骤,而是通过案例全方面地将T检验的逻辑和思想,掰开揉碎,尝试用白话讲一步,增进大家的理解,不知知足欢迎指出讨论。

    案例:5年前,全国男性的平均身高是1.75米(普查得到的总体均值),现在我们想知道如今男性的平均身高是否发生了改变。

    思路:从全国男性群体中随机抽取1000名样本,获得样本均值和样本标准差,进行假设检验。

    此处需要提醒的是,在进行假设检验时,我们的关注点在样本均值上,即我们不太关注原始样本的情况,而是关注由这个样本计算的样本均值了。

    现在,在脑海中重复上面的操作:比如我们随机抽取100次,每次都抽取1000名,所以,我们会得到100个样本均数,将这100个样本均数放在一起再求均数和标准差,得到的均数会更加接近全国这个总体的均数,而这个标准差就是你听过的“标准误”。

    然而,现实情况中我们只会抽取一次,只会得到一个样本均数和一个样本标准差,虽然这一个样本均数不如上面由100个样本均数平均后计算地精确,但在数学上仍可以证明,这一个样本均数也可以用来很好地估计总体均数。所以,问题的关键就变成了,不抽取100次,怎么计算“标准误”?好在我们也能证明,只抽样一次获得的样本标准差(S),除以根号N就可以得到“标准误”的估计值了,于是抽样一次就可以简单算出“标准误”,再次提醒,这个“标准误”实际上就是均数的标准差。

    现在我们正式开始T检验的思路。上文提到了,我们关注的随机变量已经不是原始的身高了,而是身高的均数,身高的均数,身高的均数(重要的话,讲三遍)。所以,身高均数成为了我们研究的随机变量,它也存在总体与样本的区分,它也有均值和标准差,而且我们还可以确定无论身高是否真正服从正态分布,身高均值这个变量总是近似服从正态分布(中心极限定理),由此我们就可以利用这些性质进行假设检验。

    回到上面的问题,5年前全国男子身高的总体均值是1.75米(μ),我们想知道现在是否有变化,其实就是想检验,5年后的现在全国男子身高的总体均值是否还是1.75米。因为我们不进行普查,所以我们希望通过随机抽取一个1000人的样本来进行推断和检验。得到样本后,我们可以计算出样本均数、样本标准差以及标准误。

    假设样本均数为 1.77,显然我们不能因为1.77和1.75这两个数字的不同就判断说现在全国男子的平均身高要大于5年前了。因为即使现在的身高没有变化,你随机抽取一个1000人的样本得到的样本均数也不可能就恰好等于1.75,这很好理解,抽样是有误差的。于是,我们就要搞清楚现在得到的这个样本均数(1.77)和5年前的总体均数(1.75)的差异仅仅是因为抽样误差,还是确实是因为现在人们的平均身高发生了变化,这里的“变化”用数学的语言表达就是:现在全国男子身高的总体均数到底还是不是1.75,注意这里是“总体均数”,也就是说我们真正关心的是总体,样本只是用来获得总体信息的一个手段。

    我们先假设,现在的总体均数没有变,仍等于1.75。所以,我们抽取的1000人就认为是在这个总体中抽取的一个样本。在零假设情况下,这个总体的均数是1.75,而我们获得的样本计算出来的样本均数是1.77,假设检验的问题就转换成了:在一个总体均数为1.75的总体中,抽到如今这个样本的概率是多少?

    很明显,如果这样问,答案肯定就是0。在先前的文章中,我们知道一个样本相当于数轴上的一个点,而从一个数轴中抽取一个点的概率就是0。然后,你就看到了那句“永远让人费解的话”:P值是抽取到现有样本或更极端情况样本的概率。

    如果把样本割裂来看,抽到一个样本的概率就是0,而“现有样本或更极端情况的样本”中的“或”字表明,P不是指的一个点的概率,而是一个区间的概率,也就是在μ为1.75的总体中,根据抽到的样本计算的样本均值比1.77还要大的样本(比如1.78或1.80),这些样本合起来的概率就是P,而这些样本相对均数为1.75的总体而言便是“更极端样本”了。看到这里,你可以想想这句话怎么用概率式子表示出来呢?

    最后一个问题就是,如何计算P值?这里需要的基础知识是:知道一个变量服从正态分布,怎么计算这个变量在某个区间上的概率。比如,随机变量X服从均值为2.5,标准差为1.6的正态分布,如何求X<4的概率。这种问题的解法应该都学过,我们简单回顾一下。首先将X进行标准化处理(即将变量减去均数然后除以标准差),比如将4标准化:(4-2.5)/1.6=0.94,然后查标准正态概率分布表P(Z≤0.94)=0.8264,于是就得到P(X<4)=0.8264。

    了解概率的计算方法,我们就知道了,假设检验求P值就可以等价为求P(>1.77)(这里只考虑单侧检验,就是我们知道身高不可能比原来还矮,只可能不变或变高,更严谨的写法或者是双侧检验应该是: P(Xμ>1.77μ)P(|\overline X - μ| > |1.77 - μ|),即P值是在零假设下得到那些值的概率,这些值与μ的距离比1.77与μ的距离更远,绝对值理解为“与均值的距离”)。这里的 X\overline X 跟上面的X一样看做一个变量,而1.77就是这个变量的一次取值。仿照上面的例子, X\overline X 是近似服从正态分布的,如果知道其分布的均数(μ)和标准差( σ/nσ/ \sqrt n ),就可以计算出来P( X\overline X>1.77)。

    需要区分的是,因为 [公式] 所在分布的标准差( σ/nσ/ \sqrt n,即上文提及的“标准误”)实际中经常是不知道的,所以需要用样本值来代替( S/nS/ \sqrt n ),而当用到样本值时,经过“标准化”后就不再服从标准正态分布,而是我们无比熟悉的t分布。通过我们的t检验公式(如下,把 S/nS/ \sqrt n 当成“标准差”这个整体来看),不就是一个“标准化”吗:
    t=XμS/n t = \frac{\overline X - μ}{S/ \sqrt n}

    将相关的数据代入,我们就可以得到一个t值,记为t0,通过查阅t分布(结合自由度),得出的P(t>t0)就是我们上面要求的P( X\overline X >1.77),也就是我们常说的P值。

    至此,我们完整地还原了单样本t检验的整个过程。文章的目的是增进大家的理解,所以在某些细节方面笔墨较少(比如在单侧或双侧的问题等),但并不妨碍大家对检验原理和P值意义的认识。相信下次当你再看到P值的定义——抽取现有样本或更极端情况样本的概率,会有所了然。

    我们今天虽仅仅讲解了单样本t检验,但其他检验(如两独立样本t检验、配对t检验,以及单样本方差分析、卡方检验)遵循的思路一致,仅仅只是样本的分布在发生变化。回顾一下,理解这些假设检验方法的精髓其实就在于:把样本均数而不是原始样本个体要当做一个随机变量来看,即我们研究的是 X\overline X,不是X,在实际操作中,我们会得到很多X,只会得到一个 X\overline X,但我们需要通过联想,想象出很多 X\overline X,理解起来就会容易很多。

    展开全文
  • 解释比较好的P值和t检验

    千次阅读 2016-12-21 22:04:12
    http://blog.sina.com.cn/s/blog_53c32df20101aiz5.html
    http://blog.sina.com.cn/s/blog_53c32df20101aiz5.html
    
    展开全文
  • 利用R语言计算回归分析中的t值和p值

    很多同学包括楼主喜欢R语言的原因就是因为它小巧简洁,不需要太多的代码就可以得到很好的结果。比如线性回归时利用lm()就是一个很好的例子,用简单的代码就可以得到回归表达式,以及各种系数检验等等,但是这些结果是怎么呈现到我们面前的呢,接下来就解释R语言lm()的输出结果。

     data(iris)
     fit<-lm(iris$Sepal.Width ~ iris$Petal.Width)
     summary(fit)
    Call:
    lm(formula = iris$Sepal.Width ~ iris$Petal.Width)
    
    Residuals:
         Min       1Q   Median       3Q      Max 
    -1.09907 -0.23626 -0.01064  0.23345  1.17532 
    
    Coefficients:
                     Estimate Std. Error t value Pr(>|t|)    
    (Intercept)       3.30843    0.06210  53.278  < 2e-16 
    iris$Petal.Width -0.20936    0.04374  -4.786 4.07e-06 
    Signif. codes:  0***0.001**0.01*0.05.0.1 ‘ ’ 1
    
    Residual standard error: 0.407 on 148 degrees of freedom
    Multiple R-squared:  0.134, Adjusted R-squared:  0.1282 
    F-statistic: 22.91 on 1 and 148 DF,  p-value: 4.073e-06

    很简单的代码就得到一个线性回归方程,很多书上都已经介绍了线性回归方程的原理和各种解释变量的意义。故仅在此处贴出利用R如何计算出t值

    (tstats <- coef(fit) / sqrt(diag(vcov(fit))))
    (Intercept) Petal.Width 
      53.277950   -4.786461 

    利用R如何计算出P值

     2 * pt(abs(tstats), df = df.residual(fit), lower.tail = FALSE)
     (Intercept)         Petal.Width 
    1.835999e-98     4.073229e-06
    展开全文
  • 1.T检验F检验的由来  一般而言,为了确定从样本(sample)统计结果推论至总体时所犯错的概率,我们会利用统计学家所开发的一些统计方法,进行统计检定。  通过把所得到的统计检定,与统计学家建立了一些随机...
  • 本文主要讨论Python实现一元回归的线性拟合、最小二乘法估计回归参数显著性检验(t检验和p值). 一元线性回归模型是描述两个变量之间相关关系的最简单的回归模型. 通常人们对所要研究的问题首先要收集与它有关的n...
  • 1,T检验F检验的由来一般而言,为了确定从样本(sample)统计结果推论至总体时所犯错的概率,我们会利用统计学家所开发的一些统计方法,进行统计检定。通过把所得到的统计检定,与统计学家建立了一些随机变量的概率...
  • 请教下高手,用matlab做回归分析时,如何提取出检验变量显著性的t统计量和p值啊?比如我现在的数据:X =9 81 729 11 121 133111 121 1331 15 225 337515 225 3...
  • scipy求一些统计量的p值和分位数

    万次阅读 2016-10-06 11:05:33
    scipy.stats模块中有不少涉及计算统计量的子模块 如 scipy.stats.uniform scipy.stats.norm scipy.stats.t scipy.stats.chi2 scipy.stats.f ...这里重点介绍求F统计量的p值和分位数,t统计量,
  • 为增强重选设备不完善度I值与可能偏差Ep值的可比性,应用分配曲线数学模型,计算出相同t值对应的I值与Ep值;通过最小二乘法验证了二者之间的对应关系;分析表明,随着物料平均密度d及分选密度dp的不断增大,I值对Ep值的...
  • 多重检验的p值校正:FWERFDR

    千次阅读 2020-06-23 22:50:15
    先回忆一下假设检验的来两类错误(参考:深入理解假设检验的两类错误功效): 对于多重检验来说,假设做了m次test,V是假阳性的次数,S是真阳性的次数,R是V+S。 列表如下: H0H_0H0​ Do not reject H0H_0H0​ ...
  • 线性回归提取P值

    千次阅读 2019-07-04 23:39:10
    注意summary(fit)生成包含所需所有信息的对象。...通过选择系数矩阵的第4列(存储在摘要对象中)获得p值: summary(fit)$coefficients[,4] summary(fit)$r.squared 试一试str(summary(fit))若要查看...
  • 1,T检验F检验的由来 一般而言,为了确定从样本(sample)统计结果推论至总体时所犯错的概率,我们会利用统计学家所开发的一些统计方法,进行统计检定。 通过把所得到的统计检定,与统计学家建立了一些随机变量...
  • 假设检验与P值的理解

    2021-02-22 18:36:27
    假设检验的目标是回答这个问题,“给定一个样本一个明显的effect...第三步:计算p值(p-value) 第四步:解释p值的结果 P-value的理解 p值就是null hypothesis成立的概率。如果这个值很低(一般小于0.05),那么这个
  • 统计| p值的计算

    万次阅读 2017-05-30 21:36:44
    p值的计算,R语言python的实现 今天来说说频率中假设检验要依赖的评估指标:p值,对,你也许很清楚的知道它表达的意思,但是它是怎么算得的呢?不知道你是否知道呢?这次将介绍几种分布计算p值的方法(套路)。...
  • 置信区间、P值那点事

    千次阅读 2019-04-30 15:33:23
      在假设检验中,我们...  为了给大伙说清楚置信区间和P值的梗,小编以比较常见的两独立样本t检验为例进行分析。样本数据如下:  使用SPSS进行t检验后结果如下:  在检验结果中, 可以容易找到置信区间...
  • 函数文件:ibootp Bootstrap P :一个样本测试 针对用于生成引导程序统计信息... 当 p 太小而无法通过双引导程序校准时,此函数会自动使用学生化引导程序 (bootstrap-t) 附加校正因子来计算 p 以稳定方差。

空空如也

空空如也

1 2 3 4 5 ... 20
收藏数 3,048
精华内容 1,219
关键字:

p值和t值