精华内容
下载资源
问答
  • 统计学三大分布
    千次阅读
    2020-12-19 12:47:36
    更多相关内容
  • 声明因为是方便自己看的,所以笔记中省略了一部分我很熟悉的内容和公式,需要读者有一些数学或统计学基础本笔记为个人整理,仅限学习使用,转载请标明作者和来源。码字不易
  • 统计学三大分布与正态分布的关系.doc
  • 统计学三大分布及正态分布的关系.doc
  • 统计学三大分布和正态分布的关系.doc
  • 统计学三大分布与正态分布的差异.doc
  • 统计学三大分布与正态分布的关系.docx
  • 三大统计分布 1. χ2\chi^2χ2分布 ​ 设随机变量X1,X2,⋯ ,XnX_1,X_2,\cdots,X_nX1​,X2​,⋯,Xn​相互独立且均服从标准正态分布N(0,1)N(0,1)N(0,1),则称随机变量 χ2=X12+X22+⋯+Xn2 \chi^2=X_1^2+X_2^2+\cdots+...

    三大统计分布

    1. χ 2 \chi^2 χ2分布

    ​ 设随机变量 X 1 , X 2 , ⋯   , X n X_1,X_2,\cdots,X_n X1,X2,,Xn相互独立且均服从标准正态分布 N ( 0 , 1 ) N(0,1) N(0,1),则称随机变量
    χ 2 = X 1 2 + X 2 2 + ⋯ + X n 2 \chi^2=X_1^2+X_2^2+\cdots+X_n^2 χ2=X12+X22++Xn2
    所服从的分布是自由度为 n n n χ 2 \chi^2 χ2分布,记为 χ 2 ∼ χ 2 ( n ) \chi^2\sim \chi^2(n) χ2χ2(n)

    χ 2 \chi^2 χ2分布的可加性:设 χ 1 2 ∼ χ 2 ( n 1 ) \chi_1^2\sim \chi^2(n_1) χ12χ2(n1) χ 2 2 ∼ χ 2 ( n 2 ) \chi_2^2\sim \chi^2(n_2) χ22χ2(n2),且 χ 1 2 \chi_1^2 χ12 χ 2 2 \chi_2^2 χ22独立,则 χ 1 2 + χ 2 2 ∼ χ 2 ( n 1 + n 2 ) \chi_1^2+\chi_2^2\sim \chi^2(n_1+n_2) χ12+χ22χ2(n1+n2).

    卡方分布开率密度图

    2. t t t分布

    ​ 设 X ∼ N ( 0 , 1 ) X \sim N(0,1) XN(0,1) Y ∼ χ 2 ( n ) Y \sim \chi^2(n) Yχ2(n),并且 X X X Y Y Y独立,则称随机变量
    t = X Y / n t=\frac{X}{\sqrt{Y/n}} t=Y/n X
    所服从的分布是自由度为 n n n t t t分布,记为 t ∼ t ( n ) t \sim t(n) tt(n).

    在这里插入图片描述

    n n n充分大时,自由度为 n n n t t t分布可近似地看成标准正态分布。当n>30时, t t t分布和标准正态分布就已经非常接近了,但对较小的 n n n, t t t分布与标准正态分布之间有较大的差异,且 t t t分布的尾部比标准正态分布的尾部有着更大的概率,即如果 T ∼ t ( n ) T\sim t(n) Tt(n) X ∼ N ( 0 , 1 ) X \sim N(0,1) XN(0,1),则对于充分大的正数 t 0 t_0 t0,有
    KaTeX parse error: Undefined control sequence: \notag at position 102: …nt t_0\right\} \̲n̲o̲t̲a̲g̲ ̲
    ​ 在描述不是十分罕见的极端事件所服从的统计规律性时, t t t分布是一个比正态分布更加符合实际的概率分布。

    3. F F F分布

    ​ 设 X ∼ χ 2 ( n 1 ) X \sim \chi^2(n_1) Xχ2(n1) Y ∼ χ 2 ( n 2 ) Y \sim \chi^2(n_2) Yχ2(n2),且 X X X Y Y Y独立,则称随机变量
    F = X / n 1 Y / n 2 F=\frac{X/n_1}{Y/n_2} F=Y/n2X/n1
    所服从的分布是自由度为 ( n 1 , n 2 ) (n_1,n_2) (n1,n2) F F F分布,记为 F ∼ F ( n 1 , n 2 ) F \sim F(n_1,n_2) FF(n1,n2)

    ​ 若 F ∼ F ( n 1 , n 2 ) F \sim F(n_1,n_2) FF(n1,n2),则 1 F ∼ F ( n 1 , n 2 ) \frac{1}{F}\sim F(n_1,n_2) F1F(n1,n2)

    在这里插入图片描述

    绘图的R代码:

    卡方分布概率密度图

    x1 <- seq(0,25,0.5)
    > y1 <- dchisq(x1,1)
    > y2 <- dchisq(x1,5)
    > y3 <- dchisq(x1,15)
    > png("D:/Rwork/Picture/卡方分布.png",width=760,height = 480)
    > plot(x1,y1,xlab="卡方分布",ylab="Density",type="l",col="red",lwd=1.6,main="卡方分布图")
    > lines(x1,y2,lwd=1.6,type="l")
    > lines(x1,y3,lwd=1.6,type="l",col="blue")
    > dev.off()
    

    t分布概率密度图

    x1 <- seq(-5,5,0.0001)
    > y1 <- dt(x1,1)
    > y2 <- dt(x1,10)
    > y3 <- dt(x1,30)
    > png("D:/Rwork/Picture/t分布.png",width=760,height = 480)
    > plot(x1,y3,xlab="t分布",ylab="Density",type="l",col="red",lwd=1.6,main="t分布图")
    > lines(x1,y2,lwd=1.6,type="l")
    > lines(x1,y1,lwd=1.6,type="l",col="blue")
    > abline(v=0)
    > dev.off()
    
    
    
    
    
    F分布概率密度图
    ```R
    x1 <- seq(0,6,0.05)
    y1 <- df(x1,10,25)
    y2 <- df(x1,10,5)
    png("D:/Rwork/Picture/F分布.png",width=760,height = 480)
    plot(x1,y1,xlab="F分布",ylab="Density",type="l",col="red",lwd=1.6,main="F分布图")
    lines(x1,y2,lwd=1.6,type="l")
    dev.off()
    
    展开全文
  • 这一节涉及到一些统计学中的难点,当你理解了这些概念后,后面的内容就会相对容易理解了。 文章目录自由度x2x^2x2 分布ttt 分布FFF 分布 自由度 x2x^2x2 分布 ttt 分布 FFF 分布

    从经验可知,大部分的样本分布服从或近似服从「正态分布」。现在我们要看看和正态分布有所异同,也是非常常见的三大分布都是什么样的。

    x 2 x^2 x2 分布

    Y ∼ X 2 ( n ) Y \sim X^2(n) YX2(n) 分布又称卡方分布,它的定义如下:

    基本概念

    X 1 , X 2 , ⋯   , X n X_1, X_2, \cdots, X_n X1,X2,,Xn 来自正态分布总体 N ( 0 , 1 ) N(0, 1) N(0,1) 的样本,则称统计量

    Y = X 1 2 + X 2 2 + ⋯ X n 2 Y = X_1^2 + X_2^2 + \cdots X_n^2 Y=X12+X22+Xn2

    服从自由度为 n n n X 2 X^2 X2 分布,记为 Y ∼ X 2 ( n ) Y \sim X^2(n) YX2(n) X 2 ( n ) X^2(n) X2(n) 分布的概率密度函数为:

    f ( y ) = { 1 2 n / 2 Γ ( n / 2 ) y n / 2 − 1 e − y / 2 y > 0 0 o t h e r w i s e f(y) = \left \{ \begin{matrix} \frac{1}{2^{n/2} \Gamma (n / 2)} y^{n/2-1} e^{-y / 2} & y > 0 \\ 0 & otherwise \end{matrix} \right . f(y)={2n/2Γ(n/2)1yn/21ey/20y>0otherwise

    函数密度图像

    在这里插入图片描述

    这张图主要说明,随着样本数增加,卡方分布的概率密度图像逐渐从类似 l o g log log 的对数图像逐渐接近柏松分布。使得「概率密度图像(PDF)」呈现出和「泊松等待」相类似的特征。
    在这里插入图片描述
    由于组成卡方分布的每个样本 X X X 来自标准正态分布,所以每个独立样本的期望 E ( X ) = 0 E(X) = 0 E(X)=0,方差 D ( X ) = 1 D(X) = 1 D(X)=1

    基本性质

    对于 X 2 X^2 X2 分布来说它有两个性质

    其一:

    X 2 X^2 X2 分布的期望 E ( Y ) = n E(Y) = n E(Y)=n时,它的方差 D ( Y ) = 2 n D(Y) = 2n D(Y)=2n

    其二:

    X 2 X^2 X2 分布具有可加性。
    比如,有 X ∼ Y 2 ( m ) X \sim Y^2(m) XY2(m) Y ∼ Y 2 ( n ) Y \sim Y^2(n) YY2(n),且 X 和 Y 相互独立,有 X + Y ∼ X 2 ( m + n ) X+Y \sim X^2(m+n) X+YX2(m+n)

    例题

    ( X 1 , X 2 , ⋯   , X 6 ) (X_1, X_2, \cdots, X_6) (X1,X2,,X6) 为取自标准正态总体 N ( 0 , 1 ) N(0, 1) N(0,1) 的一个样本,求下列三个统计量的分布
    (1) X 1 2 + X 2 2 X_1^2 + X_2^2 X12+X22
    (2) X 1 2 X_1^2 X12
    (3) X 1 2 + a ( X 2 + X 3 ) 2 + b ( X 4 + X 5 + X 6 ) 2 X_1^2 + a(X_2 + X_3)^2 + b(X_4 + X_5 + X_6)^2 X12+a(X2+X3)2+b(X4+X5+X6)2

    解(1):
    由样本定义可知, X 1 , X 2 , ⋯ X 6 X_1, X_2, \cdots X_6 X1,X2,X6 彼此相互独立,且服从 N ( 0 , 1 ) N(0,1) N(0,1),所以 X 1 2 + X 2 2 ∼ X 2 ( 2 ) X_1^2 + X_2^2 \sim X^2(2) X12+X22X2(2)

    解(2):
    由样本定义可知, X 1 , X 2 , ⋯ X 6 X_1, X_2, \cdots X_6 X1,X2,X6 彼此相互独立,且服从 N ( 0 , 1 ) N(0,1) N(0,1),因此对于单个元素它的卡方分布为 X 1 2 ∼ X 2 ( 1 ) X_1^2 \sim X^2(1) X12X2(1)

    解(3):
    从卡方分布的定义出发,我们令

    Y 1 = X 1 2 Y 2 = a ( X 2 + X 3 ) 2 Y 3 = b ( X 4 + X 5 + X 6 ) 2 Y_1 = X_1^2 \\ Y_2 = a(X_2 + X_3)^2 \\ Y_3 = b(X_4 + X_5 + X_6)^2 Y1=X12Y2=a(X2+X3)2Y3=b(X4+X5+X6)2

    对于 Y 1 = X 1 2 Y_1 = X_1^2 Y1=X12来说,由于元素来自标准正态总体,所以 Y 1 Y_1 Y1 的期望 E ( Y 1 ) = 0 E(Y_1) = 0 E(Y1)=0,方差 D ( Y 1 ) = 1 D(Y_1) = 1 D(Y1)=1,所以 Y 1 ∼ N ( 0 , 1 ) Y_1 \sim N(0, 1) Y1N(0,1)

    对于 Y 2 = a ( X 2 + X 3 ) 2 Y_2 = a(X_2 + X_3)^2 Y2=a(X2+X3)2 来说,它有两个离散的样本,在 《概率论基础 —— 8.数学期望、方差、协方差》 一节中,我们可以知道由样本 ( X 2 , X 3 ) (X_2, X_3) (X2,X3) 组成的离散集合,我们可以通过离散型期望、方差的计算方法得到 E ( X 2 , X 3 ) = E ( X 2 ) + E ( X 3 ) = 0 E(X_2, X_3) = E(X_2) + E(X_3) = 0 E(X2,X3)=E(X2)+E(X3)=0,其方差 D ( X 2 , X 3 ) = D ( X 2 ) + D ( X 3 ) = 2 D(X_2, X_3) = D(X_2) +D(X_3) = 2 D(X2,X3)=D(X2)+D(X3)=2,于是有 ( X 2 + X 3 ) ∼ N ( 0 , 2 ) (X_2 + X_3) \sim N(0, 2) (X2+X3)N(0,2) ,我们对正太分布进行标准化,代入如下公式:

    X − μ σ = X − 0 2 = X 2 \frac{X - \mu}{\sigma} = \frac{X - 0}{\sqrt{2}} = \frac{X}{\sqrt 2} σXμ=2 X0=2 X

    于是我们得到标准正态分布 X 2 + X 3 2 ∼ N ( 0 , 1 ) \frac{X_2 + X_3}{\sqrt 2} \sim N(0, 1) 2 X2+X3N(0,1)

    同理,对于 Y 3 = b ( X 4 + X 5 + X 6 ) 2 Y_3 = b(X_4 + X_5 + X_6)^2 Y3=b(X4+X5+X6)2,它的样本集合 ( X 4 , X 5 , X 6 ) (X_4, X_5, X_6) (X4,X5,X6) 的期望为0,方差为3,其标准正态分布为 X 4 + X 5 + X 6 3 \frac{X_4 + X_5 + X_6}{\sqrt 3} 3 X4+X5+X6

    再从卡方分布的基本概念出发,拼凑出它应该为

    X 2 = X 1 2 + ( X 2 + X 3 2 ) 2 + ( X 4 + X 5 + X 6 3 ) 2 = X 1 2 + ( X 2 + X 3 ) 2 2 + ( X 4 + X 5 + X 6 ) 2 3 X^2 = X_1^2 + \left (\frac{X_2 + X_3}{\sqrt 2} \right )^2 + \left ( \frac{X_4 + X_5 + X_6}{\sqrt 3} \right )^2 = X_1^2 + \frac{(X_2 + X_3)^2}{2} + \frac{(X_4 + X_5 + X_6)^2}{3} X2=X12+(2 X2+X3)2+(3 X4+X5+X6)2=X12+2(X2+X3)2+3(X4+X5+X6)2

    所以, a = 1 2 a=\frac{1}{2} a=21 b = 1 3 b = \frac{1}{3} b=31

    t t t 分布

    基本概念

    X ∼ N ( 0 , 1 ) X \sim N(0, 1) XN(0,1) Y ∼ X 2 ( n ) Y \sim X^2(n) YX2(n),且 X, Y 相互独立,则称随机变量
    t = X Y / n t = \frac{X}{\sqrt{Y / n}} t=Y/n X
    服从自由度为 n n n t t t 分布,记为 t ∼ t ( n ) t \sim t(n) tt(n) t ( n ) t(n) t(n) 分布的概率密度函数函数为:

    h ( t ) = Γ [ ( n + 1 ) / 2 ] π n Γ ( n / 2 ) ( 1 + t 2 n ) − ( n + 1 ) / 2 , − ∞ < t < ∞ h(t) = \frac{\Gamma [(n+1) / 2]}{\sqrt{\pi n} \Gamma(n / 2)} (1 + \frac{t^2}{n})^{-(n+1) / 2}, -\infty < t < \infty h(t)=πn Γ(n/2)Γ[(n+1)/2](1+nt2)(n+1)/2,<t<

    函数密度图像

    在这里插入图片描述

    例题

    假设总体 X ∼ N ( 0 , 3 2 ) X \sim N(0, 3^2) XN(0,32) X 1 , X 2 , ⋯ X n X_1, X_2, \cdots X_n X1,X2,Xn 是来自总体X的简单随机样本,则统计量
    Y = X 1 + X 2 + X 3 + X 4 X 5 2 + X 6 2 + X 7 2 + X 8 2 Y = \frac{X_1 + X_2 + X_3 + X_4}{\sqrt{X_5^2 + X_6^2 + X_7^2 + X_8^2}} Y=X52+X62+X72+X82 X1+X2+X3+X4 服从自由度为____ 的 __________ 分布。

    解:

    我们从t分布的基本定义入手

    t = X Y / n t = \frac{X}{\sqrt{Y / n}} t=Y/n X

    注意对于t分布的要求,其中的元素必须服从 X ∼ N ( 0 , 1 ) X \sim N(0, 1) XN(0,1),分母的Y是卡方分布, Y ∼ X 2 ( n ) Y \sim X^2(n) YX2(n)

    所以令 Z = X 1 + X 2 + X 3 + X 4 ∼ N ( 0 , 36 ) Z=X_1 + X_2 + X_3 + X_4 \sim N(0, 36) Z=X1+X2+X3+X4N(0,36),我们可以标准化这个分布后得到 Z 6 ∼ N ( 0 , 1 ) \frac{Z}{6} \sim N(0, 1) 6ZN(0,1)

    分母虽然看起来很像卡方分布,但是由于假设的总体 X ∼ N ( 0 , 3 2 ) X \sim N(0, 3^2) XN(0,32),所以我们要先对它进行标准化后,可以得到 X i 3 ∼ N ( 0 , 1 ) \frac{X_i}{3} \sim N(0, 1) 3XiN(0,1),然后凑出一个卡方分布得到

    Y ′ = ( X 5 3 ) 2 + ( X 6 3 ) 2 + ( X 7 3 ) 2 + ( X 8 3 ) 2 = X 5 2 + X 6 2 + X 7 2 + X 8 2 9 ∼ X 2 ( 4 ) Y' = \left ( \frac{X_5}{3} \right )^2 + \left ( \frac{X_6}{3} \right )^2 + \left ( \frac{X_7}{3} \right )^2 + \left ( \frac{X_8}{3} \right )^2 = \frac{X_5^2 + X_6^2 + X_7^2 + X_8^2}{9} \sim X^2(4) Y=(3X5)2+(3X6)2+(3X7)2+(3X8)2=9X52+X62+X72+X82X2(4)

    然后分别把得到的 Z Z Z Y ′ Y' Y 代入 t t t 分布公式中,于是得到

    t = X / 6 Y ′ / 4 = 1 6 X 1 + X 2 + X 3 + X 4 X 5 2 + X 6 2 + X 7 2 + X 8 2 9 × 4 = X 1 + X 2 + X 3 + X 4 X 5 2 + X 6 2 + X 7 2 + X 8 2 ∼ t ( 4 ) t = \frac{X / 6}{\sqrt{Y' / 4}} = \frac{1}{6} \frac{X_1 + X_2 + X_3 + X_4}{\sqrt{ \frac{X_5^2 + X_6^2 + X_7^2 + X_8^2}{9 \times 4}}} = \frac{X_1 + X_2 + X_3 + X_4}{\sqrt{X_5^2 + X_6^2 + X_7^2 + X_8^2}} \sim t(4) t=Y/4 X/6=619×4X52+X62+X72+X82 X1+X2+X3+X4=X52+X62+X72+X82 X1+X2+X3+X4t(4)

    所以它是自由度为4的t分布。

    F F F 分布

    基本概念

    U ∼ X 2 ( n 1 ) U \sim X^2(n_1) UX2(n1) V ∼ X 2 ( n 2 ) V \sim X^2(n_2) VX2(n2),且 U U U V V V 相互独立,则称随机变量

    F = U / n 1 V / n 2 F = \frac{U / n_1}{V / n_2} F=V/n2U/n1

    服从自由度为 ( n 1 , n 2 ) (n_1, n_2) (n1,n2) F F F 分布,记为 F ∼ F ( n 1 , n 2 ) F \sim F(n_1, n_2) FF(n1,n2) F ( n 1 , n 2 ) F(n_1, n_2) F(n1,n2) 分布的概率密度函数为:

    φ ( y ) = { Γ [ ( n 1 + n 2 ) / 2 ] ( n 1 / n 2 ) n 1 / 2 y ( n 1 / 2 ) − 1 1 y > 0 0 o t h e r w i s e \varphi (y) = \left \{ \begin{matrix} \frac{\Gamma [(n_1 + n_2) / 2] (n_1 / n_2)^{n_1 / 2} y^{(n_1 / 2) - 1}}{1} & y > 0 \\ 0 & otherwise \end{matrix} \right . φ(y)={1Γ[(n1+n2)/2](n1/n2)n1/2y(n1/2)10y>0otherwise

    函数密度图像

    在这里插入图片描述

    例题

    设随机变量 T ∼ t ( n ) T \sim t(n) Tt(n) F = 1 T 2 F = \frac{1}{T^2} F=T21 求随机变量F的分布

    解:

    先从 t t t 分布的定义出发,它是

    t = X Y / n t = \frac{X}{\sqrt{Y / n}} t=Y/n X

    其中 X ∼ N ( 0 , 1 ) X \sim N(0, 1) XN(0,1) Y ∼ X 2 ( n ) Y \sim X^2(n) YX2(n),所以我们得到 T = X Y / n T = \frac{X}{\sqrt{Y / n}} T=Y/n X。代入 F = 1 T 2 F = \frac{1}{T^2} F=T21 后,我们有

    F = Y / n X 2 F = \frac{Y / n}{X^2} F=X2Y/n

    由于我们前面已经假设了 X ∼ N ( 0 , 1 ) X \sim N(0, 1) XN(0,1),所以当 Y ′ = X 2 Y' = X^2 Y=X2 时,它自然也是卡方分布,且只有一个元素,于是有 Y ′ ∼ X 2 ( 1 ) Y' \sim X^2(1) YX2(1),参考F分布的定义,我们有

    F ′ = U / n 1 V / n 2 F' = \frac{U / n_1}{V / n_2} F=V/n2U/n1

    U U U V V V 均是卡方分布,我们代入已知的 Y / n Y / n Y/n U / n 1 U / n_1 U/n1 Y ′ Y' Y 可等价于 Y ′ / 1 Y' / 1 Y/1 并且 Y Y Y Y ′ Y' Y互相独立,于是也可以代入到 V / n 2 V/n_2 V/n2,得到最终 F ′ F' F 的分布

    F ′ = Y / n Y ′ / 1 = Y / n X 2 F' = \frac{Y / n}{ Y' / 1} = \frac{Y / n}{X^2} F=Y/1Y/n=X2Y/n

    所以 F = F ′ F = F' F=F,于是 F ∼ F ( n , 1 ) F \sim F(n , 1) FF(n,1)

    展开全文
  • 数理统计三大分布:卡方分布、t分布、F分布正态分布卡方分布定义概率密度函数性质t分布定义概率密度函数性质F分布定义概率密度函数性质Attention 正态分布 由于χ2\chi^2χ2(chi-squard)分布、t分布、F分布都是由...

    正态分布

    由于 χ 2 \chi^2 χ2(chi-squard)分布、t分布、F分布都是由正态分布构造的,首先对正态分布密度函数定义有

    P ( x ) = 1 2 π σ exp ⁡ − ( x − μ ) 2 2 σ 2 P(x) = \frac{1}{\sqrt{2\pi}\sigma}\exp^{-\frac{(x-\mu)^2}{2\sigma^2}} P(x)=2π σ1exp2σ2(xμ)2

    而标准化的正态分布为

    P ( x ) = 1 2 π exp ⁡ − x 2 2 P(x) = \frac{1}{\sqrt{2\pi}}\exp^{-\frac{x^2}{2}} P(x)=2π 1exp2x2

    卡方分布

    定义

    X 1 , X 2 , . . . . . . , X n X_1,X_2,......,X_n X1,X2,......,Xn相互独立并且都满足标准正态分布(0,1),则称 r . v . r.v. r.v.
    Y = ∑ i = 1 n X i 2 Y = \sum_{i=1}^{n}X_i^2 Y=i=1nXi2 服从自由度为 n n n χ 2 \chi^2 χ2分布,记为 Y ∼ χ 2 ( n ) Y \sim \chi^2(n) Yχ2(n)

    概率密度函数

    f ( x ; n ) = 1 2 n 2 Γ ( n 2 ) x n 2 − 1 e − x 2 ( x > 0 ) f(x;n)=\frac{1}{2^{\frac{n}{2}}\Gamma(\frac{n}{2})}x^{\frac{n}{2}-1}e^{-\frac{x}{2}}(x>0) f(x;n)=22nΓ(2n)1x2n1e2xx>0
    其中 Γ ( s ) = ∫ 0 ∞ e − t t s − 1 d t ( s > 0 ) \Gamma(s) = \int_{0}^{\infty}e^{-t}t^{s-1}dt(s>0) Γ(s)=0etts1dt(s>0),对于伽马函数 Γ ( ⋅ ) \Gamma(·) Γ()先挖个坑(可以暂时先看这个也挺不错的)
    对于不同参数的密度函数有:
    来源:https://www.zhihu.com/question/304500591/answer/729785501

    性质

    t分布

    定义

    r . v . Z , Y r.v.Z,Y r.v.Z,Y,其中 Z ∼ N ( 0 , 1 ) , X ∼ χ 2 ( n ) Z\sim N(0,1),X\sim \chi^2(n) ZN(0,1),Xχ2(n),则定义 r . v . T = Z X / n r.v.T = \frac{Z}{\sqrt{X/n}} r.v.T=X/n Z为服从自由度为n的t分布。
    对于不同参数的t分布密度函数有图如下:
    在这里插入图片描述

    概率密度函数

    性质

    t分布主要是检验均值是否相同,在小样本中有着广泛的应用。同时t分布有着厚尾性质,对于一些性质不那么好的点比较宽容(比如t-SNE对于SNE的改进)。
    特别值得注意的是,t(1)为Cauchy分布,就是那个令人讨厌的没有高阶矩的可恶的家伙,而当 n → ∞ n \rightarrow \infty n时候,t分布就趋向于正态分布。

    F分布

    定义

    假设 r . v . X , Y r.v. X,Y r.v.X,Y分别满足 X ∼ χ 2 ( n 1 ) , Y ∼ χ 2 ( n 2 ) X\sim \chi^2(n_1),Y \sim\chi^2(n_2) Xχ2(n1),Yχ2(n2),则称 r . v . Z = X / n 1 Y / n 2 r.v. Z = \frac{X/n_1}{Y/n_2} r.v.Z=Y/n2X/n1为F分布

    概率密度函数

    对于不同参数的F分布密度函数有图如下:
    在这里插入图片描述

    性质

    我个人对F分布第一次有深刻印象是在方差检验中,现在回头来看F检验的定义,确定F检验是用来检验方差是否不同。

    Attention

    这三个分布是数理统计常用的分布,但特别要注意的是,t分布和F分布只能用来检验连续性数据,所以当检验数据特别稀疏的时候容易导致误判,而 χ 2 \chi^2 χ2分布都可以。

    展开全文
  • 统计学高清思维导图-抽样分布
  • 当用与数据科学相关的必备统计只是武装自己时,很重要的须知内容之一是分布(Distribution)。正如概率的概念引出了数学计算,分布协助将隐藏的真香可视化。下面是几种必须了解的重要分布。 1.泊松分布(Poisson ...
  • 统计三大分布 1. χ2\chi^2χ2分布 本质:χ2\chi^2χ2分布是由正态分布派生出来的一种分布 定义:设X1,X2,...,XnX_1,X_2,...,X_nX1​,X2​,...,Xn​相互独立,都服从正态分布N(0,1)N(0,1)N(0,1),则称随机变量:...
  • 统计学三大相关系数

    千次阅读 2020-08-16 16:36:11
    三大相关系数分别是pearson[皮尔森]、spearman[斯皮尔曼] 和 kendall[肯德尔] 反应的都是两个变量之间变化趋势的方向以及程度,其值范围为-1到+1,0表示两个变量不相关,正值表示正相关,负值表示负相关,值越表示...
  • 介绍多点地质统计学及其用于维岩心孔隙结构建模的原理和方法。基于多点地质统计方法,以均质性较好的Fontaineblean砂岩的二维薄片为基础,重构维孔隙结构模型,并且应用局部孔隙度理论和渗流概率函数进行准确性...
  • 二项分布 二项分布是一个离散概率分布 在n次独立的实验中, 事件A 发生的概率为p(不发生的概率则为1-p),那么最终事件A 发生k(k大于等于0,小于等于n)次的概率为: nCk * p^k * (1-p)^(n-k) 其中 nCk 的意思是 组合(n...
  • 统计学原理》与MATLAB编程-第章 抽样和抽样分布
  • 统计学
  • 数据集中趋势是统计学中的其中一种指标之一,集中趋势又称 “数据的中心位置”,它代表了一组数据在一定时间、空间条件下的共同性质和一般水平。其表示方式通常有种:平均数、众数和中位数
  • 统计学——数据分布特征与适用的描述统计量数据分布特征1、集中趋势(1)分类数据:众数(2)顺序数据:中位数(3)数值型数据:平均数2、离散程度(1)分类数据:异众比率(2)顺序数据:四分位差(3)数值型数据:...
  • 统计学三大相关系数

    万次阅读 2018-08-24 11:11:42
    个相关性系数(pearson, spearman, kendall)反应的都是两个变量之间变化趋势的方向以及程度,其值范围为-1到+1,0表示两个变量不相关,正值表示正相关,负值表示负相关,值越表示相关性越强。 person ...
  • 总的来讲,个相关性系数(pearson, spearman, kendall)反应的都是两个变量之间变化趋势的方向以及程度,其值范围为-1到+1,0表示两个变量不相关,正值表示正相关,负值表示负相关,值越表示
  • [1]统计学三大相关性系数(pearson、spearman、kendall)_t15600624671的博客-CSDN博客_统计学三大相关性系数 [2]统计学三大相关系数_Li_318的博客-CSDN博客_三大相关系数 [3]W. XU, C. CHANG, Y. S. HUNG, S....
  • 0.0 神说,要有正态分布,于是就有了正态分布。 0.1 神看正态分布是好的,就让随机误差都随了正态分布。 0.2 正态分布的奇妙之处,就是许多看似随机事件竟然服从一个表达式就能表达的分布,如同上帝之手特意为之。...
  • 统计学之正态分布检验

    千次阅读 2019-08-12 23:07:35
    统计学之正态分布检验 本次主要是对数据集数据进行正态分布检验,数据集地址为:http://jse.amstat.org/datasets/normtemp.dat.txt 主要包括列数据,体温(F)、性别(1:男,2:女)、心率(次/分钟) 1.数据统计...
  • 学习统计学三大相关系数

    千次阅读 2020-08-24 10:12:21
    Pearson相关系数 ...2、实验数据之间的差距不能太,或者说皮尔森相关性系数受异常值的影响比较。例如心跳与跑步的例子,万一这个人的心脏不太好,跑到一定速度后承受不了,突发心脏病,那这时候我
  • 本篇目录参考资料:电子工业出版社的《深入浅出统计学》前言具体内容一、χ2\chi ^2χ2分布的性质二、用χ2\chi ^2χ2分布检验评估差异1、初始数据2、计算步骤3、知识进阶、用χ2\chi ^2χ2分布检验独立性1、初始...

空空如也

空空如也

1 2 3 4 5 ... 20
收藏数 27,673
精华内容 11,069
关键字:

统计学三大分布

友情链接: OPC-Automation-2.0.rar