Y
∼
X
2
(
n
)
Y \sim X^2(n)
Y∼X2(n) 分布又称卡方分布,它的定义如下:
基本概念
设
X
1
,
X
2
,
⋯
,
X
n
X_1, X_2, \cdots, X_n
X1,X2,⋯,Xn 来自正态分布总体
N
(
0
,
1
)
N(0, 1)
N(0,1) 的样本,则称统计量
Y
=
X
1
2
+
X
2
2
+
⋯
X
n
2
Y = X_1^2 + X_2^2 + \cdots X_n^2
Y=X12+X22+⋯Xn2
服从自由度为
n
n
n 的
X
2
X^2
X2 分布,记为
Y
∼
X
2
(
n
)
Y \sim X^2(n)
Y∼X2(n),
X
2
(
n
)
X^2(n)
X2(n) 分布的概率密度函数为:
f
(
y
)
=
{
1
2
n
/
2
Γ
(
n
/
2
)
y
n
/
2
−
1
e
−
y
/
2
y
>
0
0
o
t
h
e
r
w
i
s
e
f(y) = \left \{ \begin{matrix} \frac{1}{2^{n/2} \Gamma (n / 2)} y^{n/2-1} e^{-y / 2} & y > 0 \\ 0 & otherwise \end{matrix} \right .
f(y)={2n/2Γ(n/2)1yn/2−1e−y/20y>0otherwise
函数密度图像
这张图主要说明,随着样本数增加,卡方分布的概率密度图像逐渐从类似
l
o
g
log
log 的对数图像逐渐接近柏松分布。使得「概率密度图像(PDF)」呈现出和「泊松等待」相类似的特征。 由于组成卡方分布的每个样本
X
X
X 来自标准正态分布,所以每个独立样本的期望
E
(
X
)
=
0
E(X) = 0
E(X)=0,方差
D
(
X
)
=
1
D(X) = 1
D(X)=1。
基本性质
对于
X
2
X^2
X2 分布来说它有两个性质
其一:
当
X
2
X^2
X2 分布的期望
E
(
Y
)
=
n
E(Y) = n
E(Y)=n时,它的方差
D
(
Y
)
=
2
n
D(Y) = 2n
D(Y)=2n
其二:
X
2
X^2
X2 分布具有可加性。 比如,有
X
∼
Y
2
(
m
)
X \sim Y^2(m)
X∼Y2(m) 和
Y
∼
Y
2
(
n
)
Y \sim Y^2(n)
Y∼Y2(n),且 X 和 Y 相互独立,有
X
+
Y
∼
X
2
(
m
+
n
)
X+Y \sim X^2(m+n)
X+Y∼X2(m+n)
例题
设
(
X
1
,
X
2
,
⋯
,
X
6
)
(X_1, X_2, \cdots, X_6)
(X1,X2,⋯,X6) 为取自标准正态总体
N
(
0
,
1
)
N(0, 1)
N(0,1) 的一个样本,求下列三个统计量的分布 (1)
X
1
2
+
X
2
2
X_1^2 + X_2^2
X12+X22 (2)
X
1
2
X_1^2
X12 (3)
X
1
2
+
a
(
X
2
+
X
3
)
2
+
b
(
X
4
+
X
5
+
X
6
)
2
X_1^2 + a(X_2 + X_3)^2 + b(X_4 + X_5 + X_6)^2
X12+a(X2+X3)2+b(X4+X5+X6)2
解(1): 由样本定义可知,
X
1
,
X
2
,
⋯
X
6
X_1, X_2, \cdots X_6
X1,X2,⋯X6 彼此相互独立,且服从
N
(
0
,
1
)
N(0,1)
N(0,1),所以
X
1
2
+
X
2
2
∼
X
2
(
2
)
X_1^2 + X_2^2 \sim X^2(2)
X12+X22∼X2(2)
解(2): 由样本定义可知,
X
1
,
X
2
,
⋯
X
6
X_1, X_2, \cdots X_6
X1,X2,⋯X6 彼此相互独立,且服从
N
(
0
,
1
)
N(0,1)
N(0,1),因此对于单个元素它的卡方分布为
X
1
2
∼
X
2
(
1
)
X_1^2 \sim X^2(1)
X12∼X2(1)
解(3): 从卡方分布的定义出发,我们令
Y
1
=
X
1
2
Y
2
=
a
(
X
2
+
X
3
)
2
Y
3
=
b
(
X
4
+
X
5
+
X
6
)
2
Y_1 = X_1^2 \\ Y_2 = a(X_2 + X_3)^2 \\ Y_3 = b(X_4 + X_5 + X_6)^2
Y1=X12Y2=a(X2+X3)2Y3=b(X4+X5+X6)2
对于
Y
1
=
X
1
2
Y_1 = X_1^2
Y1=X12来说,由于元素来自标准正态总体,所以
Y
1
Y_1
Y1 的期望
E
(
Y
1
)
=
0
E(Y_1) = 0
E(Y1)=0,方差
D
(
Y
1
)
=
1
D(Y_1) = 1
D(Y1)=1,所以
Y
1
∼
N
(
0
,
1
)
Y_1 \sim N(0, 1)
Y1∼N(0,1)
对于
Y
2
=
a
(
X
2
+
X
3
)
2
Y_2 = a(X_2 + X_3)^2
Y2=a(X2+X3)2 来说,它有两个离散的样本,在 《概率论基础 —— 8.数学期望、方差、协方差》 一节中,我们可以知道由样本
(
X
2
,
X
3
)
(X_2, X_3)
(X2,X3) 组成的离散集合,我们可以通过离散型期望、方差的计算方法得到
E
(
X
2
,
X
3
)
=
E
(
X
2
)
+
E
(
X
3
)
=
0
E(X_2, X_3) = E(X_2) + E(X_3) = 0
E(X2,X3)=E(X2)+E(X3)=0,其方差
D
(
X
2
,
X
3
)
=
D
(
X
2
)
+
D
(
X
3
)
=
2
D(X_2, X_3) = D(X_2) +D(X_3) = 2
D(X2,X3)=D(X2)+D(X3)=2,于是有
(
X
2
+
X
3
)
∼
N
(
0
,
2
)
(X_2 + X_3) \sim N(0, 2)
(X2+X3)∼N(0,2) ,我们对正太分布进行标准化,代入如下公式:
X
−
μ
σ
=
X
−
0
2
=
X
2
\frac{X - \mu}{\sigma} = \frac{X - 0}{\sqrt{2}} = \frac{X}{\sqrt 2}
σX−μ=2X−0=2X
于是我们得到标准正态分布
X
2
+
X
3
2
∼
N
(
0
,
1
)
\frac{X_2 + X_3}{\sqrt 2} \sim N(0, 1)
2X2+X3∼N(0,1)
同理,对于
Y
3
=
b
(
X
4
+
X
5
+
X
6
)
2
Y_3 = b(X_4 + X_5 + X_6)^2
Y3=b(X4+X5+X6)2,它的样本集合
(
X
4
,
X
5
,
X
6
)
(X_4, X_5, X_6)
(X4,X5,X6) 的期望为0,方差为3,其标准正态分布为
X
4
+
X
5
+
X
6
3
\frac{X_4 + X_5 + X_6}{\sqrt 3}
3X4+X5+X6
再从卡方分布的基本概念出发,拼凑出它应该为
X
2
=
X
1
2
+
(
X
2
+
X
3
2
)
2
+
(
X
4
+
X
5
+
X
6
3
)
2
=
X
1
2
+
(
X
2
+
X
3
)
2
2
+
(
X
4
+
X
5
+
X
6
)
2
3
X^2 = X_1^2 + \left (\frac{X_2 + X_3}{\sqrt 2} \right )^2 + \left ( \frac{X_4 + X_5 + X_6}{\sqrt 3} \right )^2 = X_1^2 + \frac{(X_2 + X_3)^2}{2} + \frac{(X_4 + X_5 + X_6)^2}{3}
X2=X12+(2X2+X3)2+(3X4+X5+X6)2=X12+2(X2+X3)2+3(X4+X5+X6)2
所以,
a
=
1
2
a=\frac{1}{2}
a=21,
b
=
1
3
b = \frac{1}{3}
b=31
t
t
t 分布
基本概念
设
X
∼
N
(
0
,
1
)
X \sim N(0, 1)
X∼N(0,1),
Y
∼
X
2
(
n
)
Y \sim X^2(n)
Y∼X2(n),且 X, Y 相互独立,则称随机变量
t
=
X
Y
/
n
t = \frac{X}{\sqrt{Y / n}}
t=Y/nX 服从自由度为
n
n
n 的
t
t
t 分布,记为
t
∼
t
(
n
)
t \sim t(n)
t∼t(n)。
t
(
n
)
t(n)
t(n) 分布的概率密度函数函数为:
h
(
t
)
=
Γ
[
(
n
+
1
)
/
2
]
π
n
Γ
(
n
/
2
)
(
1
+
t
2
n
)
−
(
n
+
1
)
/
2
,
−
∞
<
t
<
∞
h(t) = \frac{\Gamma [(n+1) / 2]}{\sqrt{\pi n} \Gamma(n / 2)} (1 + \frac{t^2}{n})^{-(n+1) / 2}, -\infty < t < \infty
h(t)=πnΓ(n/2)Γ[(n+1)/2](1+nt2)−(n+1)/2,−∞<t<∞
函数密度图像
例题
假设总体
X
∼
N
(
0
,
3
2
)
X \sim N(0, 3^2)
X∼N(0,32),
X
1
,
X
2
,
⋯
X
n
X_1, X_2, \cdots X_n
X1,X2,⋯Xn 是来自总体X的简单随机样本,则统计量
Y
=
X
1
+
X
2
+
X
3
+
X
4
X
5
2
+
X
6
2
+
X
7
2
+
X
8
2
Y = \frac{X_1 + X_2 + X_3 + X_4}{\sqrt{X_5^2 + X_6^2 + X_7^2 + X_8^2}}
Y=X52+X62+X72+X82X1+X2+X3+X4 服从自由度为____ 的 __________ 分布。
解:
我们从t分布的基本定义入手
t
=
X
Y
/
n
t = \frac{X}{\sqrt{Y / n}}
t=Y/nX
注意对于t分布的要求,其中的元素必须服从
X
∼
N
(
0
,
1
)
X \sim N(0, 1)
X∼N(0,1),分母的Y是卡方分布,
Y
∼
X
2
(
n
)
Y \sim X^2(n)
Y∼X2(n)。
所以令
Z
=
X
1
+
X
2
+
X
3
+
X
4
∼
N
(
0
,
36
)
Z=X_1 + X_2 + X_3 + X_4 \sim N(0, 36)
Z=X1+X2+X3+X4∼N(0,36),我们可以标准化这个分布后得到
Z
6
∼
N
(
0
,
1
)
\frac{Z}{6} \sim N(0, 1)
6Z∼N(0,1)。
分母虽然看起来很像卡方分布,但是由于假设的总体
X
∼
N
(
0
,
3
2
)
X \sim N(0, 3^2)
X∼N(0,32),所以我们要先对它进行标准化后,可以得到
X
i
3
∼
N
(
0
,
1
)
\frac{X_i}{3} \sim N(0, 1)
3Xi∼N(0,1),然后凑出一个卡方分布得到
Y
′
=
(
X
5
3
)
2
+
(
X
6
3
)
2
+
(
X
7
3
)
2
+
(
X
8
3
)
2
=
X
5
2
+
X
6
2
+
X
7
2
+
X
8
2
9
∼
X
2
(
4
)
Y' = \left ( \frac{X_5}{3} \right )^2 + \left ( \frac{X_6}{3} \right )^2 + \left ( \frac{X_7}{3} \right )^2 + \left ( \frac{X_8}{3} \right )^2 = \frac{X_5^2 + X_6^2 + X_7^2 + X_8^2}{9} \sim X^2(4)
Y′=(3X5)2+(3X6)2+(3X7)2+(3X8)2=9X52+X62+X72+X82∼X2(4)
然后分别把得到的
Z
Z
Z 和
Y
′
Y'
Y′ 代入
t
t
t 分布公式中,于是得到
t
=
X
/
6
Y
′
/
4
=
1
6
X
1
+
X
2
+
X
3
+
X
4
X
5
2
+
X
6
2
+
X
7
2
+
X
8
2
9
×
4
=
X
1
+
X
2
+
X
3
+
X
4
X
5
2
+
X
6
2
+
X
7
2
+
X
8
2
∼
t
(
4
)
t = \frac{X / 6}{\sqrt{Y' / 4}} = \frac{1}{6} \frac{X_1 + X_2 + X_3 + X_4}{\sqrt{ \frac{X_5^2 + X_6^2 + X_7^2 + X_8^2}{9 \times 4}}} = \frac{X_1 + X_2 + X_3 + X_4}{\sqrt{X_5^2 + X_6^2 + X_7^2 + X_8^2}} \sim t(4)
t=Y′/4X/6=619×4X52+X62+X72+X82X1+X2+X3+X4=X52+X62+X72+X82X1+X2+X3+X4∼t(4)
所以它是自由度为4的t分布。
F
F
F 分布
基本概念
设
U
∼
X
2
(
n
1
)
U \sim X^2(n_1)
U∼X2(n1),
V
∼
X
2
(
n
2
)
V \sim X^2(n_2)
V∼X2(n2),且
U
U
U,
V
V
V 相互独立,则称随机变量
F
=
U
/
n
1
V
/
n
2
F = \frac{U / n_1}{V / n_2}
F=V/n2U/n1
服从自由度为
(
n
1
,
n
2
)
(n_1, n_2)
(n1,n2) 的
F
F
F 分布,记为
F
∼
F
(
n
1
,
n
2
)
F \sim F(n_1, n_2)
F∼F(n1,n2)。
F
(
n
1
,
n
2
)
F(n_1, n_2)
F(n1,n2) 分布的概率密度函数为:
φ
(
y
)
=
{
Γ
[
(
n
1
+
n
2
)
/
2
]
(
n
1
/
n
2
)
n
1
/
2
y
(
n
1
/
2
)
−
1
1
y
>
0
0
o
t
h
e
r
w
i
s
e
\varphi (y) = \left \{ \begin{matrix} \frac{\Gamma [(n_1 + n_2) / 2] (n_1 / n_2)^{n_1 / 2} y^{(n_1 / 2) - 1}}{1} & y > 0 \\ 0 & otherwise \end{matrix} \right .
φ(y)={1Γ[(n1+n2)/2](n1/n2)n1/2y(n1/2)−10y>0otherwise
函数密度图像
例题
设随机变量
T
∼
t
(
n
)
T \sim t(n)
T∼t(n),
F
=
1
T
2
F = \frac{1}{T^2}
F=T21 求随机变量F的分布
解:
先从
t
t
t 分布的定义出发,它是
t
=
X
Y
/
n
t = \frac{X}{\sqrt{Y / n}}
t=Y/nX
其中
X
∼
N
(
0
,
1
)
X \sim N(0, 1)
X∼N(0,1),
Y
∼
X
2
(
n
)
Y \sim X^2(n)
Y∼X2(n),所以我们得到
T
=
X
Y
/
n
T = \frac{X}{\sqrt{Y / n}}
T=Y/nX。代入
F
=
1
T
2
F = \frac{1}{T^2}
F=T21 后,我们有
F
=
Y
/
n
X
2
F = \frac{Y / n}{X^2}
F=X2Y/n
由于我们前面已经假设了
X
∼
N
(
0
,
1
)
X \sim N(0, 1)
X∼N(0,1),所以当
Y
′
=
X
2
Y' = X^2
Y′=X2 时,它自然也是卡方分布,且只有一个元素,于是有
Y
′
∼
X
2
(
1
)
Y' \sim X^2(1)
Y′∼X2(1),参考F分布的定义,我们有
F
′
=
U
/
n
1
V
/
n
2
F' = \frac{U / n_1}{V / n_2}
F′=V/n2U/n1
且
U
U
U,
V
V
V 均是卡方分布,我们代入已知的
Y
/
n
Y / n
Y/n 到
U
/
n
1
U / n_1
U/n1,
Y
′
Y'
Y′ 可等价于
Y
′
/
1
Y' / 1
Y′/1 并且
Y
Y
Y 和
Y
′
Y'
Y′互相独立,于是也可以代入到
V
/
n
2
V/n_2
V/n2,得到最终
F
′
F'
F′ 的分布
F
′
=
Y
/
n
Y
′
/
1
=
Y
/
n
X
2
F' = \frac{Y / n}{ Y' / 1} = \frac{Y / n}{X^2}
F′=Y′/1Y/n=X2Y/n
所以
F
=
F
′
F = F'
F=F′,于是
F
∼
F
(
n
,
1
)
F \sim F(n , 1)
F∼F(n,1)。
Hello,大家好!最近有在学习一些有关偏态分布的数理知识,但在搜偏
t
t
t分布的相关资料的时候感觉比较散,所以做个整理,主要参考的书籍是Azzalini在2014年出版的一本有关偏态分布族的书《The Skew-Normal and Related Families》,大家可以文末获取,有哪里理解不对的地方,还请各位大佬多多指正。
偏
t
t
t分布的生成,可以通过调节
t
t
t分布的尾部厚度来实现,那么我们先来写下
t
t
t分布的概率密度函数
t
(
x
;
ν
)
=
Γ
(
ν
+
1
2
)
π
ν
Γ
(
ν
2
)
(
1
+
x
2
ν
)
−
ν
+
1
2
,
x
∈
R
,
t(x;\nu)=\frac{\Gamma(\frac{\nu+1}{2})}{\sqrt{\pi \nu}\Gamma(\frac{\nu}{2})}\big( 1+\frac{x^2}{\nu} \big)^{-\frac{\nu+1}{2}},\qquad x \in \mathbb{R},
t(x;ν)=πνΓ(2ν)Γ(2ν+1)(1+νx2)−2ν+1,x∈R, 其中,
ν
\nu
ν代表自由度。
性质1.1: 用
f
0
f_0
f0表示
R
d
\mathbb{R}^d
Rd上的概率密度函数,用
G
(
⋅
)
G(\cdot)
G(⋅)表示一个连续分布函数,用
w
(
⋅
)
w(\cdot)
w(⋅)表示
R
d
\mathbb{R}^d
Rd上的实值函数,使得
f
0
(
−
x
)
=
f
0
(
x
)
,
w
(
−
x
)
=
−
w
(
x
)
,
G
0
(
−
y
)
=
1
−
G
0
(
y
)
f_0(-x)=f_0(x), \quad w(-x)=-w(x), \quad G_0(-y)=1-G_0(y)
f0(−x)=f0(x),w(−x)=−w(x),G0(−y)=1−G0(y) 对于
x
∈
R
d
x \in \mathbb{R}^d
x∈Rd,
y
∈
R
y \in \mathbb{R}
y∈R,则
f
(
x
)
=
2
f
0
(
x
)
G
{
w
(
x
)
}
f(x)=2f_0(x)G\{ w(x)\}
f(x)=2f0(x)G{w(x)} 表示为
R
d
\mathbb{R}^d
Rd上的概率密度函数。
那么对于
t
t
t分布,我们就可以通过性质1.1来生成尾部厚度不一的偏
t
t
t分布,根据以往的研究,以线性形式来引入不对称的版本,即
2
t
(
x
;
ν
)
T
(
α
x
;
ν
)
2t(x;\nu)T(\alpha x;\nu)
2t(x;ν)T(αx;ν) 其中,
T
(
⋅
;
ν
)
T(\cdot;\nu)
T(⋅;ν)表示
t
t
t分布的累积分布函数,
α
\alpha
α表示偏度参数。
除了这种构建方式外,还可以通过类似于
t
t
t分布随机变量的构建方式来获得,并且这种方式更被普遍引用,同样,我们先写出
t
t
t分布的随机变量
Z
=
Z
0
V
,
Z=\frac{Z_0}{\sqrt{V}},
Z=VZ0, 其中,
Z
0
∼
N
(
0
,
1
)
Z_0 \sim \mathrm{N}(0,1)
Z0∼N(0,1)和
V
∼
χ
ν
2
/
ν
V \sim \chi_{\nu}^2 / \nu
V∼χν2/ν为独立随机变量。
相应地,通过将
Z
0
Z_0
Z0的正态分布假设替换为
Z
0
∼
S
N
(
0
,
1
,
α
)
Z_0 \sim \mathrm{SN}(0,1,\alpha)
Z0∼SN(0,1,α)来获得偏
t
t
t分布的公式。在这种情况下,若
h
(
⋅
)
h(\cdot)
h(⋅)表示
V
V
V的密度函数,则随机变量
Z
Z
Z的密度函数为 KaTeX parse error: No such environment: align* at position 8: \begin{̲a̲l̲i̲g̲n̲*̲}̲ t(x;\alpha,\nu… 便得到了
Z
∼
S
T
(
0
,
1
,
α
,
ν
)
Z \sim \mathrm{ST}(0,1,\alpha,\nu)
Z∼ST(0,1,α,ν),如果
α
=
0
\alpha=0
α=0,那么该密度函数便会变回常规的学生
t
t
t分布;如果
ν
→
∞
\nu \to \infty
ν→∞,则变回
S
N
(
0
,
1
,
α
)
\mathrm{SN}(0,1,\alpha)
SN(0,1,α)密度函数。
为了更广泛的使用,我们需要让该分布再包含位置参数和尺度参数来进一步推广偏
t
t
t分布。我们令
Y
=
ξ
+
ω
Z
Y=\xi+\omega Z
Y=ξ+ωZ,那么原来关于
x
x
x的概率密度函数
t
(
x
;
α
,
ν
)
t(x;\alpha,\nu)
t(x;α,ν),变为了
ω
−
1
t
(
z
;
α
,
ν
)
\omega^{-1}t(z;\alpha,\nu)
ω−1t(z;α,ν),其中
z
=
ω
−
1
(
x
−
ξ
)
z=\omega^{-1}(x-\xi)
z=ω−1(x−ξ),这样就得到含有均值、方差、偏度、自由度四个参数的偏
t
t
t分布
Y
∼
S
T
(
ξ
,
ω
2
,
α
,
ν
)
Y \sim \mathrm{ST(\xi,\omega^2,\alpha,\nu)}
Y∼ST(ξ,ω2,α,ν),即
f
S
T
(
y
)
=
2
ω
t
(
η
;
ν
)
T
(
α
η
ν
+
1
ν
+
η
2
;
ν
+
1
)
,
η
=
y
−
ξ
ω
f_{ST}(y)=\frac{2}{\omega}t(\eta;\nu)T(\alpha \eta \sqrt{\frac{\nu+1}{\nu+\eta^2}};\nu+1), \qquad \eta=\frac{y-\xi}{\omega}
fST(y)=ω2t(η;ν)T(αην+η2ν+1;ν+1),η=ωy−ξ
设随机变量
X
1
X_1
X1与
X
2
X_2
X2独立,
X
1
∼
N
(
0
,
1
)
X_1\sim N(0,1)
X1∼N(0,1),
X
2
∼
χ
2
(
n
)
X_2\sim \chi^2(n)
X2∼χ2(n), 则
t
=
X
1
X
2
/
n
∼
t
(
n
)
t=\frac{X_1}{\sqrt{X_2/n}}\sim t(n)
t=X2/nX1∼t(n).
已经知道
χ
2
\chi^2
χ2分布是
G
a
m
m
a
Gamma
Gamma分布的特例,那么
t
t
t 的密度函数一定也是与
Γ
\Gamma
Γ函数密切相关的,通过令
t
2
=
F
(
1
,
n
)
t^2=F(1,n)
t2=F(1,n)以及根据
t
t
t分布的对称性,可以求出
t
t
t 的密度函数, 求
t
t
t 密度函数的过程如下: 将
P
(
0
<
t
<
y
)
=
1
2
P
(
t
2
<
y
2
)
=
1
2
P
(
F
<
y
2
)
P(0<t<y)=\frac{1}{2}P({t^2}<{y^2})=\frac{1}{2}P(F<y^2)
P(0<t<y)=21P(t2<y2)=21P(F<y2)两边求导,得
f
t
(
y
)
=
y
f
F
(
y
2
)
.
f_t(y)=yf_F(y^2).
ft(y)=yfF(y2).
1
n
(
x
‾
−
μ
)
s
\frac{\sqrt n(\overline{x}-\mu)}{s}
sn(x−μ)服从
t
t
t分布
t
t
t分布的峰比标准正态分布略低一些,尾部比标准正态分布的大一些。是由英国统计学家Gosset发现,由Fisher完善的。当数据量很大时,根据中心极限定理,总是可以将统计量归结到正态分布。但当数据量较小时,就与正态分布产生偏差。Gosset发现
n
(
x
‾
−
μ
)
s
\frac{\sqrt n(\overline{x}-\mu)}{s}
sn(x−μ)并不是完全服从正态分布的,而是服从一种全新的分布 –
t
t
t分布。由于上面已经介绍了
t
t
t分布的定义,下面证明统计量
n
(
x
‾
−
μ
)
s
\frac{\sqrt n(\overline{x}-\mu)}{s}
sn(x−μ)服从
t
t
t分布。
设
x
1
,
x
2
,
.
.
.
,
x
n
x_1,x_2,...,x_n
x1,x2,...,xn是来自总体
N
(
μ
,
σ
2
)
N(\mu,\sigma^2)
N(μ,σ2)的样本,
s
2
s^2
s2是样本标准差,则有:
(
n
−
1
)
s
2
σ
2
∼
χ
2
(
n
−
1
)
.
\frac{(n-1)s^2}{\sigma^2}\sim\chi^2(n-1).
σ2(n−1)s2∼χ2(n−1). 构造一个矩阵
A
A
A,将
(
x
1
,
x
2
,
.
.
.
,
x
n
)
(x_1,x_2,...,x_n)
(x1,x2,...,xn)正交变换为
(
y
1
,
y
2
,
.
.
.
,
y
n
)
(y_1,y_2,...,y_n)
(y1,y2,...,yn),即:
Y
=
(
y
1
,
y
2
,
.
.
.
,
y
n
)
′
=
A
(
x
1
,
x
2
,
.
.
.
,
x
n
)
′
=
A
X
Y=(y_1,y_2,...,y_n)'=A(x_1,x_2,...,x_n)'=AX
Y=(y1,y2,...,yn)′=A(x1,x2,...,xn)′=AX
A
=
(
1
n
1
n
1
n
.
.
.
1
n
1
2
⋅
1
−
1
2
⋅
1
0
.
.
.
0
1
3
⋅
2
1
3
⋅
2
−
2
3
⋅
2
.
.
.
0
⋮
⋮
⋮
⋮
⋮
1
n
⋅
(
n
−
1
)
1
n
⋅
(
n
−
1
)
1
n
⋅
(
n
−
1
)
.
.
.
−
n
−
1
n
⋅
(
n
−
1
)
)
n
×
n
A =\left( \begin{array}{} \frac{1}{\sqrt n}& \frac{1}{\sqrt n}& \frac{1}{\sqrt n}&...&\frac{1}{\sqrt n} \\ \frac{1}{\sqrt{2\cdot1}}& -\frac{1}{\sqrt{2\cdot1}} & 0&...&0 \\ \frac{1}{\sqrt{3\cdot2}}& \frac{1}{\sqrt{3\cdot2}} &- \frac{2}{\sqrt{3\cdot2}}&...&0\\ \vdots&\vdots&\vdots&\vdots&\vdots\\ \frac{1}{\sqrt{n\cdot(n-1)}}&\frac{1}{\sqrt{n\cdot(n-1)}}&\frac{1}{\sqrt{n\cdot(n-1)}}&...&-\frac{n-1}{\sqrt{n\cdot(n-1)}}\\ \end{array} \right)_{n\times n}
A=⎝⎜⎜⎜⎜⎜⎜⎛n12⋅113⋅21⋮n⋅(n−1)1n1−2⋅113⋅21⋮n⋅(n−1)1n10−3⋅22⋮n⋅(n−1)1.........⋮...n100⋮−n⋅(n−1)n−1⎠⎟⎟⎟⎟⎟⎟⎞n×n 则有
y
1
=
1
n
∑
i
=
0
n
x
i
y_1=\frac{1}{\sqrt{n}}\sum\limits_{i=0}^nx_i
y1=n1i=0∑nxi,即
x
‾
=
1
n
y
1
\overline{x}=\frac{1}{\sqrt{n}}y_1
x=n1y1,所以有:
(
n
−
1
)
s
2
=
∑
i
=
0
n
(
x
i
−
x
‾
)
2
=
∑
i
=
1
n
x
i
2
−
n
x
‾
2
=
X
′
X
−
y
1
2
(n-1)s^2=\sum\limits_{i=0}^n(x_i-\overline{x})^2 =\sum\limits_{i=1}^nx_i^2-n\overline{x}^2 =X'X-y_1^2
(n−1)s2=i=0∑n(xi−x)2=i=1∑nxi2−nx2=X′X−y12
=
X
′
A
′
A
X
−
y
1
2
=
Y
′
Y
−
y
1
2
=
∑
i
=
2
n
y
i
2
~~~~~~~=X'A'AX-y_1^2 =Y'Y-y_1^2 =\sum\limits_{i=2}^ny_i^2
=X′A′AX−y12=Y′Y−y12=i=2∑nyi2 由于
x
1
,
x
2
,
.
.
.
,
x
n
x_1,x_2,...,x_n
x1,x2,...,xn均服从
N
(
μ
,
σ
2
)
N(\mu,\sigma^2)
N(μ,σ2),
y
1
,
y
2
,
.
.
.
,
y
n
y_1,y_2,...,y_n
y1,y2,...,yn是
x
1
,
x
2
,
.
.
.
,
x
n
x_1,x_2,...,x_n
x1,x2,...,xn的线性组合,所以
y
1
,
y
2
,
.
.
.
,
y
n
y_1,y_2,...,y_n
y1,y2,...,yn也服从正态分布,其中
y
1
∼
N
(
n
μ
,
σ
2
)
y_1\sim N(\sqrt{n}\mu,\sigma^2)
y1∼N(nμ,σ2),
y
2
,
.
.
.
,
y
n
∼
N
(
0
,
σ
2
)
y_2,...,y_n\sim N(0,\sigma^2)
y2,...,yn∼N(0,σ2), 根据多元正态分布的密度函数表达式容易得出
y
2
,
.
.
.
,
y
n
y_2,...,y_n
y2,...,yn也是互相独立的。可得:
(
n
−
1
)
s
2
σ
2
=
∑
i
=
2
n
(
y
i
σ
)
2
∼
χ
2
(
n
−
1
)
.
\frac{(n-1)s^2}{\sigma^2}=\sum\limits_{i=2}^n(\frac{y_i}{\sigma})^2\sim\chi^2(n-1).
σ2(n−1)s2=i=2∑n(σyi)2∼χ2(n−1). 又由于
x
‾
\overline{x}
x和
s
2
s^2
s2独立 (
x
‾
\overline{x}
x只与
y
1
y_1
y1有关,
s
2
s^2
s2只与
y
2
,
.
.
.
,
y
n
y_2,...,y_n
y2,...,yn有关),则:
n
(
x
‾
−
μ
)
s
=
x
‾
−
μ
σ
/
n
(
n
−
1
)
s
2
/
σ
2
n
−
1
∼
t
(
n
−
1
)
\frac{\sqrt n(\overline{x}-\mu)}{s}=\frac{{\frac{\overline{x}-\mu}{\sigma/\sqrt{n}}}} {\sqrt{\frac{{(n-1)s^2}/{\sigma^2}}{n-1}}}\sim t(n-1)
sn(x−μ)=n−1(n−1)s2/σ2σ/nx−μ∼t(n−1) 证明完毕。
2 比较期望的t检验
在正态总体的参数假设检验中,t检验是经常使用的一种检验方法,使用t检验可以
检验总体期望与某一个常数是否有显著差异(样本均数与总体均数的比较)
检验两个独立总体的总体期望是否有显著差异(两独立样本均数的比较)
检验两个相关总体的总体期望是否有显著差异(两相关样本均数的比较)
下面用两独立样本均数的比较做例子解释一下统计量
n
(
x
‾
−
μ
)
s
\frac{\sqrt n(\overline{x}-\mu)}{s}
sn(x−μ)的应用。
口服多糖铁复合物是治疗肾性贫血的传统方法,为研究右旋糖酐氢氧化铁注射液在治疗肾性贫血的效果,选择血红蛋白水平相似的患者随机分为口服多糖铁复合物组和静脉注射右旋糖酐氢氧化铁组,每组分别
n
1
,
n
2
n_1,n_2
n1,n2个人,在接受治疗后,收集每个患者血红蛋白含量的增值。口服多糖铁复合物组患者的血红蛋白含量的增值记为 (
x
1
,
x
2
,
.
.
.
,
x
n
1
x_1,x_2,...,x_{n_1}
x1,x2,...,xn1);静脉注射右旋糖酐氢氧化铁组患者的血红蛋白含量的增值记为
(
y
1
,
y
2
,
.
.
.
,
y
n
2
)
(y_1,y_2,...,y_{n_2})
(y1,y2,...,yn2)。
可以把(
x
1
,
x
2
,
.
.
.
,
x
n
1
x_1,x_2,...,x_{n_1}
x1,x2,...,xn1)看作来自总体
X
X
X,把
(
y
1
,
y
2
,
.
.
.
,
y
n
2
)
(y_1,y_2,...,y_{n_2})
(y1,y2,...,yn2)看作来自总体
Y
Y
Y, 即:
X
∼
N
(
μ
1
,
σ
2
)
Y
∼
N
(
μ
2
,
σ
2
)
X\sim N(\mu_1,\sigma^2)~~~~~Y\sim N(\mu_2,\sigma^2)
X∼N(μ1,σ2)Y∼N(μ2,σ2)
从而有:
x
‾
∼
N
(
μ
1
,
σ
2
n
1
)
y
‾
∼
N
(
μ
2
,
σ
2
n
2
)
\overline{x}\sim N(\mu_1,\frac{\sigma^2}{n_1})~~~~~~~\overline{y}\sim N(\mu_2,\frac{\sigma^2}{n_2})
x∼N(μ1,n1σ2)y∼N(μ2,n2σ2)
由于服从正态分布的随机变量的线性组合也服从正态分布,所以有:
x
‾
−
y
‾
∼
N
(
μ
1
−
μ
2
,
σ
2
n
1
+
σ
2
n
2
)
\overline{x}-\overline{y}\sim N(\mu_1-\mu_2,\frac{\sigma^2}{n_1}+\frac{\sigma^2}{n_2})
x−y∼N(μ1−μ2,n1σ2+n2σ2) 即:
x
‾
−
y
‾
−
(
μ
1
−
μ
2
)
σ
1
n
1
+
1
n
2
∼
N
(
0
,
1
)
\frac{\overline{x}-\overline{y}-(\mu_1-\mu_2)}{\sigma\sqrt{\frac{1}{n_1}+\frac{1}{n_2}}}\sim N(0,1)
σn11+n21x−y−(μ1−μ2)∼N(0,1) 构造统计量
n
(
x
‾
−
μ
)
s
\frac{\sqrt n(\overline{x}-\mu)}{s}
sn(x−μ):
(
n
1
−
1
)
s
1
2
σ
2
+
(
n
2
−
1
)
s
2
2
σ
2
∼
χ
2
(
n
1
+
n
2
−
2
)
\frac{(n_1-1)s_1^2}{\sigma^2}+\frac{(n_2-1)s_2^2}{\sigma^2}\sim\chi^2(n_1+n_2-2)
σ2(n1−1)s12+σ2(n2−1)s22∼χ2(n1+n2−2)
x
‾
−
y
‾
−
(
μ
1
−
μ
2
)
σ
1
n
1
+
1
n
2
(
n
1
−
1
)
s
1
2
σ
2
+
(
n
2
−
1
)
s
2
2
σ
2
(
n
1
+
n
2
−
2
)
=
x
‾
−
y
‾
−
(
μ
1
−
μ
2
)
1
n
1
+
1
n
2
(
n
1
−
1
)
s
1
2
+
(
n
2
−
1
)
s
2
2
(
n
1
+
n
2
−
2
)
\frac{\frac{\overline{x}-\overline{y}-(\mu_1-\mu_2)}{\sigma\sqrt{\frac{1}{n_1}+\frac{1}{n_2}}}} {\sqrt{\frac{\frac{(n_1-1)s_1^2}{\sigma^2}+\frac{(n_2-1)s_2^2}{\sigma^2}}{(n_1+n_2-2)}}}= \frac{\frac{\overline{x}-\overline{y}-(\mu_1-\mu_2)}{\sqrt{\frac{1}{n_1}+\frac{1}{n_2}}}} {\sqrt{\frac{{(n_1-1)s_1^2}+{(n_2-1)s_2^2}}{(n_1+n_2-2)}}}
(n1+n2−2)σ2(n1−1)s12+σ2(n2−1)s22σn11+n21x−y−(μ1−μ2)=(n1+n2−2)(n1−1)s12+(n2−1)s22n11+n21x−y−(μ1−μ2)
=
x
‾
−
y
‾
−
(
μ
1
−
μ
2
)
∑
i
=
1
n
1
(
x
i
−
x
‾
)
2
+
∑
i
=
1
n
2
(
y
i
−
y
‾
)
2
(
n
1
+
n
2
−
2
)
1
n
1
+
1
n
2
=\frac{{\overline{x}-\overline{y}-(\mu_1-\mu_2)}} {\sqrt{\frac{\sum_{i=1}^{n_1}(x_i-\overline x)^2+\sum_{i=1}^{n_2}(y_i-\overline{y})^2}{(n_1+n_2-2)}} {\sqrt{\frac{1}{n_1}+\frac{1}{n_2}}}} ~~~~~~~~~~~~~~~
=(n1+n2−2)∑i=1n1(xi−x)2+∑i=1n2(yi−y)2n11+n21x−y−(μ1−μ2)
=
x
‾
−
y
‾
−
(
μ
1
−
μ
2
)
s
c
2
(
1
n
1
+
1
n
2
)
∼
t
(
n
1
+
n
2
−
2
)
=\frac{{\overline{x}-\overline{y}-(\mu_1-\mu_2)}} { {\sqrt{s_c^2(\frac{1}{n_1}+\frac{1}{n_2})}}}\sim t(n_1+n_2-2)~~~~~~~~~~~~~
=sc2(n11+n21)x−y−(μ1−μ2)∼t(n1+n2−2)
3 线性模型中单个变量的显著性检验
多元线性模型 (p个变量,n个样本) 的表达式为:
Y
i
=
β
T
x
i
+
ϵ
i
Y_i=\beta^T x_i+\epsilon_i
Yi=βTxi+ϵi 在这里将
Y
i
Y_i
Yi与
ϵ
i
\epsilon_i
ϵi视为随机变量。
E
(
Y
i
)
=
E
(
Y
i
∣
x
i
)
=
β
T
x
i
=
μ
i
E(Y_i)=E(Y_i|x_i)=\beta^T x_i=\mu_i
E(Yi)=E(Yi∣xi)=βTxi=μi 即:
Y
i
=
μ
i
+
ϵ
i
Y_i=\mu_i+\epsilon_i
Yi=μi+ϵi
记
X
n
×
(
p
+
1
)
X_{n\times (p+1)}
Xn×(p+1)为样本阵,则有:
Y
=
X
β
+
ϵ
=
μ
+
ϵ
Y=X\beta+\epsilon=\mu+\epsilon
Y=Xβ+ϵ=μ+ϵ 再使用最小化残差平方和的方法求
β
^
\hat\beta
β^:
β
^
=
(
X
T
X
)
−
1
X
T
Y
\hat\beta=(X^TX)^{-1}X^TY
β^=(XTX)−1XTY 然后有:
Y
^
=
μ
^
=
X
β
^
=
X
β
^
=
X
(
X
T
X
)
−
1
X
T
Y
=
H
Y
\hat Y=\hat \mu=X\hat\beta=X\hat\beta=X(X^TX)^{-1}X^TY=HY
Y^=μ^=Xβ^=Xβ^=X(XTX)−1XTY=HY
H
H
H是对称阵,也是幂等阵,且
t
r
(
H
)
=
t
r
(
X
(
X
T
X
)
−
1
X
T
)
=
p
+
1
,
tr(H)=tr(X(X^TX)^{-1}X^T)=p+1,
tr(H)=tr(X(XTX)−1XT)=p+1,记
H
=
(
h
i
j
)
H=(h_{ij})
H=(hij)。
记
e
=
Y
−
Y
^
=
(
I
−
H
)
Y
,
e
i
=
Y
i
−
Y
^
i
,
e=Y-\hat Y=(I-H)Y,e_i=Y_i-\hat Y_i,
e=Y−Y^=(I−H)Y,ei=Yi−Y^i, 所以:
E
(
σ
2
^
)
=
E
(
1
n
−
p
−
1
∑
i
=
1
n
e
i
2
)
=
1
n
−
p
−
1
∑
i
=
1
n
(
(
E
e
i
)
2
+
D
e
i
)
E(\hat{\sigma^2})=E(\frac{1}{n-p-1}\sum\limits_{i=1}^{n}e_i^2)=\frac{1}{n-p-1}\sum\limits_{i=1}^{n}((Ee_i)^2+De_i)
E(σ2^)=E(n−p−11i=1∑nei2)=n−p−11i=1∑n((Eei)2+Dei)
=
1
n
−
p
−
1
∑
i
=
1
n
(
1
−
h
i
i
)
σ
2
=
1
n
−
p
−
1
(
n
−
(
p
+
1
)
)
σ
2
=
σ
2
~~~~~~~~~~~~~~~~~~=\frac{1}{n-p-1}\sum\limits_{i=1}^{n}(1-h_{ii})\sigma^2=\frac{1}{n-p-1}(n-(p+1))\sigma^2=\sigma^2
=n−p−11i=1∑n(1−hii)σ2=n−p−11(n−(p+1))σ2=σ2 即
σ
2
^
=
1
n
−
p
−
1
∑
i
=
1
n
e
i
2
\hat{\sigma^2}=\frac{1}{n-p-1}\sum\limits_{i=1}^{n}e_i^2
σ2^=n−p−11i=1∑nei2 是
σ
2
\sigma^2
σ2 的无偏估计。
假定
ϵ
∼
N
(
0
,
Σ
0
)
Σ
0
=
(
σ
2
0
.
.
.
0
0
σ
2
.
.
.
0
⋮
⋮
⋮
⋮
0
0
.
.
.
σ
2
)
\epsilon\sim N(0,\Sigma_0)~~~~\Sigma_0=\left( \begin{array}{ccc} \sigma^2 & 0 & ...&0 \\ 0 & \sigma^2 & ...&0 \\ \vdots & \vdots &\vdots&\vdots\\ 0 & 0 & ...&\sigma^2 \\ \end{array} \right)
ϵ∼N(0,Σ0)Σ0=⎝⎜⎜⎜⎛σ20⋮00σ2⋮0......⋮...00⋮σ2⎠⎟⎟⎟⎞, 则
Y
∼
N
(
μ
,
Σ
0
)
Y\sim N(\mu,\Sigma_0)
Y∼N(μ,Σ0). 然后有:
E
(
β
^
)
=
β
E(\hat\beta)=\beta
E(β^)=β
D
(
β
^
)
=
D
(
(
X
T
X
)
−
1
X
T
Y
)
=
(
X
T
X
)
−
1
X
T
D
(
Y
)
X
(
X
T
X
)
−
1
=
σ
2
(
X
T
X
)
−
1
D(\hat\beta)=D((X^TX)^{-1}X^TY)=(X^TX)^{-1}X^TD(Y)X(X^TX)^{-1}=\sigma^2(X^TX)^{-1}
D(β^)=D((XTX)−1XTY)=(XTX)−1XTD(Y)X(XTX)−1=σ2(XTX)−1 又因为
β
^
\hat\beta
β^ 是
Y
i
Y_i
Yi 的线性组合,所以:
β
^
∼
N
(
β
,
σ
2
(
X
T
X
)
−
1
)
\hat\beta\sim N(\beta,\sigma^2(X^TX)^{-1})
β^∼N(β,σ2(XTX)−1) 再记
(
X
T
X
)
−
1
=
(
k
i
j
)
,
(X^TX)^{-1}=(k_{ij}),
(XTX)−1=(kij), 所以有:
β
^
i
∼
N
(
β
i
,
σ
2
k
i
i
)
\hat\beta_i\sim N(\beta_i,\sigma^2k_{ii})
β^i∼N(βi,σ2kii) 对
β
i
\beta_i
βi进行显著性检验,原假设为系数
β
i
\beta_i
βi不显著,即:
H
0
:
β
i
=
0
H_0:\beta_i=0
H0:βi=0 记
σ
^
=
σ
2
^
\hat\sigma=\sqrt{\hat{\sigma^2}}
σ^=σ2^,在原假设成立的条件下,就可以构造
t
t
t统计量:
t
i
=
β
^
i
k
i
i
σ
^
∼
t
(
n
−
p
−
1
)
t_i=\frac{\hat\beta_i}{\sqrt{k_{ii}}\hat\sigma}\sim t(n-p-1)
ti=kiiσ^β^i∼t(n−p−1)
分别是这样缩写的 B二项分布 binomial distribution P泊松分布 poisson's distribution U均匀分布 uniform distribution E指数分布 exponential distribution N正态分布 .u分布是标准正态分布,是以0为平均值,以1为...