数理统计_数理统计答案 - CSDN
精华内容
参与话题
  • 数理统计内容整理(一)基本概念

    千次阅读 2019-01-07 19:02:54
    数理统计 关心的是某一项或若干项数量指标X(向量)和该数量指标X在总体中的分布情况。–“所谓的总体的分布就是数量指标X的分布” 样本及其分布 样本 从总体中取得一部分个体,这一部分个体成为样本(或...

    总体(或母体)

    所研究的对象的全体。

    个体

    这里是引用

    总体中的元素。

    有限总体

    总体中的个体数目为有限。

    无限总体

    总体中的个数数目为无线。

    数理统计

    关心的是某一项或若干项数量指标X(向量)和该数量指标X在总体中的分布情况。–“所谓的总体的分布就是数量指标X的分布”

    样本及其分布

    样本

    从总体中取得一部分个体,这一部分个体成为样本(或子样)

    样品

    样本中的每个个体称为样本

    样本容量

    样本中的个体数目称为样本容量

    抽样

    取得样本的过程

    抽样法

    抽样中采用的方法

    随机抽样法

    从总体中随意的抽取若干个个体–一般采用此方法

    样本空间

    总体X随机抽样的到的样本按顺序排序用X1…Xn表示,或者用n维随即向量X=^(X1, ,Xn)TX\quad \widehat { = } \quad { ({ X }_{ 1 },\cdots ,X_{ n }) }^{ T }表示.
    样本(X1, ,Xn)T\quad { ({ X }_{ 1 },\cdots ,X_{ n }) }^{ T }可能取值的全体成为样本空间

    i.i.d.

    独立同分布

    简单随机样本

    X1{ X }_{ 1 }的分布与总体X的分布相同

    分布-对于简单随机样本X1…Xn

    若总体的分布函数为F(x)则样本的联合分布函数为:

    Fs(x1, ,xn)=i=1nF(xi){ F }_{ s }({ x }_{ 1 },\cdots ,{ x }_{ n }) = \prod _{ i=1 }^{ n }{ F({ x }_{ i }) }

    若总体的概率密度f(x)则样本的联合概率密度为:

    fs(x1, ,xn)=i=1nf(xi){ f }_{ s }({ x }_{ 1 },\cdots ,{ x }_{ n }) = \prod _{ i=1 }^{ n }{ f({ x }_{ i }) }

    若总体具有分布律(概率函数)p(x),其中p(ai) = P(X = ai),则样本的联合概率函数为:

    ps(x1, ,xn)=i=1np(xi){ p }_{ s }({ x }_{ 1 },\cdots ,{ x }_{ n })=\prod _{ i=1 }^{ n }{ p({ x }_{ i }) }

    统计量

    样本均值

    Xˉ=1ni=1nXi\bar { X } =\frac { 1 }{ n } \sum _{ i=1 }^{ n }{ { X }_{ i } }

    样本方差

    S2=1ni=1n(XiX)2=1ni=1nXi2X2{ S }^{ 2 }=\frac { 1 }{ n } \sum _{ i=1 }^{ n }{ { ({ X }_{ i }-\overline { X } ) }^{ 2 } } =\frac { 1 }{ n } \sum _{ i=1 }^{ n }{ { { X }_{ i } }^{ 2 } } -{ \overline { X } }^{ 2 }

    修正样本方差

    S2=1n1i=1n(XiX)2{ S }^{ *2 }=\frac { 1 }{ n-1 } \sum _{ i=1 }^{ n }{ { ({ X }_{ i }-\overline { X } ) }^{ 2 } }

    样本k阶原点矩

    Ak=1ni=1nXik{ A }_{ k }=\frac { 1 }{ n } \sum _{ i=1 }^{ n }{ { X }_{ i }^{ k } }

    样本k阶中心距

    Bk=1ni=1n(XiX)kB_{ k }=\frac { 1 }{ n } \sum _{ i=1 }^{ n }{ { ({ X }_{ i }-\overline { X } ) }^{ k } }

    X(k)的概率密度f(k)(x)(1<=k<=n)

    f(k)(x)=n!(k1)!(nk)![F(x)]k1[1F(x)]nkf(x){ f }_{ (k) }(x)=\frac { n! }{ (k-1)!(n-k)! } { [F(x)] }^{ k-1 }{ [1-F(x)] }^{ n-k }f(x)

    X(k)与X(j)的联合概率密度f(k)(j)(x,y)(1<=k<=j<=n)

    f(k)(j)(x,y)=n!(k1)!(jk1)!(nj)![F(x)]k1[F(y)F(x)]jk1[1F(y)]njf(x)f(y){ f }_{ (k)(j) }(x,y)=\frac { n! }{ (k-1)!(j-k-1)!(n-j)! } { [F(x)] }^{ k-1 }{ [F(y)-F(x)] }^{ j-k-1 }{ [1-F(y)] }^{ n-j }f(x)f(y)

    在顺序统计量中

    样本中位数

    Me={12(Xn/2+X(n/2+1)),nX((n+1)/2),nMe={ \{ }_{ \frac { 1 }{ 2 } ({ X }_{ n/2 }+{ X }_{ (n/2+1) }),\quad \quad \quad n为偶数 }^{ { X }_{ ((n+1)/2) },\quad \quad \quad \quad \quad n为奇数 }
    观察值为
    me={12(xn/2+x(n/2+1)),nx((n+1)/2),nme={ \{ }_{ \frac { 1 }{ 2 } ({ x }_{ n/2 }+{ x }_{ (n/2+1) }),\quad \quad \quad n为偶数 }^{ { x }_{ ((n+1)/2) },\quad \quad \quad \quad \quad n为奇数 }

    样本极差

    R=X(n)X(1)R={ X }_{ (n) } - { X }_{ (1) }
    其观察值为
    r=x(n)x(1)r={ x }_{ (n) } - { x }_{ (1) }

    经验分布函数

    在这里插入图片描述

    抽样分布

    所谓抽样分布是指统计量的概率分布,确定统计量的分布是数理统计学的基本问题之一.一般情况下,统计量分布的推导问题可分为两种情况进行讨论:(1)当已知总体X的分布时,若对任意容量为n的样本X1,...Xn{ X }_{1},...{X}_{n}能求出统计量g(X1,...Xn{ X }_{1},...{X}_{n})的分布,则称该分布为g(X1,...Xn{ X }_{1},...{X}_{n})的精确分布.确定统计量的精确分布,对于数理统计中的所谓小样问题(指样本容量n较小时的统计问题)的研究是很重要的;(2)当n->∞时,能求出统计量g(X1,...Xn{ X }_{1},...{X}_{n})的极限分布.统计量的极限分布对于数理统计中得到的所谓大样问题(指样本容量n较大时的统计问题)的研究是非常有用的.

    Γ分布

    若随机变量X具有概率密度
    f(x,α,λ)={0,x0λαΓ(α)xα1eλx,x&gt;0f(x,\alpha ,\lambda )={ \{ }_{ 0,x\le 0 }^{ \frac { { \lambda }^{ \alpha } }{ \Gamma (\alpha ) } { x }^{ \alpha -1 }{ e }^{ -\lambda x },x&gt;0 }
    则成X服从参数为α、λ的Γ分布,记为XΓ(α,λ){ X }\sim \Gamma (\alpha ,\lambda ),其中α>0,λ>0为参数.

    Γ函数

    Γ(α)=0+xα1exdx\Gamma (\alpha )=\int _{ 0 }^{ +\infty }{ { x }^{ \alpha -1 }{ e }^{ -x }dx }

    Γ引申

    Gamma(α+1)=αΓ(α)(Γ(n+1)=n!)Gamma (\alpha +1)=\alpha \Gamma (\alpha )(因而\Gamma (n+1)=n!)
    Γ(1)=1\Gamma (1)=1
    Γ(12)=π\Gamma (\frac { 1 }{ 2 } )=\sqrt { \pi }
    Γ(p)Γ(q)Γ(p+q)=B(p,q)\frac { \Gamma (p)\Gamma (q) }{ \Gamma (p+q) } =B(p,q)

    性质1

    XΓ(α,λ)X\sim \Gamma (\alpha ,\lambda ),则E(X)=αλ,D(X)=αλ2.E(X)=\frac { \alpha }{ \lambda } ,D(X)=\frac { \alpha }{ { \lambda }^{ 2 } } .

    性质2(可加性)

    XiΓ(αi,λ),i=1,&ThinSpace;,n,X1,&ThinSpace;,Xn,:若{ X }_{ i }\sim \Gamma ({ \alpha }_{ i },\lambda ),i=1,\cdots ,n,且{ X }_{ 1 },\cdots ,{ X }_{ n }相互独立,则:
    X1++XnΓ(α1++αn,λ).{ X }_{ 1 }+\cdots +{ X }_{ n }\sim \Gamma ({ \alpha }_{ 1 }+\cdots +{ \alpha }_{ n },\lambda ).

    β分布

    若随机变量X具有概率密度
    f(x;α,b)={0,xa1(1x)b1B(a,b),0&lt;x&lt;1f(x;\alpha ,b)={ \{ }_{ 0,其他 }^{ \frac { { x }^{ a-1 }{ (1-x) }^{ b-1 } }{ B(a,b) } ,0&lt;x&lt;1 }
    则称X服从参数为a、b的β分布,记为Xβ(a,b){ X }\sim β (a ,b),其中a>0,b>0为参数.

    β函数

    B(p,q)=01xp1(1x)q1dxB(p,q)=\int _{ 0 }^{ 1 }{ { x }^{ p-1 }{ (1-x) }^{ q-1 }dx }

    性质1

    Xβ(a,b)X\sim \beta (a,b),则
    E(X)=aa+b,D(X)=ab(a+b)2(a+b+1)E(X)=\frac { a }{ a+b } ,D(X)=\frac { ab }{ { (a+b) }^{ 2 }(a+b+1) }

    性质2

    XΓ(a,1),YΓ(b,1)X\sim \Gamma (a,1),Y\sim \Gamma (b,1)且X,Y相互独立,则
    Z=XX+Yβ(a,b)Z=\frac { X }{ X+Y } \sim \beta (a,b)

    χ2{ \chi }^{ 2 }分布

    若随机变量X具有概率密度
    χ2(x;n)={0,x0xn21ex22n2Γ(n2),x&gt;0{ \chi }^{ 2 }(x;n)={ \{ }_{ 0,x\le 0 }^{ \frac { { x }^{ \frac { n }{ 2 } -1 }{ e }^{ -\frac { x }{ 2 } } }{ { 2 }^{ \frac { n }{ 2 } }\Gamma (\frac { n }{ 2 } ) } ,x&gt;0 }
    则称X服从自由度为n的 χ2{ \chi }^{ 2 }分布,记为 Xχ2(n).X\sim { \chi }^{ 2 }(n).随机变量X称为χ2{ \chi }^{ 2 }变量.

    性质1

    Xχ2(n)X\sim { \chi }^{ 2 }(n),则E(X)=n,D(X)=2nE(X)=n,D(X)=2n.

    性质2(可加性)

    Xiχ2(ni),i=1,&ThinSpace;,kXi,&ThinSpace;,Xk,若{ X }_{ i }\sim { \chi }^{ 2 }({ n }_{ i }),i=1,\cdots ,k且{ X }_{ i },\cdots ,{ X }_{ k }相互独立,则
    X1++Xkχ2(n1++nk).{ X }_{ 1 }+\cdots +{ X }_{ k }\sim { \chi }^{ 2 }({ n }_{ 1 }+\cdots +{ n }_{ k }).

    定理

    设随机变量X1,&ThinSpace;,Xn{ X }_{ 1 },\cdots ,{ X }_{ n }相互独立,且都服从标准正态分布N(0,1),则随机变量
    χ2=i=1nXi2{ \chi }^{ 2 }=\sum _{ i=1 }^{ n }{ { X }_{ i }^{ 2 } }服从自由度为n的χ2{ \chi }^{ 2 }分布,即χ2χ2(n){ \chi }^{ 2 }\sim { \chi }^{ 2 }(n)

    t分布

    若随机变量T具有概率密度
    t(x;n)=Γ(n+12)nπΓ(n2)(1+x2n)n+12,&lt;x&lt;+t(x;n)=\frac { \Gamma (\frac { n+1 }{ 2 } ) }{ \sqrt { n\pi } \Gamma (\frac { n }{ 2 } ) } { (1+\frac { { x }^{ 2 } }{ n } ) }^{ -\frac { n+1 }{ 2 } },-\infty &lt;x&lt;+\infty
    则称T服从自由度为n的t分布,记为T~t(n).t分布又称为学生分布.

    定理

    XN(0,1),Yχ2(n),XY,若X\sim N(0,1),Y\sim { \chi }^{ 2 }(n),且X与Y相互独立,则
    T=XYnt(n)T=\frac { X }{ \sqrt { \frac { Y }{ n } } } \sim t(n)

    F分布

    若随机变量F具有概率密度
    f(x;n1,n2)={0,x0Γ(n1+n22)Γ(n12)Γ(n22)(n1n2)(n1n2x)n121(1+n1n2x)n1+n22,x&gt;0f(x;{ n }_{ 1 },{ n }_{ 2 })={ \{ }_{ 0,x\le 0 }^{ \frac { \Gamma (\frac { { n }_{ 1 }+{ n }_{ 2 } }{ 2 } ) }{ \Gamma (\frac { { n }_{ 1 } }{ 2 } )\Gamma (\frac { { n }_{ 2 } }{ 2 } ) } (\frac { { n }_{ 1 } }{ { n }_{ 2 } } ){ (\frac { { n }_{ 1 } }{ { n }_{ 2 } } x) }^{ \frac { { n }_{ 1 } }{ 2 } -1 }{ (1+\frac { { n }_{ 1 } }{ { n }_{ 2 } } x) }^{ -\frac { { n }_{ 1 }+{ n }_{ 2 } }{ 2 } },x&gt;0 }
    则称F服从自由度为(n1,n2)({ n }_{ 1 },{ n }_{ 2 })的F分布,记为FF(n1,n2).F\sim F({ n }_{ 1 },{ n }_{ 2 }).

    定理

    Xχ2(n1),Yχ2(n2),XY,若X\sim { \chi }^{ 2 }({ n }_{ 1 }),Y\sim { \chi }^{ 2 }({ n }_{ 2 }),且X与Y相互独立,则
    F=Xn1Yn2F(n1,n2)F=\frac { \frac { X }{ { n }_{ 1 } } }{ \frac { Y }{ { n }_{ 2 } } } \sim F({ n }_{ 1 },{ n }_{ 2 })

    推论

    ,FF(n1,n2),1FF(n2,n1).在定理的条件下,若F\sim F({ n }_{ 1 },{ n }_{ 2 }),则\frac { 1 }{ F } \sim F({ n }_{ 2 },{ n }_{ 1 }).

    分位数

    XF(x)=P{Xx},0&lt;p&lt;1,xp设随机变量X的分布函数为F(x)=P\{ X\le x\} ,对于0&lt;p&lt;1,若有{ x }_{ p }满足
    P{Xxp}=F(xp)=pP\{ X\le { x }_{ p }\} =F({ x }_{ p })=p
    xpF(x)(X)p;0&lt;α&lt;1,yα则称{ x }_{ p }为分布F(x)(或随机变量X)的下侧p分位数;对于0&lt;\alpha &lt;1,若有{ y }_{ \alpha }满足
    P{X&gt;yα}=1F(yα)=αP\{ X&gt;{ y }_{ \alpha }\} =1-F({ y }_{ \alpha })=\alpha
    yαF(x)(X)α.则称{ y }_{ \alpha }为分布F(x)(或随机变量X)的上侧\alpha 分位数.
    ,yα=x1α;xp=y1p由定义可知,{ y }_{ \alpha }={ x }_{ 1-\alpha };{ x }_{ p }={ y }_{ 1-p }

    正态总体的抽样分布

    定理1

    X1,&ThinSpace;,XnN(μ,σ2),X,S2,设{ X }_{ 1 },\cdots ,{ X }_{ n }是来自正态总体N(\mu ,{ \sigma }^{ 2 })的样本,\overline { X } 为样本均值,{ S }^{ *2 }为修正样本方差,则
    (1)XN(μ,σ2n);\overline { X } \sim N(\mu ,\frac { { \sigma }^{ 2 } }{ n } );
    (2)(n1)S2σ2=nS2σ2=1σ2i=1n(XiX)2χ2(n1);\frac { (n-1){ S }^{ *2 } }{ { \sigma }^{ 2 } } =\frac { n{ S }^{ 2 } }{ { \sigma }^{ 2 } } =\frac { 1 }{ { \sigma }^{ 2 } } \sum _{ i=1 }^{ n }{ { ({ X }_{ i }-\overline { X } ) }^{ 2 } } \sim { \chi }^{ 2 }(n-1);
    (3)XS2\overline { X } 与{ S }^{ *2 }相互独立

    定理2

    X1,&ThinSpace;,XnN(μ,σ2),X,S2,设{ X }_{ 1 },\cdots ,{ X }_{ { n } }为正态总体N(\mu ,{ \sigma }^{ 2 })的样本,\overline { X } 为样本均值,{ S }^{ *2 }为修正样本方差,则
    T=n(Xμ)St(n1)T=\frac { \sqrt { n } (\overline { X } -\mu ) }{ { S }^{ * } } \sim t(n-1)

    定理3

    X1,&ThinSpace;,Xn1Y1,&ThinSpace;,Yn2N(μ1,σ2)N(μ2,σ2),,设{ X }_{ 1 },\cdots ,{ X }_{ { n }_{ 1 } }和{ Y }_{ 1 },\cdots ,{ Y }_{ { n }_{ 2 } }分别为正态总体N({ \mu }_{ 1 },{ \sigma }^{ 2 })和N({ \mu }_{ 2 },{ \sigma }^{ 2 })的样本,且两样本相互独立,记
    X=1n1i=1n1Xi,Y=1n2i=1n2Yi,S1n12=1n11i=1n1(XiX)2,S2n22=1n21i=1n2(YiY)2,\overline { X } =\frac { 1 }{ { n }_{ 1 } } \sum _{ i=1 }^{ { n }_{ 1 } }{ { X }_{ i } } ,\\ \overline { Y } =\frac { 1 }{ { n }_{ 2 } } \sum _{ i=1 }^{ { n }_{ 2 } }{ { Y }_{ i } } ,\\ { S }_{ { 1 }_{ { n }_{ 1 } } }^{ *2 }=\frac { 1 }{ { n }_{ 1 }-1 } \sum _{ i=1 }^{ { n }_{ 1 } }{ { ({ X }_{ i }-\overline { X } ) }^{ 2 } } ,\\ { S }_{ { 2 }_{ { n }_{ 2 } } }^{ *2 }=\frac { 1 }{ { n }_{ 2 }-1 } \sum _{ i=1 }^{ { n }_{ 2 } }{ { ({ Y }_{ i }-\overline { Y } ) }^{ 2 } } ,则有
    T=(XY)(μ1μ2)Sω1n1+1n2t(n1+n22)T=\frac { (\overline { X } -\overline { Y } )-({ \mu }_{ 1 }-{ \mu }_{ 2 }) }{ { S }_{ \omega }\sqrt { \frac { 1 }{ { n }_{ 1 } } +\frac { 1 }{ { n }_{ 2 } } } } \sim t({ n }_{ 1 }+{ n }_{ 2 }-2)
    其中
    Sω=(n11)S1n12+(n21)S2n22n1+n22{ S }_{ \omega }=\sqrt { \frac { ({ n }_{ 1 }-1){ S }_{ { 1 }_{ { n }_{ 1 } } }^{ *2 }+({ n }_{ 2 }-1){ S }_{ { 2 }_{ { n }_{ 2 } } }^{ *2 } }{ { n }_{ 1 }+{ n }_{ 2 }-2 } }

    定理4

    X1,&ThinSpace;,Xn1Y1,&ThinSpace;,Yn2N(μ1,σ12)N(μ2,σ22),,S1n12S2n22,设{ X }_{ 1 },\cdots ,{ X }_{ { n }_{ 1 } }和{ Y }_{ 1 },\cdots ,{ Y }_{ { n }_{ 2 } }分别为正态总体N({ \mu }_{ 1 },{ { \sigma }_{ 1 } }^{ 2 })和N({ \mu }_{ 2 },{ { \sigma }_{ 2 } }^{ 2 })的样本,且两样本相互独立,{ S }_{ { 1 }_{ { n }_{ 1 } } }^{ *2 }和{ S }_{ { 2 }_{ { n }_{ 2 } } }^{ *2 }分别为两个样本各自的修正方差,则
    F=σ22S1n12σ12S2n22F(n11,n21)F=\frac { { \sigma }_{ 2 }^{ 2 }{ S }_{ { 1 }_{ { n }_{ 1 } } }^{ *2 } }{ { \sigma }_{ 1 }^{ 2 }{ S }_{ { 2 }_{ { n }_{ 2 } } }^{ *2 } } \sim F({ n }_{ 1 }-1,{ n }_{ 2 }-1)

    定理5(柯赫伦)-该定理在方差分析和回归分析中具有重要作用.

    X1,&ThinSpace;,Xnn,Q=i=1nXi2.QQ=Q1++QkQi(i=1,&ThinSpace;,k)X1,&ThinSpace;,Xnni,设{ X }_{ 1 },\cdots ,{ X }_{ n }是n个相互独立的标准正态变量,记Q=\sum _{ i=1 }^{ n }{ { X }_{ i }^{ 2 } } .若Q可以分解为\\ Q={ Q }_{ 1 }+\cdots +{ Q }_{ k }\\ 其中{ Q }_{ i }(i=1,\cdots ,k)是{ X }_{ 1 },\cdots ,{ X }_{ n }的秩为{ n }_{ i }的非负定二次型,
    Q1,&ThinSpace;,Qk,Qiχ2(ni)(i=1,&ThinSpace;,k)i=1kni=n则{ Q }_{ 1 },\cdots ,{ Q }_{ k }相互独立,且{ Q }_{ i }\sim { \chi }^{ 2 }({ n }_{ i })(i=1,\cdots ,k)的充分必要条件是\\ \sum _{ i=1 }^{ k }{ { n }_{ i } } =n

    正态标准化

    XN(μ,σ2)X\sim N(\mu ,{ \sigma }^{ 2 })
    XμσN(0,1)\frac { X-\mu }{ \sigma } \sim N(0,1)
    XˉN(μ,σ2n)\bar { X } \sim N(\mu ,\frac { { \sigma }^{ 2 } }{ n } )
    n(Xˉμ)σN(0,1)\frac { \sqrt { n } (\bar { X } -\mu ) }{ \sigma } \sim N(0,1)

    置信区间(X\overline {X}-△,X\overline {X}+△)

    σ\sigma已知

    △=μα2σn{ \mu }_{ \frac { \alpha }{ 2 } }\frac { \sigma }{ \sqrt { n } }

    σ\sigma未知

    △=tα2(n1)Sn{ t }_{ \frac { \alpha }{ 2 } }(n-1)\frac { S }{ \sqrt { n } }

    各种分布的方程

    二项分布X~B(n,p),则随机变量X的分布列为

    P(X=k)=Cnk{C}_{n}^{k}pk (1-p)n-k k=0,1,…,n
    μ=np\mu=np
    σ2=npq{\sigma}^{2}=npq

    泊松分布X~P(λ)

    P(X=k)=λkeλk!\frac { { \lambda }^{ k }{ e }^{ -\lambda } }{ k! },λ>0,k=0,1…
    μ=λ\mu=\lambda
    σ2=λ{\sigma}^{2}=\lambda

    均匀分布X~U(a,b)

    f(x)={1ba0,,axbf\left( x \right) =\begin{cases} \frac { 1 }{ b-a } \\ 0,其他 \end{cases},a\le x\le b
    μ=a+b2\mu=\frac { a+b }{ 2 }
    σ2=(ba)212{\sigma}^{2}=\frac { {(b-a)}^{2} }{ 12 }

    指数分布X~Exp(λ)

    f(x)={λeλx,x&gt;00,x0f\left( x \right) =\begin{cases} \lambda { e }^{ -\lambda x },x&gt;0 \\ 0,x\le 0 \end{cases}
    μ=1λ\mu=\frac { 1 }{ \lambda }
    σ2=1λ2{\sigma}^{2}=\frac { 1 }{ {\lambda}^{2} }

    正态分布X~(μ,σ2\mu,{\sigma}^{2})

    f(x)=1σ2πe(xμ)22σ2f\left( x \right) =\frac { 1 }{ \sigma \sqrt { 2\pi } } { e }^{ -\frac { { (x-\mu ) }^{ 2 } }{ 2{ \sigma }^{ 2 } } }

    用概率密度求均值

    μ=\mu=概率密度的积分

    用极差R求标准差的估计

    σ^=Rdn\hat \sigma=\frac {R}{{d}_{n}} n为样本个数dn{d}_{n}可查表得

    展开全文
  • 数理统计教学ppt 复旦大学的 适合初学者 而且例子很全
  • 数理统计.zip

    2020-07-30 23:31:01
    数理统计ppt,研究生课程
  • 数理统计——四大分布、置信区间

    万次阅读 2019-10-13 20:41:07
    在统计学中,一个概率样本的置信区间(Confidence interval)是对这个样本的某个总体参数的区间估计。置信区间展现的是这个参数的真实值有一定概率落在测量结果的周围的程度。置信区间给出的是被测量参数的测量值的...

        在统计学中,一个概率样本的置信区间(Confidence interval)是对这个样本的某个总体参数的区间估计。置信区间展现的是这个参数的真实值有一定概率落在测量结果的周围的程度。置信区间给出的是被测量参数的测量值的可信程度,即前面所要求的“一定概率”。这个概率被称为置信度(置信水平)。

    问题:

    一批零件长度服从\(N(\mu,\sigma^2)\)的正态分布,\(\mu,\sigma^2\)均为未知,现在随机抽取16个零件,\(\bar x=20(cm),S=1(cm)\),则\(\mu\)的置信度为0.90的置信区间为_________.

     

    统计量:

    为了某种目的人为制造的随机变量的函数.

    常用统计量:

    1、样本均值:\(\bar X={1\over n} \sum^n_{i=1}X_i\).
    2、样本方差:\(S^2={1\over n-1}\sum^n_{i=1}(X_i-\bar X)^2 \).

     

    统计量的分布——四大分布:

    1、正态分布:

    \(X\sim N(\mu,\sigma^2)\),    期望:\(EX=\mu\),    方差:\(DX=\sigma^2\),    标准化:\({X-\mu\over{\sigma^2}}\sim N(0,1)\).


    2、\(\chi^2\)分布:

    若\(X_1,X_2,...X_n\sim N(0,1)\),则
    $$X=\sum^n_{i=1}X^2_i\sim \chi^2(n),自由度为n$$ $$EX=n,DX=2n$$

    \(\chi^2\)分布标题


    3、t分布(学生分布):

    若\(X\sim N(0,1)\),若\(Y\sim \chi^2(n)\),且\(X,Y\)相互独立:
    $$t={X\over\sqrt{Y\over n}}\sim t(n),自由度为n.$$

    t分布


    4、F分布:

    若\(X\sim \chi^2(n_1)\),若\(Y\sim \chi^2(n_2)\),且\(X,Y\)相互独立:
    $$F={{X/n_1}\over{Y/n_2}}\sim F(n_1,n_2)自由度n_1,n_2.$$

    F分布

    上\(\alpha\)分位数:

    \(P(U\geq u_\alpha)=\alpha\),\(u_\alpha \)为上\(\alpha\)分位数.

    通过查表可得到\(\alpha\)(概率密度函数的面积)对应的\(u_\alpha \)(分位值)的值.

    上\(\alpha\)分位数

     

    置信度(置信水平)、置信区间:

    \(P(|\bar X-\mu|<\delta)=1-\alpha, 1-\alpha\)为置信度, \(\alpha\)为显著性水平,人为选取.

    大样本情况下, 由中心极限定理可知:

    不论\(X_i\mathrel{\mathop{\sim}\limits^{iid}}F(\mu,\sigma^2)(任意分布)\),有$$\sum^n_{i=1}X_i{\mathrel{\mathop{\sim}\limits^{n\to\infty}}}{N(n\mu,n\sigma^2)}$$

    \(\bar X\)与\(S^2\)相互独立, 且\(E\bar X=\mu,D\bar X={1\over n}\sigma^2,ES^2=\sigma^2\).

    下面就可以根据样本统计量得到关于被估计参数测量值的分布情况:

    $$S^2={1\over {n-1}}\sum^n_{i=1}(X_i-\bar X)^2$$
    $${(n-1)S^2\over \sigma^2}=\sum^n_{i=1}\left(X_i-\bar X\over{\sigma}\right)^2\sim\chi^2(n-1)$$
    $${{\bar X-\mu}\over{S/\sqrt n}}={{{\bar X-\mu}\over{\sigma/n}}\over{S/\sigma}}={{{\bar X-\mu}\over{\sigma/\sqrt n}}\over{\sqrt{{{\left(n-1\right)S^2}/{\sigma^2}}\over{n-1}}}}\sim t(n-1).$$

    到此, 得到了t分布, t分布为已知分布, 置信区间自然唾手可得:
    $$P\left(\left|{{\bar X-\mu}\over{S/\sqrt n}}\right|<{\delta\over{S/\sqrt n}}\right)=1-\alpha$$
    $$P(|t|<t_{\alpha\over 2}(n-1))=1-\alpha$$
    $$\delta=t_{\alpha\over 2}(n-1)S/\sqrt n$$

    样本均值\(\bar X=\mu\)的概率为0, 但\(\mu\)落在会以置信度\(1-\alpha\)为概率落在置信区间\((\bar X-\delta,\bar X+\delta)\)上.


    特殊情况:

     \(\sigma^2\)已知(理想化条件, 一般为未知)则:

    $${{\bar X-\mu}\over{\sigma/\sqrt n}}\sim N(0,1)$$

    此时, 置信区间可根据正太分布计算.

    展开全文
  • 韦来生数理统计 中科大经典数理统计教材
  • 数理统计教程及习题

    2020-07-30 23:32:45
    数理统计教学课程,几份考试试卷及答案,练习题,精心整理的,很全的
  • 数理统计

    千次阅读 2015-06-22 16:59:32
    当研究并解决一个实际问题时, 我们会 遇到下面问题: ...靠的统计结论(统计推断): 1) 估计——从局部观测资料的统计特征,推断总体的特征(分布与矩); 2)假设检验——依据抽样数据资料,对总体的某种假

    当研究并解决一个实际问题时, 我们会
    遇到下面问题:
    • 1. 这个随机现象可以用什么样的分布律
    来刻划,这种分布律的选用合理吗?
    • 2. 所选用的这一分布律的参数是多少?
    如何估计和确定这些参数?
    如何利用数据资料,作出尽可能精确可
    靠的统计结论(统计推断):
    1) 估计——从局部观测资料的统计特征,推断总体的特征(分布与矩);
    2)假设检验——依据抽样数据资料,对总体的某种假设作检验,从而决定对此假定是拒绝抑或接受.


    数理统计的基本概念

    总体:研究对象全体; 也称母体, 记作S.
    样本:总体中抽出作观测的个体;也称子样,记ω
    样本容量:抽取的个体数目;也称样本大小.

    例子

    随机抽5支,得寿命数据(称为观察[测]值):
    725520683992742.(小时)
    一般记为,x1 x2 x3 x4 x5.
    又抽5支, x1 x2 x3 x4 x5.
    再抽5支, x1 x2 x3 x4 x5 .
    …… ……
    如此继续. 各组观察值彼此不同.
    如此继续. 每组中的第一支灯的寿命,
    也彼此不同. 这样,泛指所抽取的第一支荧光灯的寿命应是一个rv,记为
    X1 . 同样第二支的寿命是rv X2 ,…
    如此得一组rv : X1,X2,X3,X4,X5
    称为大小为5的样本.
    一般地则有大小(容量)为n 的样本,称x1,x2,...,xn样本观察值[现实].
    抽取的样本如能切实保证其随机性,那么应该彼此独立,且能反映总体的随机规律性,即所有样本彼此独立且与总体同分布. 这样的样本,我们称之为简单样本. 这种抽样方法,叫简单抽样.
    注意,在有限总体中,各观察结果可能不独立.


    样本的数字特征与分布

    最简单又方便的样本函数g(X1,,Xn)Xi们的一次和二次的线性组合.
    由于样本“平等”,线性组合中应有相等的权系数.

    一次时:样本的算术平均值X¯¯¯;
    二次时:中心化后的样本二阶中心矩S2n.
    X1,,Xn为总体S的大小为n的样本, 分别称

    X¯¯¯=1ni=1nXi    S2=1n1i=1n(XiX¯¯¯)2

    样本均值*样本方差(样本方差除以n-1的原因),而依次称
    Mk=1ni=1nXki    S2n=1ni=1n(XiX¯¯¯)2

    样本的k阶矩样本的二阶中心矩.

    记号:总体k阶矩

    μk=EXk+xkdFX(x)

    总体的k阶中心矩
    σk=+(xEX)kdFX(x)

    μ=μ1,σ2=σ2.

    注意
    1)M1=X¯¯¯,S2n没叫样本方差.
    2) 比较总体的期望μ、方差σ2与矩μk:
       1. 样本的均值、方差及k阶矩等都是rv,并且因n有限而总是存在的.
       2. 总体的期望、方差及k阶矩等不一定存在.且即便存在,也是实数值, 而非rv.
    3)代入观察值, 有相应的样本矩的观察值x,m以及s2 等.

    性质 如果总体k阶矩存在,则样本的k阶矩的数学期望等于总体的k阶矩,而当n趋于无穷时,样本的k阶矩以概率收敛到总体的k阶矩,即

    这里写图片描述


    顺序统计量与经验df

    仍从观察值出发设法求总体分布. 以五支荧光灯寿命数据725,520,683,992,742为例,构造

    这里写图片描述

    df 函数(如后图)称为经验df函数.

    {xi}观察值重新依序排列为{x(n)}:    x(1)x(2)xn

    这里写图片描述

    称为由{xi}决定的经验df, 简记为Fn(x).
    将以从小到大为序重新排列的一个样本,称为顺序统计量,专记为x(1) x(2)  xn
    下面一个非常重要的定理确立经验df 的重要地位. 此定理保证,几乎由每一组观察值得到的经验df,只要n足够大,都可作为总体df的近似. 定理中一致收敛性和几乎处处收敛性,给了我们充分的自由.从而由样本去找总体df,理论上有一个完满的解决.
    limnFn(x)=F(x)


    抽样分布与统计量

    正态总体常用的样本函数

    1.设总体SN(μ,σ2). 则
    样本均值X¯¯¯N(μ,σ2n),从而

    Z:=X¯¯¯μσ/nN(0,1)

    2.K2n:=n1(Xiμσ)2的分布χ2(n)
    K2nn个独立的标准正态变量的平方和,称n个独立的标准正态变量的平方和的分布为自由度为nχ2分布.
    3.(n1)S2σ2χ2(n1)
    样本均值与样本方差独立, 且
    K2=(n1)S2σ2=1n(XiX¯¯¯σ)2  χ2(n1)

    K2n=n1(Xiμσ)2中用X¯¯¯μK2.
    4.T:=X¯μS/n t(n1)
    Z:=X¯μσ/nN(0,1)中如σ未知,S2σ2的无偏估计,自然用S代替Z中的σ引入T
    如果Z Yχ2(n)且独立,则称
    t=ZY/Nt(n)

    即自由度nt分布.
    5.Fnm:=S21σ22S22σ21F(n1,m1)
    如果Xχ2(n),Yχ2(n),且两者相互独立,则称F=χ2(n)/nχ2(m)/m(n,m)
    为自由度为n,m的F分布

    性质

    • t 分布是对称的,且n极限为正态(n30时近似的效果就很好) .
    • t 分布只有k<n阶矩.
    κ2分布和F分布不对称,且x<0 时为0.
    κ2 分布的可加性:设U 与V 独立,且分别~κ2(n)κ2(m),则UVκ2(n+m).
    对给定的实数α(0,0.5), 使

    P(X>y)=yfX(x)=α

    成立的点y, 称为X 或其分布的上百分位α点. 特别对N(0,1)t(n)κ2(n)F(n,m)分布, 分别记为
    zα,tα(n),χ2α(n),Fα(n,m)

    使
    P(X>y)=yfX(x)=1α

    成立的点y, 称为X 或其分布的下百分位α点. 特别对N(0,1)t(n)κ2(n)F(n,m)分布, 分别记为
    z1α,t1α(n),χ21α(n),F1α(n,m)

    百分位点的值,可由表查得.

    例题:

    例题1:

    X1,X2,,Xn, 是来自总体XN(0,σ2)的简单随机样本,求统计量

    10i=1(1)iXi20i=11X2i

    的分布。
    解:
    由题意可知XkN(0,σ2)可得
    10i=1(1)iXiN(0,10σ2)
    10i=1(1)iXi /10σN(0,1)
    又因为20i=11(X2iσ)χ2(10)
    故由t分布定义可得
    10i=1(1)iXi20i=11X2i = 10i=1(1)iXi10σ(20i=11(X2i/10)σ)1t(10)

    例题2:

    X1,X2,,Xn+1是正态总体的简单样本,前面容量为n的样本均值和样本二阶中心矩分别为X¯¯¯S2n
    试求下列样本函数的分布
    1)(n1)(X1μ)2 / ni=2(Xiμ)2
    2)Xn+1X¯Snn1n+1

    解:
    1)
    (n1)(X1μ)2 / ni=2(Xiμ)2=(Xiμ)2σ2ni=2(Xiμσ)2n1
    分子服从χ2(1),分母服从χ2(n1)
    所以整个式子服从F(1,n1)
    2)
    Xn+1X¯Snn1n+1
    分母部分变成:
    S2n(n1)σ2χ2(n1)
    分子部分变成:
    Xn+1X¯σ(0,1)
    因此原式变成:
    Xn+1X¯σS2n(n1)σ2 / n1
    服从t(n1)

    展开全文
  • 数理统计基础知识1

    千次阅读 2018-12-27 14:19:31
    数理统计基础知识1. 随机变量2. 概率与分布离散型随机变量概率分布连续随机变量概率分布3. 常见概率分布离散型2. 总体、个体和样本 1. 随机变量 简单的来说,随机变量是将一个随机性的事件的可能发生结果映射为数值...

    1. 随机变量

    简单的来说,随机变量是将一个随机性的事件的可能发生结果映射为数值的一种方式,先看下面这个例子:

    例子:在抛硬币这个随机事件中,可能得到的结果为正面和反面(假设立起来的情况不存在)。所以在这个随机事件中,可能的结果构成的集合为{ 正面,反面}。为了方便我们研究这个随机事件,可将正面表示为 1, 反面表示为0,因此可能的结果可表示为Ω={1, 0}(称样本空间)。

    随机变量:随机变量X是定义在样本空间Ω上的一个实值单值函数,即对于随机事件的所有结果,都可以通过随机变量X映射到样本空间S中的唯一的实值。

    随机变量的要求:①实值单值函数 ②函数是可测的

    随机变量按照取值是否连续可分为离散型随机变量连续型随机变量

    例如:灯泡的使用寿命为连续型随机变量,掷硬币的结果为离散型随机变量

    2. 概率与分布

    离散型随机变量概率分布

    对于离散型随机变量来说,样本空间中的每一个值都对应的确切的概率,我们把离散型随机变量的概率分布称为分布律,也称概率分布、概率函数、分布等。
    定义1:设离散型随机变量X所有可能取的值为xk(k=1, 2, …),事件X=xk的概率为
    P{X=xk}=pkk=1,2,...P\{X=x_k\}=p_k,k=1, 2,...
    称为离散型随机变量X的分布律
    :∑pk=1

    定义2:可定义分布函数为:
    F(x)=P{Xx}=xkxpkk=1,2,... F(x)=P\{X≤x\}=\sum_{x_k≤x}p_k , k=1, 2, ...\quad
    分布函数F(x)表示随机变量X小于给定值x的概率。

    连续随机变量概率分布

    对于连续型随机变量来说,由于样本空间的值是连续的,因此讨论某一个值对应的概率是没有意义的,也可以说概率为0。

    例如:灯泡的使用寿命为0到∞小时,则灯泡寿命正好为1000小时的概率趋于0。

    描述连续型随机变量的概率分布规律可以采用概率密度的概念。
    定义3:设X为随机变量,F(x)为X的分布函数,若存在非负函数p(x),使对于任意实数x有:
    F(x)=xp(x)dx F(x)=\quad \int_{-\infty} ^x p(x) dx
    则X为连续型随机变量,其中p(x)为X的概率密度函数,简称概率密度
    :① ∫p(x)=1 ②F’(x)=p(x)

    3. 期望与方差

    在概率论中,为了研究分布的一些性质,我们引入了期望与方差两个概念。其中,期望表示分布的平均情况,而方差表示分布的分散情况。

    上图中是期望与方差不同的三个正态分布的密度函数,其中,随机变量X1X_1X2X_2的期望相同而方差不同,故X2X_2看起来更加的平坦;X1X_1X3X_3的方差相同而期望不同,因此X1X_1X3X_3的中心位置不同。下面给出期望和方差的定义:

    期望

    离散型随机变量的分布是离散的,因此期望与方差的形式为求和的形式:
    定义1:设离散型随机变量X的分布律为:
    P{X=xk}=pkk=1,2,...P\{X=x_k\}=p_k,k=1, 2,...
    且级数kxkpk\displaystyle\sum_{k}x_kp_k收敛,则称kxkpk\displaystyle\sum_{k}x_kp_k为随机变量X的数学期望,简称期望。记作:
    E(X)=kxkpkk=1,2,...E(X)=\sum_{k}x_kp_k, k=1,2, ...

    例子:考虑掷硬币这个随机事件,设硬币朝上记为1,朝下记为0。设二者的概率均为0.5,则结果的数学期望E(X)=kxkpk=10.5+00.5=0.5E(X)=\sum_{k}x_kp_k=1*0.5+0*0.5=0.5

    连续性随机变量的期望可通过积分求得,下面给出定义:
    定义2: 设连续型随机变量X的密度函数为f(x)f(x),若积分 +xf(x)dx\int_{-\infty} ^{+\infty}xf(x) dx收敛,则随机变量X的数学期望为:
    E(X)=+xf(x)dxE(X)=\int_{-\infty} ^{+\infty}xf(x) dx
    因此,我们可以通过对密度函数f(x)f(x)进行积分求得离散型随机变量的期望。

    性质:随机变量的期望有如下几条重要的性质
    (1) E(kX)=kE(X)E(kX)=kE(X)
    (2) E(X+Y)=E(X)+E(Y)E(X+Y)=E(X)+E(Y)
    (3) E(XY)=E(X)E(Y)E(XY)=E(X)E(Y)(要求X与Y相互独立)

    方差

    通常情况下,方差可以通过均值和分布求得,下面给出方差的定义和计算方法:
    定义3: 设随机变量X的期望为EXEX, 且E{(XEX)2}E\{(X-EX)^2\}存在,则称其为随机变量X的方差,记为:
    D(X)=E{(XEX)2}D(X)=E\{(X-EX)^2\}
    通常方差还可以通过下式进行计算:
    D(X)=E(X2)(EX)2D(X)=E(X^2)-(EX)^2
    性质:随机变量的方差有如下几条重要的性质
    (1) D(kX)=k2D(X)D(kX)=k^2D(X)
    (2) D(X±Y)=D(X)+D(Y)D(X±Y)=D(X)+D(Y)

    3. 常见概率分布

    离散型随机变量

    (1) 两点分布
    两点分布又称为0-1分布、伯努利分布。若随机变量X服从两点分布,则X的取值为1/0,对应的概率为p/(1-p)。记为X~B(1,p)
    分布律P{X=0}=pP{X=1}=1p0&lt;p&lt;1