精华内容
下载资源
问答
  • 有很多统计推断是基于正态分布的假设,以标准正态分布变量为基石而构造的三个著名统计量在实际中有广泛的应用,这是因为这三个统计量不仅有明确背景,而且其抽样分布的密度函数有显式表达式,它们被称为统计中的“三...

    有很多统计推断是基于正态分布的假设,以标准正态分布变量为基石而构造的三个著名统计量在实际中有广泛的应用,这是因为这三个统计量不仅有明确背景,而且其抽样分布的密度函数有显式表达式,它们被称为统计中的“三大抽样分布”。这三大抽样分布即为著名的卡方分布,t分布F分布

    目录

    1 卡方分布(\chi ^{2}分布)

    1.1 定义

    1.2 性质

    2 t分布

    2.1 定义

    2.2 性质

    3 F分布

    3.1 定义

    3.2 性质

    4 正态总体样本均值和样本方差的分布

    4.1 正态变量线性函数的分布​

    4.2 正态变量样本均值和样本方差的分布

    5 几个重要推论

    6 总结

     



    1 卡方分布(\chi ^{2}分布)

    1.1 定义

    设随机变量 X 是自由度为 n 的 χ2 随机变量, 则其概率密度函数为

    \Gamma(\cdot )表示的是一个gamma函数,它是整数k的封闭形式。gamma函数的介绍如下伽马函数的总结

    \chi _{n}^{2} 的密度函数 g_{n}(x) 形状如下图

    \chi _{n}^{2}密度函数的支撑集 (即使密度函数为正的自变量的集合) 为(0, +∞), 从上图可见当自由度 n 越大, \chi _{n}^{2} 的密度曲线越趋于对称, n
    越小, 曲线越不对称. 当 n = 1, 2 时曲线是单调下降趋于 0. 当 n ≥ 3时曲线有单峰, 从 0 开始先单调上升, 在一定位置达到峰值, 然后单下降趋向于 0。

    若 X ∼ \chi _{n}^{2}, 记 P(x> c)=\alpha,则 c=\chi _{n}^{2}(\alpha ) 称为 \chi _{n}^{2} 分布的上侧 \alpha 分位数, 如下图所示。当\alphan 给定时可查表求出 \chi _{n}^{2}(a) 之值,如\chi _{10}^{2}(0.01)=23.209\chi _{5}^{2}(0.05)=12.592 等。

    1.2 性质

    χ2 变量具有下列性质:


    2 t分布

    说起t分布,首先要提一句u分布,正态分布(normal distribution)是许多统计方法的理论基础。正态分布的两个参数μ和σ决定了正态分布的位置和形态。为了应用方便,常将一般的正态变量X通过u变换[(X-μ)/σ]转化成标准正态变量u,以使原来各种形态的正态分布都转换为μ=0,σ=1的标准正态分布(standard normaldistribution),亦称u分布。根据中心极限定理,通过抽样模拟试验表明,在正态分布总体中以固定 n 抽取若干个样本时,样本均数的分布仍服从正态分布,即N(μ,σ)。所以,对样本均数的分布进行u变换,也可变换为标准正态分布N (0,1)

    由于在实际工作中,往往σ(总体方差)是未知的,常用s(样本方差)作为σ的估计值,为了与u变换区别,称为t变换统计量t 值的分布称为t分布

    2.1 定义

    设随机变量 T ∼ t_{n}, 则其密度函数为

    该密度函数的图形如下

    t_{n}的密度函数与标准正态分布 N(0, 1) 密度很相似, 它们都是关于原点对称, 单峰偶函数, 在 x = 0 处达到极大. 但 t_{n} 的峰值低于
    N(0, 1) 的峰值, t_{n} 的密度函数尾部都要比 N(0, 1) 的两侧尾部粗一些. 容易证明:

    此处 \varphi (x)N(0, 1) 变量的密度函数。

    若T ∼ t_{n},记P(\left | T \right |> c)=\alpha,则c={t_{n}}(\alpha /2)为自由度为nt分布的双侧\alpha分位数(如上图所示). 当给定 \alpha 时, {t_{n}}(\alpha ), {t_{n}}(\alpha /2)
    等可通过查表求出. 例如 {t_{12}}(0.05)=1.782 ,{t_{9}}(0.025)=2.262等。

    t 分布是英国统计学家 W.S. Gosset 在 1908 年以笔名 Student发表的论文中提出的, 故后人称为 “学生氏 (Student) 分布” 或 “t
    布”。

    2.2 性质

    t 变量具有下列的性质:


    3 F分布

    3.1 定义

    若随机变量 Z ∼F_{m,n}, 则其密度函数为

    自由度为 m, n F 分布的密度函数如下图:

     

    注意 F 分布的自由度 m n 是有顺序的, 当 m\neq n时, 若将自由度 m n 的顺序颠倒一下, 得到的是两个不同的 F 分布. 从上图
    可见对给定 m = 10, n 取不同值时f_{m,n}(x) 的形状, 我们看到曲线是偏态的, n 越小偏态越严重。

    若 F ∼ F_{m,n}, 记 P(F> c)=\alpha, 则 c=F_{m,n}(\alpha ) 称为 F 分布的上侧 \alpha 分位数 (见上图). 当 m, n\alpha 给定时, 可以通过查表求出
    F_{m,n}(\alpha )之值, 例如F_{4,10}(0.05)=3.48,F_{10,15}(0.01)=3.80 等. 在区间估计和假设检验问题中常常用到.

    3.2 性质

    F 变量具有下列的性质:

    以上性质中 (1) 和 (2) 是显然的, (3) 的证明不难. 尤其性质 (3)在求区间估计和假设检验问题时会常常用到. 因为当 α 为较小的数,
    如 α = 0.05 或 α = 0.01, m, n 给定时, 从已有的 F 分布表上查不到 F_{m,n}(1-0.05)F_{m,n}(1-0.01) 之值, 但它们的值可利用性质(3) 求得, 因为 F_{n,m}(0.05)F_{n,m}(0.01) 是可以通过查 F 分布表求得的.


    4 正态总体样本均值和样本方差的分布

    为方便讨论正态总体样本均值和样本方差的分布, 我们先给出正态随机变量的线性函数的分布.

    4.1 正态变量线性函数的分布

    4.2 正态变量样本均值和样本方差的分布

    下述定理给出了正态变量样本均值和样本方差的分布和它们的独立性.


    5 几个重要推论

    下面几个推论在正态总体区间估计和假设检验问题中有着重要应用.


    6 总结

    数据在使用前要注意采用有效的方法收集数据, 如设计好抽样方案, 安排好试验等等. 只有有效的收集了数据, 才能有效地使用数据,开展统计推断工作.获得数据后, 根据问题的特点和抽样方式确定抽样分布, 即统计模型. 基于统计模型, 统计推断问题可以按照如下的步骤进行:

    1. 确定用于统计推断的合适统计量;
    2. 寻求统计量的精确分布; 在统计量的精确分布难以求出的情形,可考虑利用中心极限定理或其它极限定理找出统计量的极限分布.
    3. 基于该统计量的精确分布或极限分布, 求出统计推断问题的精确解或近似解.
    4. 根据统计推断结果对问题作出解释

    其中第二步是最重要, 但也是最困难的一步. 统计三大分布及正态总体下样本均值和样本方差的分布, 在寻求与正态变量有关的统计量精确分布时, 起着十分重要作用. 尤其在求区间估计和假设检验问题时可以看得十分清楚

     

    展开全文
  • 抽样分布

    2019-12-05 21:23:36
    CONTENTS常用统计量样本均值样本方差样本偏度样本峰度次序统计量充分统计量常用抽样分布卡方分布T分布中心极限定理(其他重要抽样分布) 常用统计量 样本均值 样本均值又叫样本均数。即为样本的均值。均值是表示一组...

    常用统计量

    样本均值

    样本均值又叫样本均数。即为样本的均值。均值是表示一组数据集中趋势的量数,是指在一组数据中所有数据之和再除以这组数据的个数。它是反映数据集中趋势的一项指标。样本均值则是在总体中的样本数据的均值。

    样本方差

    先求出总体各单位变量值与其算术平均数的离差的平方,然后再对此变量取平均数,就叫做样本方差。样本方差用来表示一列数的变异程度。样本均值又叫样本均数。即为样本的均值。均值是指在一组数据中所有数据之和再除以数据的个数。

    样本偏度

    样本偏度一种基本统计量.样本三阶中心矩除以样本二阶中心矩的 32\frac{3}{2} 次幂的商,记为 SkSk
    即样本偏度常用作总体偏度的估计量和检验总体分布正态性的统计量.而总体偏度是一个描述总体分布不对称性的数字特征.正态分布是左右对称的,因而它的偏度为零。

    样本峰度

    样本峰度一种基本统计量,样本的峰度和偏度都是作为检验总体分布正态性的统计量。样本四阶中心矩除以样本二阶中心矩平方的商再减去 εε,记为 KuKu,样本峰度常用以作总体峰度的估计量。正态分布的峰度为零。非正态分布的峰度是以正态分布的峰度为标准来描述其分布密度形状为陡峭或平坦的一个数字特征。

    次序统计量

    X1,X2,,XnX1,X2, …, Xn 是取自总体 XX 的样本,X(i)X(i) 称为该样本的第 ii 个次序统计量,它的取值是将样本观测值由小到大排列后得到的第 ii 个观测值。从小到大排序为 x(1),x(2),,x(n)x(1),x(2), …,x(n),则称 X(1),X(2),,X(n)X(1),X(2), …,X(n) 为顺序统计量。

    充分统计量

    对于给定的统计推断问题,包含了原样本中关于该问题的全部有用信息的统计量。对于未知参数的估计问题,保留了原始样本中关于未知参数θ的全部信息的统计量,就是充分统计量。如样本均值X是总体数学期望的充分统计量。数学上,设 (XX)(X₁, …,Xₑ) 是来自总体 XX 的一个随机样本,T=T(XX)T=T(X₁, …,Xₑ) 是一统计量。若在 T=tT=t 的条件下,样本的条件分布与未知参数 θθ 无关,则称统计量 TTθθ 的充分统计量。

    常用抽样分布

    卡方分布

    nn 个相互独立的随机变量 ξξ...,ξnξ₁,ξ₂,...,ξn,均服从标准正态分布(也称独立同分布于标准正态分布),则这 nn 个服从标准正态分布的随机变量的平方和构成一新的随机变量,其分布规律称为卡方分布。

    T分布

    在概率论和统计学中,TT-分布用于根据小样本来估计呈正态分布且方差未知的总体的均值。如果总体方差已知(例如在样本数量足够多时),则应该用正态分布来估计总体均值。
    TT分布曲线形态与 nn(确切地说与自由度dfdf)大小有关。与标准正态分布曲线相比,自由度 dfdf 越小,tt 分布曲线愈平坦,曲线中间愈低,曲线双侧尾部翘得愈高;自由度 dfdf 愈大,tt 分布曲线愈接近正态分布曲线,当自由度 df=df=∞ 时,tt 分布曲线为标准正态分布曲线。

    中心极限定理(其他重要抽样分布)

    中心极限定理,是指概率论中讨论随机变量序列部分和分布渐近于正态分布的一类定理。这组定理是数理统计学和误差分析的理论基础,指出了大量随机变量近似服从正态分布的条件。它是概率论中最重要的一类定理,有广泛的实际应用背景。在自然界与生产中,一些现象受到许多相互独立的随机因素的影响,如果每个因素所产生的影响都很微小时,总的影响可以看作是服从正态分布的。中心极限定理就是从数学上证明了这一现象。最早的中心极限定理是讨论重点,伯努利试验中,事件A出现的次数渐近于正态分布的问题。

    展开全文
  • 第六章 样本及抽样分布 6.3抽样分布 文章目录第六章 样本及抽样分布 6.3抽样分布基本概念常见分布 基本概念 eg: 几个常用的统计量 观察值为: 经验分布函数 总体分布函数F(x)F(x)F(x)对应的统计量称为经验分布...

    第六章 样本及抽样分布 6.3抽样分布

    基本概念

    在这里插入图片描述
    eg:
    在这里插入图片描述
    几个常用的统计量
    在这里插入图片描述
    观察值为:
    在这里插入图片描述
    经验分布函数
    在这里插入图片描述
    总体分布函数F(x)F(x)对应的统计量称为经验分布函数。

    在这里插入图片描述

    常见分布

    在这里插入图片描述
    概率密度函数如图:
    在这里插入图片描述
    性质:
    在这里插入图片描述
    在这里插入图片描述
    在这里插入图片描述


    在这里插入图片描述
    在这里插入图片描述


    在这里插入图片描述
    如图:
    在这里插入图片描述
    在这里插入图片描述


    正态总体的样本均值与样本方差的的分布

    在这里插入图片描述
    一些定理:
    在这里插入图片描述
    在这里插入图片描述
    在这里插入图片描述
    在这里插入图片描述
    在这里插入图片描述

    展开全文
  • “不靠押题靠实力” ——李林 抽样分布是考研概统部分的高频考点,考生需掌握的有各分布的性质、联系以及合成样本的分布、数字特征,综合性较强。一、简单随机抽样定义:从总体X中随机抽取n个个体记为xi ,i=1,2,…,n...
    “不靠押题靠实力”         ——李林        

    3d2976928a871c1a11bfaddb0b9199e0.png

    抽样分布是考研概统部分的高频考点,考生需掌握的有各分布的性质、联系以及合成样本的分布、数字特征,综合性较强。

    一、简单随机抽样

    定义:从总体X中随机抽取n个个体记为xi ,i=1,2,…,n。其中xi相互独立,并且与总体 X 同分布,则称xi是来自总体X的简单随机样本,样本容量为n。

    二、样本:均值分布和数字特征

    定义:设任意总体X,总体均值EX=μ,总体方差DX=σ2。x1, x2 , … , xn为其简单随机样本,当n较大时,样本均值服从(或近似服从)正态分布:

    75024fae17283268238da9ab2ac9f1d9.png

    并且不论总体X服从任何分布,满足样本数字特征:

    7f7d7e7a5cb15c9ae6c81c75f6e13f2e.png

    三、常用三大抽样分布

    卡方、T、F是常用的三大抽样分布,这三个分布都是基于标准正态分布N(0,1),因此说标准正态分布是万金油,十分重要。

    1、 卡(Chi)方分布(重要)

    67f574c6dc2ae0cbdffd71e2dab1aba3.png

    49b58cbd96b298cee8e0ecb7cd315e93.png

    重要性质:

    209319b564af0067b73f89c77fa8ecfe.png

    2、 T分布

    f3fa91e3120aecea9705d5ee76f1897f.png

    e43e7fbdbc7c5dbca5beafe496a77922.png

    重要性质:

    7a37d1bb930c60df5327ce06d237e149.png

    3、 F分布

    42eb87b60db4dcb80c4ea605418ac56f.png

    9f5af36b9640637e3244075ffcc065fe.png

    重要性质:

    2f541fad06c1c17a6d51a970aad5d745.png

    四、正态总体下的抽样分布(重要)

    1.单总体

    设总体X ~ N(μ,σ2),则有:

    3e11442c19c40168ab2dc4e7f75040ec.png

    *结论 I 很重要,常搭配卡方分布的数字特征出题。

    推导过程:

    86dcf50e34b8a85d3849d5e329eb15cf.png

    0225d0eae57ed15dd897c90b7c0613a6.png

    *2.双总体(数三不考)

    设总体X ~ N(μ1 , σ12),Y~ N(μ2 , σ22),且X与Y独立,随机样本x1, x2 , … , xn; y1, y2 , … , ym 则有:

    6d8491ba5673c900456518e8d67bac0f.png

    参考文献

    [1]李林.概率论与数理统计辅导讲义.国家开放大学出版社.2020.4

    [2]李林.精讲精练880题(数学三).国家开放大学出版社.2020.5

    [3]李林.高频考点透析108题.国家开放大学出版社.2020.8

    [4]张宇.考研数学基础三十讲.高等教育出版社.2019.8

    [5]张宇.考研数学闭关修炼.中国政法大学出版社.2020.5

    一切繁琐问题必有其猥琐解法

    此章已毕,鄙人欲休,阁下若觉本文666,不妨【点赞】、【在看】享于左右益友!
    展开全文
  • 抽样分布:现在,假设将抽取n个样本组成一个简单随机样本的过程重复进行下去,每次都计算 x¯\bar{x} 和 p¯\bar{p} 的值。 在不同的简单随机样本中,这些样本统计量的值有各种可能的结果,它们是随机变量。是随机...
  • 样本均值的抽样分布One of the most important concepts discussed in the context of inferential data analysis is the idea of sampling distributions. Understanding sampling distributions helps us better ...
  • p¯\bar{p} 的抽样分布是样本比率 p¯\bar{p} 的所有可能值的概率分布。 下面我们了解下 p¯\bar{p} 的期望、标准差、形状这些数学特征。 p¯\bar{p} 的数学期望 E(p¯)=pE(\bar{p})=p ,其中p为总体比率。 ...
  • 抽样分布也称统计量分布、随机变量函数分布,是指样本估计量的分布。样本估计量是样本的一个函数,在统计学中称作统计量,因此抽样分布也是指统计量的分布。以样本平均数为例,它是总体平均数的一个估计量,如果按照...
  • (1)从总体到样本的方向,目的是要研究从总体中抽出的所有可能样本统计量的分布及其与原总体的关系,即抽样分布 (2)从样本到总体的方向,从总体中随机抽取样本,并用样本对总体作出推论,即统计推断问题。 抽样...
  • 基本概念与抽样分布

    2014-04-26 12:48:32
    基本概念与抽样分布 基本概念与抽样分布基本概念与抽样分布
  • 1. 介绍三大抽样分布(卡方分布,t分布,F分布的定义和基本性质) 2. 展示各个分布的概率密度图像
  • 零基础理解抽样分布

    2020-03-06 17:51:13
    文章目录抽样分布1 样本统计量2 正态分布3 三大抽样分布3.1 卡方分布3.2 t分布3.3 F分布4 统计量的抽样分布4.1 样本均值的抽样分布4.2 样本比例的抽样分布4.3 样本方差的抽样分布 定义:样本统计量的概率分布,是一...
  • 统计的抽样分布

    2012-04-01 15:36:16
    统计的抽样分布 抽样分布 定义和主要概念: • 用来估计一个未知总体参数的抽样统计称为 估计。 • 真实参数值和估计值间的差异称为抽样误 差。 • 带有概率分布的随机变量统计称为抽样分 布,由重复抽样产生。 • ...
  • 有很多统计推断是基于正态分布的假设,以标准正态分布变量为基石而构造的三个著名统计量在实际中有广泛的应用,这是因为这三个统计量不仅有明确背景,而且其抽样分布的密度函数有显式表达式,它们被称为统计中的“三...
  • 抽样分布概念及其三大重要分布

    千次阅读 2019-12-14 19:23:55
    抽样分布概念 总体的容量很大,我们需要从总体抽出的样本进行一些规律的分析,进而对总体的分布情况进行推断,因此抽样分布具有重要意义。 分析抽样样本规律的过程中,需要对抽样特征进行提取,进而对原始数据进行...
  • 对于大样本的抽样分布,由中心极限定理,无论总体分布是否为正态分布,其均值x_bar的抽样分布为近似正态分布,同时对于较大的n(n>=30),s将会是σ的优良估计。 x_bar的抽样分布的置信区间可以使用z统计量来...
  • 抽样分布及参数估计抽样分布及参数估计1.随机的基本概念随机实验随机实验是概率论的一个基本概念。概括的讲,在概率论中把符合下面三个特点的试验叫做随机试验可以在相同的条件下重复的进行每次试验的可能结果不止一...
  • 抽样分布习题 1.抽样分布是指 C A 一个样本各观测值的分布 B 总体中各观测值 的分布 C 样本统计量的分布 D 样本数量的分布 2.根据中心极限定理可知当样本容量充分大时样本均值 的抽样分布服从正态分布其分布的均值为...
  • 1.概率抽样分布 2.三种不同性质的分布 3.一个总体参数推断时样本统计量的抽样分布 4. 两个总体参数推断时样本统计量的抽样分布 1.概率抽样分布 根据抽取原则的不同,分为概率抽样和非概率抽样。概率抽样是根据已知的...

空空如也

空空如也

1 2 3 4 5 ... 20
收藏数 2,169
精华内容 867
关键字:

抽样分布