精华内容
下载资源
问答
  • 《数理统计》课本上对二项分布、泊松分布以及正态分布特征函数的推导过程没有详细描述,我在利用现有公式对上述三种分布推导一遍,并对相关性质知识进行回顾,以此记录。 特征函数 特征函数是实变量的复值函数,...

    《数理统计》课本上对二项分布、泊松分布以及正态分布的特征函数的推导过程没有详细描述,我在利用现有公式对上述三种分布推导一遍,并对相关性质知识进行回顾,以此记录。


    特征函数

    特征函数\varphi_{x}\left ( t \right )是实变量的复值函数,它在一切实数t\in \left ( -\infty,+\infty \right )都有定义,在不引起混淆的情况下,将\varphi_{x}\left ( t \right )简记为\varphi\left ( t \right )

    X是离散型随机变量,其概率分布列为p_{x}=P\left \{ X=x_{k} \right \},则它的特征函数为

                                                                                \varphi\left ( t \right )=E(e^{itX})=\sum_{k}^{ }p_{k}e^{itx_{k}}

    X是连续型随机变量,其概率密度为f(x),则它的特征函数为

                                                                          \varphi\left ( t \right )=E(e^{itX})=\int_{-\infty }^{+\infty }e^{itx}f(x)dx


    二项分布特征函数推导

    二项分布:离散型概率分布,B\sim (n,p)P\left \{ X=k \right \}=\binom{n}{k}p^{k}(1-p)^{n-k}

    期望:E(x)=np

    方差:D(x)=np(1-p)

    特征方程的推导:

    \varphi \left ( t \right )=\sum_{k}^{ }p_{k}e^{itk}

             =\sum_{k}^{ }e^{itk}\binom{n}{k}p^{k}(1-p)^{n-k}

             =\sum_{k}^{ }\binom{n}{k}\left ( pe^{it} \right )^{k}\left ( 1-p \right )^{n-k}

             =\left ( pe^{it}+\left ( 1-p \right ) \right )^{n}


    泊松分布特征函数推导

    泊松分布:离散型概率分布,P\left \{ X=k \right \}=\frac{\lambda ^{k}}{k!}e^{-\lambda },k=0,1,...

    期望:E(x)=\lambda

    方差:D(x)=\lambda

    特征方程的推导:

    \varphi \left ( t \right )=\sum_{k}^{ }p_{k}e^{itk}

             =\sum_{k}^{ }\frac{\lambda ^{k}}{k!}e^{-\lambda }e^{itk}

             =e^{-\lambda }\sum_{k}^{ }\frac{\left ( e^{it}\lambda \right )^{k}}{k!}

             =e^{-\lambda }e^{e^{it}\lambda }

             =exp\left \{ \left ( e^{it}-1 \right )\lambda \right \}


    正态分布特征函数推导

    正态分布:连续型概率分布,X\sim \left ( \mu ,\sigma ^{2} \right )f\left ( x \right )=\frac{1}{\sqrt{2\Pi}\sigma }exp\left \{ -\frac{\left ( x-\mu \right )^{2}}{2\sigma ^{2}} \right \}

    期望:E(x)=\mu

    方差:D(x)=\sigma ^{2}

    特征方程的推导:

    方法一:

    \varphi \left ( t \right )=\int_{-\infty }^{+\infty }e^{itx}\frac{1}{\sqrt{2\Pi }\sigma }exp\left \{ -\frac{\left ( x-\mu \right )^{2}}{2\sigma ^{2}} \right \}dx

             =\int_{-\infty }^{+\infty }\frac{1}{\sqrt{2\Pi }\sigma }exp\left \{ -\frac{\left [ \left ( x-\mu \right )-\sigma ^{2} it\right ]^{2}-2\sigma ^{2}\mu it-\sigma ^{4}i^{2}t^{2}}{2\sigma ^{2}} \right \}dx

             =exp\left \{ i\mu t+\frac{\sigma ^{4}i^{2}t^{2}}{2\sigma ^{2}} \right \}

    由于\int_{-\infty }^{+\infty }\frac{1}{\sqrt{2\Pi }\sigma }exp\left \{ -\frac{\left ( x-\mu -\sigma ^{2}it \right )^{2}}{2\sigma ^{2}} \right \}dx=1U\sim N\left ( (\mu +\sigma ^{2}it),\sigma ^{2} \right )

    由于i=\sqrt{-1},所以i^{2}=-1

             =exp\left \{ i\mu t-\frac{\sigma ^{2}t^{2}}{2} \right \}

    方法二:

    \varphi \left ( t \right )=\int_{-\infty }^{+\infty }e^{itx}\frac{1}{\sqrt{2\Pi }\sigma }exp\left \{ -\frac{\left ( x-\mu \right )^{2}}{2\sigma ^{2}} \right \}dx

             (a=\frac{x-\mu }{\sigma })

             =\frac{1}{\sqrt{2\Pi }\sigma }\int_{-\infty }^{+\infty }exp\left \{ it\left ( a\sigma +\mu \right )-\frac{a^{2}}{2} \right \}\sigma da

             =e^{i\mu t}\frac{1}{\sqrt{2\Pi }}\int_{-\infty }^{+\infty }exp\left \{ -\frac{a^{2}}{2} +ita\sigma \right \}da

             =e^{i\mu t}\frac{1}{\sqrt{2\Pi }}\int_{-\infty }^{+\infty }exp\left \{ -\frac{\left ( a-it\sigma \right )^{2}}{2}+\frac{\left ( it\sigma \right )^{2}}{2} \right \}da

    同理由于i=\sqrt{-1},所以i^{2}=-1

             =\frac{1}{\sqrt{2\Pi }}exp\left \{​{i\mu t-\frac{t^{2}\sigma ^{2}}{2}} \right \}\int_{-\infty }^{+\infty }exp\left \{ -\frac{\left ( a-it\sigma \right )^{2}}{2} \right \}da

    由于\int_{-\infty }^{+\infty }exp\left \{ -\frac{\left ( a-it\sigma \right )^{2}}{2} \right \}da=\sqrt{2\Pi }

             =exp\left \{​{i\mu t-\frac{t^{2}\sigma ^{2}}{2}} \right \}

    以上就是全部推导过程!

    其他函数就不一一展示了,公式在最上方,通过计算可以得到每一种分布的特征函数!

     

    展开全文
  • 二项分布的概念与特征

    千次阅读 2011-03-25 14:17:00
     二项分布的概念与特征  一、二项分布的概念 在医学领域中,有一些随机事件是只具有两种互斥结果的离散型随机事件,称为二项分类变量(dichotomous variable),如对病人治疗结果的有效与无效,某种...

    http://www.foodmate.net/lesson/41/

    第一节  二项分布的概念与特征

     

    一、二项分布的概念

    在医学领域中,有一些随机事件是只具有两种互斥结果的离散型随机事件,称为二项分类变量(dichotomous variable),如对病人治疗结果的有效与无效,某种化验结果的阳性与阴性,接触某传染源的感染与未感染等。二项分布(binomial distribution)就是对这类只具有两种互斥结果的离散型随机事件的规律性进行描述的一种概率分布。

    考虑只有两种可能结果的随机试验,当成功的概率(π )是恒定的,且各次试验相互独立,这种试验在统计学上称为贝努里试验(Bernoulli trial)。如果进行n 次贝努里试验,取得成功次数为XX =0,1,…,n )的概率可用下面的二项分布概率公式来描述:

    (7.1)

    式中的n 为独立的贝努里试验次数,π 为成功的概率,(1-π )为失败的概率,X 为在n 次贝努里试验中出现成功的次数, 表示在n 次试验中出现X 的各种组合情况,在此称为二项系数(binomial coefficient)。

    所以 的含义为:含量为n 的样本中,恰好有 例阳性数的概率。

    含量为n 的样本中,发生各种阳性数的概率正好为下列二项式展开的各项

    (7.2)

    式中,π为总体阳性率;n 为样本含量;X 为阳性数;(n X)为组合数,即二项式展开后各项的系数。

    二、二项分布的应用条件

    1.各观察单位只能具有相互对立的一种结果,如阳性或阴性,生存或死亡等,属于两分类资料。

    2.已知发生某一结果(阳性)的概率为π ,其对立结果的概率为1-π ,实际工作中要求π 是从大量观察中获得比较稳定的数值。

    3.n 次试验在相同条件下进行,且各个观察单位的观察结果相互独立,即每个观察单位的观察结果不会影响到其他观察单位的结果。如要求疾病无传染性、无家族性等。

    三、二项分布的性质

    1.二项分布的均数和标准差在二项分布资料中,当πn 已知时,它的均数μ 及其标准差σ 可由式(7.3)和(7.4)算出。

    μ = (7.3)

    σ = (7.4)

    若均数和标准差不用绝对数表示,而是用率表示时,即对式(7.3)和(7.4)分别除以n ,得

    μp =π (7.5)

    σp = (7.6)

    σp 是样本率的标准误的理论值,当π 未知时,常用样本率p 作为π 的估计值,式(7.6)变为:

    sp = (7.7)

    2.二项分布的累计概率(cumulative probability)常用的有左侧累计和右侧累计两种方法。从阳性率为π 的总体中随机抽取含量为n 的样本,则

    (1)最多有k 例阳性的概率

    (7.8)

    (2)最少有k 例阳性的概率

    (7.9)

    其中,X =0,1,2,…,k ,…,n

    3.二项分布的图形已知πn ,就能按公式计算X =0,1,…,n 时的PX )值。以X 为横坐标,以PX )为纵坐标作图,即可绘出二项分布的图形,如图7.1,给出了p =0.5和 p =0.3时不同n 值对应的二项分布图。

    二项分布的形状取决于πn 的大小,高峰在m =n p 处。当p 接近0.5时,图形是对称的;p 离0.5愈远,对称性愈差,但随着n 的增大,分布趋于对称。当n →∞ 时,只要p 不太靠近0或1,特别是当nPn (1-P )都大于5时,二项分布近似于正态分布。

    π =0.5时,不同n 值对应的二项分布

    π=0.3时, 不同n 值对应的二项分布

    图7.1二项分布示意

    展开全文
  • 二项分布的定义、性质分布图形特征、相互关系、与正态分布的关系
  • 离散型变量 如:二项分布、泊松分布 三者之间的关系 二项分布(Binomial distribution) 二项分布(Binomial distribution)是n重伯努利试验成功次数的离散概率分布,记作。伯努利试验是只有两种可能结果的单次随机...

    变量类型:

    1. 连续型变量         如:指数分布、正态分布
    2. 离散型变量         如:二项分布、泊松分布

    三者之间的关系

    二项分布(Binomial distribution)

    二项分布(Binomial distribution)n重伯努利试验成功次数的离散概率分布,记作B(n,\pi )伯努利试验是只有两种可能结果的单次随机试验。

    伯努利试验都可以表达为“是或否”的问题。例如,抛一次硬币是正面向上吗?刚出生的小孩是个女孩吗?等等

    • 如果试验E是一个伯努利试验,将E独立重复地进行n次,则称这一串重复的独立试验为n重伯努利试验。
    • 进行一次伯努利试验,成功(X=1)概率为p(0<=p<=1),失败(X=0)概率为1-p,则称随机变量X服从伯努利分布。伯努利分布是离散型概率分布,伯努利分布(Bernoulli distribution)又名两点分布或0-1分布。

    二项分布的三个特点:

    • 每次实验结果,只能是两个互斥的结果之一。
    • 各次实验独立,各次的实验结果互不影响。。
    • 相同的实验条件下,每次实验中事件A的发生具有相同的概率\pi

    二项分布的概率函数P(X)可用公式

    P(X)=C_{n}^{X}\pi^{X}(1-\pi )^{n-X}

    其中,C_{n}^{X}=\frac{n!}{X!(n-X)!}

    对于任何二项分布,总有\sum_{X=0}^{n}P(X)=1

    例1.如果某地钩虫感染率为13%,随机观察当地150人,其中恰好有10人感染钩虫的概率有多大?

    分析: 
    (1)钩虫感染只有两个互斥的结果,即感染与非感染;
    (2)每个人被钩虫感染的概率相同;
    (3)人与人之间钩虫感染可假设为相互独立的,所以感染钩虫的人数 X 可认为服从 n = 150,π = 0.13的二项分布。

    P(X)=C_{n}^{X}\pi^{X}(1-\pi )^{n-X}

    P(X=10)=\frac{150!}{10!(150-10)!}\times (0.13^{10}\times 0.87^{(150-10)})=0.0055

    二项分布的特征

    • n,\pi是二项分布的两个参数,所以二项分布的形状取决于n,\pi(阳性率)。
    • \pi =0.5时分布对称,近似对称分布。
    • \pi ≠0.5时,分布呈偏态,特别是 n 较小时,\pi 偏离0.5越远,分布的对称性越差,但只要不接近1和0时,随着n的增大,分布逐渐逼近正态。
    • \pi1-\pi 不太小,而 n足够大,通常 n\pin(1-\pi )大于或等于5,我们常用正态近似的原理来处理二项分布的问题。

    二项分布的正态近似

    • 根据中心极限定理,在n较大,n\pin(1-\pi )均大于或等于5时,二项分布接近与正态分布。
    • n无穷大时,二项分布B(n,\pi)的极限分布是总体均数为\mu =n\pi,总体标准差为\sigma =\sqrt{n\pi (1-\pi )}的正态分布N(n\pi ,n\pi (1-\pi )),此时可用该正态分布进行估计。

    二项分布的均数和标准差

    对于任何一个二项分布B(n,\pi ),如果每次试验出现“阳性” 结果的概率均为\pi,则在 n 次独立重复实验中:

    1、出现  X 次阳性结果

    总体均数(出现阳性结果的次数X的均值):\mu_{X} =n\pi

    标准差(出现阳性结果的次数X的标准差):\sigma_{X} =\sqrt{n\pi (1-\pi )}

    2、阳性结果的频率记做为P=\frac{X}{n}

    P的总体均数(出现阳性结果频率P的均值):\mu_{P} =\pi

    标准差(出现阳性结果频率P的标准差):\sigma_{P} =\sqrt{\frac{\pi (1-\pi )}{n}}

    \sigma_{P}是频率P的标准误,反映阳性频率的抽样误差的大小。

    泊松分布(Poisson distribution)

    泊松分布是二项分布在阳性率特别小时的一种情形,用于描述单位时间、空间、面积等的罕见事件发生次数的概率分布,如:

    • 每毫升水中的大肠杆菌数
    • 单位时间(如1分钟)内放射性质点数
    • 每1000个新生儿中某出生缺陷、多胞胎、染色体异常等事件出现的例数

    泊松分布的三个特点:

    泊松分布是二项分布当中的一种特殊情况,则泊松分布也遵循二项分布的三个特点:

    • 观察结果相互独立
    • 每次试验只有两个结果
    • 发生的概率\pi不变

    如,人群中传染性疾病首例出现后便成为传染源,会增加后续病例出现的概率,因此病例数的分布不能看作是Poisson分布。

    又如,污染的牛奶中细菌成集落存在,单位容量牛奶中细菌数不能认为服从Poisson分布。 

    泊松分布分布一般记作P(\lambda ),其概率函数为: 

    P(X)=e^{-\lambda }\frac{\lambda ^{X}}{X!}

    式中,\lambda=n\pi为Poisson分布的总体均数(\pi表示概率);X 为观察单位内某稀有事件的发生次数;e 为自然对数的底,为常数,约等于2.71828,自然对数的底数e是由一个重要极限给出的:当n趋于无限时,\lim_{n \to +\propto }(1+\frac{1}{n})^n=e

    泊松定理(泊松分布是二项分布当中的一种特殊情况)

    设随机变量X(X=1,2,3,...)服从二项分布,即P(X)=C_{n}^{X}\pi^{X}(1-\pi )^{n-X}。其中,\pi(0<\pi <1)是与n有关的数,且设n\pi =\lambda >0是常数,则有\lim_{X \to \propto }P(X)=e^{-\lambda }\frac{\lambda ^{X}}{X!}X=1,2,3,...

    证明:依题设有\pi =\frac{\lambda }{n},代入P(X)=C_{n}^{X}\pi^{X}(1-\pi )^{n-X}中,有

    \begin{align}P(X) &=\frac{n(n-1)(n-2)...(n-X+1)}{X!}(\frac{\lambda }{n})^{X}(1-\frac{\lambda }{n})^{n-X} \\&=\frac{\lambda ^{X}}{X!}[\frac{n}{n}\cdot \frac{n-1}{n}\cdot \frac{n-2}{n}...\cdot \frac{n-X+1}{n}]\cdot(1-\frac{\lambda }{n}) ^{n}\cdot(1-\frac{\lambda }{n}) ^{-X} \\&=\frac{\lambda ^{X}}{X!}[1\cdot (1-\frac{1}{n})\cdot(1- \frac{2}{n})...\cdot (1-\frac{X-1}{n})]\cdot(1-\frac{\lambda }{n}) ^{n}\cdot(1-\frac{\lambda }{n}) ^{-X} \end{align}

    对于固定的X,有

    \lim_{n \to +\propto }1\cdot (1-\frac{1}{n})\cdot(1- \frac{2}{n})...\cdot (1-\frac{X-1}{n})=1

    \lim_{n \to +\propto }(1-\frac{\lambda }{n}) ^{n}=\lim_{n \to +\propto }(1-\frac{\lambda }{n}) ^{(-\frac{n}{\lambda })\cdot (-\lambda) }=e^{-\lambda }(根据\lim_{n \to +\propto }(1+\frac{1}{n})^n=e

    \lim_{n \to +\propto }(1-\frac{\lambda }{n}) ^{-X}=1

    所以\lim_{X \to \propto }P(X)=e^{-\lambda }\frac{\lambda ^{X}}{X!}X=1,2,3,...

    可见,二项分布的极限分布是泊松分布,当n很大,\pi很小时,可用e^{-\lambda }\frac{\lambda ^{X}}{X!}近似代替C_{n}^{X}\pi^{X}(1-\pi )^{n-X}(n\pi =\lambda ),一般n\geq 20,\pi \leq 0.05时,可采用上次近似公式代替。

    泊松分布的特征

    • 随着\lambda的增大,Poisson分布逐渐趋于对称分布。
    • \lambda>20时,Poisson分布可视为近似正态分布。

    下图表示出了\lambda对泊松分布的影响,\lambda表示泊松分布的均值。当\lambda变大时,不仅整个分布模式向右移动,数据也更加分散,方差随之变大。

    泊松分布的特性

    • 总体均数与总体方差相等:均为\lambda
    • 可加性:从总体均数分别为\lambda1 和\lambda2 的两个Poisson分布总体中各自随机抽出一份样本,其中稀有事件的发生次数分别为X_{1}X_{2} ,则合计发生数T=X_{1}+X_{2 }也服从Poisson分布,总体均数为\lambda1 +\lambda2 。

    可加性的运用:分5次,每次都是监测5毫升的水样,得到的\lambda都比20小,但是5次\lambda相加的之后形成的\lambda比20大的话,我们就可以10毫升水样当中的细菌数的分布用正态近似法了

    例:某放射性物质半小时内发出的脉冲数服从Poisson分布,平均为  360个,试估计该放射性物质半小时内发出的脉冲数大于400个的概率。

    \begin{align} P(X>400) & = 1-P(X\leq 400)\approx 1-\Phi (\frac{400+0.5-360}{\sqrt{360}}) \\ & = 1-\Phi(2.135)=0.0164 \end{align}

    其中,0.5表示连续型校正,表示处理离散型变量,应用到连续型的正态分布的时候,效果更佳的一种修正。

    注意:泊松分布不具备可乘性。

    指数分布

    设随机变量X的分布密度函数为

    f(x)=\left\{\begin{matrix} \lambda e^{-\lambda x},x>0\\ 0,x\leq 0 \end{matrix}\right.

    其中\lambda >0为常数,我们称X服从参数为\lambda的指数分布,记作X\sim E(\lambda ),其相应的分布函数为

    F(x)=\left\{\begin{matrix} 1-e^{-\lambda x},x>0 \\ 0,x\leq 0 \end{matrix}\right.

    f(x)F(x)的图形见下图。

    指数分布的特性

    • 总体均数E(X)=\frac{1}{\lambda},总体方差D(X)=\frac{1}{\lambda ^{2}}

    指数分布通常用作各种“寿命”的分布。例如,无线电元件的寿命,动物的寿命等,另外电话问题的通话时间、随机服务系统中的服务时间等都可以认为服从指数分布,因此,它在排队论和可靠性理论等领域中有广泛的应用。

    例、某电子元件的使用寿命X是一个连续型随机变量,其概率密度为

    f(x)=\left\{\begin{matrix} k e^{-\frac{x}{100}},x>0\\ 0,x\leq 0 \end{matrix}\right.

    (1)确定常数k

    (2)求寿命超过100小时的概率

    (3)已知该元件已经正常使用200小时,求它至少还能正常使用100小时的概率。

    解:

    (1)由概率密度函数性质2知

    \int_{0}^{+\propto }ke^{-\frac{x}{100}}dx=[-100ke^{-\frac{x}{100}}]|_{0}^{+\propto}=100k=1,得k=0.01

    (2)寿命超过100小时的概率为

    P(X>100)=1-F(100)=1-(1-e^{-0.01\times 100})=e^{-1}\approx 0.3679

    (3)条件概率

    \begin{align} P(X>300|X>200) &=\frac{P(X>300,X>200)}{P(X>200)}\\&=\frac{P(X>300)}{P(X>200)}\\&=\frac{e^{-3}}{e^{-2}}=e^{-1}\approx 0.3679 \end{align}

    由(2),(3)可知,该元件寿命超过100小时的概率等于已使用200小时的条件下至少还能使用100小时的概率,这个性质称为指数分布的“无记忆性”。

    若随机变量X对任意的s>0,t>0都有P(X>s+t|X>s)=P(X>t),则称X的分布具有无记忆性。

    因此,指数分布具有无记忆性,若某元件或动物的寿命服从指数分布,则上式表明,如果已知寿命长于s年,则再“活”t年的概率与s无关,即对过去的s时间没有记忆,也就是说只要在某时刻s仍“活”着,它的剩余寿命的分布和原来的寿命分布相同,所以人们也戏称指数分布是“永远年轻的”。

    正态分布(Normal distribution)

    正态分布的概率密度函数(即纵向的曲线高度)

    f(X)=\frac{1}{\sigma \sqrt{2\pi }}e^{-\frac{1}{2}(\frac{X-\mu }{\sigma })^{2}}-\infty < X< +\infty

    \sigma规定了曲线的形状,\mu反应了其在横轴上的位置不同。

    正态分布的特征

    • 关于x=\mu对称,即正态分布以均数为中心,左右对称。
    • x=\mu处取得概率密度函数的最大值,在x=\mu\pm \sigma处有拐点,表现为 钟形曲线。即正态曲线在横轴上方均数处最高。
    • 正态分布有两个参数,即均数\mu和标准差\sigma\mu是位置参数,\sigma是变异度参数(形状参数)。常用N(\mu ,\sigma ^{2})表示均数为\mu,标准差为\sigma的正态分布;用N(0 ,1)表示标准正态分布。
    • 正态曲线下面积分布有一定规律。横轴上正态曲线下的面积等于1(也常写作100%)。

    正态方程的积分式(概率分布函数):

    概率分布函数即为正态概率密度曲线下的面积 。

    F(X)=\frac{1}{\sigma \sqrt{2\pi }}\int_{-\infty }^{X}e^{-\frac{1}{2}(\frac{X-\mu }{\sigma })^{2}}dX

    F(X)为正态变量X的累计分布函数,反映正态曲线下,横轴尺度自-\inftyX的面积,即下侧累计面积。

    标准正态分布

    均数为0,标准差为1的正态分布,这种正态分布称为标准正态分布

    对于任意一个服从正态分布N(\mu ,\sigma ^{2})的随机变量,可作如下的标准化变换,也称Z(z-score)变换

    其中,Z=\frac{X-\mu }{\sigma },标准正态分布的概率密度函数:f(Z)=\frac{1}{\sqrt{2\pi }}e^{-\frac{Z^{2}}{2}}

    标准正态分布方程积分式(概率分布函数):

    \Phi (Z)=\frac{1}{2\pi }\int_{-\infty }^{Z}e^{-\frac{Z^{2}}{2}}dZ

    \Phi (Z)为标准正态变量Z的累计分布函数,反映标准正态曲线下,横轴尺度自-\inftyZ的面积,即下侧累计面积,如下图所示。 

    标准正态分布表

    用查表代替计算必须注意:

    • 表中曲线下面积为-\inftyZ的面积。
    • \mu,\sigmaX已知时,先求出Z值, Z=\frac{X-\mu }{\sigma },再用Z值查表,得所求区间占总面积的比例。
    • \mu\sigma未知时,要用样本均数\overline{X}和样本标准差S来估计Z值,Z=\frac{X-\overline{X} }{S}
    • 曲线下对称于0的区间,面积相等。 
    • 曲线下横轴上的面积为1 (即100% )。

    正态分布是一种对称分布,其对称轴为直线X=\mu,即均数位置。

    理论上:

    • \mu \pm 1\sigma范围内曲线下的面积占总面积的68.27%
    • \mu \pm 1.96\sigma范围内曲线下的面积占总面积的95%
    • \mu \pm 2.58\sigma范围内曲线下的面积占总面积的99% 

    实际上:

    • \overline{X} \pm 1S范围内曲线下的面积占总面积的68.27%
    • \overline{X} \pm 1.96S范围内曲线下的面积占总面积的95%
    • \overline{X} \pm 2.58 S范围内曲线下的面积占总面积的99% 

    实际应用中,我们一般将1.96看似成2,2.58看似成3。

    标准正态分布的\mu=0,\sigma=1,则 

    • \mu \pm 1\sigma相当于区间(­1,1)
    • \mu \pm 1.96\sigma相当于区间(­1.96,1.96)
    • \mu \pm 2.58\sigma相当于区间(­2.58,2.58)
    • 区间(­1,1)的面积:1-2\Phi (-1)=1­-2×0.1587=0.6826=68.26% 
    • 区间(­1.96,1.96)的面积:1-2\Phi (-1.96 )=1­-2×0.0250=0.9500=95.00%
    • 区间(­2.58,2.58)的面积:1-2\Phi (-2.58)=1­-2×0.0049=0.9902=99.02% 

    例: 已知某地1986年120名8岁男童身高均数 \overline{X}=123.02cmS=4.79cm,估计(1)该地8岁男孩身高在130cm以上者占该地8岁男孩总数的百分比;(2)身高界于120cm~128cm者占该地8岁男孩总数的比例;(3)该地80%男孩身高集中在哪个范围?

    (1)先做标准化转换:

    Z=\frac{X-\overline{X} }{S}=\frac{130-123.02}{4.79}=1.46

    \Phi (-Z)=\Phi (-1.46)=0.0721         根据标准正态分布的对称性

    理论上该地8岁男孩身高在130 cm以上者占该地8岁男孩总数的7.21%。

    (2)

    Z_{1}=\frac{X_{1}-\overline{X} }{S}=\frac{120-123.02}{4.79}=-0.63      \Phi (Z_{1})=\Phi (-0.63)=0.2643

    Z_{2}=\frac{X_{2}-\overline{X} }{S}=\frac{128-123.02}{4.79}=1.04         \Phi (Z_{2})=1-\Phi (-1.04)=0.8508

    \Phi (Z_{2})-\Phi (Z_{1})=0.8508-0.2643=0.5865

    (3)

    查标准正态分布界值表,标准正态分布曲线下左侧面积为0.10所对应的Z值为­1.28,所以80%的8岁男孩身高值集中在\overline{X} \pm 1.28S区间内,即116.9cm~129.2cm

    正态分布的应用

    制定参考值范围的步骤:

    • 选择足够数量的正常人作为调查对象。
    • 样本含量足够大。
    • 确定取单侧还是取双侧正常值范围。

    有些指标过高过低都是异常的,我们需要制定双侧的正常值范围

    有些指标过低才是异常的,比如肺活量,我们只要制定单侧的正常值范围

    • 选择适当的百分界限。

    在实际操作当中,我们一般将正常人中的5%排除在外,计算95%参考值范围。

    • 选择适当的计算方法。

    正态近似法:适用于正态分布或近似正态分布的资料。

    例1  某地调查120名健康女性血红蛋白,直方图显示,其分布近似于正态分布,得均数为117.4g/L,标准差为10.2g/L  ,试估计该地正常女性血红蛋白的95%医学参考值范围。

    分析:正常人的血红蛋白过高过低均为异常,要制定双侧正常值范围。

     \overline{X} \pm 1.96S=117.4\pm 1.96\times 10.2 = 97.41\sim 137.39

    该指标的95%医学参考值范围为97.41~137.39(g/L) 

    百分位数法:适用于偏态分布资料。 

    例2 某年某市调查了200例正常成人血铅含量(μg/100g)  如下,试估计该市成人血铅含量的95%医学参考值范围。

    分析:血铅的分布为偏峰分布,且血铅含量只以过高为异常,要用百分位数法制定单侧上限。

    P_{95}=L+\frac{i}{f_{x}}(n\cdot x \%-\sum f_{L})=38+\frac{5}{7}(200\times 95\%-189)=38.7\mu g /100g

     

     

     

    展开全文
  • 从这里学习总结如下,以下内容均来源:...二项分布:离散概率分布 总共n次,事件发生概率p,其中发生x次概率的概率计算可得: 二项分布可用于采集在临床研究中死于心脏病的人数、

    从这里学习总结如下,以下内容均来源:http://hongyitong.github.io/2016/11/13/%E4%BA%8C%E9%A1%B9%E5%88%86%E5%B8%83%E3%80%81%E6%B3%8A%E6%9D%BE%E5%88%86%E5%B8%83%E3%80%81%E6%AD%A3%E6%80%81%E5%88%86%E5%B8%83/

    二项分布:离散概率分布

    总共n次,事件发生概率p,其中发生x次概率的概率计算可得:

    f\left( x\right) =\dfrac {n!} {x!\left( n-x\right) !}p^{x}\left( 1-p\right) ^{n-x}

    二项分布可用于采集在临床研究中死于心脏病的人数、拥挤电梯中在第二层走出电梯的人数,或是某动物种群中携带特定遗传性状的动物数量。

    所有试验都是相互独立的,并且每个试验只有成功和失败这两种结果。

     期望值: μ=np
     方差: σ²=np(1-p)

    泊松分布:离散概率分布

    泊松分布适合在给定一个已知平均值的情况下对固定时间步长内事件的发生次数概率进行建模。这些事件与它们最后一次发生的状态无关。

    X 轴上是 0、1、2、3、4(以此类推)等事件的离散值(通常表示事件的发生次数),Y 轴上是现象的发生概率(通常是给定一个已知平均值)。

    这些事件可以是十字路口的事故发生次数、出生缺陷数量或一平方公里内驼鹿的数量。

    公式:f\left( x;\lambda \right) =\begin{cases} \lambda e^{-\lambda x},x\geq 0\\ 0,x < 0\end{cases}

    e 是自然对数的底。
    x 是事件的可能发生次数(正整数)。
    λ(即,平均值)是一个正数,代表指定区间内事件的预期发生次数。如果事件在 1 小时内(60 分钟)每 10 分钟发生一次,则 λ 为 6。

    泊松分布与二项分布类似,但泊松分布是在不知道事件的可能发生总次数的情况下对小概率事件建模

    泊松分布的建模对象是十字路口的事故发生次数,而二项分布的建模对象是事故发生次数与经由十字路口的汽车数量之间的相对关系。

    期望值:λ(即,平均值)
     方差:方差σ²与均数λ相等,即σ²=λ

    性质:

    1)Poisson分布是一种单参数的离散型分布,其参数为λ,它表示单位时间或空间内某事件平均发生的次数,又称强度参数。
    2)Poisson分布的方差σ²与均数λ相等,即σ²=λ
    3)Poisson分布是非对称性的,在λ不大时呈偏态分布,随着λ的增大,迅速接近正态分布。一般来说,当λ=20时,可以认为近似正态分布,Poisson分布资料可按正态分布处理。
    4)Poisson分布的累计概率常用的有左侧累计和右侧累计两种。单位时间或空间内事件发生的次数。

    正态分布:连续概率分布

    如果存在大量观测值,则随机变量的总和将呈正态分布。

    例如,如果多次抛掷硬币,则在一连串抛币动作中硬币正面朝上的次数将接近正态分布。

    正态分布的例子包括:某国家的人的身高、某个省的各个高程值以及 12 岁学生的数学考试分数。

    注意:正态分布的横轴是不一样的,是连续量,与二项分布和泊松分布对比!!!

     

     

     

    展开全文
  • 常见分布特征函数

    千次阅读 2020-08-17 18:44:56
    、泊松分布 注意到, 所以原式可化为 三、几何分布 四、均匀分布 五、标准正态分布 六、指数分布 注意到 所以原式可化为 七、特征函数的性质 特征函数以指数的形式存在,因此可以化随机变量的...
  • 许多的统计分布都是指数型分布,彼此之间具有一定的共性,在研究其统计性质分布特征时,利用指数型分布族的特征,可以将这一族分布特征分别表示出。在广义线性模型的统计推断中,常假设样本服从指数型分布。 ...
  • 如果无穷随机变量序列是独立同分布(i.i.d.)的,而且每个随机变量都服从参数为p的伯努利分布,那么随机变量就形成参数为p的一系列伯努利试验。同样,如果n个随机变量独立同分布,并且都服从参数为p的伯努利分布,...
  • 利用条件矩的性质特征刻画伽玛分布,负二项分布,广义混合指数分布,广义混合几何分布.
  • 分布特征函数

    千次阅读 2019-12-01 11:18:00
    1. 如何理解分布特征函数? 如何确认两个随机变量的分布相同,在不知道这两个随机变量的分布的情况下。 根据类比两个背影是否是同一个人,那么对比这两个背影的特征:身高,发色,腰围,。。。 那么对比这两个...
  • 由前面 离散型随机变量,二项分布,泊松分布,指数分布,几何分布(概统2.知识) 可知泊松分布的应用类型,第一类是单位时间内按固定频率发生的事件,此时固定频率就是常数λ" role="presentation" style=...
  • 二项分布期望和方差

    万次阅读 2017-09-29 14:13:15
    做n次0-1试验,每次实验为1的概率为p,为0的概率为1-p;有k次为1,n-k次为0的概率,就是二项分布B(n,p,k)。   最后欢迎大家访问我的个人网站:1024s
  • 正态分布及其性质

    万次阅读 多人点赞 2015-08-20 13:43:41
    正态分布也称为高斯分布。客观世界中很多变量都服从或近似服从正态分布,且正态分布具有很好的数学性质,所以正态分布也是人们研究最多的分布之一。本文对正态分布性质做归纳总结,方便日后查找。
  • 1.比率的二项分布检验-适用于样本量较小(n&lt;30)的检验-精确 ...2.中位数符号检验,以中位数将数据分成两边(一边为正,一边为负),那么样本出现在两边的概率均为1/2,因此使用p=0.5的二项分布...
  • 投一枚硬币四次,两次正面,两次背面,问:投这枚... 我们根据实验的结论,2/4 = 0.5, 所以硬币是正面的概率是0.5。 上面的两种错误相互对立,历史告诉我们,将两种对立的错误加以整合,往往就能得到一个超级自然...
  • 所以协方差矩阵满足实对称矩阵和半正定矩阵的性质。 记Σ\SigmaΣ为协方差矩阵。 Σ\SigmaΣ是满秩的,也就是∣Σ∣|\Sigma|∣Σ∣(行列式)不为0。 Σ\SigmaΣ是半正定的,所以∣Σ∣|\Sigma|∣Σ∣是大于0。 Σ\...
  • 常用概率分布的矩母函数与特征函数的推导 一、离散型随机变量的分布 1、离散型均匀分布 、连续型随机变量的分布
  • 假设有一批产品,不合格品率为P,从这批产品中随机地抽出n件作为被检样品,其中不合格品数X服从的分布二项分布。 X的概率分布为: 0 x=0,1,……,n X的期望 E(X)=np X的方差 D(X)=np(1-p) 3.2.3 ...
  • 由于狄利克雷分布二项分布扩展到n个变量的
  • 常见分布正态分布 ...公式:p(x)=12π√σexp(−(x−μ)22σ2) p(x) = \frac{1}{\sqrt{2\pi}\sigma}\exp (- \frac{(x-\mu )^{2}}{2\sigma ^{2}}) 图示: 可以看出期望 μ\mu 代表了正态分布的偏移量(位置);
  • 针对翟镇井田断裂构造性质比较复杂的现状,基于翟镇井田的2#和4#煤层采掘工程平面图,对井田内正断层及逆断层进行了统计,总结了断层分布规律,揭示了不同标高逆断层的发育数量特征,分析了形成这些规律和特征的原因。
  • 常用概率分布函数及随机特征

    万次阅读 2018-02-08 20:28:52
    常见分布的随机特征离散随机变量分布伯努利分布分布)伯努利分布亦称“零一分布”、“两点分布”。称随机变量X有伯努利分布, 参数为p(0&lt;p&lt;1),如果它分别以概率p和1-p取1和0为值。EX= p,DX=p(1-p...
  • 维随机变量 联合分布函数 定义 性质 边缘分布函数 联合密度 边缘密度 期望 方差
  • 采用TAW-3000型刚性伺服试验机和VIC-3D全场应变数字散斑测量系统,通过对0°,30°,45°,60°,90°5种层理倾角片麻岩进行单轴压缩试验,揭示不同层理倾角片麻岩力学性质和应变场演化特征。研究表明:随着层理倾角的增加,...
  • 在离散型随机变量中,二项分布、泊松分布、几何分布和超几何分布占有重要地位。对于这类取非负整数值的随机变量,其母函数有极好的分析性质。在研究这类随机变量的分布问题时,采用母函数方法,可以使问题的分析与计算化...
  • 多元正态分布性质和定理

    千次阅读 2018-04-11 22:38:56
    多元高斯分布 向量随机变量X=[X1...Xn]TX=[X1...Xn]TX= [X_1 ... X_n]^T服从多元高斯分布,均值为μ∈Rnμ∈Rn\mu \in R^n(这里μμ\mu是一个n维向量),协方差矩阵为Σ∈S++nΣ∈S++n\Sigma \in {...μ,Σ)=1(2π)n...
  • 对平朔矿区4号煤层中黏土矿物、铝的氢氧化物矿物、方解石、菱铁矿和黄铁矿等矿物的分布和赋存特征进行了研究,同时深入分析了平朔矿区煤中黏土矿物中分散矿物及微量元素的分布特征,以及各种矿物之间的共生、交代作用...
  • 通过对下2煤层物理性质、化学性质、煤岩特征及煤类的统计分析,认为区内同一煤层的变质程度随含煤地层和上覆岩系的总厚度增大而增高,在垂向上随煤层层位的降低而增高;四井田总体构造形态为倾向南西的单斜构造,其煤类...

空空如也

空空如也

1 2 3 4 5 ... 20
收藏数 39,827
精华内容 15,930
关键字:

二项分布性质特征