精华内容
下载资源
问答
  • 常见有界变量
    千次阅读
    2021-11-06 11:40:17

            不知道大家在学数理统计的时候,对这三个概念怎么理解的,我学的时候还是很有疑惑的,为什么随机变量可以用样本表示,那统计量用来干什么的呢?于是我查阅了很多资料,下面谈谈自己的认识,欢迎大家分享自己的理解。

    1 引言

            自然界和社会上发生的现象是多种多样的。概括起来可以分为两大类:一类现象,在一定条件下必然发生,例如,同性电荷必相互排斥,等等。这类现象称为确定现象。另一类现象,比如在相同条件下抛同一枚硬币,其结果可能是正面朝上,也可能是反面朝上,并且在每次抛之前无法确定抛掷的结果是什么,等等。这类现象,在一定的条件下,可能出现这样的结果,也可能出现那样的结果,而在试验或观察之前不能预知确切的结果。但在大量重复实验或观察下,它的结果却呈现某种规律性。像这种在个别试验中其结果呈现出不确定性,在大量重复试验中其结果又具有统计规律性的现象,我们称之为随机现象

            数理统计学是研究随机现象规律性的一门学科,它以概率论为理论基础,研究如何以有效的方式收集﹑整理和分析受到随机因素影响的数据,并对所考察的问题作出推理和预测,直至为采取某种决策提供依据和建议。数理统计研究的内容非常广泛,概括起来可分为两大类:一是试验设计,即研究如何对随机现象进行观察和试验,以便更合理更有效地获得试验数据;二是统计推断,即研究如何对所获得的有限数据进行整理和加工,并对所考察的对象的某些性质作出尽可能精确可靠的判断(这不正是目前机器学习在做的事)。

            统计学研究的一个主要问题是通过试验推断总体。而概率论为整个统计学奠定了基础,它为总体、随机试验等几乎所有随机现象的建模提供了方法。下面先引入概率论的中常用的样本空间、事件、随机变量和概率空间的几个概念,然后引入统计里常用的总体、样本、统计量。


    2 概率论基础

    2.1 样本空间

            称某次随机试验 E E E 全体可能的结果所构成的集合 Ω \Omega Ω 为该试验的 样本空间(sample space)。样本空间的元素,即 E E E 的每个结果,称为样本点 e e e

    2.2 随机事件

            我们称试验 E E E 的样本空间 Ω \Omega Ω 的子集为 E E E 的随机事件,简称事件。每次试验中,当且仅当这一子集中的一个样本点出现时,称这一事件发生。由一个样本点组成的单点集,称为基本事件。一个事件(event)是一次试验若干可能的结果所构成的集合,即 S 的一个子集(可以是S本身)。

    2.3 随机变量

            设随机试验的样本空间为 S = { e } S=\{e\} S={e} X = X ( e ) X=X(e) X=X(e) 是定义在样本空间 S S S 上的实值单值函数。称 X = X ( e ) X=X(e) X=X(e) 为随机变量。随机变量的本质就是从样本空间映射到实数的函数。随机变量常以大写字母记,其具体取值则用相应的小写字母表示。例如,随机变量 X X X 可以取值 x x x

    图1 样本点 e 与实数 X=X(e) 对应的示意图

            研究随机变量的目的是通过研究随机变量的概率特性,或者叫统计特性,来反映和预测结果。
            随机变量的数字特征: 数学期望(均值:反映数据集中在哪个量附近,一般不与随机变量的取值相同),方差(反映波动大小:反映数据的集中程度),两个随机变量的协方差(反映两个随机变量的相依关系),分布函数(分布律:反映随机变量落入某区域的概率),密度函数(连续型:反映随机变量在某点附近概率的变化快慢,密度函数的积分就是分布函数)。

            多维随机变量或多维随机向量。随机向量是样本空间到实数组集合的映射。例如(X,Y)是二维随机变量,对应的是实数对,可以取值为(1,2)。

            多元随机变量是一个随机变量,只不过是多元的。例如 X Y XY XY 是二元随机变量,可以取值为 1 × 2 1\times 2 1×2。函数 f ( X Y ) f(XY) f(XY) X Y XY XY 的函数。

            总结: 维是代表随机变量维度增多了,元代表随机变量个数增多了。

    2.4 概率空间

            概率论中,用 e e e 为基本事件或样本, Ω \Omega Ω 为样本空间, A ( ∈ F ) A(\in\mathcal{F}) A(F) 为事件, F \mathcal{F} F 是事件的全体,而 P ( A ) P(A) P(A) 表示事件发生的概率。三元组 ( Ω , F , P ) (\Omega, \mathcal{F}, P) (Ω,F,P) 构成概率空间


    3 数理统计

    3.1 总体

            在数理统计学中,我们把所研究对象的全体元素组成的集合称为总体(或称母体),而把组成总体的每个元素称为个体。例如,在考察某批灯泡的质量时,该批灯泡的全体就组成一个总体,而其中每个灯泡就是个体。

            但是,在实际应用中,人们所关心的并不是总体中个体的一切方面,而所研究的往往是总体中个体的某一项或某几项数量指标。例如,考察灯泡质量时,我们并不关心灯泡的形状,式样等特征,而只研究灯泡的寿命、亮度等数量指标特征。如果只考察灯泡寿命这一项指标时,由于一批灯泡中每个灯泡都有一个确定的寿命值,因此,自然地把这批灯泡寿命值的全体视为总体,而其中每个灯泡的寿命值就是个体。由于具有不同寿命值的灯泡的比例是按一定规律分布的,即任取一个灯泡其寿命为某一值具有一定概率,因而,这批灯泡的寿命是一个随机变量,也就是说,可以用一个随机变量 X X X 来表示这批灯泡的寿命这个总体。因此,在数理统计中,任何一个总体都可用一个随机变量来描述。总体的分布及数字特征,即指表示总体的随机变量的分布及数字特征。对总体的研究也就归结为对表示总体的随机变量的研究。

    3.2 样本

            为了了解总体 X X X 的分布规律或某些特征,必须对总体进行抽样观察,即从总体 X X X 中,随机抽取 n n n 个个体 X 1 , X 2 , ⋯   , X n X_1, X_2, \cdots, X_n X1,X2,,Xn,记为 ( X 1 , X 2 , ⋯   , X n ) T (X_1, X_2, \cdots, X_n)^T (X1,X2,,Xn)T,并称此为来自总体 X X X 的容量为 n n n样本。由于每个 X i X_i Xi 都是从总体 X X X 中随机抽取的,它的取值就在总体 X X X 的可能取值范围内随机取得,自然每个 X i X_i Xi 也是随机变量,从而样本 ( X 1 , X 2 , ⋯   , X n ) T (X_1, X_2, \cdots, X_n)^T (X1,X2,,Xn)T 是一个 n n n 维随机向量。 ( X 1 , X 2 , ⋯   , X n ) T (X_1, X_2, \cdots, X_n)^T (X1,X2,,Xn)T 是一个 n n n 维随机向量。在抽样观测后,它们是 n n n 个数据 ( x 1 , x 2 , ⋯   , x n ) T (x_1, x_2, \cdots, x_n)^T (x1,x2,,xn)T,称之为样本 ( X 1 , X 2 , ⋯   , X n ) T (X_1, X_2, \cdots, X_n)^T (X1,X2,,Xn)T 的一个观测值,简称样本值。
            我们的目的是依据从总体 X X X 中抽取的一个样本值 ( x 1 , x 2 , ⋯   , x n ) T (x_1, x_2, \cdots, x_n)^T (x1,x2,,xn)T,对总体 X X X 的分布或某些特征进行分析推断,因而要求抽取的样本能很好地反映总体的特征且便于处理,于是,提出下面两点要求:
    (1)代表性——要求样本 ( X 1 , X 2 , ⋯   , X n ) T (X_1, X_2, \cdots, X_n)^T (X1,X2,,Xn)T同分布且每个 X i X_i Xi 与总体 X X X 具有相同的分布。
    (2)独立性——要求样本 ( X 1 , X 2 , ⋯   , X n ) T (X_1, X_2, \cdots, X_n)^T (X1,X2,,Xn)T 是相互独立的随机变量。
            满足上述两条性质的样本称为简单随机样本

    3.3 统计量

            样本是进行统计推断的依据。在应用时,往往不是直接使用样本本身,而是针对不同的问题构造样本的适当函数,利用这些样本的函数进行统计推断。
            设 X 1 , X 2 , ⋯   , X n X_1, X_2, \cdots, X_n X1,X2,,Xn 是来自总体 X X X 的一个样本, g ( X 1 , X 2 , ⋯   , X n ) g(X_1, X_2, \cdots, X_n) g(X1,X2,,Xn) X 1 , X 2 , ⋯   , X n X_1, X_2, \cdots, X_n X1,X2,,Xn 的函数,若 g g g 中不含任何未知参数,则称 g ( X 1 , X 2 , ⋯   , X n ) g(X_1, X_2, \cdots, X_n) g(X1,X2,,Xn) 是一统计量。
            因为 X 1 , X 2 , ⋯   , X n X_1, X_2, \cdots, X_n X1,X2,,Xn 都是随机变量,而统计量 g ( X 1 , X 2 , ⋯   , X n ) g(X_1, X_2, \cdots, X_n) g(X1,X2,,Xn) 是随机变量的函数,因此统计量是一个随机变量。

            参数是用来描述总体特征的概括性数字度量,是研究者想要了解的总体的某种特征值。由于总体数据通常是不知道的,所以参数是一个未知的常数。统计量是用来描述样本特征的概括性数字度量,它是根据样本数据计算出来的一个量。由于抽样是随机的,所以统计量是样本的函数;由于样本是已知的,所以统计量总是知道的。抽样的目的就是要根据样本统计量去估计总体参数。

    3.4 样本和随机变量

            统计里的样本有二重性,即样本既可以看作是一组观测值又可以看作是随机变量。因为在抽样之前,样本观测值是未知的,所以可以看成是随机变量(设该样本为 X X X,抽取之前 X X X 的值未知, X X X 的值是什么,其概率分布是符合对应随机变量概率分布的);而当样本抽取完之后又是一组确定的值,故又可以看成是一组确定的值。一般情况下把样本看作是一组随机变量。

            个人理解: 在统计学里,即抽样分布里,在数据是一维的时候,可以把每个样本都看做一个随机变量;但到了概率论中,对于给定一个多维数据,比如多个样本多个特征,此时应该把每个特征看做一个随机变量,这时才有协方差矩阵的概念。随机变量是贯穿于概率论和数理统计的一个概念,在前后学习的时候如果可以正确认识,会对统计有更深的理解。


    参考

    更多相关内容
  • 最小二乘回归的子集(特征)选择是一个常见问题,它是组合问题,因此在计算上是 NP 困难的。 此代码提供了一种使用改进的向下分支定方法来有效解决此问题的工具。 该算法的应用之一是选择全局最优控制变量进行自...
  • 常见的Flink在windows的开发环境变量

       

     

     

     

    我们在将Windows启动系统的时候,操作系统一般默认去读取环境变量中的PATH,把当前目录下的所有可执行程序读取到内存中,并随时进行访问。
    因为其他软件是基于Java开发的,所以很多程序执行都会去找一个叫JAVA__HOME的环境变量,如果存在则表示有该环境变量,可直接使用,如果没有则会报错,提示需要Java环境。这个变量名是
    IT界约定俗成名字的名字,可以更改,只是不建议。
    创建变量 JAVA_HOME=JDK安装路径,使用变量%JAVA_HOME%

    展开全文
  • 作者主页(文火冰糖的硅基工坊):文火冰糖(王文兵)的博客_文火冰糖的硅基工坊_CSDN博客 ... 目录 第1章 概率函数、概率...第2章 常见一元离散型随机变量概率分布(用概率(密度)函数表达) 2.1 说明 2.2 伯努利(随

    作者主页(文火冰糖的硅基工坊):文火冰糖(王文兵)的博客_文火冰糖的硅基工坊_CSDN博客

    本文网址:https://blog.csdn.net/HiWangWenBing/article/details/123618654


    目录

    第1章 概率函数、概率分布函数、概率密度函数

    1.1 引言

    1.2 概率函数/概率密度函数

    1.3 概率分布函数的定义

    1.4 正态密度函数与正态分布函数的区别

    第2章 常见一元离散型随机变量概率分布(用概率(密度)函数表达)

    2.1 说明

    2.2 伯努利(随机)分布

    2.3 泊松分布

    2.4 几何分布

    第3章 常见一元连续型随机变量概率分布(用概率(密度)函数表达)

    3.1 说明

    3.2 均匀分布

    3.3 指数函数

    3.4 正态分布

    3.5 标准正态分布


    第1章 概率函数、概率分布函数、概率密度函数

    1.1 引言

    我们常听说概率分布函数,如二项分布、(n重伯努利实验)、伽玛分布、均匀分布、指数分布、泊松分布、正态分布。这里涉及到XXX分布,如最常见的正态分布。

    这里涉及到三部分的内容:

    (1)xxx是什么含义?代表不同形态的概率分布,正态分布只是其中一种。

    (2)分布是什么含义?这个词最容易误解,概率分布的定义与XXX分布给出的函数不太一致,本文首先要阐述这个概念的差异。

    (3)函数是什么含义?代表了随机变量的取值与其取值出现的可能性(概率)之间的关系。这里涉及到的函数,都属于随机函数,也称为概率函数。

    1.2 概率函数/概率密度函数

    概率函数/概率密度可以看成是相同的定义,它是一种自变量为随机变量,因变量是概率的随机函数。

    f = f(x) =》 p= P(x)

    • X:随机变量
    • P:某种特定分布的概率分布函数,也称为随机函数, 如正态分布,均匀分布、指数分布等。
    • p:概率

    x在某个点处的概率可以表示为:

    p= P(x=A) = P{x=A} = P(A).

    1.3 概率分布函数的定义

    概率分布函数是概率论的基本概念之一。在实际问题中,常常要研究一个随机变量ξ取值小于某一数值x的概率,这概率是x的函数,称这种函数为随机变量ξ的分布函数,简称分布函数,记作F(x),即F(x)=P(ξ<x) (-∞<x<+∞),由它并可以决定随机变量落入任何范围内的概率。

    简单的讲,在概率论中,概率分布函数是概率密度函数或概率函数在(X<x区间)内的概率函数的积分。

    1.4 正态密度函数与正态分布函数的区别

    下面这张图充分展现了正态(密度)函数与 正态分布函数的区别。

    左图:正态密度函数,反应了在不同X点处的概率值,是随机函数,用f(x)表示。

    右图:正态分布函数,反应了在不同的X点处的概率积分值,是单调递增函数,用F(x)表示。

    在实际过程中,xxx分布函数用得比较少,大多数时候给出的XXX分布的函数,是指xxx概率分布函数。比如,给出的正态分布的函数:

    该函数的几何图形:

    我们常说的正态分布,无论是给出的图像,还是给出的数学函数的,实际上给出的是:正态密度函数或正态函数f(x), 而不是正态分布函数F(x)。

    因此,本文后续要探讨的XXX分布给出的图像或函数,都是指XXX概率密度函数或xxx概率函数,而不是XXX概率分布函数

    第2章 常见一元离散型随机变量概率分布(用概率(密度)函数表达)

    2.1 说明

    (1)一元是指只有一个随机变量X

    (2)离散型概率函数也可以通过离散随机变量的特性来分类

    2.2 伯努利(随机)分布

    随机变量只有两种可能的取值:1-成功和0-失败,随机变量符合这样特征的概率函数,称为伯努利(随机)分布。

    在上图中,x=0时的概率为p,则取1的概率为1-p.

    P{x=0} = p

    P{x=1} = 1-p

    import numpy as np
    from scipy import stats
    import matplotlib.pyplot as plt
    
    def bernoulli_pmf(p=0.0):
        ber_dist = stats.bernoulli(p)
        x = [0, 1]
        x_name = ['0', '1']
        pmf = [ber_dist.pmf(x[0]), ber_dist.pmf(x[1])]
        plt.bar(x, pmf, width=0.15)
        plt.xticks(x, x_name)
        plt.ylabel('Probability')
        plt.title('PMF of bernoulli distribution')
        plt.show()
    bernoulli_pmf(p=0.3)

    2.3 泊松分布

    Poisson分布,是一种统计与概率学里常见到的离散概率分布,由法国数学家西莫恩·德尼·泊松(Siméon-Denis Poisson)在1838年时发表。

    # 泊松分布(Poisson distribution)
    # 泊松分布是用来描述在一指定时间范围内或在指定的面积或体积之内某一事件出现的次数的分布,例如某企业每月发生事故的次数。
    from scipy.stats import poisson
    data_poisson = poisson.rvs(mu=3, size=10000)
    ax = sns.distplot(data_poisson,
                      bins=30,
                      kde=False,
                      color="green",
                      hist_kws={"linewidth": 15,'alpha':1})
    ax.set(xlabel='Poisson Distribution', ylabel='Frequency')

    2.4 几何分布

    # 几何分布(Geometric distribution)
    # 几何分布是指在n次贝努里试验中,经过k次获得1次成功的概率。
    # 几何分布的特点:
    #(1)进行一系列相互独立的试验;
    #(2)每一次试验既有成功的可能,也有失败的可能,且单次试验的成功概率相同;
    #(3)主要是为了取得第一次成功需要进行多少次试验。
    from scipy.stats import geom
    data_geom = geom.rvs(size=10000,p=0.5)
    ax= sns.distplot(data_geom,
                     kde=False,
                     color="green",
                     hist_kws={"linewidth": 15,'alpha':1})
    ax.set(xlabel='Geometric Distribution', ylabel='Frequency')

     

    第3章 常见一元连续型随机变量概率分布(用概率(密度)函数表达)

    3.1 说明

    (1)一元是指只有一个随机变量X

    (2)连续型概率函数也可以通过连续型随机变量的特性来分类。

    3.2 均匀分布

    均匀分布所有可能结果的n个数的发生概率是相等的,均匀分布变量X的概率密度函数为:

     

    probs = np.full((6), 1/6)
    face = [1,2,3,4,5,6]
    plt.bar(face, probs)
    plt.ylabel('Probability', fontsize=12)
    plt.xlabel('Dice Roll Outcome', fontsize=12)
    plt.title('Fair Dice Uniform Distribution', fontsize=12)
    axes = plt.gca()
    axes.set_ylim([0,1])

    3.3 指数函数

    连续随机变量X的概率密度为

    其中λ>0,为常数,则称X服从参数为λ的指数分布。

    在概率论和统计学中,指数分布是一种连续概率分布。

    指数分布可以用来表示独立随机事件发生的时间间隔,比如旅客进机场的时间间隔、中文维基百科新条目出现的时间间隔等等。

    随着时间t的变化,其函数值按照指数的方式减少特征的场合,就可以利用指数函数。

    3.4 正态分布

    正态分布(Normal distribution),也称“常态分布”,又名高斯分布(Gaussian distribution)

    正态的英文的nommal,为啥是normal呢? 这说明,这个函数的分布形态反应的是大自然的普遍规律,是非常常态性的分布规律。正因为如此,正态分布应用及其广泛。 

    自然界、人类社会、心理和教育中大量现象均按正态形式分布,例如能力的高低,学生成绩的好坏等都属于正态分布。它随随机变量的平均数、标准差的大小与单位不同而有不同的分布形态。

     

    3.5 标准正态分布

    标准正态分布是正态分布的一种,其平均数和标准差都是固定的,平均数为u=0,标准差为1的正态分布函数。

    # 正态分布(Normal Distribution)
    from scipy.stats import norm
    
    # 生成标准正态分布,N(0,1)
    data_normal = norm.rvs(size=10000,loc=0,scale=1)
    
    ax = sns.distplot(data_normal,
                      bins=100,
                      kde=True,
                      color="green",
                      hist_kws={"linewidth": 15,'alpha':1})
    ax.set(xlabel='Normal Distribution', ylabel='Frequency')

    import numpy as np
    from scipy import stats
    import matplotlib.pyplot as plt
    
    # 利用相应的分布函数及参数,创建一个冻结的正态分布(frozen distribution)
    norm_dis = stats.norm(5, 3)   
    
    # 在区间[-5, 15]上均匀的取101个点
    x = np.linspace(-5, 15, 101)  
    
    # 计算该分布在x中个点的概率密度分布函数值(PDF)
    pdf = norm_dis.pdf(x)
    
    # 计算该分布在x中个点的累计分布函数值(CDF)
    cdf = norm_dis.cdf(x)
    
    # 下面是利用matplotlib画图
    plt.figure(1)
    # plot pdf
    plt.subplot(211)  # 两行一列,第一个子图
    plt.plot(x, pdf, 'b-',  label='pdf')
    plt.ylabel('Probability')
    plt.title(r'PDF/CDF of normal distribution')
    plt.text(-5.0, .12, r'$\mu=5,\ \sigma=3$')  # 3是标准差,不是方差
    plt.legend(loc='best', frameon=False)
    
    # plot cdf
    plt.subplot(212)
    plt.plot(x, cdf, 'r-', label='cdf')
    plt.ylabel('Probability')
    plt.legend(loc='best', frameon=False)
    
    plt.show()


     作者主页(文火冰糖的硅基工坊):文火冰糖(王文兵)的博客_文火冰糖的硅基工坊_CSDN博客

    本文网址:https://blog.csdn.net/HiWangWenBing/article/details/123618654

    展开全文
  • 随机变量及其分布和几种常见分布

    万次阅读 2018-05-27 21:47:09
    随机变量 定义: 设随机试验的样本空间S={e}.X=X(e)S={e}.X=X(e)S=\{e\}.X=X(e)是定义在样本空间SSS上的实值单值函数。称X=X(e)X=X(e)X=X(e)为随机变量。 投掷一枚硬币三次,观察出现正面和反面的情况 样本空间...

    符号


    (I) ( I ) (0-1)分布(离散型)

    XB(1,p) X ∼ B ( 1 , p )

    (II) ( I I ) 伯努利试验,二项分布(离散型)
    XB(n,p) X ∼ B ( n , p )

    (III) ( I I I ) 泊松分布(离散型)
    Xπ(λ) X ∼ π ( λ )

    (IV) ( I V ) 几何分布(离散型)
    XG(p) X ∼ G ( p )

    (V) ( V ) 超几何分布(离散型)
    XH(n,M,N) X ∼ H ( n , M , N )

    (VI) ( V I ) 均匀分布(连续型)
    XU(a,b) X ∼ U ( a , b )

    (VII) ( V I I ) 指数分布(连续型)
    XE(θ) X ∼ E ( θ )

    (VIII) ( V I I I ) 正态分布(连续型)
    XN(μ,σ2) X ∼ N ( μ , σ 2 )

    标准正态分布:
    XN(0,1) X ∼ N ( 0 , 1 )

    随机变量

    定义:
    设随机试验的样本空间 S={e}.X=X(e) S = { e } . X = X ( e ) 是定义在样本空间 S S 上的 实值单值函数。称X=X(e) 随机变量
    投掷一枚硬币三次,观察出现正面和反面的情况
    样本空间是:

    S={HHH,HHT,HTH,THH,HTT,THT,TTH,TTT} S = { H H H , H H T , H T H , T H H , H T T , T H T , T T H , T T T }

    X X 记三次投掷得到正面H的总数,那么对于样本空间 S={e} S = { e } 中每一个样本点 e e X都有一个数与之对应。 X X 是定义在样本空间S上的一个实值单值函数,他的定义域是样本空间 S S ,值域是实数集合{0,1,2,3},使用函数标记可以将 X X 写成:
    X=X(e)={3,e=HHH2,e=HHT,HTH,THH1,e=HTT,THT,TTH0,e=TTT

    离散型随机变量及其分布律

    有些随机变量,他的全部可能取值是有限个或者可列无限多个,这种随机变量称为离散型随机变量
    设离散型随机变量 X X 的所有可能取值为xk(k=1,2,), X X 取各个可能值得概率,即事件{X=xk}的概率,为

    P{X=xk}=pk,k=1,2,.(1) (1) P { X = x k } = p k , k = 1 , 2 , ⋯ .

    由概率的定义, pk p k 满足如下两个条件:


    1 1 ∘ pk0,k=1,2,; p k ≥ 0 , k = 1 , 2 , ⋯ ;
    2 2 ∘ k=1pk=1. ∑ k = 1 ∞ p k = 1.

    我们称 (1) ( 1 ) 为离散型随机变量 X X 分布律。分布律也可以用表格的形式来表示
    这里写图片描述

    (I)(0-1)分布(离散型)

    设随机变量 X X 只可能取0 1 1 两个值,它的分布律是

    P{X=k}=pk(1p)1k,k=0,1(0<p<1)

    则称 X X 服从以p为参数的 (01) ( 0 − 1 ) 分布或两点分布
    (01) ( 0 − 1 ) 分布也可以写成
    这里写图片描述
    对于一个随机试验,如果它的样本空间只包含两个元素,即 S={e1,e2} S = { e 1 , e 2 } ,我们总能在 S S 上定义一个服从(01)分布的随机变量

    X=X(e)={0,e=e11,e=e2 X = X ( e ) = { 0 , 当 e = e 1 1 , 当 e = e 2

    (II) ( I I ) 伯努利试验,二项分布(离散型)

    设试验 E E 只有两个可能结果:A A¯¯¯¯ A ¯ ,则称 E E 伯努利试验(Bernoulli)试验
    。设P(A)=p(0<p<1),此时 P(A¯¯¯¯)=1p P ( A ¯ ) = 1 − p .将 E E 独立重复地进行n次,则称这一连串重复地独立试验为 n n 重伯努利试验
    这里的重复是指在每次试验中P(A)=p保持不变;
    独立是指各次试验结果互不影响,即若以 Ci C i 记第 i i 次试验的结果,Ci A A A¯i=1,2,,n.
    独立是指

    P(C1C2Cn)=P(C1)P(C2)P(Cn) P ( C 1 C 2 ⋯ C n ) = P ( C 1 ) P ( C 2 ) ⋯ P ( C n )
    .

    X X 表示n重伯努利试验中事件 A A 发生的次数X是一个随机变量,我们求它的分布律。 X X 的所有可能取值为0,1,2,,n.由于各次试验是相互独立的,因此事件 A A 在指定的k(0kn)次试验中发生,在其他 nk n − k 次试验中 A A 不发生的概率为

    pp  pk(1p)(1p)  (1p)(n-k)=pk(1p)nk

    这种指定的方式共有 (nk) ( n k ) 种,它们是两两互不相容的,故在 n n 次试验中A发生 k k 次的概率是(nk)pk(1p)nk,记 q=1p q = 1 − p ,即有

    P{X=k}=(nk)pk(1p)nk,k=0,1,2,,n. P { X = k } = ( n k ) p k ( 1 − p ) n − k , k = 0 , 1 , 2 , ⋯ , n .

    显然:
    P{X=k}0,k=0,1,2,,n; P { X = k } ≥ 0 , k = 0 , 1 , 2 , ⋯ , n ;

    k=0nP{X=k}=k=0n(nk)pk(1p)nk=(p+q)n=1 ∑ k = 0 n P { X = k } = ∑ k = 0 n ( n k ) p k ( 1 − p ) n − k = ( p + q ) n = 1

    所以 P{X=k} P { X = k } 满足条件 1,2 1 ∘ , 2 ∘ ,注意到 (nk)pkqnk ( n k ) p k q n − k 刚好是二项式 (p+q)n ( p + q ) n 的展开式中 pk p k 的那一项,我们称变量 X X 服从参数为n,p的二项分布,并记为 Xb(n,p) X ∼ b ( n , p ) .
    特别的,当 n=1 n = 1 时二项分布化为
    P{X=k}=pkq1k,k=0,1 P { X = k } = p k q 1 − k , k = 0 , 1

    这就是 (01) ( 0 − 1 ) 分 布 .

    (III) ( I I I ) 泊松分布(离散型)

    设随机变量 X X 所有可能取值为0,1,2,,而取各个值得概率是

    P{X=k}=λkeλk!,k=0,1,2, P { X = k } = λ k e − λ k ! , k = 0 , 1 , 2 , ⋯

    其中 λ>0 λ > 0 是常数。则称 X X 是服从参数λ泊松分布,记为 Xπ(λ) X ∼ π ( λ )
    对于条件 1,2 1 ∘ , 2 ∘
    P{X=k}0,k=0,1,2, P { X = k } ≥ 0 , k = 0 , 1 , 2 , ⋯ 且有
    k=0P{X=k}=k=0λkeλk!=eλk=0λkk!=eλeλ=1 ∑ k = 0 ∞ P { X = k } = ∑ k = 0 ∞ λ k e − λ k ! = e − λ ∑ k = 0 ∞ λ k k ! = e − λ ⋅ e λ = 1

    泊松定理

    λ>0 λ > 0 是一个常数, n n 是任意正整数,设npn=λ,则对任意一个固定的非负整数 k k ,有

    limn(nk)pnk(1pn)nk=λkeλk!

    证:
    pn=λn p n = λ n

    (nk)pkn(1pn)nk=n(n1)(nk+1)k!(λn)k(1λn)nk=λkk![1(11n)(1k1n)](1λn)n(1λn)k ( n k ) p n k ( 1 − p n ) n − k = n ( n − 1 ) ⋯ ( n − k + 1 ) k ! ( λ n ) k ( 1 − λ n ) n − k = λ k k ! [ 1 ⋅ ( 1 − 1 n ) ⋯ ( 1 − k − 1 n ) ] ( 1 − λ n ) n ( 1 − λ n ) − k

    对任意固定的 k k ,当n
    1(11n)(1k1n)1,(1λn)neλ,(1λn)k1. 1 ⋅ ( 1 − 1 n ) ⋯ ( 1 − k − 1 n ) → 1 , ( 1 − λ n ) n → e − λ , ( 1 − λ n ) − k → 1.

    故有:
    limn(nk)pkn(1pn)nk=λkeλk! lim n → ∞ ( n k ) p n k ( 1 − p n ) n − k = λ k e − λ k !

    (IV) ( I V ) 几何分布(离散)

    如果 X X 的概率分布为P{X=k}=qk1p(k=1,2;0<p<1;q=1p)则称 X X 服从参数为P的几何分布,记为 XG(p) X ∼ G ( p )

    (V) ( V ) 超几何分布(离散)

    从一个有限总体中进行不放回抽样常会遇到超几何分布
    设由 N N 个产品组成的总体,其中含有M个不合格品,若从中随机不放回地抽取 n n 个,其中含有不合格的产品个数X是一个离散型随机变量,假如 nM n ≤ M ,则 X X 的可能取值为0,1,,n;若 X X 可能取值0,1,,M由古典方法

    P{X=x}=CxMCnxNMCnN(*) (*) P { X = x } = C M x C N − M n − x C N n

    由组合等式
    x=0rCxMCnxNM=CnN ∑ x = 0 r C M x C N − M n − x = C N n

    可以看出上述的概率之和为 1 1 ,即x=0rP{X=x}=1 式所表示的一组概率构成一个概率分布,这个分布称为超几何分布
    它含有三个参数N,M,n记为 XH(n,N,M) X ∼ H ( n , N , M )
    数学期望
    XH(n,N,M) X ∼ H ( n , N , M ) ,则数学期望为
    E(X)=x=0rxCxMCnxNMCnN=nMNx=1rCx1M1CnxNMCn1N1=nMN E ( X ) = ∑ x = 0 r x C M x C N − M n − x C N n = n M N ∑ x = 1 r C M − 1 x − 1 C N − M n − x C N − 1 n − 1 = n M N

    nN n ≪ N (即抽取个数 n n 远远小于产品数N)时,每次抽取后,总体中不合格品率 p=MN p = M N 改变非常小,这时候的不放回抽样可以看成是放回抽样,这时候超几何分布可以用二项分布来近似。

    随机变量的分布函数

    X X 是一个随机变量,x是任意实数,函数

    F(x)=P{Xx},<x<+ F ( x ) = P { X ≤ x } , − ∞ < x < + ∞

    称为 X X 的分布函数。
    对于任意实数x1,x2,(x1<x2),有
    P{x1<Xx2}=P{Xx2}P{Xx1}=F(x2)F(x1)(A) (A) P { x 1 < X ≤ x 2 } = P { X ≤ x 2 } − P { X ≤ x 1 } = F ( x 2 ) − F ( x 1 )

    因此如果已知 X X 分布函数,我们就知道X落在区间 (x1,x2] ( x 1 , x 2 ] 上的概率。
    如果将 X X 看成是数轴上的随机点的坐标,那么,分布函数F(x) x x 处的函数值就表示X落在区间D (,x] ( − ∞ , x ] 上的概率。
    分布函数 F(x) F ( x ) 具有以下的基本性质:

    1 1 ∘ :
    F(x) F ( x ) 是一个不减函数
    事实上式 (A) ( A ) 对于任意的实数 x1,x2(x1<x2) x 1 , x 2 ( x 1 < x 2 ) ,有
    F(x2)F(x1)=P{x1<Xx2}0 F ( x 2 ) − F ( x 1 ) = P { x 1 < X ≤ x 2 } ≥ 0

    2 2 ∘ :
    0F(x)1 0 ≤ F ( x ) ≤ 1 ,且
    F()=limxF(x)=0,F()=limxF(x)=1 F ( − ∞ ) = lim x → − ∞ F ( x ) = 0 , F ( ∞ ) = lim x → ∞ F ( x ) = 1

    3 3 ∘ :
    F(x+0)=F(x) F ( x + 0 ) = F ( x )

    连续型随机变量概率密度

    如果对于随机变量 X X 的分布函数F(x),存在非负可积函数 f(x) f ( x ) ,对于任意实数 x x

    F(x)=xf(t)dt

    则称 X X 连续型随机变量f(x)称为 X X 概率密度函数,简称概率密度
    概率密度函数的性质:

    1:

    f(x)0; f ( x ) ≥ 0 ;

    2 2 ∘ :
    +f(x)dx=1 ∫ − ∞ + ∞ f ( x ) d x = 1

    3 3 ∘ :对于任意实数 x1,x2(x1x2) x 1 , x 2 ( x 1 ≤ x 2 ) ,
    P{x1<Xx2}=F(x2)F(x1)=x2x1f(x)dx P { x 1 < X ≤ x 2 } = F ( x 2 ) − F ( x 1 ) = ∫ x 1 x 2 f ( x ) d x

    4 4 ∘ :若 f(x) f ( x ) 在点 x x 处连续,则有F(x)=f(x)

    f(x) f ( x ) 具备性质 1,2 1 ∘ , 2 ∘ ,引入 G(x)=xf(t)dt G ( x ) = ∫ − ∞ x f ( t ) d t ,它是某一随机变量 X X 分布函数,f(x) X X 的概率密度。

    三个重要的连续型随机变量

    (VI)均匀分布(连续型)

    若连续型随机变量 X X 具有概率密度

    f(x)={1ba,a<x<b0,

    则称 X X 在区间(a,b)上服从均匀分布。记为 XU(a,b) X ∼ U ( a , b )

    分布函数

    F(x)=0xaba1,x<a,ax<b,xb F ( x ) = { 0 , x < a x − a b − a , a ≤ x < b 1 , x ≥ b

    (VII) ( V I I ) 指数分布(连续型)

    若连续型随机变量 X X 具有概率密度

    f(x)={1θex/θ,x>00,

    分布函数

    F(x)={1ex/θ0,x>0, F ( x ) = { 1 − e − x / θ , x > 0 0 , 其 他


    无记忆性:
    对于任意的 s,t>0 s , t > 0 ,有
    P{X>s+tX>s}=P{X>t} P { X > s + t ∣ X > s } = P { X > t }


    P{X>s+tX>s}=P{(X>s+t)(X>s)}P{X>t}=P{X>s+t}P{X>t}=1F(s+t)1F(s)=e(s+t)/θes/θ=et/θ=P{X>t} P { X > s + t ∣ X > s } = P { ( X > s + t ) ∩ ( X > s ) } P { X > t } = P { X > s + t } P { X > t } = 1 − F ( s + t ) 1 − F ( s ) = e − ( s + t ) / θ e − s / θ = e − t / θ = P { X > t }

    (VIII) ( V I I I ) 正态分布(连续型)

    若连续型随机变量 X X 具有概率密度

    f(x)=12πσe(xμ)22σ2,<x<+

    其中 μ,σ(σ>0) μ , σ ( σ > 0 ) 为常数,则称 X X 服从参数为μ,σ正态分布高斯分布,记为 XN(μ,σ2) X ∼ N ( μ , σ 2 )
    相关性质:

    1 1 ∘ :曲线关于 x=μ x = μ 对称,这表明对于任意 h>0 h > 0

    P{μh<Xμ}=P{μ<Xμ+h} P { μ − h < X ≤ μ } = P { μ < X ≤ μ + h }

    2 2 ∘ :当 x=μ x = μ 时取到最大值
    f(μ)=12πσ f ( μ ) = 1 2 π σ


    分布函数
    F(x)=12πσxe(tμ)22σ2dt F ( x ) = 1 2 π σ ∫ − ∞ x e − ( t − μ ) 2 2 σ 2 d t

    标准正态分布
    特别当 μ=0,σ=1 μ = 0 , σ = 1 时称变量 X X 服从标准正态分布,其概率密度和分布函数分别用ϕ(x),Φ(x)表示,既有:

    ϕ(x)=12πex2/2Φ(x)=12πxet2/2dtΦ(x)=1Φ(x) ϕ ( x ) = 1 2 π e − x 2 / 2 Φ ( x ) = 1 2 π ∫ − ∞ x e − t 2 / 2 d t 容 易 得 到 : Φ ( − x ) = 1 − Φ ( x )

    引理:
    XN(μ,σ2) X ∼ N ( μ , σ 2 ) ,则 Z=XμσN(0,1) Z = X − μ σ ∼ N ( 0 , 1 )
    证:
    P{Zx}tμσ=uP{Zx}=P{Xμσx}=P{Xμ+σx}=12πμ+σxe(tμ)22σ2dt=12πxeu2/2du=Φ(x) P { Z ≤ x } = P { X − μ σ ≤ x } = P { X ≤ μ + σ x } = 1 2 π ∫ − ∞ μ + σ x e − ( t − μ ) 2 2 σ 2 d t 令 : t − μ σ = u , 得 P { Z ≤ x } = 1 2 π ∫ − ∞ x e − u 2 / 2 d u = Φ ( x )

    展开全文
  • 如果随机变量X的所有可能取值不可以逐个列举出来,而是取数轴上某一区间内的任意点,那么称之为连续型随机变量。例如,一批电子元件的寿命、实际中常遇到的测量误差等都是连续型随机变量。>&g...
  • 变量的命名基本规定和习惯

    千次阅读 2022-04-29 22:01:34
    在进行脚本编程时,由于个人偏向以及撰写习惯问题,导致许多人在编程...所以该文分享了几种常见变量(或者是脚本中某些名称,类,类成员)的命名习惯法则,希望编程小白们能编写出日后让我减少阅读痛苦的优质代码!
  • Shell中的变量——用户环境变量、系统环境变量、PATH环境变量
  • 概率论 随机变量及常用6大分布整理

    千次阅读 2021-06-03 10:42:23
    随机变量 随机变量定义: 样本空间为Ω,随机变量X表示样本空间Ω中的一个样本点(样本空间和随机变量的关系类似于实数轴上的x轴...因为 F(x)是单调有界非减函数,所以其任一点x0的右极限F(x0+0)必存在。 数学期望
  • 两个分类变量间的关系,无法直接使用常见的皮尔逊相关系数来表述,多采用频数统计、交叉表卡方检验等过程进行处理,当分类变量的取值较多时,列联表频数的形式就变得更为复杂,很难从中归纳出变量间的关系。...
  • Linux 环境变量配置全攻略,超详细~

    千次阅读 2022-01-05 15:34:39
    针对不同程序在不同的环境下运行就需要修改环境变量进行定制,本文介绍 Linux常见的环境变量设置方法,希望对你帮助。 Linux环境变量配置 在自定义安装软件的时候,经常需要配置环境变量,下面列举出...
  • C语言基本数据类型之整型变量

    千次阅读 2019-07-10 15:42:30
    基本数据类型之整型常量 在c语言中,整形常量分为八进制、十六进制、和十进制三种 ...⑷在16位字长的机器上,基本整形无符号十进制所能表示的数值最大为 2的16次方即0-65535,符号整常数所能表...
  • access全局变量As developers, we frequently need to store values for use throughout our application or to pass values from one object (form, report, module) to another. There are a number of ways to do...
  • 一维随机变量及分布分布函数性质常见随机变量及其分布离散型分布律常见离散型随机变量及分布0-1分布二项分布泊松分布连续型性质随机变量函数的概率分布 分布函数 随机变量:通俗说,随机变量就是一次随机试验产生的...
  • 随机变量的定义——函数; 分布函数的定义和性质; 连续型随机变量的概率密度函数与单点密度的区别。
  • windows 用户变量和系统变量的区别

    千次阅读 2018-12-17 14:50:05
    点击“我的电脑→属性→高级系统设置”标签的“环境变量”...的时候我们会看到在用户变量和系统变量中都存在某一个环境变量,比如path,那么path的值到底是用户变量中的值还是系统变量中的值,或者两者都不是呢?...
  • 从方法上讲,该研究使用来自巴西可持续发展公司的宏观经济学和财务变量,对条件的CAPM模型进行了测试,该模型是从Jagannathan和Wang借来的。 根据我们的发现,证据表明,针对北美市场的Jagannathan和Wang的...
  • Windows变量路径

    千次阅读 2018-09-18 19:47:41
    用Windows系统还是要多了解常用变量路径的,这样也能帮助自己多了解VS中工程的配置路径。 参考文献: Windows变量路径与通配符 Windows变量路径 路径名称 实际路径 %System...
  • 然而观察性研究并不像随机试验一样一个表示随机分组的变量,所以我们需要使用其他变量作为我们的工具变量,其中一个可能选项是香烟的价格。香烟价格似乎能满足工具变量的三个条件:(1)香烟价格能影响一个人是否...
  • 数据预处理之变量变换

    千次阅读 2019-11-06 21:36:49
    在学习「数据挖掘导论」的数据预处理时,里面谈到了变量变换,我联想到了在基因表达量分析时的常见操作,例如FPKM,TPM,CPM,log对数变换。 比如说在文章里面会见到如下的描述 The size factor of each cell was ...
  • JavaScript变量和数据类型总结

    多人点赞 热门讨论 2022-02-12 23:53:39
    管你变量怎么变,一篇文章搞定(霸气)!
  • 我们也可以理解为,变量就像一个购物袋,我们可以用来装苹果、榴莲(当然也可以用来装玫瑰),需要注意的是,一般情况下一个变量只能装一个(不要太贪心)值,除非是复合变量(后面变量类型时会介绍),当我们放进去...
  • 一种无参熵估计法(non-parametric entropy estimation)可以避免划分bins来计算熵值,包括了核...相比之下,直方图法不够精确,而核密度估计法运算量太大,k-近邻估计成为了普遍使用的一种计算连续随机变量的熵值方式。
  • 出品 | CDA数据分析研究院,转载需授权 @[toc] 本文将介绍关于机器学习中的特征工程关于分类变量的处理。 分类变量 概念 顾名思义,分类变量用于表示类别或标签。...然而,与数值变量不同,分类变量的值...
  • 【转】分类变量的encoding处理

    千次阅读 2020-07-22 09:17:05
    原文章标题:机器学习中的特征工程——分类变量的处理 作者:CDA数据分析师培训 链接:https://www.jianshu.com/p/d63c0dbe7f3c 来源:简书 介绍关于机器学习中的特征工程关于分类变量的处理。 分类变量 概念 ...
  • 变量 和 内存地址

    千次阅读 2019-07-25 10:35:53
    (该版课程的内容更新及订正均已停止) 旧版课程打包下载 ---------------------------------- [想看涵盖“面向对象”、“图形编程”、“泛型编程”…… 的...] (另有: 博客版) 第五章 变量和常量 5.1 从类型到变量...
  • 变量的八种数据类型------06

    千次阅读 2019-01-03 18:52:53
    PHP变量类型-布尔类型 二: PHP标量类型-整型 三. PHP标量类型-浮点型 四: PHP标量类型-字符串型 五: PHP特殊类型-资源 六: PHP特殊类型-空类型(NULL) 七: 复合类型-数组 八: 复合类型-对象 一. PHP变量...