精华内容
下载资源
问答
  • 之前你已经了解概率基础知识(如果还不知道概率能干啥,在生活中有哪些应用的例子,可以看我这个:人工智能时代,用概率思维发现人生机会​www.zhihu.com今天我们来聊聊几种特殊概率分布。这个知识目前来看,还...

    之前你已经了解概率的基础知识(如果还不知道概率能干啥,在生活中有哪些应用的例子,可以看我这个:

    人工智能时代,用概率思维发现人生机会www.zhihu.com图标

    今天我们来聊聊几种特殊的概率分布。这个知识目前来看,还没有人令我满意的答案,因为其他人多数是在举数学推导公式。我这个人是最讨厌数学公式的,但是这并不妨碍我用统计概率思维做很多事情。相比熟悉公式,我更想知道学的这个知识能用到什么地方。可惜,还没有人讲清楚。今天,就让我来当回雷锋吧。


    首先,你想到的问题肯定是:

    1. 什么是概率分布?

    2. 概率分布能当饭吃吗?学了对我有啥用?

    好了,我们先看下:什么是概率分布?


    1. 什么是概率分布?

    要明白概率分布,你需要知道先两个东东:

    1)数据有哪些类型 2)什么是分布

    数据类型(统计学里也叫随机变量)有两种。第1种是离散数据。

    离散数据根据名称很好理解,就是数据的取值是不连续的。例如掷硬币就是一个典型的离散数据,因为抛硬币的就2种数值(也就是2种结果,要么是正面,要么是反面)。

    你可以把离散数据想象成一块一块垫脚石,你可以从一个数值调到另一个数值,同时每个数值之间都有明确的间隔。


    第2种是连续数据。连续数据正好相反,它能取任意的数值。例如时间就是一个典型的连续数据1.25分钟、1.251分钟,1.2512分钟,它能无限分割。连续数据就像一条平滑的、连绵不断的道路,你可以沿着这条道路一直走下去。


    什么是分布呢?

    数据在统计图中的形状,叫做它的分布。


    其实我们生活中也会聊到各种分布。比如下面不同季节男人的目光分布.。


    各位老铁,来一波美女,看看你的目光停在哪个分布的地方。


    美女也看了,现在该专注学习了吧。现在,我们已经知道了两件事情:

    1)数据类型(也叫随机变量)有2种:离散数据类型(例如抛硬币的结果),连续数据类型(例如时间) 2)分布:数据在统计图中的形状

    现在我们来看看什么是概率。概率分布就是将上面两个东东(数据类型+分布)组合起来的一种表现手段:

    概率分布就是在统计图中表示概率,横轴是数据的值,纵轴是横轴上对应数据值的概率。



    很显然的,根据数据类型的不同,概率分布分为两种:离散概率分布,连续概率分布。

    那么,问题就来了。为什么你要关心数据类型呢?

    因为数据类型会影响求概率的方法。

    对于离散概率分布,我们关心的是取得一个特定数值的概率。例如抛硬币正面向上的概率为:p(x=正面)=1/2

    而对于连续概率分布来说,我们无法给出每一个数值的概率,因为我们不可能列举每一个精确数值。

    例如,你在咖啡馆约妹子出来,你提前到了。为了给妹子留下好印象,你估计妹子会在5分钟之内出现,有可能是在4分钟10秒以后出现,或者在4分钟10.5秒以后出现,你不可能数清楚所有的可能时间,你更关心的是在妹子出现前的1-5分钟内(范围),你把发型重新整理下(虽然你因为加班头发 已经秃顶了,但是发型不能乱),给妹子留个好印象。所以,对于像时间这样的连续型数据,你更关心的是一个特定范围的概率是多少。


    2. 概率分布能当饭吃吗?学了对我有啥用?

    当统计学家们开始研究概率分布时,他们看到,有几种形状反复出现,于是就研究他们的规律,根据这些规律来解决特定条件下的问题。



    想起,当年为了备战高考,我是准备了一个自己的“万能模板”,任何作文题目过来,我都可以套用该模板,快速解决作文这个难题。当你,我高考的作文分数还是不错的。(我聪明吧)

    同样的,记住概率里这些特殊分布的好处就是:

    下次遇到类似的问题,你就可以直接套用“模板”(这些特殊分布的规律)来解决问题了。

    酷不酷?爽不爽?

    接下里,我们一起来聊聊常见的4种概率分布。

    1)3种离散概率分布

    二项分布 泊松分布 几何何分布

    2)1种连续概率分布

    正态分布

    在开始介绍之前,你先回顾下这两个知识:

    期望:概率的平均值 标准差:衡量数据的波动大小。


    第1种:二项分布

    我们从下面3个问题开聊:

    1. 二项分布有啥用? 2. 如何判断是不是二项分布? 3. 二项分布如何计算概率?


    1. 二项分布有啥用呢?

    当你遇到一个事情,如果该事情发生次数固定,而你感兴趣的是成功的次数,那么就可以用二项分布的公式快速计算出概率来。

    例如你按我之前的《投资赚钱与概率》买了这5家公司的股票(谷歌,Facebook,苹果,阿里巴巴,腾讯),为了保底和计算投入进去多少钱,你想知道只要其中3个股票帮你赚到钱(成功的次数)的概率多大,那么这时候就可以用二项分布计算出来。

    牛掰吧?

    2. 如何判断是不是二项分布?

    首先,为啥叫二项,不叫三项,或者二愣子呢?故明思义,二项代表事件有2种可能的结果,把一种称为成功,另外一种称为失败。

    生活中有很多这样2种结果的二项情况,例如你表白是二项的,一种成功(恭喜你表白成功,可以恋爱了,兴奋吧?),一种是失败(被拒绝了,伤不伤心?)。你向老板提出加薪的要求,结果也有两种(二项)。一种是成功(加薪成功,老板我爱你),一种是失败(麻蛋,不给涨薪老子不干了,像是这种有统计概率思维的人,是很稀缺的,明天就投简历出去)


    那么,什么是二项分布呢?只要符合下面3个特点就可以判断某事件是二项分布了:

    1)做某件事的次数(也叫试验次数)是固定的,用n表示。

    (例如抛硬币3次,投资5支股票),

    2)每一次事件都有两个可能的结果(成功,或者失败)

    (例如每一次抛硬币有2个结果:正面表示成功,反面表示失败。

    每一次投资美股有2个结果:投资成功,投资失败)。

    3)每一次成功的概率都是相等的,成功的概率用p表示

    (例如每一次抛硬币正面朝上的概率都是1/2。

    你投资了5家公司的股票,假设每一家投资盈利成功的概率都相同)

    4)你感兴趣的是成功x次的概率是多少。那么就可以用二项分布的公式快速计算出来了。

    (你已经知道了我前面讲的5家美股的赚钱概率最大,所以你买了这5家公司的股票,假设投资的这5家公司成功的概率都相同,那么你关心其中只要有3个投资成功,你就可以赚翻了,所以想知道成功3次的概率)


    根据这4个特点,我们就知道抛硬币是一个典型的二项分布,还有你投资的这5支股票也是一个典型的二项分布(在假设每家公司投资成功的前提下)。


    3. 二项分布如何计算概率?

    怎么计算符合二项分布事件的概率呢?也就是你想知道下面的问题:

    你抛硬币3次,2次正面朝上的概率是多少? 你买了这5家公司的股票,3支股票赚钱的概率是多大?

    上面我们已经知道了二项分布的4个特点,并知道每个特点的表示方法:

    1)做某件事次数是固定的,用n表示
    2)每一次事件都有两个可能的结果(成功,或者失败)
    3)每一次成功的概率都是相等的,成功的概率用p表示
    4)你感兴趣的是成功x次的概率是多少

    这时候,二项分布的公式就可以发挥威力了:

    这里你也别害怕数学公式,每一项的含义我前面已经讲的很清楚了。这个公式就是计算做某件事情n次,成功x次的概率的。很多数据分析工具(Excel,Python,R)都提供工具让你带入你研究问题的数值,就能得到结果。

    例如,抛硬币5次(n),恰巧有3次正面朝上(x=3,抛硬币正面朝上概率p=1/2),可以用上面的公式计算出出概率为31.25%(用Excel的BINOM.DIST函数,Python,R都可以快速计算)


    二项分布经常要计算的概率还有这样一种情况:

    抛硬币5次,硬币至少有3次正面朝上(即x>=3)的概率是多少?

    你能直接想到的简单方法是:将恰巧有3次,恰巧有4次,恰巧有5次的概率相加,结果便是至少3次,为50%。

    但是如果次数很多,这样的办法简直是给自己挖了一个大大的坑。

    我们用逆向思维换个思路,至少3次正面朝上的反向思考是什么呢?


    反向思路就是最多2次正面朝上。只要我们先计算出最多2次正面朝上的概率p(x<=2),那么至少3次正面朝上的概率就是1-p(x<=2)。

    这样用逆向思维,就把一个复杂的问题,化解为简单的问题。因为求做多2次朝上的概率比较简单:

    p(x<=2)=p(0)+p(1)+p(2)


    最好提下二项分布的:

    期望E(x)=np (表示某事情发生n次,预期成功多少次。)

    知道这个期望有啥用呢?

    做任何事情之前,知道预期结果肯定对你后面的决策有帮助。比如你抛硬币5次,每次概率是1/2,那么期望E(x)=5*1/2=2.5次,也就是有大约3次你可以抛出正面。

    在比如你之前投资的那5支股票,假设每支股票帮你赚到钱的概率是80%,那么期望E(x)=5*80%=4,也就是预期会有4只股票投资成功帮你赚到钱。


    第2种:几何分布

    其实我一直把几何分布,叫做二项分布的孪生兄弟,因为他两太像了。只有1点不同,就像海尔兄弟只有内裤不同一样。

    我们还是从下面这个套路聊起来一起找出这个不同的“劲爆点”:

    1 . 几何分布有啥用? 2. 如何判断是不是几何分布? 3. 几何分布如何计算概率?


    1.几何分布有啥用?

    如果你需要知道尝试多次能取得第一次成功的概率,则需要几何分布。

    2. 如何判断是不是几何分布?

    只要符合下面4个特点就可以判别你做的事情是就是几何分布了:

    1)做某事件次数(也叫试验次数)是固定的,用n表示
    (例如抛硬币3次,表白5次),
    2)每一次事件都有两个可能的结果(成功,或者失败)
    (例如每一次抛硬币有2个结果:正面表示成功,反面表示失败。
    每一次表白有2个结果:表白成功,表白失败)。
    3)每一次“成功”的概率都是相等的,成功的概率用p表示
    (例如每一次抛硬币正面朝上的概率都是1/2。
    假设你是初出茅庐的小伙子,还不是老油条,所以你表白每一次成功的概率是一样的)
    4)你感兴趣的是,进行x次尝试这个事情,取得第1次成功的概率是多大。
    (例如你在玩抛硬币的游戏,想知道抛5次硬币,只有第5次(就是滴1次成功)正面朝上的概率是多大。

    你表白你的暗恋对象,你希望知道要表白3次,心仪对象答应和你手牵手的概率多大。)

    正如你上面看到的,几何分布和二项分布只有第4点,也就是解决问题目的不同。这个点够不够劲爆?(嘻嘻)

    3. 几何分布如何计算概率?

    用下面公式就可以了:

    p为成功概率,即为了在第x次尝试取得第1次成功,首先你要失败(x-1)次。

    假如在表白之前,你计算出即使你尝试表白3次,在最后1次成功的概率还是小于50%,还没有抛硬币的概率高。那你就要考虑换个追求对象。或者首先提升下自己,提高自己每一次表白的概率,比如别让自己的鼻毛长出来。我之前读书的一个师兄,每天鼻毛长出来,看的我都恶心,何况其他人呢。


    几何分布的期望是E(x)=1/p。代表什么意思呢?

    假如你每次表白的成功概率是60%,同时你也符合几何分布的特点,所以期望E(x)=1/p=1/0.6=1.67

    所以你可以期望自己表白1.67次(约等于2次)会成功。这样的期望让你信息倍增,起码你不需要努力上100次才能成功,2次还是能做到的,有必要尝试下。

    几何分布的标准差:

    第3种泊松分布

    还是同样的味道,还是同样的讨论,我们一起通过下面3个问题了解这个泊松分布。

    1. 泊松分布有啥用? 2. 如何判断是不是泊松分布? 3. 泊松分布如何计算概率?


    1. 泊松分布有啥用?

    如果你想知道某个时间范围内,发生某件事情x次的概率是多大。这时候就可以用泊松分布轻松搞定。比如一天内中奖的次数,一个月内某机器损坏的次数等。

    知道这些事情的概率有啥用呢?

    当然是根据概率的大小来做出决策了。比如你搞了个抽奖活动,最后算出来一天内中奖10次的概率都超过了90%,然后你顺便算了下期望,再和你的活动成本比一下,发现要赔不少钱。那这个活动就别搞了。

    泊松分布的形状会随着平均值的不同而有所变化,无论是一周内多少人能赢得彩票,还是每分钟有多少人会打电话到呼叫中心,泊松分布都可以告诉我们它们的概率。




    2. 什么是泊松分布?

    符合以下3个特点就是泊松分布:

    1)事件是独立事件
    (之前如果你看过我的《投资赚钱与概率》已经知道赌徒谬论了,所以类似抽奖这样的就是独立事件)
    2)在任意相同的时间范围内,事件发的概率相同
    (例如1天内中奖概率,与第2天内中间概率相同)
    3)你想知道某个时间范围内,发生某件事情x次的概率是多大
    (例如你搞了个促销抽奖活动,想知道一天内10人中奖的概率)

    用x代表事情发的次数(例如中奖10个人中奖),u代表给定时间范围内事情发生的平均次数(例如你搞的抽奖活动1天平均中奖人数是5人),概率计算公式为:

    可别被上面的公式吓到,数学公式就是纸老虎,现在有很多工具(Excel,Python,R)都可以直接计算出来这个概率,所以也别记住这个公式,用的时候知道泊松分布适合啥时候用就妥了。

    例如你搞了个促销抽奖活动,只知道1天内中奖的平均个数为5个,你想知道1天内恰巧中奖次数为7的概率是多少?

    此时x=7,u=5(区间内发生的平均次数),代入公式求出概率为10.44%。Excel中的函数为POISSON.DIST就可以立马算出来。


    泊松概率还有一个重要性质,它的数学期望和方差相等,都等于u

    1. 什么是概率分布?

    概率分布就是在统计图中表示概率,横轴是数据的值,纵轴是横轴上对应数据值的概率。

    2. 概率分布能当饭吃吗?学了对我有啥用?

    下次遇到类似的问题,你就可以直接套用“模板”(这些特殊分布的规律)来求得概率了。

    3.特殊的概率分布有哪些?

    3种离散概率分布,分别代表了解决3种问题的“万能模板”

    二项分布(Binomial distribution)

    符合以下4个特点的就是二项分布

    1)做某件事的次数是固定的。

    2)每一次事件都有两个可能的结果(成功,或者失败)

    3)每一次成功的概率都是相等的

    4)你感兴趣的是成功x次的概率是多少

    案例:

    抛5次硬币,有2次正面朝上的概率是多少

    你买了之前我介绍你的5家公司的股票,假设投资的这5家公司成功的概率都相同,那么你关心其中只要有3个投资成功,你就可以赚翻了,所以想知道成功3次的概率多大。

    几何何分布(Geometric distribution)

    只要符合下面4个特点就可以判别你做的事情是就是几何分布了:

    1)做某事件次数(也叫试验次数)是固定

    2)每一次事件都有两个可能的结果

    3)每一次“成功”的概率都是相等的,成功的概率用p表示

    4)你感兴趣的是,进行x次尝试这个事情,取得第1次成功的概率是多大。

    案例:例如你在玩抛硬币的游戏,想知道抛5次硬币,只有第5次(就是滴1次成功)正面朝上的概率是多大。

    表白3次,第3次成功的概率多大

    泊松分布(poisson distribution)

    符合以下3个特点就是泊松分布:

    1)事件是独立事件

    2)在任意相同的时间范围内,事件发的概率相同

    3)你想知道某个时间范围内,发生某件事情x次的概率是多大

    案例:例如你搞了个促销抽奖活动,想知道一天内10人中奖的概率

    例如你是公司质检管理员,想知道一个月内某机器损坏的10次(假如超过10次一句认为不合格)的概率是多少。

    1种连续概率分布:正态分布(Normal distribution)

    这个分布在生活中太有用了,给我一种相见恨晚的“劲爆感”,留着下次聊

    reference

    来自这位大佬,这里主要是为了学习,如有侵权请联系我删除

    展开全文
  • 陀螺仪是一种测量运动物体相对惯性空间旋转...陀螺旋进是日常生活中常见的现象,许多人小时候都玩过陀螺就是一例。  人们利用陀螺力学性质所制成各种功能陀螺装置称为陀螺仪(gyroscope),它科学、技术、军
  • 陀螺仪是一种测量运动物体相对惯性空间旋转...陀螺旋进是日常生活中常见的现象,许多人小时候都玩过陀螺就是一例。  人们利用陀螺力学性质所制成各种功能陀螺装置称为陀螺仪(gyroscope),它科学、技术、军
  • 这个图片展示了不同平均值和方差正态分布,这可以说是生活中常见的模型了。很多地方都可以看到正态分布的影子,例如大多数生物高度和重量都可以看到正态分布。那么为什么会出现正态分布呢?什么情况下可以...

    3d048ece462645a506e01dbbb2635a7b.png

    这个图片展示了不同的平均值和方差的正态分布,这可以说是生活中最常见的模型了。很多地方都可以看到正态分布的影子,例如大多数生物的高度和重量都可以看到正态分布。那么为什么会出现正态分布呢?在什么情况下可以把分布看作正态分布呢?正态分布有什么应用?这篇文章将回答这些问题。

    为什么存在正态分布

    这里首先需要提到中心极限定理:

    在适当的条件下,大量相互独立随机变量的均值经适当标准化后分布收敛于正态分布.

    这里用抛硬币的例子来说明这个问题,每次抛硬币是独立同分布的。如果连续抛10000次硬币,每次抛硬币的正反概率都是1/2,之后计算出现正面的概率。重复做这个实验很多次,得到的正面结果的分布就是一个正态分布。

    中心极限定理的特殊之处在于不管每个独立事件的分布如何,最后都是成立的。经研究发现,当 N > 20 的时候,这些独立事件的均值就服从正态分布。因为N是固定的,所以也可以看作这些独立事件的是正态分布的。

    重要的一点在于,服从正态分布的是许多随机事件的个体的均值或者是和,并不是独立的事件出现的本身。这时候聪明的读者可能就会想,那么为什么每个人的身高是符合正态分布呢?

    人的身高是受到本身的基因和外界坏境影响。经过研究发现,基因的贡献率可能高达80%,所以在这里简化认为人的身高只受到基因的影响。研究发现至少180个基因有助于人的身体长高,这些基因在人类的身体里是共有的,不过表达的程度不同,所以可以把一个人的身高看作这些基因的表现之和。由此解释了为什么人的身高符合正态分布。

    而对于一些事情,其实就不应该符合正态分布,例如一次考试的成绩。成绩受到试卷的难度,学生的水平多方面影响,很难看作独立同分布事件之和,所以成绩并不符合正态分布的假设。如果把很多同学成绩的均值进行统计,是符合正态分布的。而在一些地方,会强行要求每个同学的成绩符合正态分布,这无疑是一件很难的事情。大学成绩要求正态分布合理吗?

    正态分布的一些应用

    我们可以利用正态分布解释为什么罕见结果在规模小的群体里更加常见。随机变量均值的标准差并不等于分布的标准差/N, 同样的,随机变量的和的标准差也不是等于分布的标准差 * N。

    当群体比较大的时候,均值的波动会比较小,但是和的波动就会比较大。当群体小的时候,均值的标准差会比大群体大不少,所以出现极端情况会比较多。美国多州疫情数据显示:非洲裔等少数族裔确诊和死亡病例远高于平均值 我们也可以利用这条应用解释这个新闻。这个现象出现的原因:一方面是本身医疗条件和生活水平的差距,另一点也是受少数族裔本身的影响,其确症和死亡率比大群体 -- 白人是要高一点。

    另一个应用是六西格玛方法,它是由摩托罗拉公司于1980年代提出的,可以利用正态分布来为质量控制提供有效信息。

    71df57b78831ea35b7c1ee22bbb52cab.png

    六西格玛的由来可以看这个图,$pm 3 sigma$ 可以包含 接近99.8%的结果。摩托罗拉公司在生产零件的时候要求产品如果出现和均值相比超过2个标准差的误差,那么就是不合格的。两个标准差之外出现的概率大概是5%,对于企业还是太高了。所以通过这种方法可以降低标准差,降低不合格产品的可能性。这里的核心思想就是在六个标准差内可以包含几乎所有的事情。

    对数正态分布

    如果事件是互相影响的,那么则不能用普通的正态分布来研究,而要使用对数正态分布。对数正态缺乏对称性,当大于1时,其乘积增长很快,所以会出现长尾效应。当将20个不均匀分布在0到10之间的随机变量相乘,总会出现一些很小的和一些很大的。

    99d98d5957e455449f6a3e50468d8e61.png

    人们的工资分布可以用对数分布来解释。在不少公司里,人们是通过百分比加薪的,而不是每次增加固定的薪水。所以人的收入是多次加薪相乘的结果,而不是累加。如果每次都增加一定的薪水,则对于同一工作年限的人来说,其收入更加接近普通的正态分布。

    小结

    这里我们一起探讨了正态分布的由来和一些应用。正态分布之所以常见是因为中心极限定理的强大,如果一个群体里每个个体是独立的随机事件,群体的均值或者和总是可以看成其符合某种正态分布,对数正态分布则解释了当个体是互动影响的情况。

    展开全文
  • 本文重点介绍了日常生活中经常能遇到的六个重要分布,并解释了它们的应用。 介绍 假设你是一所大学的老师。对一周的作业进行了检查之后,你给所有的学生打了分数。你把这些打了分数的论文交给大学的数据...

    概率分布在许多领域都很常见,包括保险、物理、工程、计算机科学甚至社会科学,如心理学和医学。它易于应用,并应用很广泛。本文重点介绍了日常生活中经常能遇到的六个重要分布,并解释了它们的应用。


    介绍

    假设你是一所大学的老师。在对一周的作业进行了检查之后,你给所有的学生打了分数。你把这些打了分数的论文交给大学的数据录入人员,并告诉他创建一个包含所有学生成绩的电子表格。但这个人却只存储了成绩,而没有包含对应的学生。


    他又犯了另一个错误,在匆忙中跳过了几项,但我们却不知道丢了谁的成绩。我们来看看如何来解决这个问题吧。


    一种方法是将成绩可视化,看看是否可以在数据中找到某种趋势。


    640?wx_fmt=png&wxfrom=5&wx_lazy=1


    上面展示的图形称为数据的频率分布。其中有一个平滑的曲线,但你注意到有一个异常情况了吗?在某个特定的分数范围内,数据的频率异常低。所以,最准确的猜测就是丢失值了,从而导致在分布中出现了凹陷。


    这个过程展示了你该如何使用数据分析来尝试解决现实生活中的问题。对于任何一位数据科学家、学生或从业者来说,分布是必须要知道的概念,它为分析和推理统计提供了基础。


    虽然概率为我们提供了数学上的计算,而分布却可以帮助我们把内部发生的事情可视化。


    在本文中,我将介绍一些重要的概率分布,并会清晰全面地对它们进行解释。


    注意:本文假设你已经具有了概率方面的基本知识。如果没有,可以参考这篇有关概率基础的文章。


    常见的数据类型

    在开始详细讲述分布之前,先来看看我们会遇到哪些种类的数据。数据可以分为离散的和连续的。


    离散数据顾名思义,只包含指定的值。例如,当你投骰子的时候,输出结果只可能是1、2、3、4、5或6,而不可能出现1.5或2.45。


    连续数据:可以在给定的范围内取任何值。范围可以是有限的,也可以是无限的。例如,女孩的体重或身高、路程的长度。女孩的体重可以是54千克、54.5千克,或54.5436千克。


    现在我们开始学习分布的类型。


    分布的类型

    伯努利分布


    我们首先从最简单的分布伯努利分布开始。


    伯努利分布只有两种可能的结果,1(成功)和0(失败)。因此,具有伯努利分布的随机变量X可以取值为1,也就是成功的概率,可以用p来表示,也可以取值为0,即失败的概率,用q或1-p来表示。


    概率质量函数由下式给出:px(1-p)1-x, 其中x € (0, 1)。它也可以写成:


    640?wx_fmt=png


    成功与失败的概率不一定相等。这里,成功的概率(p)与失败的概率不同。所以,下图显示了我们之间比赛结果的伯努利分布。


    640?wx_fmt=png


    这里,成功的概率 = 0.15,失败的概率 = 0.85 。如果我打了你,我可能会期待你向我打回来。任何分布的基本预期值是分布的平均值。来自伯努利分布的随机变量X的期望值如为:


    E(X) = 1*p + 0*(1-p) = p


    随机变量与二项分布的方差为:


    V(X) = E(X²) – [E(X)]² = p – p² = p(1-p)


    伯努利分布的例子有很多,比如说明天是否要下雨,如果下雨则表示成功,如果不下雨,则表示失败。


    均匀分布


    对于投骰子来说,结果是1到6。得到任何一个结果的概率是相等的,这就是均匀分布的基础。与伯努利分布不同,均匀分布的所有可能结果的n个数也是相等的。


    如果变量X是均匀分布的,则密度函数可以表示为:


    640?wx_fmt=png


    均匀分布的曲线是这样的:


    640?wx_fmt=png


    你可以看到,均匀分布曲线的形状是一个矩形,这也是均匀分布又称为矩形分布的原因。其中,a和b是参数。


    花店每天销售的花束数量是均匀分布的,最多为40,最少为10。我们来计算一下日销售量在15到30之间的概率。


    日销售量在15到30之间的概率为(30-15)*(1/(40-10)) = 0.5


    同样地,日销售量大于20的概率为 = 0.667


    遵循均匀分布的X的平均值和方差为:


    平均值 -> E(X) = (a+b)/2


    方差 -> V(X) =  (b-a)²/12


    标准均匀密度的参数 a = 0 和 b = 1,因此标准均匀密度由下式给出:


    640?wx_fmt=png


    推荐阅读

    谷歌新品发布会:赋能AI 三大原则 软硬结合

    深度学习软件安装指南

    谷歌教你零编程基础玩转机器学习

    中科院谭铁牛爱徒研发碟中谍中的步态识别技术

    肯尼亚的小哥利用深度学习“桃脸识别”

    专访深度学习之父Geoffrey Hinton

    NIH发布全球最大胸部X光数据集

    CMU用「PixelNN」完美还原马赛克照片(paper)

    9行Python代码搭建神经网络(代码)

    娃哈哈投资1000万美元在以色列建立AI研究中心

    430家以色列人工智能初创公司图谱及十大特征 

    25行Python代码实现人脸识别 || 教程

    长期招聘志愿者

    加入「AI从业者社群」请备注个人信息

    添加小鸡微信  liulailiuwang


    640?wx_fmt=png

    展开全文
  •  LCD显示屏的应用越来越广,数量越来越多。LCD显示屏应用广泛,无处不在。小到家庭各种电器设备,大到军事设备。更常见是用于各种公共场合如体育馆、广场等商业用途。给我们传递一种更为直观、生动的信息。从此我们...
  • 例如,下面这个设备监控应用统系中,首页除了显示实时监控数据外,还需要右上角显示实时时间:这种形式“动态报表”其实我们生活中也随处可见,最常见的就是火车站大屏幕上列车时刻表,上面显示当前时间,...

    7393dd11b6d7d324c9f7430635a49b50.png

    报表,除了相对静态地展现汇总统计数据以及分布、趋势等数据内容外,也可以用于显示和时间相关的即时信息,包括实时显示时间。例如,下面这个设备监控应用统系中,首页除了显示实时监控数据外,还需要在右上角显示实时时间:

    6278bcd31a6760c81d47c23473156876.png

    这种形式的“动态报表”其实在我们生活中也随处可见,最常见的就是火车站大屏幕上的列车时刻表,上面显示的当前时间,让旅客能够一目了然地知道自己的列车还有多长时间开,等待的列车什么时候到。

    4e8560f9f61de679d9a5f3aafc30406a.png

    其实,要在报表中做到上面的效果很简单,基本思路就是让页面定时(比如每隔一秒钟)调用 JS 方法,在 JS 中通过单元格的 ID 获取到显示时间的那个格子,将当前时间作为这个格子的新值显示就可以了。


    下面,我们就具体看看如何通过润乾报表实现这样司空见惯的动态显示时间效果。

    1、设置报表单元格表达式

    前面第一个图是在润乾报表设计器自带的报表“设备故障分析.rpx”的基础上实现的,接下来我们就用这个报表作为例子进行说明。我们首先在自带报表中添加时间,合并 N4、O4 单元格,并在该合并格中设置单元格表达式 =string(now(),”yyyy 年 MM 月 dd 日 hh:MM:ss”)。

    51e93f5215bca0adb11ac18ee370a373.png

    2、设置 JSP 页面标签

    然后,我们打开报表展现页面 showReport.jsp,在这个页面中设置标签属性 generateCellId,以便报表单元格在页面生成格子的 ID。

    打开原始的报表展现页面,我们发现设置当前时间的单元格,并没有生成对应的 ID,如下图所示:

    3abb115e9e9a711ca25c46c2af4a6ddb.png

    为了在 JS 脚本中能够通过 ID 可以获得到该单元格,以便修改该单元格的值,我们需要在展现的页面中添加标签属性 generateCellId=”yes”,如下图所示:

    5c168dbdad68f13c3f44d39c3f4e5ba8.png

    设置了该属性后,我们可以在页面中可以看到,该单元格生成了对应的 id 值:

    acff8960ffe72055531a059c60398c91.png

    3、设置页面 JS 方法

    接下来,我们在在报表展现的页面中添加动态改变单元格值的 JS 方法 myrefresh(), 在这个方法中通过单元格的 ID 动态改变该单元格中的显示时间,同时通过 setTimeout() 在 1 秒后调用函数 myrefresh。由于 setTimeout()函数只会被调用一次,所以我们还需要在 myrefresh() 函数体中也加上这个函数,从而达到循环调用的效果,下面是具体的 JS 方法:

    function myrefresh()

    {

    var tbl = document.getElementById(“report1_N12”);

    var myDate = new Date();

    tbl.innerHTML=myDate.toLocaleString( );

    setTimeout(‘myrefresh()’,1000);

    }

    setTimeout(‘myrefresh()’,1000);

    4、预览页面效果

    . 这样,经过以上的简单设置,我们就可以在 showReport.jsp 页面中展现“设备故障分析.rpx”报表,并且在页面上方看到实时变化的时间了,页面效果如下:

    428f86e3d62afbd6a4ecdbc74cf2cae0.png

    通过这个简单的例子,我们知道,就像开篇所说,报表不仅能够呈现固定的统计汇总数据,还有相当不错的动态展示能力。我们在这里使用的定时调用 JS 改变单元格的值的方式,可以实现页面局部内容的动态变化,而且没有闪烁刷新,毫无违和感!

    怎么样,意不意外?惊不惊喜?让我们赶紧撸起袖子利用报表让数据展现更加丰富起来吧!

    更多动态交互的页面效果请查看:前端效果导航
    *报表工具如何实现“点击查看原图”
    *如何实现伸缩 (折叠) 报表?
    *HTML 事件 – 鼠标移入高亮显示
    *报表怎样实现滚动的公告效果?

    展开全文
  • 对40G光模块认知

    2019-11-25 11:40:44
    目前40G光模块在生活中的应用越来越广泛,今天让我们对40G光模块进行一个简单的认识。 40G光模块是为了满足更高密度的高速可插拔解决方案的需求而衍生的产物,有4个相互独立的发射和接收光信号通道,能够为数据中心...
  • 小文 | 公众号 小文的数据之旅前言:上一期说到三大抽样分布的主要作用在于参数估计与假设验证,参数估计已经在重温统计学--参数...在生活中的应用假设检验的例子有很多,最常见的就是在法庭上,法官先假设嫌疑犯...
  • 报表,除了相对静态地展现汇总统计数据以及分布、趋势等数据内容外,也可以用于显示和时间相关即时信息,包括实时显示时间。...这种形式“动态报表”其实我们生活中也随处可见,最常见的就是火车站大屏幕上...
  • 聚类算法分析总结

    万次阅读 2016-01-15 17:14:11
    同时,聚类分析已经广泛的应用在许多应用,包括模式识别,数据分析,图像处理以及市场研究。通过聚类,人们能意识到密集和稀疏的区域,发现全局的分布模式,以及数据属性之间的有趣的相互关系。简单来说就是将
  • 报表实时显示时间

    2018-08-28 15:22:00
    报表,除了相对静态地展现汇总统计数据以及分布、趋势等数据内容外,也可以用于显示和时间相关即时信息,包括实时显示...这种形式“动态报表”其实我们生活中也随处可见,最常见的就是火车站大屏幕上列车...
  • 假设检验其实很好理解,生活中的例子也很多,最常见的就是应用在法庭上,法官先假设嫌疑犯无罪,然后收集证据,如果有足够证据证明嫌疑犯有罪,则需要宣判嫌疑犯有罪。假设验证做的就是这么一回事,先不管其统计学...
  • 报表,除了相对静态地展现...这种形式“动态报表”其实我们生活中也随处可见,比如最常见的就是火车站大屏幕上列车时刻表,上面显示当前时间,让旅客能够一目了然地知道自己列车还有多长时间开,等待...
  • 这种形式“动态报表”其实我们生活中也随处可见,最常见的就是火车站大屏幕上列车时刻表,上面显示当前时间,让旅客能够一目了然地知道自己列车还有多长时间开,等待列车什么时候到。 ...

空空如也

空空如也

1 2 3
收藏数 42
精华内容 16
关键字:

常见分布在生活中的应用