精华内容
下载资源
问答
  • 分布
    千次阅读
    2021-07-11 16:45:29


    高斯分布又叫正态分布,是统计学中最重要的连续概率分布。研究表明,在物理科学和经济学中,大量数据的分布通常是服从高斯分布, 所以当我们对数据潜在分布模式不清楚时,可以优先用高斯分布近似或精确描述。

    遵循高斯分布的随机变量是假设在给定范围内的任何值,比如某小学学校学生的身高,它可以取任何值,但是会限制在0到2米范围内,这个限制是根据实际生活中强加的,但是在高斯分布中,没有随机变量这个范围限制,可以扩展到整个实数范围内,最终会得到一个很好的平滑曲线,这样的随机变量被称为连续变量,高斯分布的作用在于给定某个值在特定范围内的概率,它是一种研究误差服从一个什么样的分布。

    高斯分布定义

    高斯分布相关概念在高中数学学到过,估计大家都忘了差不多,先稍微回顾下。

    假设随机变量X服从高斯分布,即
    X ∼ N ( μ , σ 2 ) X\sim N(\mu ,\sigma^{2} ) XN(μ,σ2)
    其概率密度函数为:
    f ( x ) = 1 σ 2 π e − 1 2 ( x − μ σ ) 2 f(x)=\frac{1}{\sigma \sqrt{2\pi }}e^{-\frac{1}{2}(\frac{x-\mu }{\sigma })^{2}}\\ f(x)=σ2π 1e21(σxμ)2
    其 中 , σ 为 总 体 标 准 差 , μ 为 总 体 均 值 , π 为 3.14159 , e 为 2.71828 其中,\sigma为总体标准差,\mu为总体均值,\\ \pi为3.14159,e为2.71828 σμπ3.14159e2.71828

    在这里插入图片描述
    以上高斯分布曲线取决于两个因素:均值和标准差。分布的均值决定了图形中心的位置,标准差决定了图像的高度和宽度。标准差大时,曲线呈现出“矮胖”,标准差小时,曲线呈现出“高瘦”。因此通过改变均值和标准差,根据其概率密度函数得到不同的高斯分布,如下图所示。
    在这里插入图片描述
    那么高斯分布曲线具有什么样的性质呢?
    ①曲线下的总面积为1
    ②随机变量X等于任何特定值的概率为0
    ③X大于a的概率等于以a为界到正无穷大的曲线下的面积
    ④X小于a的概率等于从负无穷大到以a为界的曲线下的面积

    此外,高斯分布(无论其均值和标准差如何)都符合以下性质
    ①大约 68% 的曲线下面积落在平均值的 1 个标准偏差内
    ②大约 95% 的曲线下面积落在平均值的 2 个标准差内
    ③大约 99.7% 的曲线下面积落在平均值的 3 个标准差内

    这些点统称为经验法则或 68-95-99.7 法则。 显然,给定一个高斯分布,大多数结果将在平均值的 3 个标准偏差内。

    标准形式
    因为改变 μ 和 σ 的效果只是使曲线沿 x 轴移动,或者只是分别加宽或缩小它。 因此,我们可以定义一个新的随机变量 Z 来适应这些变化:
    z = ( x − μ ) / σ z=(x-\mu)/\sigma z=(xμ)/σ
    以上,z称为标准化高斯分布,是高斯分布的一种特例,其中标准的高斯分布的随机变量称为标准分数或者z分数,每个高斯随机变量X可以通过以上等式转换为z-score。就这个标准变量而言,高斯分布可以简化为
    f ( x ) = 1 σ 2 π e − 1 2 z 2 f(x)=\frac{1}{\sigma \sqrt{2\pi }}e^{-\frac{1}{2}z^{2}} f(x)=σ2π 1e21z2
    这个分布的参数为 μ=0,σ=1,因此Z∼N(0,1)。

    高斯分布意义

    首先举几个小栗子:
    ①在高尔顿钉板实验中,从漏斗形上口掉落的小球会遇上一系列排列成三角形的“钉子”。每当小球从正上方下落到一个“钉子”上时,它总是会有50%的概率跑到左边,50%的概率跑到右边。在经过数次这样随机的“左右选择”之后,小球掉落到下方的格子中。
    最终,格子中小球的数量直观地体现了这一过程的概率分布。小球落入某个格子的概率符合二项分布,而当钉子、格子和小球的数量足够多时,小球的分布会接近高斯分布。
    在这里插入图片描述
    ②再比如,疫情期间隔离为14天,为啥一定是14天?这个数字就是来源于高斯分布;在流行病学中,疾病的潜伏期通常可以用对数高斯分布来近似,对数高斯随机分布都存在一个长尾,尽管长尾部分的概率很小但不是零,如果样本量足够大,长尾部分的小概率事件还是有可能发生的。
    在这里插入图片描述

    ③超市某牛奶为250ml,但是实际过程中肯定会有误差,真实值是服从均值为250ml的高斯分布,但是这里的方差肯定很小,不然会招到顾客投诉;
    ④惊奇的是,智商测试的分数也是服从高斯分布,因此大部分人的智商都是正常的,像爱因斯坦这种聪明绝顶的属于高斯分布的顶尖;
    在这里插入图片描述

    生活中有好多例子都是服从高斯分布 ,那么高斯分布还能做些什么呢?
    答案是能够估算出数据的位置。
    就比如每次考试出题目,好的考卷并不是题目都很容易,或者都很难,它的目的是为了区分人才,因此这里的标准差就起到了很大的作用。

    重点来啦
    以上,现实世界中的现象遵循高斯(或接近高斯)分布,这使研究人员可以使用高斯分布作为评估与现实世界现象相关的概率模型。 通常,分析包括两个步骤。
    Step1:转换原始数据。通常,原始数据不是 z-score的形式,需要使用前面通过转换方程将它们转换为 z-score:z = (X - μ) / σ。
    Step2:寻找概率。将数据转换为z-score后,可以使用标准高斯分布表、在线计算器或手持绘图计算器来查找与 z-score相关的概率。

    高斯分布的概率密度函数推导

    如上所述,高斯分布的概率密度函数为
    f ( x ) = 1 σ 2 π e − 1 2 ( x − μ σ ) 2 f(x)=\frac{1}{\sigma \sqrt{2\pi }}e^{-\frac{1}{2}(\frac{x-\mu }{\sigma })^{2}} f(x)=σ2π 1e21(σxμ)2
    简化形式为
    f ( x ) = 1 2 π σ e − x 2 2 σ 2 f(x)=\frac{1}{\sqrt{2\pi}\sigma }e^{-\frac{x^{2}}{2\sigma ^{2}}} f(x)=2π σ1e2σ2x2
    现对以上公式进行推导。
    假设误差密度函数为f(x),现有n个独立观测值x1,x2,…,xn,真实值为x,则似然估计函数(不懂的快去补基础知识)为:
    L ( x ) = f ( x 1 − x ) ⋅ f ( x 2 − x ) ⋅ ⋅ ⋅ f ( x n − x ) L(x)=f(x_{1}-x)\cdot f(x_{2}-x)\cdot \cdot \cdot f(x_{n}-x) L(x)=f(x1x)f(x2x)f(xnx)
    为了将似然估计函数取得最大值,一般求导,并将导函数等于0,即可求得极值,但是直接求导太麻烦,因此这里会做一个取对数的操作,就是为了方便计算。
    所以,等式两边取对数,则有
    l n L ( x ) = ∑ i = 1 n l n f ( x i − x ) lnL(x)= \sum_{i=1}^{n}lnf(x_{i}-x) lnL(x)=i=1nlnf(xix)
    再对x进行求导,有
    d l n L ( x ) d x = − ∑ i = 1 n f ′ ( x i − x ) f ( x i − x ) = 0 \frac{dlnL(x)}{dx}=-\sum_{i=1}^{n}\frac{f^{'}(x_{i}-x)}{f(x_{i}-x)}=0 dxdlnL(x)=i=1nf(xix)f(xix)=0

    g ( x ) = f ′ ( x ) f ( x ) g(x)=\frac{f^{'}(x)}{f(x)} g(x)=f(x)f(x)

    ∑ i = 1 n g ( x i − x ) = 0 \sum_{i=1}^{n}g(x_{i}-x)=0 i=1ng(xix)=0
    这里,高斯做了一个大胆的假设,认为真实值x的估计为 x ‾ , 其 中 x ‾ = x 1 + x 2 + ⋅ ⋅ ⋅ x n n \overline{x},其中\overline{x}=\frac{x_{1}+x_{2}+\cdot \cdot \cdot x_{n}}{n} xx=nx1+x2+xn
    g ( x 1 − x ˉ ) + g ( x 2 − x ˉ ) + . . . + g ( x n − x ˉ ) = 0 g(x_{1}-\bar{x})+g(x_{2}-\bar{x})+...+g(x_{n}-\bar{x})=0 g(x1xˉ)+g(x2xˉ)+...+g(xnxˉ)=0
    因此对上式x1进行求偏导,得
    g ′ ( x 1 − x ˉ ) ⋅ ( 1 − ∂ x ˉ ∂ x 1 ) + g ′ ( x 2 − x ˉ ) ⋅ ( − ∂ x ˉ ∂ x 1 ) + . . . = 0 g^{'}(x_{1}-\bar{x})\cdot (1-\frac{\partial \bar{x}}{\partial x_{1}})+g^{'}(x_{2}-\bar{x})\cdot (-\frac{\partial \bar{x}}{\partial x_{1}})+...=0 g(x1xˉ)(1x1xˉ)+g(x2xˉ)(x1xˉ)+...=0
    因为
    ∂ x ˉ ∂ x 1 = 1 n \frac{\partial \bar{x}}{\partial x_{1}}=\frac{1}{n} x1xˉ=n1
    同理,分别对x2,x3…xn进行求导,写成矩阵形式为:
    ( 1 − 1 n − 1 n . . . − 1 n − 1 n 1 − 1 n . . . − 1 n ⋮ ⋮ ⋱ ⋮ − 1 n − 1 n ⋯ 1 − 1 n ) ( g ′ ( x 1 − x ˉ ) g ′ ( x 2 − x ˉ ) ⋮ g ′ ( x n − x ˉ ) ) = 0 \begin{pmatrix} 1-\frac{1}{n} & -\frac{1}{n} & ... & -\frac{1}{n} \\ -\frac{1}{n} & 1-\frac{1}{n} & ... & -\frac{1}{n}\\ \vdots & \vdots &\ddots &\vdots \\ -\frac{1}{n} & -\frac{1}{n} & \cdots & 1-\frac{1}{n} \end{pmatrix}\begin{pmatrix} g^{'}(x_{1}-\bar{x})\\ g^{'}(x_{2}-\bar{x})\\ \vdots \\ g^{'}(x_{n}-\bar{x}) \end{pmatrix}=0 1n1n1n1n11n1n1......n1n11n1g(x1xˉ)g(x2xˉ)g(xnxˉ)=0
    以上为齐次线性方程组,利用齐次线性方程组性质:
    x = c ( 1 , . . . , 1 ) τ x=c\begin{pmatrix} 1,...,1 \end{pmatrix}^{\tau } x=c(1,...,1)τ

    g ′ ( x 1 − x ˉ ) = g ′ ( x 2 − x ˉ ) = ⋯ = g ′ ( x n − x ˉ ) = c g^{'}(x_{1}-\bar{x})=g^{'}(x_{2}-\bar{x})=\cdots =g^{'}(x_{n}-\bar{x})=c g(x1xˉ)=g(x2xˉ)==g(xnxˉ)=c
    则,g(x)=cx+b
    0 = ∑ i = 1 n g ( x i − x ) = ∑ i = 1 n c ( x i − x ) + n b 0=\sum_{i=1}^{n}g(x_{i}-x)=\sum_{i=1}^{n}c(x_{i}-x)+nb 0=i=1ng(xix)=i=1nc(xix)+nb
    所以,b=0
    因为:
    f ′ ( x ) f ( x ) = c x \frac{f^{'}(x)}{f(x)}=cx f(x)f(x)=cx
    根据分离变量求解,得
    f ( x ) = k e 1 2 c x 2 f(x)=ke^{\frac{1}{2}cx^{2}} f(x)=ke21cx2
    由于
    ∫ − ∞ + ∞ f ( x ) d x = 1 \int_{-\infty }^{+\infty}f(x)dx=1 +f(x)dx=1
    若要收敛,则c<0

    c = − 1 σ 2 c=-\frac{1}{\sigma ^{2}} c=σ21
    利用
    ∫ − ∞ + ∞ e − x 2 d x = π / 2 ( 需 要 自 证 ) \int_{-\infty }^{+\infty }e^{-x^{2}}dx=\sqrt{\pi }/2(需要自证) +ex2dx=π /2

    k = 1 2 π σ k=\frac{1}{\sqrt{2\pi}\sigma } k=2π σ1
    所以
    f ( x ) = 1 2 π σ e − x 2 2 σ 2 f(x)=\frac{1}{\sqrt{2\pi}\sigma }e^{-\frac{x^{2}}{2\sigma ^{2}}} f(x)=2π σ1e2σ2x2

    以上推导两大创新之处:
    ①直接构造极大似然函数
    ②逆向思维,即对真值x的估计

    更多相关内容
  • 泊松分布和指数分布

    千次阅读 2020-10-05 15:31:26
    日常生活中,大量事件是有固定频率的。 某医院平均每小时出生3个...泊松分布就是描述某段时间内,事件具体的发生概率。 上面就是泊松分布的公式。等号的左边,P 表示概率,N表示某种函数关系,t 表示时间,n 表示数量

    一、泊松分布

    1.1 泊松分布的定义

    日常生活中,大量事件是有固定频率的。

    • 某医院平均每小时出生3个婴儿
    • 某公司平均每10分钟接到1个电话
    • 某超市平均每天销售4包xx牌奶粉
    • 某网站平均每分钟有2次访问

    它们的特点就是,我们可以预估这些事件的总数,但是没法知道具体的发生时间。已知平均每小时出生3个婴儿,请问下一个小时,会出生几个?

    有可能一下子出生6个,也有可能一个都不出生。这是我们没法知道的。

    泊松分布就是描述某段时间内,事件具体的发生概率。
    在这里插入图片描述
    上面就是泊松分布的公式。等号的左边,P 表示概率,N表示某种函数关系,t 表示时间,n 表示数量,1小时内出生3个婴儿的概率,就表示为 P(N(1) = 3) 。等号的右边,λ 表示事件的频率。

    接下来两个小时,一个婴儿都不出生的概率是0.25%,基本不可能发生。
    在这里插入图片描述
    接下来一个小时,至少出生两个婴儿的概率是80%。
    在这里插入图片描述
    泊松分布的图形大概是下面的样子。
    在这里插入图片描述
    可以看到,在频率附近,事件的发生概率最高,然后向两边对称下降,即变得越大和越小都不太可能。每小时出生3个婴儿,这是最可能的结果,出生得越多或越少,就越不可能。

    1.2 如何理解泊松分布?

    1.2.1 甜在心馒头店

    公司楼下有家馒头店:
    在这里插入图片描述
    每天早上六点到十点营业,生意挺好,就是发愁一个事情,应该准备多少个馒头才能既不浪费又能充分供应?
    在这里插入图片描述
    你“甜在心馒头店”又不是小米,搞什么饥饿营销啊?老板当然也知道这一点,就拿起纸笔来开始思考。

    1.2.2 老板的思考

    老板尝试把营业时间抽象为一根线段,把这段时间用T来表示:
    在这里插入图片描述
    把T均分为四个时间段:
    在这里插入图片描述
    此时,在每一个时间段上,要不卖出了(一个)馒头,要不没有卖出:
    在这里插入图片描述
    在每个时间段,就有点像抛硬币,要不是正面(卖出),要不是反面(没有卖出)
    T内那么卖出3个馒头的概率,就和抛了4次硬币(4个时间段),其中3次正面(卖出3个)的概率一样了。
    在这里插入图片描述
    在这里插入图片描述

    1.2.3 p的计算

    “那么”,老板用笔敲了敲桌子,“只剩下一个问题,概率p怎么求?”
    在这里插入图片描述

    1.2.4 泊松分布

    在这里插入图片描述

    1.2.5 馒头店的问题的解决

    老板依然蹙眉,不知道 μ \mu μ啊?

    没关系,刚才不是计算了样本均值:

    X ‾ = 5 \overline{X}=5 X=5

    可以用它来近似:

    X ‾ ≈ μ \overline{X}\approx\mu Xμ

    于是:

    P ( X = k ) = 5 k k ! e − 5 P(X=k)=\frac{5^k}{k!}e^{-5} P(X=k)=k!5ke5

    画出概率质量函数的曲线就是:
    在这里插入图片描述
    可以看到,如果每天准备8个馒头的话,那么足够卖的概率就是把前8个的概率加起来:
    在这里插入图片描述
    这样93%的情况够用,偶尔卖缺货也有助于品牌形象。

    老板算出一脑门的汗,“那就这么定了!”

    1.2.6 总结

    这个故事告诉我们,要努力学习啊,要不以后馒头都没得卖。

    生活中还有很多泊松分布。比如物理中的半衰期,我们只知道物质衰变一半的时间期望是多少,但是因为不确定性原理,我们没有办法知道具体哪个原子会在什么时候衰变?所以可以用泊松分布来计算。

    1.3 泊松分布使用范围

    Poisson分布主要用于描述在单位时间(空间)中稀有事件的发生数. 即需满足以下四个条件:

    1、给定区域内的特定事件产生的次数,可以是根据时间,长度,面积来定义;

    2、各段相等区域内的特定事件产生的概率是一样的;

    3、各区域内,事件发生的概率是相互独立的;

    4、当给定区域变得非常小时,两次以上事件发生的概率趋向于0。

    例如:

    1、放射性物质在单位时间内的放射次数;
    2、在单位容积充分摇匀的水中的细菌数;
    3、野外单位空间中的某种昆虫数等。

    1.4 泊松分布的期望和方差

    由泊松分布知 E [ N ( t ) − N ( t 0 ) ] = D [ N ( t ) − N ( t 0 ) ] = λ ( t − t 0 ) E[N(t) − N(t_0)] = D[N(t) − N(t_0)] = λ(t − t_0) E[N(t)N(t0)]=D[N(t)N(t0)]=λ(tt0)

    特别的,令 t 0 = 0 t_0=0 t0=0.由于假设 N ( 0 ) = 0 N(0)=0 N(0)=0,故可推知泊松过程的均值函数和方差函数分别为 E [ N ( t ) ] = λ t , D [ N ( t ) ] = λ t E[N(t)] = λt,D[N(t)] = λt E[N(t)]=λt,D[N(t)]=λt,

    泊松过程的强度 λ \lambda λ(常数)等于单位长时间间隔内出现的质点数目的期望值。即对泊松分布有: E ( X ) = D ( X ) = λ E(X) = D(X) = \lambda E(X)=D(X)=λ

    15. 泊松分布的特征

    1、泊松分布是一种描述和分析稀有事件的概率分布。要观察到这类事件,样本含量 n n n必须很大。

    2、 λ \lambda λ是泊松分布所依赖的唯一参数。 λ \lambda λ值愈小,分布愈偏倚,随着 λ \lambda λ的增大,分布趋于对称。

    3、当 λ = 20 \lambda= 20 λ=20时,分布泊松接近于正态分布;当 λ = 50 \lambda= 50 λ=50时,可以认为泊松分布呈正态分布。在实际工作中,当时就可以用正态分布来近似地处理泊松分布的问题。

    二、指数分布

    2.1 指数分布的定义

    指数分布是事件的时间间隔的概率。

    下面这些都属于指数分布。

    • 婴儿出生的时间间隔
    • 来电的时间间隔
    • 奶粉销售的时间间隔
    • 网站访问的时间间隔

    指数分布的公式可以从泊松分布推断出来。如果下一个婴儿要间隔时间 t ,就等同于 t 之内没有任何婴儿出生。
    在这里插入图片描述
    反过来,事件在时间 t 之内发生的概率,就是1减去上面的值。
    在这里插入图片描述
    接下来15分钟,会有婴儿出生的概率是52.76%。
    在这里插入图片描述
    接下来的15分钟到30分钟,会有婴儿出生的概率是24.92%。
    在这里插入图片描述
    指数分布的图形大概是下面的样子。
    在这里插入图片描述
    可以看到,随着间隔时间变长,事件的发生概率急剧下降,呈指数式衰减。想一想,如果每小时平均出生3个婴儿,上面已经算过了,下一个婴儿间隔2小时才出生的概率是0.25%,那么间隔3小时、间隔4小时的概率,是不是更接近于0?

    指指数分布的概率密度为:
    在这里插入图片描述
    式中: x x x是给定的时间; λ \lambda λ为单位时间事件发生的次数; e = 2.71828 e=2.71828 e2.71828

    指数分布概率密度曲线如下图:
    在这里插入图片描述

    2.2 指数分布的特征

    指数分布具有以下特征:

    (1)随机变量 X X X的取值范围是从0到无穷;

    (2)极大值在 x = 0 x=0 x0处,即 f ( x ) = λ f(x)=\lambda f(x)λ

    (3)函数为右偏,且随着 x x x的增大,曲线稳步递减;

    (4)随机变量的期望值和方差为 μ = 1 / λ , σ 2 = 1 / λ 2 \mu=1/\lambda,\sigma^2=1/\lambda^2 μ1/λσ21/λ2

    通过对概率密度函数的积分,就可以得到相应的概率,其表达式有两种

    P ( X ≥ x ) = e − λ x P(X\geq x)=e^{-\lambda x} P(Xx)eλx

    P ( X ≤ x ) = 1 - e − λ x P(X\leq x)=1-e^{-\lambda x} P(Xx)1eλx

    例:某电视机生产厂生产的电视机平均10年出现大的故障,且故障发生的次数服从泊松分布。

    问(1)该电视机使用15年后还没有出现大故障的比例;(2)如果厂家想提供大故障免费维修的质量担保,但不能超过全部产量的20%,试确定提供担保的年数。

    解:

    (1)设X为电视机出现大故障的时间。已知 μ = 10 \mu=10 μ10年,则 λ = 1 / μ = 0.1 \lambda=1/\mu=0.1 λ1/μ0.1,于是, P ( X ≥ x ) = e − λ x = e − 0.1 ∗ 15 ≈ 0.223 P(X≥x)=e^{-λx}=e^{-0.1*15}≈0.223 P(Xx)eλxe0.1150.223。则15年后,没有出现大故障的电视机约占22.3%。

    (2)问题要求比例不超过20%,这是求X的右侧概率面积,现在根据公式确定适当的X值。

    在这里插入图片描述

    从表中可以看到:担保2年时,出现大故障的比例是18.1%,不超过20%。担保3年时,出现大故障的比例为25.9%,已经超过20%。所以,厂家应以2年为担保期。

    三、总结

    一句话总结:泊松分布是单位时间内独立事件发生次数的概率分布,指数分布是独立事件的时间间隔的概率分布。

    请注意是”独立事件”,泊松分布和指数分布的前提是,事件之间不能有关联,否则就不能运用上面的公式。

    泊松分布是二项式分布的细分,当n→∞,p非常小的时候。
    在这里插入图片描述

    https://www.matongxue.com/madocs/858/
    http://www.woshipm.com/pmd/163461.html
    https://www.cnblogs.com/think-and-do/p/6483335.html

    展开全文
  • 原创 | 一文读懂泊松分布,指数分布和伽马分布

    千次阅读 多人点赞 2021-01-20 17:00:00
    本文约3400字,建议阅读6分钟本文以简单直白的方式让大家能够理解泊松分布,指数分布和伽马分布的实际含义和作用,并且由此推导其概率密度函数。在开始之前,我们需要预习一下二项分布。还是丢硬...

    本文约3400字,建议阅读6分钟

    本文以简单直白的方式让大家能够理解泊松分布,指数分布和伽马分布的实际含义和作用,并且由此推导其概率密度函数。

    在开始之前,我们需要预习一下二项分布。

    还是丢硬币的例子,丢某块特制的硬币,假设正面向上的概率是P,则掷出次,有K次向上的概率P是多少?

    将硬币正面朝上的次数记为随机变量,则有

    这种分布就是二项分布。容易证明,二项分布的数学期望 

    泊松分布

    我们回到泊松分布。先来看一个生活场景。

    宋朝庆历年间,刘姥姥由于生活压力,不得不根据祖传秘方发明总结并始创了一种名叫十二香的调料,并开始在市场上叫卖。刘姥姥在街上卖了半年,由于本小利薄,味道赞绝,一直供不应求,但由于制作周期长,原料准备流程复杂,而且保存时间较短,一直无法提高产量。

    这一天,刘姥姥终于决定要弄清楚她每天刚制作的调料究竟是如何被火速买光的,以便提高进货量来增加销量。

    刘姥姥首先买了绝对充足的原料,熬夜制作了足份的十二香。卖了一周,每天开张五个时辰,结果没卖光剩下的调料全部变质了只能丢掉,心疼的她难受了小半天。不过她总算是记录下了宝贵的数据:这七天内每天调料的销售情况。

    刘姥姥看着这用浪费的调料换来的宝贵数据,想了想,打算以后每天都按照日出货平均数:即10份来进原材料,制作,保存。

    刘姥姥的儿子刘大耳不同意。他认为:如果按照10份准备,那七天里有四天都不够卖的,这可能会使王县令的老婆买不到调料,将来一定会闹事。

    刘大耳说:我们应该保证有90%以上的把握准备最少的调料每日的份数,使来咱这购买十二香的客人需求全都满足。我们可以如此如此,这般这般……

    于是刘姥姥就听从了大耳儿的建议,从此之后,生意更加兴隆,至于王县令后来入伙加盟,生意不断做大,后来更是推陈出新创立了十三香举世闻名,当然这都是后话了。

    那么当时刘大耳的方案是什么呢?接下来将一一道来。

    刘姥姥每天卖五个时辰,也就是600分钟,如果每分钟最多只能卖出一份调料,且在这一分钟卖出调料的概率是P,那么这一天卖出10份调料的概率可以通过二项分布计算:

    但是王县令家里人丁兴旺,他老婆有时候会一次买几十份调料,那每分钟可能就卖出去不止一份调料。于是刘大耳将分割六个时辰的时间间隔进一步缩小,分割成,再利用极限的思想:

    再抽象一些,那么在某天能卖出份调料的概率应该是:

    那么P如何计算呢?还记得二项分布的期望吗:假设

    而我们可以使用当比较小的时候计算平均值得到的来近似

    另外,需要注意的是,在如上假设下,当越来越大时,值也会越来越小。

    我们来进一步计算一下这个概率:

    而容易看出:




    因此我们得到:


    至此,我们就得到了教科书中泊松分布的概率密度函数!

    刘大耳用近似替代这里的。于是我们可以利用python中的scipy库快速画出刘姥姥每天卖出份十二香的概率密度曲线和累计分布函数。

    import numpy as np
    from scipy import stats
    from matplotlib import pyplot as plt
    
    
    mu = 10
    x = np.arange(0,101,1) 
    plist = stats.poisson.pmf(x,mu) 
    clist = stats.poisson.cdf(x,mu)
    
    
    plt.plot(x,plist,label='poisson distribution pmf') # 
    plt.plot(x,cdflist,label='poisson distribution cdf') 
    plt.xlim((-1,15))
    plt.grid() 
    plt.legend() 
    plt.title(r'Poisson Distribution $\mu$:10') 
    plt.show()
    

    如图1。近似从图中得出:每天准备14份十二香,就有超过90%的把握不让顾客乘兴而来空手而去。

    从上面的例子可以看出,泊松分布可以近似模拟一个离散事件在连续时间内发生的次数的概率分布。真实世界中有很多场景都和泊松分布有关,比如某网站在某段时间内的点击率;客服中心在某段时间内接到电话的次数;医院在某段时间内接生的婴儿;放射性元素在某段时间内衰变的粒子个数……

    事实上我们通过上面的推导过程也能看出:当很小(或很大)时的二项分布就近似等于泊松分布,此时我们也可以用泊松分布来快速近似计算起来更麻烦的二项分布。不信的话我们把代码和图撂在这,请看图2。

    import numpy as np 
    from scipy import stats 
    from matplotlib import pyplot as plt
    
    
    mu = 10 
    x = np.arange(0,101,1) 
    plist = stats.poisson.pmf(x,mu)
    blist1 = stats.binom.pmf(x,20,0.5) 
    blist2 = stats.binom.pmf(x,40,0.25) 
    blist3 = stats.binom.pmf(x,100,0.1)
    
    
    plt.plot(x,plist,label=r'poisson $/mu:10$',color='k') 
    plt.plot(x,blist1,'-.',label=r'binomial $n:20, p:0.5$',alpha=0.5) 
    plt.plot(x,blist2,'-.',label=r'binomial $n:40, p:0.25$',alpha=0.5) 
    plt.plot(x,blist3,'-.',label=r'binomial $n:100, p:0.1$',alpha=0.5)
    plt.xlim((-1,20)) 
    plt.title(r'Poisson and Binomial Distribution') 
    plt.grid() 
    plt.legend() 
    plt.show()
    

    指数分布

    我们继续刘姥姥的故事。

    话说这刘姥姥还有个孙子刘小笨,随着刘姥姥和刘大耳的买卖日益红火,刘小笨的伙食也越来越好,饱暖思学术,开始成天开始研究算术。刘小笨天天看刘姥姥卖调料,发现卖出一份调料所需要的时间间隔符合某种分布。经过思考,他决定把这种分布称为指数分布。

    经过后人对刘小笨的著作进行解读,我们发现了他的思考过程。

    这里我们先考虑简单的量,比如卖出一份调料所需要的时间大于1个时辰(2个小时,120分钟)的概率,其实和1个时辰内一份调料也没有卖出的概率,之和为1。

    另外,假设每个时辰平均卖出的调料数为(根据刘姥姥的记录,我们知道这个数近似为2)。记随机变量为两次卖出调料之间的时间间隔。根据之前刘大耳的假设,立刻有:

    至此,刘小笨可以估算任意时刻他姥姥卖出一份调料的概率。比如,任何1个时辰内,会有调料卖出的概率是:

    个时辰

    而在接下来的30分钟到60分钟内,会有调料卖出的概率是:

    事实上,到这里我们已经得到了的累计分布函数了:

    对其求导就可以得到其概率密度函数:


    至此,我们就得到了刘姥姥连续两次卖出调料的时间间隔的概率密度函数,随机变量就符合指数分布,其中的指的是每个时辰平均卖出调料的份数(这里是2) 。

    指数分布的图像我们可以画出来,如图3。

    import numpy as np 
    from scipy import stats 
    from matplotlib import pyplot as plt
    
    
    x = np.arange(0,10,0.1) 
    elist1 = stats.expon.pdf(x,scale=1/2) 
    elist2 = stats.expon.pdf(x,scale=1/3) 
    elist3 = stats.expon.pdf(x,scale=1/5)
    plt.plot(x,elist1,label=r'$\lambda:2$') 
    plt.plot(x,elist2,label=r'$\lambda:3$') 
    plt.plot(x,elist3,label=r'$\lambda:5$') 
    plt.xlim((0,3)) 
    plt.grid() 
    plt.legend() 
    plt.title(r'Exponential Distribution PDF') 
    plt.show()
    

    可以从图中看出,当每个时辰卖出更多的调料份数时,更小的连续两次卖出调料时间间隔发生的概率更高,这很合理。

    用一句话来概括,每天卖出的调料份数服从的是泊松分布,而卖出两份调料的时间间隔服从指数分布,它们的期望分别代表了平均每天卖出的调料份数和每份调料卖出的平均时间间隔。真实世界中同样有很多场景也和指数分布有关,比如某网站被访问的时间间隔;客服中心连续接到电话中间的休息时间间隔;电子产品的寿命(出现故障的时间间隔即正常使用寿命)……

    伽马分布

    我们紧接上面的故事展开后续。

    话说刘姥姥去世之后,刘小笨和王县令合作开店。这个时候生意更好了,王县令粗略统计了一下,发现平均每个时辰能卖出100份调料。他于是问刘小笨:昨天刚做好的那300份调料都卖光的时间满足什么概率分布?刘小笨沉吟片刻,感觉这种分布和之前的泊松分布指数分布都不一样,于是他把这种分布称作:伽马分布。

    刘小笨后来的手札记录了他当时的思考过程。

    假设每份调料卖出都是相互独立的,而单位时间卖出调料份数均值为。则在这里,从开张到卖出到当日第X份调料所需要的时间随机变量就是我们应该关注的量。我们假设该随机变量分布的概率密度函数为。进一步的,我们根据概率密度函数定义有:

    而我们同样可以使用处理泊松分布时的方法,将均分为份,计算当趋近于无穷大时的。需要注意的是,时间后,我们应该卖出了第份,也就是说,在将这一时间段分为份后,前份中我们肯定已经卖出了份调料。假设每一小份时间段内我们卖出调料的概率为,那么这么问题又退化成了二项分布相关的问题。

    根据期望的定义,我们有, 将带入上式。

    至此,我们得到了伽马分布的概率密度函数。更一般,当我们允许为小数时,可以对阶乘做适当的解析延拓,也就是伽马函数了。

    别看这式子如此复杂,实际上伽马分布就是要解决计算从此时到后次随机事件都发生,需要等多长时间的问题。

    显然,当时,退化为了指数分布,即要解决的问题退化为了计算下一次发生该随机事件的时间间隔问题。

    我们来看看伽马分布密度函数的函数图像。

    import numpy as np 
    from scipy import stats 
    from matplotlib import pyplot as plt
    
    
    x = np.arange(0,10,0.1)
    
    
    glist1 = stats.gamma.pdf(x,1) 
    glist2 = stats.gamma.pdf(x,2) 
    glist3 = stats.gamma.pdf(x,3)
    plt.plot(x,glist1,label=r'$x:1$') 
    plt.plot(x,glist2,label=r'$x:2$') 
    plt.plot(x,glist3,label=r'$x:3$') 
    plt.grid() 
    plt.legend() 
    plt.title(r'Gamma Distribution PDF: $\lambda:1$') 
    plt.show()
    

    至此,我们讲解完了泊松分布,指数分布和伽马分布。

    总结一下,泊松分布解决的是离散事件发生在连续的时间内的次数概率分布的问题;指数分布解决的是独立离散事件发生一次所需连续时间长度分布的问题;伽马分布解决的是多次离散事件发生所需连续时间长度分布的问题其中,指数分布是伽马分布的特例。

    作者:贾恩东

    编辑:于腾凯

    校对:林亦霖

    数据派研究部介绍

    数据派研究部成立于2017年初,以兴趣为核心划分多个组别,各组既遵循研究部整体的知识分享实践项目规划,又各具特色:

    算法模型组:积极组队参加kaggle等比赛,原创手把手教系列文章;

    调研分析组:通过专访等方式调研大数据的应用,探索数据产品之美;

    系统平台组:追踪大数据&人工智能系统平台技术前沿,对话专家;

    自然语言处理组:重于实践,积极参加比赛及策划各类文本分析项目;

    制造业大数据组:秉工业强国之梦,产学研政结合,挖掘数据价值;

    数据可视化组:将信息与艺术融合,探索数据之美,学用可视化讲故事;

    网络爬虫组:爬取网络信息,配合其他各组开发创意项目。

    点击文末“阅读原文”,报名数据派研究部志愿者,总有一组适合你~

    转载须知

    如需转载,请在开篇显著位置注明作者和出处(转自:数据派THUID:DatapiTHU),并在文章结尾放置数据派醒目二维码。有原创标识文章,请发送【文章名称-待授权公众号名称及ID】至联系邮箱,申请白名单授权并按要求编辑。

    未经许可的转载以及改编者,我们将依法追究其法律责任。

    点击“阅读原文”加入组织~

    展开全文
  • 如何通俗理解泊松分布

    万次阅读 多人点赞 2019-04-12 14:48:40
    鉴于二项分布与泊松分布的关系,可以很自然的得到一个推论,当二项分布的   很小的时候,两者比较接近: 7 总结 这个故事告诉我们,要努力学习啊,要不以后馒头都没得卖。 生活中还有很多泊松分布。...

    1 甜在心馒头店

    公司楼下有家馒头店:

    每天早上六点到十点营业,生意挺好,就是发愁一个事情,应该准备多少个馒头才能既不浪费又能充分供应?

    老板统计了一周每日卖出的馒头(为了方便计算和讲解,缩小了数据):

    \begin{array}{c|c} \qquad\qquad&\qquad销售\qquad\\\hline\color{SkyBlue}{周一}& 3 \\ \hline \color{blue}{周二}& 7 \\ \hline \color{orange}{周三}&4\\\hline \color{Goldenrod}{周四}&6\\ \hline \color{green}{周五}&5\\\end{array}\\

    均值为:

    \overline{X}=\frac{3+7+4+6+5}{5}=5\\

    按道理讲均值是不错的选择(参见如何理解最小二乘法?),但是如果每天准备5个馒头的话,从统计表来看,至少有两天不够卖,40\% 的时间不够卖:

    \begin{array}{c|c}\qquad\qquad&\qquad销售\qquad&\quad备货五个\\\hline\color{SkyBlue}{周一}& 3 \\\hline \color{blue}{周二}& 7&\color{red}{不够} \\ \hline \color{orange}{周三}&4\\ \hline \color{Goldenrod}{周四}&6&\color{red}{不够}\\\hline \color{green}{周五}&5\\\end{array}\\

    你“甜在心馒头店”又不是小米,搞什么饥饿营销啊?老板当然也知道这一点,就拿起纸笔来开始思考。

    2 老板的思考

    老板尝试把营业时间抽象为一根线段,把这段时间用 T 来表示:

    然后把周一的三个馒头(“甜在心馒头”,有褶子的馒头)按照销售时间放在线段上:

    把 T 均分为四个时间段:

    此时,在每一个时间段上,要不卖出了(一个)馒头,要不没有卖出:

    在每个时间段,就有点像抛硬币,要不是正面(卖出),要不是反面(没有卖出):

    T 内卖出3个馒头的概率,就和抛了4次硬币(4个时间段),其中3次正面(卖出3个)的概率一样了。

    这样的概率通过二项分布来计算就是:

    \binom{4}{3}p^3(1-p)^1\\

    但是,如果把周二的七个馒头放在线段上,分成四段就不够了:

    从图中看,每个时间段,有卖出3个的,有卖出2个的,有卖出1个的,就不再是单纯的“卖出、没卖出”了。不能套用二项分布了。

    解决这个问题也很简单,把 T 分为20个时间段,那么每个时间段就又变为了抛硬币:

    这样,T 内卖出7个馒头的概率就是(相当于抛了20次硬币,出现7次正面):

    \binom{20}{7}p^7(1-p)^{13}\\

    为了保证在一个时间段内只会发生“卖出、没卖出”,干脆把时间切成 n 份:

    \binom{n}{7}p^7(1-p)^{n-7}\\

    越细越好,用极限来表示:

    \lim_{n\to\infty}\binom{n}{7}p^7(1-p)^{n-7}\\

    更抽象一点,T 时刻内卖出 k 个馒头的概率为:

    \lim_{n\to\infty}\binom{n}{k}p^k(1-p)^{n-k}\\

    3 p 的计算

    “那么”,老板用笔敲了敲桌子,“只剩下一个问题,概率 p 怎么求?”

    在上面的假设下,问题已经被转为了二项分布。二项分布的期望为:

    E(X)=np=\mu\\

    那么:

    p=\frac{\mu}{n}\\

    4 泊松分布

    有了 p=\frac{\mu}{n}了之后,就有:

    \lim_{n\to\infty}\binom{n}{k}p^k(1-p)^{n-k}=\lim_{n\to\infty}\binom{n}{k}\left(\frac{\mu}{n}\right)^k(1-\frac{\mu}{n})^{n-k}\\

    我们来算一下这个极限:

    \begin{align}\lim_{n\to\infty}\binom{n}{k}\left(\frac{\mu}{n}\right)^k(1-\frac{\mu}{n})^{n-k}&= \lim_{n\to\infty}\frac{n(n-1)(n-2)\cdots(n-k+1)}{k!}\frac{\mu^k}{n^k}\left(1-\frac{\mu}{n}\right)^{n-k}\\ &=\lim_{n\to\infty}\frac{\mu^k}{k!}\frac{n}{n}\cdot\frac{n-1}{n}\cdots\frac{n-k+1}{n}\left(1-\frac{\mu}{n}\right)^{-k}\left(1-\frac{\mu}{n}\right)^n\end{align}\\

    其中:

    \lim_{n\to\infty}\frac{n}{n}\cdot\frac{n-1}{n}\cdots\frac{n-k+1}{n}\left(1-\frac{\mu}{n}\right)^{-k}=1\\

     

    \lim_{n \to \infty}\left(1-\frac{\mu}{n}\right)^n = e^{-\mu}\\

    所以:

    \lim_{n\to\infty}\binom{n}{k}\left(\frac{\mu}{n}\right)^k(1-\frac{\mu}{n})^{n-k}=\frac{\mu^k}{k!}e^{-\mu}\\

    上面就是泊松分布的概率密度函数,也就是说,在 T 时间内卖出 k 个馒头的概率为:

    P(X=k)=\frac{\mu^k}{k!}e^{-\mu}\\

    一般来说,我们会换一个符号,让 \mu=\lambda ,所以:

    P(X=k)=\frac{\lambda^k}{k!}e^{-\lambda}\\

    这就是教科书中的泊松分布的概率密度函数。

    5 馒头店的问题的解决

    老板依然蹙眉,不知道 \mu 啊?

    没关系,刚才不是计算了样本均值:

    \overline{X}=5\\

    可以用它来近似:

    \overline{X}\approx\mu\\

    于是:

    P(X=k)=\frac{5^k}{k!}e^{-5}\\

    画出概率密度函数的曲线就是:

    可以看到,如果每天准备8个馒头的话,那么足够卖的概率就是把前8个的概率加起来:

    这样 93\% 的情况够用,偶尔卖缺货也有助于品牌形象。

    老板算出一脑门的汗,“那就这么定了!”

    6 二项分布与泊松分布

    鉴于二项分布与泊松分布的关系,可以很自然的得到一个推论,当二项分布的 p 很小的时候,两者比较接近:

    7 总结

    这个故事告诉我们,要努力学习啊,要不以后馒头都没得卖。

    生活中还有很多泊松分布。比如物理中的半衰期,我们只知道物质衰变一半的时间期望是多少,但是因为不确定性原理,我们没有办法知道具体哪个原子会在什么时候衰变?所以可以用泊松分布来计算。

    还有比如交通规划等等问题。

    顺着这个故事我们还可以讲解:如何理解指数分布?

    文章最新版本在(有可能会有后续更新):如何理解泊松分布?

    展开全文
  • 高斯分布和卡方分布

    千次阅读 2019-08-25 12:49:38
    高斯分布和卡方分布高斯分布和卡方分布高斯分布1 单元高斯分布1.1 一维随机变量1.2 标准正太分布1.3 numpy中使用正太分布2 多元高斯分布2.1 独立多元/维高斯分布2.2 举例-画2维独立不相关高斯图2.3 相关系数2.3 举例...
  • 泊松分布

    万次阅读 2020-09-08 10:04:20
    泊松分布定义:如果随机事件A发生的概率是P,进行n次独立试验,恰巧发生了k次,则相应的概率可以用这样一个公式来计算: 在实际事例中,当一个事件以固定的平均速率出现时随机且独立地出现时,那么这个时间在单位...
  • 列举MATLAB中一些常见的概率分布
  • 实数上最常用的分布就是正态分布,也称为高斯分布: N(x∣μ,σ2)=12πσ2e−(x−μ)22σ2N(x|\mu,\sigma^2)=\sqrt{\frac{1}{2\pi\sigma^2}}e^{-\frac{(x-\mu)^2}{2\sigma^2}}N(x∣μ,σ2)=2πσ21​​e−2σ2(x−μ...
  • 离散型变量 如:二项分布、泊松分布 三者之间的关系 二项分布(Binomial distribution) 二项分布(Binomial distribution)是n重伯努利试验成功次数的离散概率分布,记作。伯努利试验是只有两种可能结果的单次随机...
  • 有很多统计推断是基于正态分布的假设,以标准正态分布变量为基石而构造的三个著名统计量在实际中有广泛的应用,这是因为这三个统计量不仅有明确背景,而且其抽样分布的密度函数有显式表达式,它们被称为统计中的“三...
  • 大千世界随机现象众多,其分布各异。按数据变量类型划分可以分为离散型与连续性两类:离散型变量根据名称很好理解,就是数据的取值是不连续的。例如掷硬币就是一个典型的离散数据,因为抛硬币的就2种结果。你可以把...
  • 浅谈两点分布,二项分布,伽马分布,指数分布,泊松分布,卡方分布,t分布,F分布,均匀分布,正态分布,β分布,狄利克雷分布。(红丸子,白丸子,四喜丸子。。。) 我们知道,在数理统计中,经常是和各种分布打...
  • 几何分布(一种离散分布

    千次阅读 2022-02-16 10:48:50
    几何分布 几何分布是伯努利分布的推广,不断重复伯努利试验,直到首次成功为止,随机变量XXX表示首次成功时已经完成的试验次数,我们称 XXX 是一个服从几何分布的随机变量 截图来源:Geometric distribution ...
  • ​常见的8个概率分布公式和可视化

    千次阅读 2022-04-21 10:48:33
    “概率分布是一个数学函数,它给出了实验中不同可能结果的发生概率。” 了解数据的分布有助于更好地模拟我们周围的世界。它可以帮助我们确定各种结果的可能性,或估计事件的可变性。所有这些都使得了解不同的概率...
  • 伽马分布分布分布函数)

    千次阅读 2021-04-20 11:34:45
    相信很多人对于伽马分布分布分布函数)并不是非常的了解,因此小编在这里为您详解的讲解一下相关信息!卡方(n)~gamma(n/2,1/2) 指数分布exp(k)~gamma(1,k)伽玛分布是统计学中的一种连续概率函数,包含两个参数α...
  • 概率分布汇总

    千次阅读 2019-08-29 15:22:26
    概率分布、总体分布、抽样分布,一开始很容易搞混,还以为是同一个理论,不同的概念,毕竟都是分布,又都是统计学里面的概率。今天就来理解理解这个东西吧。 概率分布是指随机变量的各取值与该取值对应的概率之间...
  • 一文搞懂均匀分布、高斯分布、瑞利分布、莱斯分布(含MATLAB代码)
  • 在统计学上,我们会遇到一些常见的分布,除了正态分布外,,如t检验对应的t分布,检验对应的分布,方差分析对应的F分布等。这些分布是统计学的基础,在假设检验、方差分析等领域都起着至关重要的作用。在此,我们对...
  • u分布(u分布和t分布)

    千次阅读 2021-01-16 09:24:40
    分别是这样缩写的 B二项分布 binomial distribution P泊松分布 poisson's distribution U均匀分布 uniform distribution E指数分布 exponential distribution N正态分布 .u分布是标准正态分布,是以0为平均值,以1为...
  • 伯努利分布(Bernoulli Distribution) 又名两点分布或者0-1分布,是一个离散型概率分布,为纪念瑞士科学家雅各布·伯努利而命名。若伯努利试验成功,则伯努利随机变量取值为1。若伯努利试验失败,则伯努利随机变量...
  • 13. 均匀分布和指数分布

    千次阅读 2019-12-05 13:59:45
    文章目录均匀分布和指数分布均匀分布的定义性质:均匀分布具有等可能性均匀分布的概率计算指数分布的定义性质:指数分布具有无记忆性 均匀分布和指数分布 均匀分布的定义 若 XXX 的概率密度函数为 f(x)={1b−a,x∈(a...
  • 指数分布,卡方分布和伽马分布

    千次阅读 2021-06-17 16:37:42
    指数分布和卡方分布都是伽马分布的一种特殊情况。 伽马分布 伽马分布一般用符号:X∼Γ(α,β)X\sim \Gamma(\alpha,\beta)X∼Γ(α,β),概率密度函数如下所示。 f(x)={1βαΓ(α)xα−1e−xβ,x>00,x≤0\begin{...
  • 共轭分布(conjugacy):后验概率分布函数与先验概率分布函数具有相同形式 先验概率和后验概率的关系为: p o s t e r i o r = l i k e l i h o o d ∗ p r i o r posterior = likelihood * prior posterior=...
  • 正态分布(也称为高斯分布)是统计中最常用的连续分布。正态分布在统计中至关重要,主要有以下三个原因:商业中常见的许多连续变量的分布与正态分布非常相似。正态分布可用于近似各种离散的概率分布。由于正态分布与...
  • 文章目录伯努利分布二项分布多项分布贝塔分布狄利克雷分布高斯分布 伯努利分布 伯努利分布(Bernoulli distribution)又名两点分布或0-1分布,介绍伯努利分布前首先需要引入伯努利试验(Bernoulli trial)。 伯努利...
  • 正态分布 高斯分布(数学)

    千次阅读 2020-04-26 20:57:49
    正态分布(Normal distribution),也称高斯分布(Gaussian distribution) 目录 [隐藏] 1什么是正态分布 2正态分布的发展 3正态分布的主要特征 4正态分布的应用 5数据正态分布检验 Q-Q...
  • T分布:温良宽厚 本文由“医学统计分析精粹”小编“Hiu”原创完成,文章采用知识共享Attribution-NonCommercial-NoDerivatives 4.0国际许可协议(http://creativecommons.org/licenses/by-nc-nd/4...
  • 各种分布怎么来的 当统计学家们开始研究概率分布时,他们看到,有几种形状反复出现,于是就研究他们的规律,根据这些规律来解决特定条件下的问题。 泊松分布 传送门 假设一个馒头店,老板想知道应该准备多少个馒头...

空空如也

空空如也

1 2 3 4 5 ... 20
收藏数 1,315,554
精华内容 526,221
关键字:

分布

友情链接: variadas 2019 dj luan.zip