精华内容
下载资源
问答
  • 正太分布

    2016-10-24 10:14:51
    正太分布

    概念

    参考
    在游戏制作的过程中,可能需要使用到这个来做随机掉落。将掉落的几率呈正太分布。

    软件安装

    更换pip的镜像。否则很有可能无法更新到软件。

    windows 下就是在 “%HOME%/pip/pip.ini” 目录中,比如当前是administrator,那位置就是 “c:\users\administrator\pip\pip.ini”。
    [global]
    timeout = 30
    trusted-host = pypi.douban.com
    index-url = http://pypi.douban.com/simple

    安装matplotlib(负责绘图)和numpy(负责数据公式)

    $ pip install matplotlib
    Collecting matplotlib
    c:\python27\lib\site-packages\pip\_vendor\requests\packages\urllib3\util\ssl_.py:318: SNIMissingWarning: An HTTPS request has been made, but the SNI (Subject Name Indication) extension to TLS is not available on this platform. This may cause the server to present an incorrect TLS certificate, which can cause validation failures. You can upgrade to a newer version of Python to solve this. For more information, see https://urllib3.readthedocs.org/en/latest/security.html#snimissingwarning.
      SNIMissingWarning
    c:\python27\lib\site-packages\pip\_vendor\requests\packages\urllib3\util\ssl_.py:122: InsecurePlatformWarning: A true SSLContext object is not available. This prevents urllib3 from configuring SSL appropriately and may cause certain SSL connections to fail. You can upgrade to a newer version of Python to solve this. For more information, see https://urllib3.readthedocs.org/en/latest/security.html#insecureplatformwarning.
      InsecurePlatformWarning
      Downloading matplotlib-1.5.3-cp27-cp27m-win32.whl (6.0MB)
        100% |████████████████████████████████| 6.0MB 5.6kB/s
    Collecting cycler (from matplotlib)
      Downloading cycler-0.10.0-py2.py3-none-any.whl
    Collecting pytz (from matplotlib)
      Downloading pytz-2016.7-py2.py3-none-any.whl (480kB)
        100% |████████████████████████████████| 481kB 12kB/s
    Collecting pyparsing!=2.0.4,!=2.1.2,>=1.5.6 (from matplotlib)
      Downloading pyparsing-2.1.10-py2.py3-none-any.whl (56kB)
        100% |████████████████████████████████| 61kB 13kB/s
      Downloading numpy-1.11.2-cp27-none-win32.whl (6.5MB)
        100% |████████████████████████████████| 6.5MB 18kB/s
    Collecting python-dateutil (from matplotlib)
      Downloading python_dateutil-2.5.3-py2.py3-none-any.whl (201kB)
        100% |████████████████████████████████| 204kB 30kB/s
    Collecting six (from cycler->matplotlib)
      Downloading six-1.10.0-py2.py3-none-any.whl
    Installing collected packages: six, cycler, pytz, pyparsing, numpy, python-dateutil, matplotlib
    Successfully installed cycler-0.10.0 matplotlib-1.5.3 numpy-1.11.2 pyparsing-2.1.10 python-dateutil-2.5.3 pytz-2016.7 six-1.10.0
    

    python实例

    #!/usr/bin/env python
    # -*- coding: utf-8 -*-
    import numpy as np
    import matplotlib.mlab as mlab
    import matplotlib.pyplot as plt
    import pdb
    
    mu, sigma = 100, 15
    x = mu + sigma*np.random.randn(10000)
    
    # the histogram of the data
    # normed表示直方图规范化总面积为1,alpha表示透明度
    
    n, bins, patches = plt.hist(x, 50, normed=1, facecolor='green', alpha=0.75)
    
    # add a 'best fit' line
    # normpdf表示在bins的每个点上用mu,sigma参数画出对应的正态点
    
    y = mlab.normpdf( bins, mu, sigma)
    z = mlab.normpdf( bins, mu, 10)
    
    l = plt.plot(bins, y, 'r--', linewidth=1)
    v = plt.plot(bins, z, 'bo', linewidth=3)
    
    plt.xlabel('Smarts')
    plt.ylabel('Probability')
    plt.title(r'$\mathrm{Histogram\ of\ IQ:}\ \mu=100,\ \sigma=15$')
    plt.axis([40, 160, 0, 0.03])
    plt.grid(True)
    
    plt.show()
    

    最终结果

    C++ 11实例

    #include <iostream>
    #include <iomanip>
    #include <string>
    #include <map>
    #include <random>
    #include <cmath>
    int main()
    {
        std::random_device rd;
        std::mt19937 gen(rd());
    
        // values near the mean are the most likely
        // standard deviation affects the dispersion of generated values from the mean
        std::normal_distribution<> d(5,2);
    
        std::map<int, int> hist;
        for(int n=0; n<10000; ++n) {
            ++hist[std::round(d(gen))];
        }
        for(auto p : hist) {
            std::cout << std::fixed << std::setprecision(1) << std::setw(2)
                      << p.first << ' ' << std::string(p.second/200, '*') << '\n';
        }
    }
    展开全文
  • 正态分布  判断一样本所代表的背景总体与理论正态分布是否没有显著差异... #画样本概率密度图s-rnorm(100)#产生样本d-density(s)plot(d,col=green,ylim=c(0,0.5))#添加正太分布概率密度图s2-seq(from=-4,to=4,le...

      正态分布

      判断一样本所代表的背景总体与理论正态分布是否没有显著差异的检验。

      

    方法一概率密度曲线比较法

     

      看样本与正太分布概率密度曲线的拟合程度,R代码如下:

      #画样本概率密度图s-rnorm(100)#产生样本d-density(s)plot(d,col=green,ylim=c(0,0.5))#添加正太分布概率密度图s2-seq(from=-4,to=4,length.out=100)lines(s2,norm_expression(s2),col=red)

      画图结果如下:

      

    https://img3.mukewang.com/5b4750900001224a05170503.jpg

     

      

    方法二 正太Q-Q图法

     

      使用Q-Q图来判断数据是否服从正太分布,R代码如下:

      s-rnorm(100)#产生样本qqnorm(s)qqline(s)

      画图结果如下,可见数据分布集中在对角线上,可以认为总体服从正太分布:

      

    https://img.mukewang.com/5b4750990001478f05140502.jpg

     

      

    方法三 经验法则

     

      约68.3%数值分布在距离平均值有1个标准差之内的范围,约95.4%数值分布在距离平均值有2个标准差之内的范围,以及约99.7%数值分布在距离平均值有3个标准差之内的范围。称为“68-95-99.7法则”或“经验法则”。

      使用R的验证代码如下:s-rnorm(10000)#产生样本sum(abs(s-mean(s))sd(s))/length(s)sum(abs(s-mean(s))2*sd(s))/length(s)程序结果:s-rnorm(10000)#产生样本sum(abs(s-mean(s))sd(s))/length(s)[1]0.6871sum(abs(s-mean(s))2*sd(s))/length(s)[1]0.9538

      

    方法四 统计检验方法

     

      使用样本偏度和样本峰度来估计总体偏度和峰度,在正太分布的假定下,样本偏度和峰度均服从均值为零、方差分别为6/T和24/T的正太分布,可以分别检验偏度和峰度,也可以将两个统计量结合起来生成一个服从自由度为2的卡方分布的统计量,再进行检验【参见《金融时间序列分析》第三版P8~P9】。理论方面的东西略...

      可以使用夏皮罗-威尔克(Shapiro-Wilk)检验,代码如下:

      s-rnorm(1000)#产生样本shapiro.test(s)

      检验结果:

      shapiro.test(s)Shapiro-Wilknormalitytestdata:sW=0.9987,p-value=0.6716

      shapiro.test函数输出一个p值,照惯例,p0.05说明总体不太可能是正太分布,否则不能提供这么个证据,也就是说这个检验比较保守,倾向于错误的过分证明正态性。

      

    展开全文
  • 理解正太分布

    2019-05-20 16:13:19
    正太分布概述 正态分布是统计学中最重要和最广泛使用的分布。它有时被称为“钟形曲线”,虽然这种钟的音质不会令人满意。在数学家卡尔·弗里德里希·高斯之后,它也被称为“高斯曲线”。正如你将在关于正态分布历史...

    正太分布概述

    正态分布是统计学中最重要和最广泛使用的分布。它有时被称为“钟形曲线”,虽然这种钟的音质不会令人满意。在数学家卡尔·弗里德里希·高斯之后,它也被称为“高斯曲线”。正如你将在关于正态分布历史的部分中看到的那样,尽管高斯在其历史中发挥了重要作用,但亚伯拉罕德莫维尔首先发现了正态分布

    正太分布普遍规律

    知乎上的回答点击前往

    正太分布是普遍规律,神奇的是生活中很多是正太分布的例子。
    比如人的升高,手臂长度,到考试成绩都符合正太分布
    如下例子:
    大部分人的智商是正常的,正态分布有点像2/8原则。
    少数像爱因斯坦老爷子这样的智商太超常了


    image.png

    box-cox变换

    在很多开源的nodebook看到很多人在特征工程时候会对某些特征X做box-cox变换鸡Y =log(1+x)
    通过box-cox变换将特征分布正太化,使其更加符合数据分布的假设。


    image.png
    展开全文
  • Excel自动求正太分布

    2018-03-30 15:30:12
    可以自动求正太分布,在公司写的,简单方便哈哈哈哈,字数不够啊
  • 正太分布详细介绍

    2015-05-28 11:24:03
    详细说明了正太分布即高斯函数的概念,来源以及应用,并举例实际的统计学特征做为示例分析
  • 二项正太分布

    2014-07-08 22:56:55
    本资源主要讲述的是数据分布的函数,里面主要讲解的是二项分布和正太分布的详细算法,有详细的代码讲解,可以直接引用
  • t分布与正太分布相比多了自由度参数,在小样本中,能够更好的剔除异常值对于小样本的影响,从而能够准确的抓住数据的集中趋势和离散趋势。卡方检验在很多课本中被认为是非参数检验的一员,但从分布假设来说,他属于...

    先上结论:

    t分布并不是仅仅用于小样本(虽然小样本中用的风生水起)中,大样本依旧可以使用。t分布与正太分布相比多了自由度参数,在小样本中,能够更好的剔除异常值对于小样本的影响,从而能够准确的抓住数据的集中趋势和离散趋势。

    卡方检验在很多课本中被认为是非参数检验的一员,但从分布假设来说,他属于参数检验。卡方分布(x2)是K个服从 正太分布的随机变量的平方和所服从分布。其参数只有自由度一个,当自由度很大时,X2近似服从正太分布。

    F分布是两个服从卡方分布的随机变量各自除以他们的自由度的商。

    正太分布是以上所有分布的基础。

    具体性质:

    以下内容仅为参考:

    t分布-命名与源起

    “t”,是伟大的Fisher为之取的名字。Fisher最早将这一分布命名为“Student's distribution”,并以“t”为之标记。Student,则是William Sealy Gosset(戈塞特)的笔名。他当年在爱尔兰都柏林的一家酒厂工作,设计了一种后来被称为t检验的方法来评价酒的质量。因为行业机密,酒厂不允许他的工作内容外泄,所以当他后来将其发表到至今仍十分著名的一本杂志《Biometrika》时,就署了student的笔名。所以现在很多人知道student,知道t,却不知道Gosset。(相对而言,我们常说的正态分布,在国外更多的被称为高斯分布)

    t分布的性质:厚尾性

    具体长处:研究样本量的估计量更小。标准差是样本量计算的一个重要参数,t分布能够很好的消除异常值带来的标准差波动,最终减少样本量。

    点估计更准确。如果小样本使用正态分布来拟合,很容易就受到离群异常值的影响而得到错误的估计。

    回归中应用t分布,可以得到更稳健的估计量(β值或OR值),这也是我们实现“稳健回归”的一个重要手段。

    卡方分布

    若n个相互独立的随机变量ξ₁、ξ₂、……、ξn ,均服从标准正态分布(也称独立同分布于标准正态分布),则这n个服从标准正态分布的随机变量的平方和

    Q=∑i=1nξ2i

    构成一新的随机变量,其卡方分布规律称为x^2,分布(chi-square distribution),其中参数n称为自由度,正如正态分布中均值或方差不同就是另一个x2正态分布一样,自由度不同就是另一个分布。记为 Q~x^2(k). 卡方分布是由正态分布构造而成的一个新的分布,当自由度n很大时,X^2分布近似为正态分布。 对于任意正整数k, 自由度为 k的卡方分布是一个随机变量X的机率分布。

    F分布

    研究A、B、C三种不同学校学生的阅读理解成绩找到一种解决的办法,有人可能会以为,只要多次使用Z检验或t检验,比较成对比较学校(或条件)即可。但是我们不会这样来处理。因为Z检验或t检验有其局限性:

    (1)比较的组合次数增多,上例需要3次,如果研究10个学校,需要45个

    (2)降低可靠程度,如果我们做两次检验,每次都为0.05的显著性水平,那么不犯Ⅰ型错误的概率就变为0.95×0.95=0.90。此时犯Ⅰ型错误的概率则为1-0.90=0.10,即至少犯一次Ⅰ型错误的概率翻了一倍。若做10次检验的话,至少犯一次Ⅰ型错误的概率将上升到0.40(1-0.952),而10次检验结论中都正确的概率只有60%。所以说采用Z检验或t检验随着均数个数的增加,其组合次数增多,从而降低了统计推论可靠性的概率,增大了犯错误的概率

    完全随机设计是采用完全随机化的分组方法,将全部实验对象分配到g个处理组(水平组),各组分别接受不同的处理,试验结束后比较各组均数之间的差别有无统计学意义。

    参考文献:

    展开全文
  • python正太分布概率计算

    千次阅读 2019-08-04 01:32:04
    python正太分布概率计算 #numpy库的标准正太分布概率分布(针对连续性概率事件) #rand 针对离散型概率事件 a=np.random.randn(500000) #标准正太分布 pos_min = (a>=-1) #下限 pos_max = (a<=1) #上限 pos_...
  • 一元高斯分布(正太分布) 标准高斯分布(标准正太分布) 二维高斯分布 多维高斯分布 高斯分布的四则运算 加减法运算 乘除运算 ...
  • 标准正态分布的双侧临界值介绍,旨在了解正太分布的双侧临界值
  • 关于正太分布,最小二乘等等的介绍,最小二乘可以说是现阶段AI的基础之一。
  • 正太分布笔记

    2015-05-21 16:44:52
    总结于Rickjin@weibo.com 正太分布的前世今生  Reference 1. 陈希孺, 数理统计学简史(非常推荐这本) 2. 吴江霞, 正态分布进入统计学的历史演化 3. E.T. Jaynes, Probability Theory, The Logic of Science
  • 正态分布最通俗的解释---今天你正太分布了吗?生活中的正态分布现象正太分布名字的由来为什么机器学习中要经常用到正态分布 正态分布这一现象有多重要?可以说我们的生活中随处都可遇见,只是没有被人留意。但是当你...
  • 概率论之正太分布

    2018-09-27 15:54:56
    正太分布公式: 公式相关解释:   若随机变量X的均值为μ、标准差为σ,σ的平方是方差,其概率分布为以上公式。 分布曲线: 面积分布: 图像解释:   参考来源: ...
  • 今天小编就为大家分享一篇Python实现非正太分布的异常值检测方式,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
  • t 分布t分布(t-distribution),用于根据小样本来估计呈正态分布且方差未知的总体的平均值如果总体方差已知,则应该使用正态分布自由度越大,t分布越接近标准正太分布随自由度的增大,t分布逐渐逼近标准正太分布t...
  • 正太分布表格用excel做的正太分布表格用excel做的正太分布表格用excel做的
  • C# 与6西格玛,有关的代码 ,包括PLOT图,正太分布,C# 与6西格玛有关的代码 ,包括PLOT图,正太分布
  • 水一篇正太分布

    2019-11-26 14:57:17
    什么符合正太分布 多个随机变量造成结果的统计 概率密度 某个数值的概率 曲线覆盖的面基总为1, 发生某件事情的概率为 从负无穷到该事件值的积分 ...
  • 正太分布检验-python金融应用 严格的检验过程。函数normality_tests包括三种不同的统计检验 Skewness Test(skewtest):这个方式检验样本数据的偏度是否是正态的(也就是偏度是否为0)。 Kurtosis Test(kurtosistest)...
  • 正太分布概率的C++实现

    热门讨论 2010-03-30 15:42:14
    利用C++实现正太分布概率函数NORMDIST(x)

空空如也

空空如也

1 2 3 4 5 ... 20
收藏数 926
精华内容 370
关键字:

正太分布