一、正态分布 标准正态分布 标准正态分布就是均值为0，标准差为1的分布，如下图
一、正态分布
标准正态分布 标准正态分布就是均值为0，标准差为1的分布，如下图 一般正态分布 一般正态分布n，假设其均值是 μ，标准差为σ ，即服从 n~N(μ,σ) 经过变换可以转换成标准正态分布：另X = (N - μ)/ σ，则X就是服从标准的正态分布了X~N(0,1)
二、置信区间
上图中的面积就是标准正态分布的概率，而置信区间就是变量的区间估计，例如图中的-1到1就是一个置信区间：标准正态分布的变量X ，有68.27%的概率 X属于[-1,1]这个区间。 最常用的是95%的分布区间，就是[-1.96,1.96]这个区间。方便公式化，我们另区间为[-z,z]，那么 -z<=X<=z。 进而可以推导一般正态分布的置信区间: -z<=X<=z -z<=(N - μ)/ σ<=z μ-zσ<=N<=μ+zσ 因此，一般正态分布n~N(μ,σ)的置信区间是 [μ-zσ, μ+zσ]，其中z根据置信水平而定。置信水平与区间对应关系如下： 性质分析 置信区间与置信水平、样本量等因素均有关系，其中样本量对置信区间的影响为：在置信水平固定的情况下，样本量越多，置信区间越窄。其次，在样本量相同的情况下，置信水平越高，置信区间越宽。 因此：如果样本多，就说明比较可信，不需要很大的修正，所以置信区间会比较窄，下限值会比较大；但是如果样本少，就说明不一定可信，必须进行较大的修正，置信区间会比较宽，下限值会比较小。 由此得出结论：上述正态区间只适用于样本较多的情况，对于小样本，它的准确性很差。
三、威尔逊区间(Wilson score interval)
由于正态区间对于小样本并不可靠，因而，1927年，美国数学家 Edwin Bidwell Wilson提出了一个修正公式，被称为“威尔逊区间”，很好地解决了小样本的准确性问题。 在上面的公式中，^p表示样本的”赞成票比例”，n表示样本的大小，z表示对应某个置信水平的z统计量，这是一个常数，可以通过查前文表得到。一般情况下，在95%的置信水平下，z统计量的值为1.96。威尔逊置信区间的均值为 下限为： 可以看到：当n的值足够大时，这个下限值会趋向^p。如果n非常小（投票人很少），这个下限值会大大小于p，实际上，起到了降低”赞成票比例”的作用，使得该项目的得分变小、排名下降。根据离散型随机变量的均值和方差定义： μ=E(X)=0*(1-p)+1*p=p σ=D(X)=(0-E(X))2(1-p)+(1-E(X))2p=p2(1-p)+(1-p)2p=p2-p3+p3-2p2+p=p-p2=p(1-p) 因此上面的威尔逊区间公式可以写成： 就是对正态区间的均值和标准差进行了修正。 但是有个问题：这个修正公式是仅仅适用于伯努利分布（好差评），还是也适用于其他分布（如5星评价）？这个问题本人也没搞清，望高人指点。
计算程序如下：
def wilson_score(pos, total, p_z=2.):
"""
威尔逊得分计算函数
参考：https://en.wikipedia.org/wiki/Binomial_proportion_confidence_interval
:param pos: 正例数
:param total: 总数
:param p_z: 正太分布的分位数
:return: 威尔逊得分
"""
pos_rat = pos * 1. / total * 1.  # 正例比率
score = (pos_rat + (np.square(p_z) / (2. * total))
- ((p_z / (2. * total)) * np.sqrt(4. * total * (1. - pos_rat) * pos_rat + np.square(p_z)))) / \
(1. + np.square(p_z) / total)
return score

tips：对于5星评价问题，可以参考 http://www.evanmiller.org/ranking-items-with-star-ratings.html
目录
1.置信区间的计算
1.1 总体方差已知
1.2 总体方差未知
2.计算 P-Value
2.1 总体方差已知
2.2 总体方差未知

1.置信区间的计算
根据总体分布（T分布或者Z分布）和规定的置信度计算总体均值在指定置信度下的置信区间，然后将实验值和置信区间比较，若在置信区间之外（小概率事件发生）则表示实验统计量和总体统计量存在显著差异
1.1 总体方差已知
总体方差已知时，根据总体均值和方差，使用Z分布计算置信区间，公式如下：

其中：
表示样本均值   表示总体标准差，n表示样本数   表示根据二分之一置信度查表得到的z值， 为显著性水平=1-置信度，若置信度为90%，则  =1-0.9=0.1
1.2 总体方差未知
总体方差未知时，使用样本方差代替总体方差，根据样本方差和总体均值使用T分布计算置信区间，公式如下：

其中：
表示样本均值   表示样本标准差，n表示样本数   表示根据二分之一置信度查表得到的t值， 为显著性水平=1-置信度  n-1是自由度，因为样本均值已知，因此已知n-1个样本，第n个样本就能通过计算得到
注：当样本数量大于30时，T分布和Z分布得到的值十分接近（概率分布图像也十分相似），可以用Z分布代替T分布，换句话说，这时样本方差和总体方差的差距就非常小了
2.计算 P-Value
p值表示当前值或比当前值更极端值出现的概率和，通过和小概率事件（总体统计量分布）的临界值  比较，从而判定样本中的统计量在总体统计量分布中是否属于小概率事件
2.1 总体方差已知
总体方差已知时，根据总体均值和方差，使用Z分布计算P-value，首先要得到z值，z值得计算公式如下：

其中：
为样本均值 为总体均值， 为样本标准差，n为样本数量
得到z值后，查表得到P值，然后设置显著性水平\alpha（\alpha=1-置信度），比如  =0.05，若p值<1- ，则拒绝原假设，样本统计量和总体统计量存在显著性差异，反之则无法拒绝原假设，样本统计量和总体统计量无显著性差异；
2.2 总体方差未知
总体方差未知时，根据总体均值和方差，使用T分布计算P-value，首先要得到t值，t值得计算公式如下：

其中：
为样本均值， 为总体均值，S为样本标准差，n为样本数量
得到t值后，根据自由度（样本数-1）查表得到P值，然后设置显著性水平 （ =1-置信度），比如  =0.05，若p值<1- ，则拒绝原假设，样本统计量和总体统计量存在显著性差异，反之则无法拒绝原假设，样本统计量和总体统计量无显著性差异；
这里显著性水平  本质上就是在总体统计量分布中人为规定一个小概率事件发生的概率；P值就是样本统计量在总体统计量下发生的概率，如果P值< 表明样本统计量在总体统计量的分布中属于小概率事件，因此总体统计量和样本统计量存在显著性差异
参考文章：
假设检验--Z检验、t检验_ws19920726的博客-CSDN博客_z检验公式
置信区间的计算方法_alyssa520的博客-CSDN博客_置信区间计算公式

