精华内容
下载资源
问答
  • 偏度和峰度都是统计量偏度Skewness(三阶) ——峰度Kurtosis (四阶) ——import matplotlib.pyplot as plt import math import numpy as npdef calc(data): n = len(data) niu = 0.0 niu2 = 0.0 niu3 = 0.0 for ...

    偏度和峰度都是统计量
    偏度Skewness(三阶) ——三阶中心距除以标准差的三次方

    峰度Kurtosis (四阶) —— 概率密度在均值处峰值高低的特征,常定义四阶中心矩除以方差的平方,减去三;

    import matplotlib.pyplot as plt
    import math
    import numpy as np
    
    def calc(data):
        n = len(data)
        niu = 0.0
        niu2 = 0.0
        niu3 = 0.0
        for a in data:
            niu += a
            niu2 += a**2
            niu3 += a**3
        niu/= n   #这是求E(X)
        niu2 /= n #这是E(X^2)
        niu3 /= n #这是E(X^3)
        sigma = math.sqrt(niu2 - niu*niu) #这是D(X)的开方,标准差
        return [niu,sigma,niu3] #返回[E(X),标准差,E(X^3)]
    
    def calc_stat(data):
        [niu,sigma,niu3] = calc(data)
        n = len(data)
        niu4 = 0.0
        for a in data:
            a -= niu
            niu4 += a ** 4
        niu4 /= n   
        skew = (niu3 - 3*niu*sigma**2 - niu**3)/(sigma**3)
        kurt =  niu4/(sigma**2)
        return [niu,sigma,skew,kurt] #返回了均值,标准差,偏度,峰度
    
    if __name__== "__main__":
        data = list(np.random.randn(10000))#关于此处的数组与列表
        data2 = list(2*np.random.randn(10000))
        data3 = [x for x in data if x> -0.5]
        data4 = list(np.random.uniform(0,4,10000))
        [niu,sigma,skew,kurt] = calc_stat(data)
        [niu2,sigma2,skew2,kurt2] = calc_stat(data2)
        [niu3,sigma3,skew3,kurt3] = calc_stat(data3)
        [niu4,sigma4,skew4,kurt4] = calc_stat(data4)
        print niu,sigma,skew,kurt
        print niu2,sigma2,skew2,kurt2
        print niu3,sigma3,skew3,kurt3
        print niu4,sigma4,skew4,kurt4
    
        info = r'$\mu=%.2f,\ \sigma=%.2f,\ skew=%.2f,\ kurt=%.2f$'%(niu,sigma,skew,kurt)
        info2 =r'$\mu=%.2f,\ \sigma=%.2f,\ skew=%.2f,\ kurt=%.2f$'%(niu2,sigma2,skew2,kurt2)
        plt.text(1,0.38,info,bbox=dict(facecolor='red',alpha=0.25))
        plt.text(1,0.35,info2,bbox=dict(facecolor='green',alpha=0.25))
        #plt.text(x的位置,y的位置,面板内写的信息,标签框的属性=dict(facecolor='面板颜色',alpha='深浅度'))
        plt.hist(data,50,normed=True,facecolor='r',alpha=0.9)
        #hist直方图/箱式图(
        #将data中的元素分到50个等间隔的范围内,返回每个范围内元素的个数作为一个行向量,
        #50代表要分的元素的个数
        #
        #facecolor,alpha都是代表颜色的)
        plt.hist(data2,80,normed=True,facecolor='g',alpha = 0.8)
        plt.grid(True)
        plt.show()
    
    展开全文
  • 正在做一个把matlab程序转python的工作,记录下遇到的问题与解决方案           定义 峰度kurtosis:用于度量x偏离某分布的程度。 正太分布的峰度是3; 当时间序列的曲线峰值比正太分布...

             

              正在做一个把matlab程序转python的工作,记录下遇到的问题与解决方案

             

    定义

    • 峰度kurtosis:用于度量x偏离某分布的程度。
      • 正太分布的峰度是3;
      • 当时间序列的曲线峰值比正太分布的高时,峰度大于3;
      • 当比正太分布的低时,峰度小于3。

             

    • 偏度skewness:用于衡量x的对称性。
      • 对于正太分布,偏度为0;
      • 若偏度为正,则x均值左侧的离散度比右侧弱;
      • 若偏度为负,则x均值左侧的离散度比右侧强。

    matlab

    radius = [1,2,3,4,5];
    bubble_kurtois = kurtosis(radius);                    %12 陡峭度
    bubble_sknew = skewness(radius);                      %13 偏斜度
    

    python

    from scipy import stats
    
    radius = [1,2,3,4,5]
    bubble_kurtois = stats.kurtosis(radius, fisher=False)   #12 陡峭度
    bubble_sknew = stats.skew(radius)                       #13 偏斜度
    

              两个函数的详细参数见 scipy.stats.kurtosisscipy.stats.skew

              注意求峰度的时候指定 fisher=False ,否则会出现这篇文章的问题 python求解峰度kurtosis 和matlab求得的值差很远 解决办法

    展开全文
  • 一、Python环境配置因为自己的电脑已经有Python的环境了,所以无法一步一步详细的介绍Python的安装步骤,简单介绍下需要安装的东西:⒈ Python安装既然叫做用Python进行数据分析,那么安装Python是必不可少的,要...

    一、Python环境配置

    因为自己的电脑已经有Python的环境了,所以无法一步一步详细的介绍Python的安装步骤,简单介绍下需要安装的东西:

    ⒈ Python安装

    既然叫做用Python进行数据分析,那么安装Python是必不可少的,要记住,Python是你向计算机发号施令的语言(像英语一样,是你和计算机交流的一种语言,其他编程语言都是这个意思)。

    根据自己电脑的操作系统,选择对应的版本安装即可。

    ⒉ 集成开发环境(IDE,Integrated Development Environment)

    注意IDE是建立在安装了编程语言之上的一个工具。

    IDE是一种个编程软件,是集成了程序员语言开发中会需要的一些基本工具、基本环境和其他辅助功能的应用软件。IDE一般包含三个主要组件:源代码编辑器(Editor)、编译器、解释器(Compiler、Interpreter)和调试器(Debugger)。

    目前IDE很多,选择适合自己的就好。

    【软件开发人员版】

    总之就是感觉功能很丰富。

    【数据分析人员版】

    为了方便,可以使用Jupyter Notebook,一种类似于记事本的IDE。安装方法:https://jupyter.org/install 。

    Jupyter有个好处是,你可以把它安装在服务器上,走到哪里都可以通过浏览器打开。

    二、Python语言的基础

    像学英语一样,每个语言有自己的词汇、语法,Python也不例外。这块基础知识可以参照廖雪峰老师的教程,从一个程序员的角度来看,还是很不错的。Python教程

    三、Pandas学习

    ⒈ Pandas 安装

    Pandas官网,具体的安装方法可以参考下,实际需要参照你的IDE环境来选择安装方式。

    ⒉ Pandas 学习

    Pandas常用的数据结构有两种:Series和DataFrame。这些数据结构都是构建早Numpy数组之上的。

    真的感觉很详细。

    3.实践

    # coding = utf-8

    import numpy as np

    import stats as sts

    #随机生成10个0-100的整数

    data = np.random.randint(100, size=10)

    print("原始数据:",data)

    #排序

    print("排序后数据:",np.sort(data, axis=0))

    #众数

    counts = np.bincount(data)

    modenum = np.argmax(counts)

    print("众数:",modenum)

    #中位数

    print("中位数:",np.median(data))

    #算术平均数

    print("算术平均数:",np.mean(data))

    #25%分位数和75%分位数

    print("25%分位数和75%分位数:",np.percentile(data, 25), np.percentile(data,75))

    #极差

    print("极差:",np.ptp(data))

    #加权平均数

    weights = np.random.randint(10, size=10)

    print("权重:",weights)

    print("加权平均数:",np.average(data, weights=weights))

    #几何平均数

    production = 1

    for i in data:

    production *= i

    print("几何平均数:",production**(1/10))

    #方差

    print("方差:",np.var(data))

    #标准差

    print("标准差:",np.std(data))

    #平均差

    avgd = 0

    for i in data:

    avgd += abs(i - np.mean(data))

    print("平均差:",avgd/10)

    #四分位差

    print("四分位差:",np.percentile(data, 75) - np.percentile(data, 25))

    #异众比率

    count = 0

    for i in data:

    if i != modenum:

    count += 1

    print("异众比率:",count/10)

    #离散系数

    print("离散系数:",np.std(data)/np.mean(data))

    #偏态系数

    print("偏态系数:",sts.skewness(data))

    #峰态系数

    print("峰态系数:",sts.kurtosis(data))

    展开全文
  • 偏度(skewness)和峰度(kurtosis)

    万次阅读 多人点赞 2019-03-19 20:32:55
    偏度(skewness),是统计数据分布偏斜方向和程度的度量,是统计数据分布非对称程度的数字特征。定义上偏度是样本的三阶标准化矩。 偏度定义中包括正态分布(偏度=0),右偏分布(也叫正偏分布,其偏度>0),...

    偏度

    偏度(skewness),是统计数据分布偏斜方向和程度的度量,是统计数据分布非对称程度的数字特征。定义上偏度是样本的三阶标准化矩。

    偏度定义中包括正态分布(偏度=0),右偏分布(也叫正偏分布,其偏度>0),左偏分布(也叫负偏分布,其偏度<0)。

    Python代码实现方法:

    pandas的Series 数据结构可以直接调用skew()方法来查看

    df.iloc[:,1].skew()

    峰度

    峰度(peakedness;kurtosis)又称峰态系数。表征概率密度分布曲线在平均值处峰值高低的特征数。直观看来,峰度反映了峰部的尖度。随机变量的峰度计算方法为:随机变量的四阶中心矩与方差平方的比值。

    峰度包括正态分布(峰度值=3),厚尾(峰度值>3),瘦尾(峰度值<3)。注意,个别的软件会将峰度值减3,ArcGIS默认正态分布的峰度为3。MS Excel的计算公式与上面略有不同。

     

    Python代码实现方法:

    pandas的Series 数据结构可以直接调用kurt()方法来查看

    df.iloc[:,1].kurt()

     

    转载地址:https://blog.csdn.net/xbmatrix/article/details/69360167

    展开全文
  • python语言读取二进制图片文件,并提取非零数据统计信息(例如:max,min,skewness and kurtosis)python新手,注释较少,欢迎指教import structimport mathimport numpyimport scipy.statsfilename = input('...
  • python语言读取二进制图片文件,并提取非零数据统计信息(例如:max,min,skewness and kurtosis)python新手,注释较少,欢迎指教import structimport mathimport numpyimport scipy.statsfilename = input('...
  • python度量学习Hi folks, welcome back to my new edition of the blog, thank you so much for your love and support, I hope you all are doing well. In today’s learning, we will try to understand about ...
  • skewness z 分数 重点 (Top highlight)Most of the time I write longer articles on data science topics but recently I’ve been thinking about writing small, bite-sized pieces around specific concepts, ...
  • 连接器与io数据库类别PythonRMySQLmysql-connector-python(官方)RMySQLOraclecx_OracleROracleMongoDBpymongoRMongo, rmongodbODBCpyodbcRODBCIO类类别PythonRexcelxlsxWriter, pandas.(from/to)_excel, ...
  • 连接器与io数据库类别PythonRMySQLmysql-connector-python(官方)RMySQLOraclecx_OracleROracleMongoDBpymongoRMongo, rmongodbODBCpyodbcRODBCIO类类别PythonRexcelxlsxWriter, pandas.(from/to)_excel, ...
  • Python-测量方差 (Python - Measuring Variance) Advertisements 广告 Previous Page 上一页 Next Page 下一页 In statistics, variance is a measure of how far a value in a data set lies from ...
  • 常用的网格划分软件中关于网格偏度(Skewness)只有统计结果,通常只能看到平均值、最大值及粗略的分布情况,而无法看到每一个网格单元对应的Skewness。因此,这里我希望借助OpenFOAM建立一个生成每个网格单元对应...
  • 这篇博文目的就是整理基本的假设检验方法、适用条件和调用Python(主要是scipy模块)的哪些方法。正态性检验这个是很多统计建模的第一步,例如,普通线性回归就对残差有正态性要求。K-S检验特点是比较严格,基于的...
  • 下面的Python代码从一系列幅度值计算了这些特征: def moments(x):mean = x.mean()std = x.var()**0.5skewness = ((x - mean)**3).mean() / std**3kurtosis = ((x - mean)**4).mean() / std**4return [mean, std, ...
  • python中数据可视化数据可视化(Data Visualization) Data Visualization is the graphical representation of Data. It involves producing efficient visual elements like charts, dashboards, graphs, mappings ...
  • 数据库 类别 Python R MySQL mysql-connector-python(官方) RMySQL Oracle cx_Oracle ROracle Redis redis rredis MongoDB pymongo RMongo, rmong
  • python语言读取二进制图片文件,并提取非零数据统计信息(例如:max,min,skewness and kurtosis) python新手,注释较少,欢迎指教 import struct import math import numpy import scipy.stats filename = ...
  • 在这篇教程中,你将会从零开始,学习如何用 Python 实现《Classification And Regression Tree algorithm》中所说的内容。 在学完该教程之后,你将会知道: 如何计算并评价数据集中地候选分割点(Candidate Split ...
  • python 来做统计分析时一般使用 scipy 中的 stats。 numpy 也能生成一定概率分布的随机数,但如果需要更具体的概率密度,累积概率等,就用用到 scipy.stats 了,感觉它类似 java 中的 ssj 包。下面简单总结一些它的...
  • nba球员python(Notes: All opinions are my own) (注:所有观点均为我自己) 介绍 (Introduction) This article explores correlations between NBA player salary data and actual on-court performance, using ...
  • a=None, reta=False) 一般我们只用 x 参数就行,x 即待检验的数据 scipy.stats.normaltest normaltest 也是专门做正态性检验的模块,原理是基于数据的skewness和kurtosis scipy.stats.normaltest(a, axis=0, nan_...
  • 相关矩阵 import seaborn as sns corrmat = two_data[['avs', 'avgAbs', 'rms', 'rms2', 'wave', 'pulse', 'PeekFlag', 'Margin', 'Skewness', 'Kurtosis', 'median', 'pca_value', 'label']].corr() # .corr()求...
  • 正太分布检验-python金融应用 严格的检验过程。函数normality_tests包括三种不同的统计检验 Skewness Test(skewtest):这个方式检验样本数据的偏度是否是正态的(也就是偏度是否为0)。 Kurtosis Test(kurtosistest)...
  • 对商业智能BI、大数据分析挖掘、机器学习,python,R等数据领域感兴趣的同学加微信:tstoutiao,邀请你进入数据爱好者交流群,数据爱好者们都在这儿。 用先进的回归技术做房价数据预测竞赛。按照以下步骤取得...

空空如也

空空如也

1 2 3 4 5 ... 20
收藏数 1,390
精华内容 556
关键字:

pythonskewness

python 订阅