精华内容
下载资源
问答
  • 这里需要说明的是:Python峰度计算是以0为中间值,R中峰度计算是以3位中间值(R峰度计算过程中没有减3的操作)。 以Python为例: #python import numpy as np from scipy.stats import kurtosis ss = np....

    转自:https://www.jianshu.com/p/d9a205ec284b

    时间序列

    简而言之,时间序列就是带时间戳的数值序列。股票,期货等金融数据就是典型的时间序列。量化的过程,很多时间都是在分析时间序列,找到稳定赚钱因子。

    平稳性定义

    所谓时间序列的平稳性,是指时间序列的均值,方差以及协方差都是常数,与时间t无关。这样的序列才可以作为我们基于历史预测未来的基础。
    满足以上条件属于严平稳,一般达到弱平稳都是可以接受的。

    平稳性是当前时间序列分析的前提条件,因为我们的建模过程基本都是以大数定理和中心极限定理为理论基础(比如ARMA,ARIMA模型等),而大数定理和中心极限定理也是有前提条件的,那就是要求样本同分布(等价于时间序列的平稳性)。如果这个条件不满足,那么我们的很多分析结果是不可靠的。

    1. 白噪声属于平稳序列,因为它的均值为0,方差为常数,协方差为0。但白噪声属于纯随机序列,基于它预测是没有意义的。
    2. 随机游走属于非平稳序列,因为它的均值为常数,但是方差为非常数,与时间t有关。

    平稳性检验

    对于一个时间序列,我们如何处理呢?
    1 检验序列是否平稳性序列
    2 如果序列非平稳,通过数学变换为平稳性序列
    3 检验序列是否白噪声
    4 下一步

    平稳性检验常用方法有ADF检验和KPSS检验。

    平稳性检验-ADF Test

    ADF Test:Augmented Dickey-Fuller Test
    首先假设时间序列是不稳定的,根据假设求得的置信度P值如果小于阈值(一般为1%),那么我们认为假设不成立,时间序列是稳定的;反之,假设成立。
    Python和R都有相应平稳性检验的模块。
    Python需安装statsmodels模块。
    R需安装tseries模块。
    这里以Python为例:

    #python
    import numpy as np
    from statsmodels.tsa.stattools import adfuller
    ss = np.random.randn(10000)
    adfuller(ss)
    
    #(-100.04436307924058,
    #  0.0, ##(P Value)
    #  0, 
    #  9999,
    #  {'1%': -3.4310041633725734,
    #    '10%': -2.566923883481157,
    #    '5%': -2.861829101294412},
    #  28143.20974307366)
    

    检验结果的第二项为P值,这里为0.0%,远低于阈值1%,因为我们检验的是一个标准正太分布,因此假设肯定是不成立的,我们的序列为稳定性时间序列。

    平稳性检验-KPSS Test

    KPSS Test:Kwiatkowski-Phillips-Schmidt-Shin Test
    首先假设序列是平稳的,根据假设求得的P值如果小于阈值(一般为5%),那么假设不成立;反之,假设成立。仍以Python为例:

    #python
    import numpy as np
    from statsmodels.tsa.stattools import kpss
    ss = np.random.randn(10000)
    kpss(ss)
    
    # (0.09407968315491025,
    #   0.1, ##(P Value)
    #   38,
    # {'1%': 0.739, '10%': 0.347, '2.5%': 0.574, '5%': 0.463})
    

    检验结果的第二项为P值,这里为10%,远高于阈值5%,因此假设是成立的,我们的序列为稳定性时间序列。

    白噪声检验-Ljung-Box Test

    首先假设序列为白噪声,根据假设求得的P值如果小于阈值(一般为5%),那么假设不成立;反之,假设成立。仍以Python为例:

    #python
    import numpy as np
    from statsmodels.stats.diagnostic import acorr_ljungbox as ljbox
    ss = np.random.randn(10000)
    ljbox(ss, lags=1)
    
    #  (array([0.00307541]), 
    #  array([0.95577487]))  ##P-Value
    

    检验结果的第二项为P值,这里为95.57%,远高于阈值5%,因此假设是成立的,我们的序列为白噪声序列(实际是随机序列)。

    峰度 - Kurtosis

    峰度表征统计分布在平均值处峰值高低的度量,反应了峰部的尖度。
    峰度按数值包括三类:

    1. 正态分布(Kurtosis = 0)
    2. 厚尾分布(Kurtosis > 0)
    3. 瘦尾分布(Kurtosis < 0)
      金融时间序列一般都是厚尾分布。
      Python峰度计算采用scipy模块,R峰度计算采用moments模块。
      这里需要说明的是:Python峰度计算是以0为中间值,R中峰度计算是以3位中间值(R峰度计算过程中没有减3的操作)。
      以Python为例:
    #python
    import numpy as np
    from scipy.stats import kurtosis
    ss = np.random.randn(10000)
    kurtosis(ss)
    
    # -0.045421184138716875
    

    偏度 - Skewness

    偏度表征统计分布偏斜方向和程度的度量,是统计分布非对称程度的数字特征。
    偏度按数值包括三类:

    1. 正态分布(skew = 0)
    2. 左偏分布(skew < 0),峰在左边。
    3. 右偏分布(skew > 0),峰在右边。
      以Python为例:
    #python
    import numpy as np
    from scipy.stats import skew
    ss = np.random.randn(10000)
    skew(ss)
    
    # -0.0071660377825474705 
    

    非平稳变换

    非平稳的序列如何变换成平稳系列呢?
    一般有如下几种方法:

    1. 对数变换
    2. 平滑变换(移动平均,指数平均等)
    3. 差分变换(一阶差分,二阶差分,高阶差分等)
    4. 分解变换(多成分分解 = 长期趋势 + 中期趋势 + 随机)

    这里就不展开了。



    原作者:北冥Master
    链接:https://www.jianshu.com/p/d9a205ec284b
    来源:简书
    简书著作权归作者所有,任何形式的转载都请联系作者获得授权并注明出处。

    展开全文
  • create table test( value int ) insert into test select 3 union all select 4 union all select 5 union all select 6 求出峰度 偏度 和中位数 谢谢大神!
  • R语言中的which.max和峰度偏度解析

    千次阅读 2018-08-30 21:50:45
    可参考:http://baijiahao.baidu.com/s?id=1569732797373513&amp;wfr=spider&amp;for=pc  
    展开全文
  • 以Python为例: #python import numpy as np from scipy.stats import kurtosis ss = np.random.randn(10000) kurtosis(ss) # -0.045421184138716875 偏度 - Skewness 偏度表征统计分布偏斜方向和程度的度量,是...

    时间序列

    简而言之,时间序列就是带时间戳的数值序列。股票,期货等金融数据就是典型的时间序列。量化的过程,很多时间都是在分析时间序列,找到稳定赚钱因子。

    平稳性定义

    所谓时间序列的平稳性,是指时间序列的均值,方差以及协方差都是常数,与时间t无关。这样的序列才可以作为我们基于历史预测未来的基础。

    满足以上条件属于严平稳,一般达到弱平稳都是可以接受的。

    平稳性是当前时间序列分析的前提条件,因为我们的建模过程基本都是以大数定理和中心极限定理为理论基础(比如ARMA,ARIMA模型等),而大数定理和中心极限定理也是有前提条件的,那就是要求样本同分布(等价于时间序列的平稳性)。如果这个条件不满足,那么我们的很多分析结果是不可靠的。

    白噪声属于平稳序列,因为它的均值为0,方差为常数,协方差为0。但白噪声属于纯随机序列,基于它预测是没有意义的。

    随机游走属于非平稳序列,因为它的均值为常数,但是方差为非常数,与时间t有关。

    平稳性检验

    对于一个时间序列,我们如何处理呢?

    1 检验序列是否平稳性序列

    2 如果序列非平稳,通过数学变换为平稳性序列

    3 检验序列是否白噪声

    4 下一步

    平稳性检验常用方法有ADF检验和KPSS检验。

    平稳性检验-ADF Test

    ADF Test:Augmented Dickey-Fuller Test

    首先假设时间序列是不稳定的,根据假设求得的置信度P值如果小于阈值(一般为1%),那么我们认为假设不成立,时间序列是稳定的;反之,假设成立。

    Python和R都有相应平稳性检验的模块。

    Python需安装statsmodels模块。

    R需安装tseries模块。

    这里以Python为例:

    #python

    import numpy as np

    from statsmodels.tsa.stattools import adfuller

    ss = np.random.randn(10000)

    adfuller(ss)

    #(-100.04436307924058,

    # 0.0, ##(P Value)

    # 0,

    # 9999,

    # {'1%': -3.4310041633725734,

    # '10%': -2.566923883481157,

    # '5%': -2.861829101294412},

    # 28143.20974307366)

    检验结果的第二项为P值,这里为0.0%,远低于阈值1%,因为我们检验的是一个标准正太分布,因此假设肯定是不成立的,我们的序列为稳定性时间序列。

    平稳性检验-KPSS Test

    KPSS Test:Kwiatkowski-Phillips-Schmidt-Shin Test

    首先假设序列是平稳的,根据假设求得的P值如果小于阈值(一般为5%),那么假设不成立;反之,假设成立。仍以Python为例:

    #python

    import numpy as np

    from statsmodels.tsa.stattools import kpss

    ss = np.random.randn(10000)

    kpss(ss)

    # (0.09407968315491025,

    # 0.1, ##(P Value)

    # 38,

    # {'1%': 0.739, '10%': 0.347, '2.5%': 0.574, '5%': 0.463})

    检验结果的第二项为P值,这里为10%,远高于阈值5%,因此假设是成立的,我们的序列为稳定性时间序列。

    白噪声检验-Ljung-Box Test

    首先假设序列为白噪声,根据假设求得的P值如果小于阈值(一般为5%),那么假设不成立;反之,假设成立。仍以Python为例:

    #python

    import numpy as np

    from statsmodels.stats.diagnostic import acorr_ljungbox as ljbox

    ss = np.random.randn(10000)

    ljbox(ss, lags=1)

    # (array([0.00307541]),

    # array([0.95577487])) ##P-Value

    检验结果的第二项为P值,这里为95.57%,远高于阈值5%,因此假设是成立的,我们的序列为白噪声序列(实际是随机序列)。

    峰度 - Kurtosis

    峰度表征统计分布在平均值处峰值高低的度量,反应了峰部的尖度。

    峰度按数值包括三类:

    正态分布(Kurtosis = 0)

    厚尾分布(Kurtosis > 0)

    瘦尾分布(Kurtosis < 0)

    金融时间序列一般都是厚尾分布。

    Python峰度计算采用scipy模块,R峰度计算采用moments模块。

    这里需要说明的是:Python峰度计算是以0为中间值,R中峰度计算是以3位中间值(R峰度计算过程中没有减3的操作)。

    以Python为例:

    #python

    import numpy as np

    from scipy.stats import kurtosis

    ss = np.random.randn(10000)

    kurtosis(ss)

    # -0.045421184138716875

    偏度 - Skewness

    偏度表征统计分布偏斜方向和程度的度量,是统计分布非对称程度的数字特征。

    偏度按数值包括三类:

    正态分布(skew = 0)

    左偏分布(skew < 0),峰在左边。

    右偏分布(skew > 0),峰在右边。

    以Python为例:

    #python

    import numpy as np

    from scipy.stats import skew

    ss = np.random.randn(10000)

    skew(ss)

    # -0.0071660377825474705

    非平稳变换

    非平稳的序列如何变换成平稳系列呢?

    一般有如下几种方法:

    对数变换

    平滑变换(移动平均,指数平均等)

    差分变换(一阶差分,二阶差分,高阶差分等)

    分解变换(多成分分解 = 长期趋势 + 中期趋势 + 随机)

    这里就不展开了。

    展开全文
  • 以Python为例: #python import numpy as np from scipy.stats import kurtosis ss = np.random.randn(10000) kurtosis(ss) # -0.045421184138716875 偏度 - Skewness 偏度表征统计分布偏斜方向和程度的度量,是...

    时间序列

    简而言之,时间序列就是带时间戳的数值序列。股票,期货等金融数据就是典型的时间序列。量化的过程,很多时间都是在分析时间序列,找到稳定赚钱因子。

    平稳性定义

    所谓时间序列的平稳性,是指时间序列的均值,方差以及协方差都是常数,与时间t无关。这样的序列才可以作为我们基于历史预测未来的基础。

    满足以上条件属于严平稳,一般达到弱平稳都是可以接受的。

    平稳性是当前时间序列分析的前提条件,因为我们的建模过程基本都是以大数定理和中心极限定理为理论基础(比如ARMA,ARIMA模型等),而大数定理和中心极限定理也是有前提条件的,那就是要求样本同分布(等价于时间序列的平稳性)。如果这个条件不满足,那么我们的很多分析结果是不可靠的。

    白噪声属于平稳序列,因为它的均值为0,方差为常数,协方差为0。但白噪声属于纯随机序列,基于它预测是没有意义的。

    随机游走属于非平稳序列,因为它的均值为常数,但是方差为非常数,与时间t有关。

    平稳性检验

    对于一个时间序列,我们如何处理呢?

    1 检验序列是否平稳性序列

    2 如果序列非平稳,通过数学变换为平稳性序列

    3 检验序列是否白噪声

    4 下一步

    平稳性检验常用方法有ADF检验和KPSS检验。

    平稳性检验-ADF Test

    ADF Test:Augmented Dickey-Fuller Test

    首先假设时间序列是不稳定的,根据假设求得的置信度P值如果小于阈值(一般为1%),那么我们认为假设不成立,时间序列是稳定的;反之,假设成立。

    Python和R都有相应平稳性检验的模块。

    Python需安装statsmodels模块。

    R需安装tseries模块。

    这里以Python为例:

    #python

    import numpy as np

    from statsmodels.tsa.stattools import adfuller

    ss = np.random.randn(10000)

    adfuller(ss)

    #(-100.04436307924058,

    # 0.0, ##(P Value)

    # 0,

    # 9999,

    # {"1%": -3.4310041633725734,

    # "10%": -2.566923883481157,

    # "5%": -2.861829101294412},

    # 28143.20974307366)

    检验结果的第二项为P值,这里为0.0%,远低于阈值1%,因为我们检验的是一个标准正太分布,因此假设肯定是不成立的,我们的序列为稳定性时间序列。

    平稳性检验-KPSS Test

    KPSS Test:Kwiatkowski-Phillips-Schmidt-Shin Test

    首先假设序列是平稳的,根据假设求得的P值如果小于阈值(一般为5%),那么假设不成立;反之,假设成立。仍以Python为例:

    #python

    import numpy as np

    from statsmodels.tsa.stattools import kpss

    ss = np.random.randn(10000)

    kpss(ss)

    # (0.09407968315491025,

    # 0.1, ##(P Value)

    # 38,

    # {"1%": 0.739, "10%": 0.347, "2.5%": 0.574, "5%": 0.463})

    检验结果的第二项为P值,这里为10%,远高于阈值5%,因此假设是成立的,我们的序列为稳定性时间序列。

    白噪声检验-Ljung-Box Test

    首先假设序列为白噪声,根据假设求得的P值如果小于阈值(一般为5%),那么假设不成立;反之,假设成立。仍以Python为例:

    #python

    import numpy as np

    from statsmodels.stats.diagnostic import acorr_ljungbox as ljbox

    ss = np.random.randn(10000)

    ljbox(ss, lags=1)

    # (array([0.00307541]),

    # array([0.95577487])) ##P-Value

    检验结果的第二项为P值,这里为95.57%,远高于阈值5%,因此假设是成立的,我们的序列为白噪声序列(实际是随机序列)。

    峰度 - Kurtosis

    峰度表征统计分布在平均值处峰值高低的度量,反应了峰部的尖度。

    峰度按数值包括三类:

    正态分布(Kurtosis = 0)

    厚尾分布(Kurtosis > 0)

    瘦尾分布(Kurtosis < 0)

    金融时间序列一般都是厚尾分布。

    Python峰度计算采用scipy模块,R峰度计算采用moments模块。

    这里需要说明的是:Python峰度计算是以0为中间值,R中峰度计算是以3位中间值(R峰度计算过程中没有减3的操作)。

    以Python为例:

    #python

    import numpy as np

    from scipy.stats import kurtosis

    ss = np.random.randn(10000)

    kurtosis(ss)

    # -0.045421184138716875

    偏度 - Skewness

    偏度表征统计分布偏斜方向和程度的度量,是统计分布非对称程度的数字特征。

    偏度按数值包括三类:

    正态分布(skew = 0)

    左偏分布(skew < 0),峰在左边。

    右偏分布(skew > 0),峰在右边。

    以Python为例:

    #python

    import numpy as np

    from scipy.stats import skew

    ss = np.random.randn(10000)

    skew(ss)

    # -0.0071660377825474705

    非平稳变换

    非平稳的序列如何变换成平稳系列呢?

    一般有如下几种方法:

    对数变换

    平滑变换(移动平均,指数平均等)

    差分变换(一阶差分,二阶差分,高阶差分等)

    分解变换(多成分分解 = 长期趋势 + 中期趋势 + 随机)

    这里就不展开了。

    展开全文
  • data_show<-function(x) { n<-length(x) m<-mean(x) v<-var(x) s<-sd(x) me<-median(x) cv<-100*s/m css<-sum((x-m)^2) uss<-sum(x^2) ...
  • 峰度偏度

    千次阅读 2019-03-21 16:56:25
    文章目录缘由峰度偏度引用自 缘由 在打kaggle比赛时,浏览和借鉴了别人的代码,发现别人的代码里计算了数据的偏度和峰度,所以刻意去找了一下相关的概念。 峰度 峰度是描述总体中所有取值分布形态陡缓程度的...
  • 特征工程 - 数据分析 - 峰度 and 偏度偏度峰度 偏度 偏度(Skewness)用来描述数据分布的对称性。 当偏度 <0 时,称为负偏,数据出现左侧长尾; 当偏度>0时,称为正偏,数据出现右侧长尾。 正态分布是对称...
  • C# 峰度偏度计算

    2020-12-18 11:21:24
    C# 计算峰度偏度公共方法
  • MATLAB计算数据峰度偏度
  • 偏度峰度

    2021-03-03 20:21:52
    偏度峰度 偏度(skewness) 数据分布的的不对称性称为偏态。偏态是指数据分布的偏斜方向和程度。偏度,通常分为右偏(正偏)和左偏(负偏)两种。它们是以对称分布为标准相比较而言的。 在对称分布的情况下,平均...
  • 信号的峰度偏度

    千次阅读 2019-11-04 11:32:16
    信号的峰度偏度信号的高阶矩偏度峰度 信号的高阶矩 信号的均值、均方值和方差能全面反映高斯分布的随机信号特征,比如说幅值情况、能量变换情况,不过单单只是这几种随机信号特征,并不能完美的描述数学模型的偏移...
  • python计算峰度偏度

    2020-12-11 17:51:37
    import pandas as pd x=[] #列表,里面是数字 s=pd.Series(x) #list转为series print(‘偏度:’,s.skew()) print(‘峰度:’,s.kurt())
  • 图像特征_峰度偏度

    千次阅读 2016-09-18 10:57:31
    之前看过网上有很多关于峰度偏度的文章,结合自己的理解,我想稍微做下总结。定义 Kurtosis(峰度):是对Sample构成的分布的峰值是否突兀或是平坦的描述。 计算时间序列x的峰度峰度用于度量x偏离某分布的情况...
  • 峰度偏度的SQL表示

    千次阅读 2016-08-05 23:53:42
    翻译了一下峰度偏度的公式。。。如有错误,请指正。 还有就是大家怎么没有给我评论的呢 -==========================分割线=============================== 言归正传,上SQL 1.峰度 SD为...
  • 峰度偏度 偏度峰度如何影响您的分布 偏度(skewness)和峰度(kurtosis) 摘要 偏度Skewness定义中包括正态分布(偏度=0),右偏分布(也叫正偏分布,其偏度>0),左偏分布(也叫负偏分布,其偏度<0) 峰度...
  • 峰度偏度的计算方法&偏度的处理

    千次阅读 2020-09-20 10:28:55
    pandas的dataframe train_data['base_FVC'].skew() train_data['base_FVC'].kurt() scipy from scipy import stats #x为列表 stats.skew(x) stats.kurtosis(x)
  • 在R和Python中求峰度偏度

    千次阅读 2019-03-10 20:01:15
    文章目录一、 偏度1.1 计算公式1.2 自定义函数以及调用二、峰度2.1 计算公式2.2 自定义函数以及调用三、参考资料 一、 偏度 1.1 计算公式 &amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&...
  • 一些高阶矩的介绍,峰度偏度

    千次阅读 2020-09-15 22:55:58
    峰度(Kurtosis) 定义 峰度又称峰态系数,表征概率密度分布曲线在平均值处峰值高低的特征数,即是描述总体中所有取值分布形态陡缓程度的统计量。直观看来,峰度反映了峰部的尖度。这个统计量需要与正态分布相比较。...
  • Skew and Kurtosis (峰度偏度) 转载

    千次阅读 2019-08-24 11:13:33
    Skewness It is the degree of distortion from the symmetrical bell curve or the normal distribution. It measures the lack of symmetry in data distribution. It differentiates extreme values in one versu...
  • 偏度峰度描述什么数据科学,机器学习(Data Science, Machine Learning) In this article, we will go through two of the important concepts in descriptive statistics — Skewness and Kurtosis. At the end of...

空空如也

空空如也

1 2 3 4 5 ... 20
收藏数 593
精华内容 237
关键字:

峰度偏度