精华内容
下载资源
问答
  • 通过小波变换判断数据是否平稳波动 1. 小波变换理解 2. 判断数据是否平稳波动 3. 代码示例 1. 小波变换理解 小波,就是很小的波,它的积分总是接近于 0; 小波变换就是把一个波形分解成N个低频部分和M个高频部分的和...

    通过小波变换判断数据是否平稳波动

    1. 小波变换理解

    小波,就是很小的波,它的积分总是接近于 0;

    小波变换就是把一个波形分解成N个低频部分和M个高频部分的和;

    小波变换百科解释:指用有限长或快速衰减的“母小波”的振荡波形来表示信号。该波形被缩放和平移以匹配输入的信号。

    基础补充:

    每个小波变换都会有一个mother wavelet,我们称之为母小波,同时还有一个scaling function,中文是尺度函数,也被成为父小波。
    母小波是一类具有快速衰减有限长的波函数。
    任何小波变换的基函数,其实就是对这个母小波和父小波缩放和平移后的集合。
    小波基形成,是基于基本的小波函数,也就是母小波来做缩放和平移的。但是,母小波并非唯一的原始基。在构建小波基函数集合的时候,通常还要用到一个函数叫尺度函数,即父小波。

    2. 判断数据是否平稳波动

    标准差是一种常见的全局波动度量方法,可以描述数据围绕均值波动程度的大小,标准差越大表示数据波动越厉害。因此可以通过计算标准差作为量化评价数据整体波动情况的指标。

    对局部数据的波动度量,可以采用小波变换的方法来提取数据中的局部波动信息。对数据进行小波变换可以获得数据的低频信息和高频信息,其中低频信息代表了数据局部的平均值,能描述整段数据的近似轮廓;高频信息反映了数据局部的波动情况,能描述信号的细节信息。

    计算全局波动指标与局部波动指标的比值,来描述全局波动和局部波动的差异。
    在这里插入图片描述
    最后可以通过对n设置阈值来判断数据是否属于平稳数据类型,如果n大于阈值表示数据不属于平稳类型。阈值大小可以参考历史数据设定,阈值越大表示可以接受平稳数据波动的程度越大,阈值越小表示判定数据为平稳类型的要求更严格。

    3. 代码示例

    代码位置: https://github.com/lilihongjava/aiops

    检测是否平稳方法

    def is_stable(data, n_threshold=1.1, show_pic=False):
        # 标准差
        raw_data_std = np.std(data, ddof=1)
        # 一维离散信号的小波变换
        coeffs = wavedec(data, 'db4', level=2)
        cA2, cD2, cD1 = coeffs
        # cD2标准差
        cD2_std = np.std(cD2, ddof=1)
    
        if show_pic is True:
            plt.subplot(311)
            plt.title('original')
            plt.plot(data)
            plt.subplot(312)
            plt.title('ca2')
            plt.plot(cA2)
            plt.subplot(313)
            plt.title('cd2')
            plt.plot(cD2)
            plt.show()
    
        # 全局波动指标与局部波动指标的比值来描述两者的差异
        n = raw_data_std / cD2_std
        # 比值小于阈值为平稳数据,大于为波动数据
        if n < n_threshold:
            return True
        else:
            return False
    

    数据验证

    if __name__ == '__main__':
        # 平稳数据
        df = pd.read_csv('../data/stable.csv')
        data = df['count'].values
        print(is_stable(data, 1.1, True))
    
        # 周期性数据
        df = pd.read_csv('../data/api_access_fix.csv')
        data = df['count'].values
        print(is_stable(data, 1.1, True))
    

    平稳数据
    在这里插入图片描述
    波动数据
    在这里插入图片描述

    展开全文
  • 原文:http://lbxc.iteye.com/blog/1522257时间序列分析(一) 如何判断序列是否平稳序列平稳平稳,一般采用两种方法:第一种:看图法图是指时序图,例如(eviews画滴): 分析:什么样的图不平稳,先说下什么是平稳...

    原文:http://lbxc.iteye.com/blog/1522257

    时间序列分析(一) 如何判断序列是否平稳

    序列平稳不平稳,一般采用两种方法:

    第一种:看图法

    图是指时序图,例如(eviews画滴):

     

    分析:什么样的图不平稳,先说下什么是平稳,平稳就是围绕着一个常数上下波动。

    看看上面这个图,很明显的增长趋势,不平稳。

     

    第二种:自相关系数和偏相关系数

    还以上面的序列为例:用eviews得到自相关和偏相关图,Q统计量和伴随概率。

    分析:判断平稳与否的话,用自相关图和偏相关图就可以了。

    平稳的序列的自相关图和偏相关图不是拖尾就是截尾。截尾就是在某阶之后,系数都为 0 ,怎么理解呢,看上面偏相关的图,当阶数为 1 的时候,系数值还是很大, 0.914. 二阶长的时候突然就变成了 0.050. 后面的值都很小,认为是趋于 0 ,这种状况就是截尾。再就是拖尾,拖尾就是有一个衰减的趋势,但是不都为 0 。

    自相关图既不是拖尾也不是截尾。以上的图的自相关是一个三角对称的形式,这种趋势是单调趋势的典型图形。

     

     

    下面是通过自相关的其他功能

    如果自相关是拖尾,偏相关截尾,则用 AR 算法

    如果自相关截尾,偏相关拖尾,则用 MA 算法

    如果自相关和偏相关都是拖尾,则用 ARMA 算法, ARIMA 是 ARMA 算法的扩展版,用法类似 。

    不平稳,怎么办?

    答案是差分,什么是差分?不介绍了,给个链接:

    http://zh.wikipedia.org/wiki/%E5%B7%AE%E5%88%86

    还是上面那个序列,两种方法都证明他是不靠谱的,不平稳的。确定不平稳后,依次进行1阶、2阶、3阶...差分,直到平稳位置。先来个一阶差分,上图。



     从图上看,一阶差分的效果不错,看着是平稳的。





    其他补充:https://zhuanlan.zhihu.com/p/22248464 AR/MA/ARMA/ARIMA

    展开全文
  • 时间序列分析(一) 如何判断序列是否平稳 序列平稳平稳,一般采用两种方法: 第一种:看图法 图是指时序图,例如(eviews画滴):   分析:什么样的图不平稳,先说下什么是平稳平稳就是围绕着一个...

    时间序列分析(一) 如何判断序列是否平稳

    序列平稳不平稳,一般采用两种方法:

    第一种:看图法

    图是指时序图,例如(eviews画滴):

     

    分析:什么样的图不平稳,先说下什么是平稳,平稳就是围绕着一个常数上下波动。

    看看上面这个图,很明显的增长趋势,不平稳。

     

    第二种:自相关系数和偏相关系数

    还以上面的序列为例:用eviews得到自相关和偏相关图,Q统计量和伴随概率。

    分析:判断平稳与否的话,用自相关图和偏相关图就可以了。

    平稳的序列的自相关图和偏相关图不是拖尾就是截尾。截尾就是在某阶之后,系数都为 0 ,怎么理解呢,看上面偏相关的图,当阶数为 1 的时候,系数值还是很大, 0.914. 二阶长的时候突然就变成了 0.050. 后面的值都很小,认为是趋于 0 ,这种状况就是截尾。再就是拖尾,拖尾就是有一个衰减的趋势,但是不都为 0

    自相关图既不是拖尾也不是截尾。以上的图的自相关是一个三角对称的形式,这种趋势是单调趋势的典型图形。

     

     

    下面是通过自相关的其他功能

    如果自相关是拖尾,偏相关截尾,则用 AR 算法

    如果自相关截尾,偏相关拖尾,则用 MA 算法

    如果自相关和偏相关都是拖尾,则用 ARMA 算法, ARIMA ARMA 算法的扩展版,用法类似

    不平稳,怎么办?

    答案是差分,什么是差分?不介绍了,给个链接:

    http://zh.wikipedia.org/wiki/%E5%B7%AE%E5%88%86

    还是上面那个序列,两种方法都证明他是不靠谱的,不平稳的。确定不平稳后,依次进行1阶、2阶、3阶...差分,直到平稳位置。先来个一阶差分,上图。



     从图上看,一阶差分的效果不错,看着是平稳的。

     

    展开全文
  • 描述了如何从直观的数据图中,和数据分布图(钟形曲线),以及数据统计值(Dickey-Fuller)上判断数据是否平稳的。 正文: 时间序列不同于更传统的分类和回归预测建模问题。 时间结构为观察增加了一个顺序。...

    导读:

    本文介绍了数据平稳的重要性,平稳的数据对模型有什么影响。

    描述了如何从直观的数据图中,和数据分布图(钟形曲线),以及数据统计值(Dickey-Fuller)上判断数据是否是平稳的。

    正文:

    时间序列不同于更传统的分类和回归预测建模问题。

    时间结构为观察增加了一个顺序。这种强加的顺序意味着需要专门处理关于这些观察的一致性的重要假设。

    例如,在建模时,假设观测的汇总统计数据是一致的。在时间序列术语中,我们将此期望称为时间序列是静止的。

    通过增加趋势,季节性和其他依赖于时间的结构,可以在时间序列中容易地违反这些假设。

    在本教程中,您将了解如何使用Python检查时间序列是否稳定。

    完成本教程后,您将了解:

    • 如何使用线图识别明显的静止和非平稳时间序列。
    • 如何查看随时间变化的均值和方差等汇总统计信息。
    • 如何使用具有统计显着性的统计检验来检查时间序列是否静止。

    固定时间序列

    静止时间序列中的观察结果不依赖于时间。

    如果没有趋势或季节性影响,时间序列是固定的。按时间序列计算的汇总统计数据随时间变化是一致的,如观测值的均值或方差。

    当时间序列静止时,可以更容易建模。统计建模方法假定或要求时间序列是静止的以使其有效。

    以下是固定的每日女性出生数据集的示例。

    from pandas import Series
    from matplotlib import pyplot
    series = Series.from_csv('daily-total-female-births.csv', header=0)
    series.plot()
    pyplot.show()

    运行该示例将创建以下图表。 

    每日女性出生数据集图

                                      每日女性出生数据集图

     

    非定时时间序列

    非平稳时间序列的观测显示了季节性影响,趋势和其他依赖于时间指数的结构。

    像平均值和方差这样的汇总统计数据会随着时间的推移而发生变化,从而使模型可能尝试捕获的概念发生偏差。

    经典时间序列分析和预测方法涉及通过识别和消除趋势以及消除季节性影响来使非平稳时间序列数据静止。

    以下是非固定航空公司乘客数据集的示例,显示趋势和季节性组件。

    from pandas import Series
    from matplotlib import pyplot
    series = Series.from_csv('international-airline-passengers.csv', header=0)
    series.plot()
    pyplot.show()

    运行该示例将创建以下图表。 

    非固定航空公司乘客数据集

                                  非固定航空公司乘客数据集

    固定时间序列的类型

    平稳性的概念来自时间序列的理论研究,在预测时它是一个有用的抽象。

    如果你深入研究这个话题,你可能会遇到一些更细微的平稳性概念。他们是:

    他们是:

    • 固定过程:产生一系列固定观测的过程。
    • 固定模型:描述固定观测系列的模型。
    • Trend Stationary:不显示趋势的时间序列。
    • 季节性文具:没有季节性的时间序列。
    • 严格固定:静止过程的数学定义,特别是观测的联合分布对时移是不变的。

    固定时间序列与预测

    你应该把你的时间序列固定吗?

    一般来说,是的。

    如果您的时间序列中有明确的趋势和季节性,那么对这些组件进行建模,将其从观察中移除,然后在残差上训练模型。

    统计时间序列方法甚至现代机器学习方法将受益于数据中更清晰的信号。

    当经典方法失败时,我们转向机器学习方法。当我们想要更多或更好的结果时。我们不知道如何最好地模拟时间序列数据中的未知非线性关系,并且一些方法在使用非平稳观测或某些固定和非静止视图的混合时可以产生更好的性能。

    这里的建议是将时间序列的属性视为静止或不作为另一个信息源,可以在使用机器学习方法时在时间序列问题中使用特征工程和特征选择。

    检查平稳性

    有许多方法可以检查时间序列(直接观察,残差)是静止的还是非静止的。

    1. 看看Plots:您可以查看数据的时间序列图,并目视检查是否有任何明显的趋势或季节性。
    2. 摘要统计:您可以查看季节或随机分区数据的摘要统计信息,并检查明显或显着的差异。
    3. 统计测试:您可以使用统计测试来检查是否满足或已经违反了平稳性的期望。

    在上文中,我们已经将每日女性出生和航空旅客数据集分别定为静止和非静止,并且图表显示趋势和季节性成分明显缺乏和存在。

    接下来,我们将看一个快速的方法来计算和查看我们的时间序列数据集的摘要统计数据,以检查它是否是静止的。

    摘要统计

    如何快速的检查以确定您的时间序列是非静止的是查看摘要统计信息。

    您可以将时间序列拆分为两个(或更多)分区,并比较每个组的均值和方差。如果它们不同并且差异具有统计显着性,则时间序列可能是非平稳的。

    接下来,让我们在Daily Births数据集上尝试这种方法。

    每日出生数据集

    因为我们正在研究均值和方差,所以我们假设数据符合高斯(也称为钟形曲线或正态)分布。

    我们还可以通过观察我们观察的直方图来快速检查这一点。

    from pandas import Series
    from matplotlib import pyplot
    series = Series.from_csv('daily-total-female-births.csv', header=0)
    series.hist()
    pyplot.show()

     

    运行该示例绘制时间序列中的值的直方图。我们清楚地看到高斯分布的钟形曲线形状,也许右尾更长。

    每日女性出生的直方图

                                        每日女性出生的直方图

    接下来,我们可以将时间序列分成两个连续的序列。然后我们可以计算每组数字的均值和方差并比较这些数值。

    from pandas import Series
    series = Series.from_csv('daily-total-female-births.csv', header=0)
    X = series.values
    split = len(X) / 2
    X1, X2 = X[0:split], X[split:]
    mean1, mean2 = X1.mean(), X2.mean()
    var1, var2 = X1.var(), X2.var()
    print('mean1=%f, mean2=%f' % (mean1, mean2))
    print('variance1=%f, variance2=%f' % (var1, var2))

    运行此示例显示均值和方差值不同,但大致在同一水平线上。 

    mean1=39.763736, mean2=44.185792
    variance1=49.213410, variance2=48.708651

    接下来,让我们在Airline Passengers数据集上尝试相同的方法。 

    航空公司乘客数据集

    直接切入追踪,我们可以分割我们的数据集并计算每个组的均值和方差。

    from pandas import Series
    series = Series.from_csv('international-airline-passengers.csv', header=0)
    X = series.values
    split = len(X) / 2
    X1, X2 = X[0:split], X[split:]
    mean1, mean2 = X1.mean(), X2.mean()
    var1, var2 = X1.var(), X2.var()
    print('mean1=%f, mean2=%f' % (mean1, mean2))
    print('variance1=%f, variance2=%f' % (var1, var2))

    运行该示例,我们可以看到均值和方差看起来非常不同。因此这是一个非平稳的时间序列。 

    mean1=182.902778, mean2=377.694444
    variance1=2244.087770, variance2=7367.962191

    让我们退一步,检查在这种情况下假设高斯分布是否有意义,将时间序列的值绘制为直方图。 

    from pandas import Series
    from matplotlib import pyplot
    series = Series.from_csv('international-airline-passengers.csv', header=0)
    series.hist()
    pyplot.show()

    运行该示例表明,值的分布确实看起来不像高斯,因此均值和方差值的意义不大。 

    这种观察的压扁分布可能是非平稳时间序列的另一个指标。

    航空公司乘客的直方图

                                          航空公司乘客的直方图

    再次回顾时间序列的章节,我们可以看到有一个明显的季节性成分,看起来季节性成分正在增长。

    这可能表明每个季节都呈指数级增长。可以使用对数变换将指数变化平坦回到线性关系。

    下面是具有时间序列的对数变换的相同直方图。

    from pandas import Series
    from matplotlib import pyplot
    from numpy import log
    series = Series.from_csv('international-airline-passengers.csv', header=0)
    X = series.values
    X = log(X)
    pyplot.hist(X)
    pyplot.show()
    pyplot.plot(X)
    pyplot.show()

    运行这个例子,我们可以看到更熟悉的高斯分布或类似统一的值分布。 

    航空公司乘客的直方图记录

                                航空公司乘客的直方图记录

    我们还创建了对数转换数据的线图,可以看到指数增长似乎减少了,但我们仍然有趋势和季节性元素。

    航空公司乘客的线路图

                                     航空公司乘客的线路图

    我们现在可以计算对数变换数据集的值的均值和标准差。

    from pandas import Series
    from matplotlib import pyplot
    from numpy import log
    series = Series.from_csv('international-airline-passengers.csv', header=0)
    X = series.values
    X = log(X)
    split = len(X) / 2
    X1, X2 = X[0:split], X[split:]
    mean1, mean2 = X1.mean(), X2.mean()
    var1, var2 = X1.var(), X2.var()
    print('mean1=%f, mean2=%f' % (mean1, mean2))
    print('variance1=%f, variance2=%f' % (var1, var2))

    运行示例显示了每组的平均值和标准偏差值,这些值相似但不相同。 

    或许,仅从这些数字来看,我们就会说时间序列是静止的,但我们坚信在审查线图时不会出现这种情况。

    mean1=5.175146, mean2=5.909206
    variance1=0.068375, variance2=0.049264  

    这是一种快速的方法,但很容易被误导。

    我们可以使用统计检验来检查两个高斯随机变量样本之间的差异是真实的还是统计的侥幸。我们可以探索统计显着性检验,例如Student t检验,但由于值之间的序列相关性,事情变得棘手。

    在下一节中,我们将使用统计测试来明确评论单变量时间序列是否是静止的。

    增强Dickey-Fuller测试

    统计测试对您的数据做出了强有力的假设。它们只能用于通知零假设可被拒绝或未被拒绝的程度。必须解释结果才能使给定问题有意义。

    然而,他们可以提供快速检查和确认,证明您的时间序列是静止的或非静止的。

    扩张的Dickey-Fuller检定是一类被称为统计测试的单位根检验

    单位根检验背后的直觉是它确定趋势定义时间序列的强度。

    有许多单位根测试,Augmented Dickey-Fuller可能是更广泛使用的之一。它使用自回归模型并优化跨多个不同滞后值的信息标准。

    测试的零假设是时间序列可以用单位根表示,它不是静止的(具有一些时间依赖的结构)。替代假设(拒绝零假设)是时间序列是静止的。

    • 空假设(H0):如果未被拒绝,则表明时间序列具有单位根,这意味着它是非平稳的。它有一些时间依赖的结构。
    • 替代假设(H1):零假设被拒绝; 它表明时间序列没有单位根,这意味着它是静止的。它没有时间依赖的结构。

    我们使用测试中的p值来解释这个结果。低于阈值的p值(例如5%或1%)表明我们拒绝零假设(静止),否则高于阈值的p值表明我们未能拒绝零假设(非静止)。

    • p值> 0.05:无法拒绝原假设(H0),数据具有单位根并且是非平稳的。
    • p值<= 0.05:拒绝原假设(H0),数据没有单位根并且是静止的。

    下面是在Daily Female Births数据集上计算Augmented Dickey-Fuller测试的示例。statsmodels库提供了实现测试的adfuller()函数。

    from pandas import Series
    from statsmodels.tsa.stattools import adfuller
    series = Series.from_csv('daily-total-female-births.csv', header=0)
    X = series.values
    result = adfuller(X)
    print('ADF Statistic: %f' % result[0])
    print('p-value: %f' % result[1])
    print('Critical Values:')
    for key, value in result[4].items():
    	print('\t%s: %.3f' % (key, value))

    运行该示例将打印测试统计值-4。这个统计数据越负,我们就越有可能拒绝零假设(我们有一个固定的数据集)。 

    作为输出的一部分,我们得到一个查找表来帮助确定ADF统计数据。我们可以看到,我们的统计值-4小于-3.449的值,1%。

    这表明我们可以拒绝具有小于1%的显着性水平的零假设(即结果是统计学侥幸的低概率)。

    拒绝原假设意味着该过程没有单位根,反过来,时间序列是静止的或没有时间依赖的结构。

    ADF Statistic: -4.808291
    p-value: 0.000052
    Critical Values:
        5%: -2.870
        1%: -3.449
        10%: -2.571

    我们可以在Airline Passenger数据集上执行相同的测试。 

    from pandas import Series
    from statsmodels.tsa.stattools import adfuller
    series = Series.from_csv('international-airline-passengers.csv', header=0)
    X = series.values
    result = adfuller(X)
    print('ADF Statistic: %f' % result[0])
    print('p-value: %f' % result[1])
    print('Critical Values:')
    for key, value in result[4].items():
    	print('\t%s: %.3f' % (key, value))

    运行该示例给出了与上面不同的图片。检验统计量是正的,这意味着我们不太可能拒绝零假设(它看起来是非平稳的)。 

    将测试统计量与临界值进行比较,看起来我们不得不拒绝零假设,即时间序列是非平稳的并且具有时间依赖性结构。

    ADF Statistic: 0.815369
    p-value: 0.991880
    Critical Values:
        5%: -2.884
        1%: -3.482
        10%: -2.579

    让我们再次对数据集进行log转换,使值的分布更加线性,更好地满足此统计检验的预期。 

    from pandas import Series
    from statsmodels.tsa.stattools import adfuller
    from numpy import log
    series = Series.from_csv('international-airline-passengers.csv', header=0)
    X = series.values
    X = log(X)
    result = adfuller(X)
    print('ADF Statistic: %f' % result[0])
    print('p-value: %f' % result[1])
    for key, value in result[4].items():
    	print('\t%s: %.3f' % (key, value))

    运行该示例显示测试统计信息的负值。 

    我们可以看到该值大于临界值,这意味着我们不能拒绝零假设,反过来说时间序列是非平稳的。

    ADF Statistic: -1.717017
    p-value: 0.422367
        5%: -2.884
        1%: -3.482
        10%: -2.579 

     

    展开全文
  • 1. 从感官上如何判断? 从长期看没有可预测的运行模式,序列平稳也就是,随着时间的变化,序列没有较明确的运行模式,其未来大致的取值难以预测。 如果一个时间序列含有以下任一部分都可判定为非平稳的:趋势性部分...
  • 数据平稳

    万次阅读 2015-05-02 15:48:17
    一、数据平稳性 李子奈曾指出,一些非平稳的经济时间序列往往表现出共同的变化趋势,而这些序列间本身不一定有直接的关联,此时,对这些数据进行回归,尽管有较高的R平方,但其结果是没有任何实际意义的。这种情况...
  • if __name__ == '__main_... # 平稳数据 df = pd.read_csv('../data/stable.csv') data = df['count'].values is_cycle, cycles = is_periodicity(data) print("是否周期:%s,可能周期:%s" % (is_cycle, cycles))
  • 时间序列是否平稳的判别方法

    千次阅读 2020-03-26 11:50:21
    时间序列平稳指的是这个时间序列的值与时间无关。 1. 首先可以做ACF图直观上判别时间序列是否存在明显的自相关; 2. 常用的检验有KPSS, ADF检验等。 3. ...
  • AR模型与数据平稳性之间的关系

    千次阅读 2017-12-19 22:17:00
    作者:桂。 时间:2017-12-1921:39:08 ... 前言 ... 前几天碰到一个序列分析的问题,涉及到自回归(auto-regression, AR)等... 发现金融数据分析里,这方面的知识很多,以后用到可以借鉴,例如伍德里奇《计量经济...
  • 在嵌入式行业很多数据需要知道是增大、减小、稳定还是无序,下面程序就是数据现象: /***********2:稳定、1:递增、0:无序、-1:递减*******/ #include&lt;stdio.h&gt; #define LIGHT_DATA_COUNT_MAX 7 ...
  • ——平稳性的意义如何检验时间序列数据平稳性?——单位根检验数据平稳怎么办?——协整检验单整、协整(cointegration)协整检验总结——时间序列数据的一般处理流程 为什么要把时间序列变成平稳的?——平稳性...
  • 二、判断序列是否可以使用时间序列预测 首先从时间的角度可以把一个序列基本分为3类: 1.纯随机序列(白噪声序列),这时候可以停止分析,因为就像预测下一次硬币哪一面朝上一样毫无规律。 2.平稳非白噪声序列,...
  • 从tushare上下载'002337'的数据 import tushare as ts data = ts.get_h_data('002337') data.to_csv('e:/stockData/002337.csv') 做ADF Test: import pandas as pd import statsmodels.tsa.stattools...
  • 最近写怎么判断数据的波动情况,有一组数据1.0,2.0,3.0,4.0,5.0,6.0,7.0,800.0,9.0,1000.0 要判断这组数据的波动情况,求大神写个函数,传一组数据,判断这组数据波动猛不猛,猛烈程度分七级,用0代表数据...
  • 由于平稳信号和非平稳信号的性质差别显着,因此在处理信号之前先行判断它的平稳性就显得尤为重要。虽然信号平稳性的定义十分明确,但是实际判断过程却是复杂的,例如观察尺度对信号平稳判断就有很大的影响。  这...
  • 平稳序列

    千次阅读 2017-12-02 12:39:08
    平稳序列的性质与应用。是时间序列分析课程的第一章。
  • 故时间序列分析数据要有平稳性 由此,我们引入一个概念,Strict stationary process(SSS)/严格平稳过程 n个随机变量的联合分布函数和的联合分布函数对所有时延都是相同的,称为严格平稳随机过程,又称为狭义平稳随机...
  • 时间序列-平稳

    千次阅读 2019-02-19 17:07:31
    1.时间序列的平稳性  1.1 任何一个时间序列都可以被看做是由随机过程产生的结果。和普通两变量和多变量不一样,任何一个时间点上的值都是随机过程产生的,也是都是随机的。  1.2 如果一个随机过程所产生的时间...
  • 读取整个csv文件 csv_data = pd.read_csv(filePath) #取得平稳性检测指标(单位根检验) #adf1 = ADF(pap_sum) #print(adf1) adf=unitroot_adf(csv_data) #检验值、p-value、滞后阶数、自由度 print(adf) if adf[0][4]...
  • 平稳多元序列建模的R实现

    千次阅读 2019-06-28 20:56:29
    1.模型简介 对于平稳多元时间序列建模的思想是:假定响应序列{yt}和输入序列{x1t},{x2t},…,{xkt}均...(1)读入数据,并绘制其时序图,并判断平稳性 (2)绘制其输出序列自相关图,偏自相关图,并利用其自相关图...
  • 一些非平稳的经济时间序列往往表现出共同的变化趋势,而这些序列间本身不一定有直接的关联关系,这时对这些数据进行回归,尽管有较高的R2R^2R2,但其结果是没有任何实际意义的,这种现象我们称之为虚假回归。...
  • 时间序列分析:平稳时间序列建模

    千次阅读 2020-06-08 19:07:21
    根据序列的时序图,自相关图和偏自相关图判断序列的平稳性,随机性2.1.时序图检验2.2.自相关图检验2.3判断该序列的纯随机性3.选择适当模型4.参数估计5.模型检验及优化5.1模型显著性检验5.2参数显著性检验5.3模型优化...
  • 尤其是arima的举例! 可以看到:ARIMA本质上是error和t-?时刻数据差分的线性模型!!! ARIMA模型全称为自回归积分滑动平均模型(Autoregressive Integrated Moving Average Model,简记ARIMA),...
  • Python量化基础:时间序列的平稳性检验

    万次阅读 多人点赞 2019-01-31 16:06:43
    时间序列数据平稳性对于我们采用什么样的分析方式、选择什么样的模型有着至关重要的影响。 我们想一下,假如一个时间序列的波动趋势从来没有稳定过,那么它每个时期的波动对于之后一段时期的影响都是无法预测的,...
  • 在拿到时间序列数据后,首先要对数据的随机性和平稳性进行检测, 这两个检测是时间序列预测的重要部分。根据不同检测结果需要采取不同的分析方法。 为什么时间序列要求平稳性呢?平稳性就是要求由样本拟合出的曲线在...

空空如也

空空如也

1 2 3 4 5 ... 20
收藏数 13,847
精华内容 5,538
关键字:

判断数据是否平稳