精华内容
下载资源
问答
  • 时间序列学习笔记(一)
    2020-01-15 20:54:34

    时间序列学习笔记(一)

    第一次写,不太会写,希望多多包涵
    所有的时间序列学习笔记是在自己学习吴喜之,刘苗编著的《应用时间序列分析》这本书时为了方便学习时所写

    平稳、自协方差函数和自相关函数

    平稳性

    对于时间序列X1,X2,…,来说如果是严平稳的,则满足以下条件
    对于任何t1,…,tk,滞后期τ和k,Xt1,…,Xt2的联合分布与Xt1+τ,…,Xtk+τ的联合分布相同。如果k=1,那么Xt的分布对所有的t都相同,且均值和方差不随t而变。

    对于时间序列X1,X2,…,来说如果是弱平稳的,则满足以下条件
    Xt的数学期望不随时间而改变,即E(Xt)=μ(μ为常数),且任何滞后期τ,Xt与Xt+τ的相关系数Cov(Xt,Xt+τ)=γt,即该相关系数只依赖于τ,与时间t无关。
    显然,平稳时间序列的方差是一个常数,Var(Xt)=γ0
    注意:
    1.除非在某些特定的条件下,平稳性和严平稳之间并没有包含关系。
    2.对于正态过程,弱平稳就意味着严平稳。

    自协方差函数和自相关函数

    μ t = E ( X t ) , μ s = E ( X s ) μ_t=E(X_t),μ_s=E(X_s) μt=E(Xt)μs=E(Xs)
    Xt和Xs自协方差函数(acvf) 定义为
    γ ( t , s ) = C o v ( X t , X s ) = E [ ( X t − μ t ) ( X s − μ s ) ] γ(t,s)=Cov(X_t,X_s)=E[(X_t-μ_t)(X_s-μ_s)] γ(t,s)=Cov(Xt,Xs)=E[(Xtμt)(Xsμs)]
    对于平稳时间序列,如果 τ = s − t τ=s-t τ=st μ = E ( X t ) = E ( X s ) μ=E(X_t)=E(X_s) μ=E(Xt)=E(Xs)则有自协方差函数
    γ ( h ) ≡ γ τ ≡ γ ( t , s ) = E [ ( X t − μ t ) ( X s − μ s ) ] = E [ ( X t − μ ) ( X s − μ ) ] γ(h)≡γ_τ≡γ(t,s)=E[(X_t-μ_t)(X_s-μ_s)]=E[(X_t-μ)(X_s-μ)] γ(h)γτγ(t,s)=E[(Xtμt)(Xsμs)]=E[(Xtμ)(Xsμ)]
    即平稳时间序列的自协方差函数γτ仅仅依赖于时间差τ,与绝对时间无关。
    平稳时间序列的自相关函数(acf) 定义为
    ρ ( τ ) ≡ ρ τ ≡ γ t γ 0 = E [ ( X t − μ ) ( X s − μ ) ] V a r ( X   t   ) ρ(τ)≡ρ_τ≡\frac{γ_t}{γ_0}=\frac{E[(X_t-μ)(X_s-μ)]}{Var(X~t~)} ρ(τ)ρτγ0γt=Var(X t )E[(Xtμ)(Xsμ)]
    对于平稳序列,有
    γ τ = C o v ( X t , X t + τ ) = C o v ( X t − τ , X t ) = γ − τ γ_τ=Cov(X_t,X_t+τ)=Cov(X_t-τ,X_t)=γ_-τ γτ=Cov(Xt,Xt+τ)=Cov(XtτXt)=γτ
    自相关系数性质:
    若记 σ 2 = V a r ( X t ) = γ 0 \sigma^2=Var(X_t)=\gamma_0 σ2=Var(Xt)=γ0 ρ γ = γ τ / γ 0 = γ τ / σ 2 \rho_\gamma=\gamma_\tau/\gamma_0=\gamma_\tau/\sigma^2 ργ=γτ/γ0=γτ/σ2

    ρ γ = ρ − γ \rho_\gamma=\rho_{-\gamma} ργ=ργ
    ∣ ∣ ρ γ ∣ ∣ ≤ 1 ( 证 明 略 ) ||\rho_\gamma||\leq1(证明略) ργ1()
    注意:

    acf并不唯一识别背景模型,虽然一个给定的随机过程都有唯一的acf,但是一个给定的acf并不一定对应唯一的随机过程。(即使不同的正太过程也有可能有同样的acf,此时需要利用可逆性条件来证明唯一性)

    如果{xt}Tt=1(代表x1,x2,…,xT)为时间序列 {Xt}Tt=1(代表X1,X2,…,XT)的样本,滞后期τ的样本自协方差函数(sacvf) 及其样本自相关系数(sacf) 分别定义为
    γ ^ τ = 1 T ∑ t = τ + 1 T ( x t − x ˉ ) ( x t − τ − x ˉ ) \hat{γ}_τ=\frac{1}{T}\sum_{t=τ+1}^{T}(x_t-\bar{x})(x_{t-τ}-\bar{x}) γ^τ=T1t=τ+1T(xtxˉ)(xtτxˉ)
    ρ ^ τ = γ ^ τ γ ^ 0 \hat{ρ}_τ=\frac{\hat{γ}_τ}{\hat{γ}_0} ρ^τ=γ^0γ^τ

    更多相关内容
  • 平稳时间序列模型的统计性质

    千次阅读 2020-06-21 10:37:42
    对于平稳时间序列模型的统计性质的理论知识

    平稳时间序列模型的统计性质

    1、AR模型的统计性质;2、MA模型的统计性质;3、ARMA模型的统计性质
    统计性质包括5个:(1)均值;(2)方差;(3)协方差;(4)自相关系数;(5)偏自相关系数。
    在这里插入图片描述
    ARMA模型的相关性特征:
    在这里插入图片描述
    在这里插入图片描述

    1、AR模型的统计性质

    (1)均值
    如果AR§模型满足平稳,均值为常数。
    在这里插入图片描述
    在这里插入图片描述
    (2)方差
    求解思路:首先把序列转化为传递形式,再求解方差;不能直接求解,把序列变成白噪声的线性组合,因为白噪声的很多统计性质是已知的。
    传递形式的目的:把AR模型对应的时间序列表示成关于白噪声的线性相关组合形式;传递形式里面包括Green函数,Green函数的原理包括原始模式以及期待形式,用待定系数法进行求解,其中白噪声互不相关,并且需要满足同方差假定。
    (3)协方差
    两种求解协方差(方差)的方式:

    • 利用AR§模式的传递形式来求;
    • 利用自协方差函数之间的递推函数来求。
      (4)自相关系数
      自相关系数的定义:
      在这里插入图片描述
      求解方法:
      1.用自相关系数的定义结合自协方差函数可以求解;
      2.基于传递形式直接求解自相关系数;
      3.基于自相关系数的递推公式求解。
      自相关系数有拖尾性,原因是该序列值所对应过去时刻的序列值都会影响它。
      自相关图里拖尾的原因有两个:
    • 用样本估计总体参数时有误差;
    • 本身自相关系数具有拖尾性,不恒等于0。

    (5)偏自相关系数
    定理:零均值平稳序列为AR§序列的充要条件是平稳序列的偏自相关系数P步截尾。
    求解方法:
    基于Yule-Walker方程组以及行列式来求解;
    利用偏自相关系数递推公式来求解。

    2、MA模型的统计性质

    (1)均值
    常数均值。
    (2)方差
    常数方差,利用白噪声项互不相关的假定。
    (3)协方差
    基于自协方差函数的定义,直接利用模型表达式来求。
    (4)自相关系数
    自相关系数以及自协方差的计算相同,都是基于白噪声的序列以及假定来计算的。
    自协方差函数、自相关系数q阶截尾,自协方差函数只与时间间隔有关。
    不同的MA(1)模型,相同的自相关系数,也就是说自相关系数具有非唯一性,自相关系数和模型之间不是一一对应的关系,为了解决这个问题,增加一个约束条件,而这个约束条件是模型的可逆条件,这就形成了一一对应关系,一个自相关系数与可逆MA模型一一对应。
    (5)偏自相关系数

    • 基于Yule-Walker方程和克莱姆法则求解;
    • 首先求出自相关系数,然后基于偏自相关系数递推公式求解。
      偏自相关系数具有拖尾性

    3、ARMA模型的统计性质

    ARMA模型生成的序列的统计性质:均值、自协方差、自相关系数以及偏自相关系数的计算均可参考AR和MA模型的情形。
    ARMA(p,q)传递形式(平稳条件)与逆转形式(可逆条件),即无穷阶MA模型与无穷阶AR模型。
    ARMA模型相关性特征:
    在这里插入图片描述

    展开全文
  • 文章目录一、方差平稳二、具有趋势性1、回归分析法2、随机趋势3、平滑法 一、方差平稳 最简单的是做对数变换,使得前后方差没有那么变化。 二、具有趋势性 1、回归分析法 对于一个有线性趋势的序列,可以做一个...


    前言

    时间序列为什么要平稳后建模?

    • 时间序列是平稳的,则没有任何预测价值,因为均值不变,所以实际上人们只会对非平稳时间序列感兴趣
    • 之所以研究平稳时间序列,因为总希望可以通过差分等方式把非平稳序列变成平稳的,而平稳时间序列可以通过数学公式予以解释

    一、方差不平稳

    最简单的是做对数变换,使得前后方差没有那么变化。

    #Log transform: variance stationary
    data(AirPassengers)
    AirPassengers
    par(mfrow=c(1,2))
    plot(AirPassengers)
    plot(log(AirPassengers))
    

    在这里插入图片描述

    二、具有趋势性

    1、确定性趋势的删除——趋势拟合法

    最简单的处理方法就是考虑均值函数可以由一个时间的确定性函数来描述,比如可以用回归模型来描述。对于一个有线性趋势的序列,可以做一个线性模型。

    • Linear trend
    ##read the gasline data
    ##Abraham and Ledolter (1983) on the
    ##monthly gasoline demand in Ontario over the period 1960 - 1975.
    gas = scan("gas.dat")
    ## note that read.table() would give an error here since the data is not in rectangular format.
    gas.ts = ts(gas, frequency = 12, start = 1960)
    gas.ts
    plot(gas.ts, main = "Gasoline demand in Ontario", ylab = "Million gallons")
    #fit trend:OLS with constant and trend
    time = 1:length(gas.ts)
    fit = lm(gas.ts~time)
    summary(fit)#R-squared:  0.8225
    par(mfrow=c(2,1))
    plot(time, gas.ts, type='l', xlab='months', ylab='Million gallons gasoline',
    main="OLS fit")
    legend(.1, 256000, c("Time plot", "OLS fit"), col = c(1,2), text.col = "black",
    merge = TRUE, lty=c(1,1))
    abline(fit,col=2,lwd=2)
    plot(time, fit$resid, type='l', xlab="months", ylab="Residuals",main="Residuals OLS [yt-fit(yt)]")
    abline(a=0, b=0)#残差在0附近点波动
    #savePlot("plot of Residuals_gas",type="pdf")
    

    在这里插入图片描述

    • Quadratic trend
    fit2 = lm(gas.ts~time+I(time^2))
    summary(fit2)#R-squared:  0.8327
    names(fit2)
    par(mfrow=c(2,1))
    plot(time, gas.ts, type='l', xlab='months', ylab='Million gallons gasoline',
         main="OLS fit")
    legend(.1, 256000, c("Time plot", "OLS fit"), col = c(1,2), text.col = "black",
           merge = TRUE, lty=c(1,1))
    lines(time,fitted(fit2),col=2)   
    plot(time, fit2$resid, type='l', xlab="months", ylab="Residuals",main="Residuals OLS [yt-fit(yt)]")
    abline(a=0, b=0)
    

    在这里插入图片描述

    • Polynomial trend

    2、随机趋势的删除——差分法

    随机趋势的删除——差分法。

    • 一阶差分可以使线性趋势的序列实现趋势平稳
    Zt = as.ts(rnorm(1000, sd = 20))
    RW1 = as.ts(cumsum(Zt))
    par(mfrow = c(2,2))
    plot(RW1, main = "Random walk")
    acf(RW1, main = "Correlogram random walk")
    Yt=as.ts(diff(RW1))
    plot(Yt,main='Diff(RW1)')
    acf(Yt)
    

    在这里插入图片描述

    • 序列蕴含着曲线趋势,通常低阶(二阶或三阶)差分可提取出曲线趋势的影响 ,这里效果不好的话,可以先取对数,再做差分
    • 对于蕴含着固定周期的序列进行步长为周期长度的差分运算,通常可以较好地提取周期信息
    • 差分的阶数要适度,避免过差分

    3、未知趋势的删除——平滑法

    平滑法——顾名思义,使序列变平滑。 期望结果,是显示出趋势变化的规律。

    1. 移动平均法

    假定在短的时间间隔内,序列的取值是比较稳定的,序列的大小差异主要是由随机波动造成的。用一段时间间隔内的平均值作为某一期的估计值。

    • 简单移动平均
    ##Moving average Model
    Vt5 = filter(Zt, rep(1/5, 5), sides = 2)
    Vt21 = filter(Zt, rep(1/21, 21), sides = 2)
    par(mfrow = c(2,2))
    plot(Vt5, main = "Moving 5-point average of above white noise series")
    acf(Vt5, main = "Correlogram 5-point moving average", lag.max = 40, na.action = na.pass)
    plot(Vt21, main = "Moving 21-point average of above white noise series")
    acf(Vt21, main = "Correlogram 21-point moving average", lag.max = 40, na.action = na.pass)
    par(mfrow = c(1,1))
    

    在这里插入图片描述

    • 权重移动平均

    2. 指数平滑法

    4、季节性

    Seasonality means an effect that happens at the same time and with the same magnitude and direction every year. 从而使得经过季节调整的序列能够较好的反应社会经济指标运行基本态势。

    1.Method1: 减掉趋势成分后取平均

    ## Investigating seasonality
    library(fields)
    z = matrix(fit$resid, ncol=12, byrow=TRUE)
    colnames(z) = c("Jan","Feb","Mar","Apr","May","Jun","Jul","Aug","Sep","Oct","Nov","Dec")
    bplot(z, xlab="Month", ylab="Detrended demand of gasoline", main="Annual seasonality of the detrended demand of gasoline")    
    mean=matrix(0, nrow=ncol(z), ncol=1) #mean for each month
    for(i in 1:ncol(z)){
      mean[i,1]=mean(z[,i])
    }
    Seas = as.matrix(rep(mean,16)) # matrix with seasonal term
    des.gas = fit$resid - Seas   # detrended and now deseasonized series
    par(mfrow=c(2,1))
    plot(fit$resid, type='l', xlab="months", ylab="Residuals", main="Residuals OLS [yt-fit(yt)]")
    abline(a=0, b=0)
    plot(des.gas, type='l', xlab="months", ylab="Deseasonized residuals", main="Deseasonized ResidualsOLS")
    abline(a=0, b=0)
    

    在这里插入图片描述

    2.Method2:使用哑元变量做回归分析

    ##seasonal modeling and estimating seasonal trends
    ##such as for the average monthly temperature data 
    library(TSA)  #install package TSA
    win.graph(width=4.875, height=2.5,pointsize=8)
    data(tempdub); 
    plot(tempdub,ylab='Temperature',type='o')
    month.=season(tempdub) # period added to improve table display
    model2=lm(tempdub~month.) # -1 removes the intercept term
    summary(model2)
    
    Call:
    lm(formula = tempdub ~ month.)
    
    Residuals:
        Min      1Q  Median      3Q     Max 
    -8.2750 -2.2479  0.1125  1.8896  9.8250 
    
    Coefficients:
                    Estimate Std. Error t value Pr(>|t|)    
    (Intercept)       16.608      0.987  16.828  < 2e-16 ***
    month.February     4.042      1.396   2.896  0.00443 ** 
    month.March       15.867      1.396  11.368  < 2e-16 ***
    month.April       29.917      1.396  21.434  < 2e-16 ***
    month.May         41.483      1.396  29.721  < 2e-16 ***
    month.June        50.892      1.396  36.461  < 2e-16 ***
    month.July        55.108      1.396  39.482  < 2e-16 ***
    month.August      52.725      1.396  37.775  < 2e-16 ***
    month.September   44.417      1.396  31.822  < 2e-16 ***
    month.October     34.367      1.396  24.622  < 2e-16 ***
    month.November    20.042      1.396  14.359  < 2e-16 ***
    month.December     7.033      1.396   5.039 1.51e-06 ***
    ---
    Signif. codes:  0***0.001**0.01*0.05 ‘.’ 0.1 ‘ ’ 1
    
    Residual standard error: 3.419 on 132 degrees of freedom
    Multiple R-squared:  0.9712,	Adjusted R-squared:  0.9688 
    F-statistic: 405.1 on 11 and 132 DF,  p-value: < 2.2e-16
    
    展开全文
  • 在此假设读者已熟悉时间序列、ARIMA和平稳性的概念,以下是一些包含基础内容的参考资料:时间序列建模完整教程给初学者的时间序列预测综合指南目录1. 平稳简介2. 加载数据3. 检验平稳的方法ADF检验KPSS检验4. 平稳的...

    本文将重点介绍时间序列数据的平稳性检验方法。在此假设读者已熟悉时间序列、ARIMA和平稳性的概念,以下是一些包含基础内容的参考资料:

    时间序列建模完整教程

    给初学者的时间序列预测综合指南

    目录

    1. 平稳简介

    2. 加载数据

    3. 检验平稳的方法

    ADF检验

    KPSS检验

    4. 平稳的种类

    严格平稳

    趋势平稳

    差分平稳

    5. 时间序列平稳化

    差分

    季节性差分

    对数变换

    1. 平稳简介

    “平稳”是处理时间序列数据时遇到的最重要的概念之一:平稳序列是指其特性-均值、方差和协方差不随时间而变化的序列。

    让我们用一个直观的例子来理解这一点。考虑以下三个图形:

    在第一幅图中,我们可以清楚地看到,均值随时间而变化(增加),呈现上升的趋势。因此,这是一个非平稳序列。平稳序列不应该呈现出随时间变化的趋势。

    第二幅图显然看不到序列的趋势,但序列的变化是一个时间的函数。正如前面提到的,平稳序列的方差必须是一个常数。

    再来看第三幅图,随着时间的增加,序列传播后变得更近,这意味着协方差是时间的函数。

    上述三个例子均是非平稳时间序列。现在来看第四个图:

    在这张图中,均值、方差和协方差都是常数,这就是平稳时间序列。

    再想一想,上面的哪一幅图预测未来会更容易呢?第四个图,对吧?大多数统计模型都要求序列是平稳的,这样才能进行有效和精确的预测。

    因此,总的来说,平稳时间序列是一个不依赖时间变化 (即均值、方差和协方差不随时间变化)的时间序列。在下一节中,我们将介绍各种检测给定序列是否平稳的方法。

    2. 加载数据

    在本节和后续几节中,将介绍检测时间序列数据的平稳性的方法,以及如何处理非平稳序列。同时,本文还提供了相应的Python代码。大家可以到:AirPassengers下载文中使用的数据集。

    在继续分析数据集之前,首先加载和预处理数据。

    好了,看来可以继续了!

    3. 检验平稳的方法

    下一步是确定给定的序列是否是平稳的,并对它做相应的处理。本节将介绍一些常见的方法,利用这些方法来检测序列是否平稳。

    目视检验

    看一下我们在上一节中使用的图形,仅需通过目测图形,便能够识别出序列的均值和方差是否随时间变化。同样,通过绘制数据图形,便能确定该序列的属性是否随时间而变化。

    显然,通过作图,可以看到序列的趋势(变化的均值),然而,这种目视检测方法得到的结果可能不准确。最好是用一些统计检验方法来验证观测结果。

    统计检验

    可以利用统计检验来代替目视检验:比如单位根平稳检验。单位根表名给定序列的统计特性(均值,方差和协方差)不是时间的常数,这是平稳时间序列的先决条件。下面是它的数学解释:

    假设我们有一个时间序列:

    其中yt是t时刻的数据值,ε t 是误差项。需要利用yt-1的值来计算yt,即:

    如果利用所有的观察值,yt 的值将是:

    假设在上述方程中a的值为1(单位),则预测值将等于yt-n 和从t-n到t的所有误差之和,这意味着方差将随着时间的推移而增大,这就是时间序列中的单位根。众所周知,平稳时间序列的方差不能是时间的函数。单元根检验通过检查a=1的值来检查序列中是否存在单位根。以下是两个最常用的单位根平稳检测方法:

    ADF(增补迪基-福勒)检验

    The Dickey Fuller test is one of the most popular statistical tests. It can be used to determine the presence of unit root in the series, and hence help us understand if the series is stationary or not. The null and alternate hypothesis of this test are:

    The Dickey Fuller test is one of the most popular statistical tests. It can be used to determine the presence of unit root in the series, and hence help us understand if the series is stationary or not. The null and alternate hypothesis of this test are:

    迪基-福勒(Dickey Fuller)检验是最流行的统计检验方法之一,可以用它来确定序列中单位根的存在,从而帮助判断序列是否是平稳。这一检验的原假设与备择假设如下:

    原假设:序列有一个单位根(a=1的值)

    备择假设:该序列没有单位根。

    如果不能拒绝原假设,则该序列是非平稳的,这意味着序列可以是线性的,也可以是差分平稳的(将在下一节中更多地了解差分平稳)。

    Python代码:

    ADF检验结果:ADF检验的统计量为1%,p值为5%,临界值为10%,置信区间为10%。我们对本序列的检验结果如下:

    平稳性检验:如果检验统计量小于临界值,我们可以拒绝原假设(也就是序列是平稳的)。当检验统计量大于临界值时,不能拒绝原假设(这意味着序列不是平稳的)。

    在上面的例子中,检验统计量>临界值,这意味着序列不是平稳的。这证实了我们最初在目视检测中观察的结果。

    KPSS(科瓦特科夫斯·基菲利普·斯施密特·辛)检验

    KPSS检验是另一种用于检查时间序列的平稳性 (与迪基-福勒检验相比稍逊一筹) 的统计检验方法。KPSS检验的原假设与备择假设与ADF检验的原假设与备择假设相反,常造成混淆。

    KPSS检验是另一种用于检查时间序列的平稳性 (与迪基-福勒检验相比稍逊一筹) 的统计检验方法。KPSS检验的原假设与备择假设与ADF检验的原假设与备择假设相反,常造成混淆。

    KPSS检验的作者将原假设定义为趋势平稳,并将备择假设定义为单位根序列。我们将在下一节详细了解趋势平稳。现在,来看一下KPSS检验的实现,并查看KPSS检验的结果。

    原假设:序列是趋势平稳的。

    备择假设:序列有一个单位根(序列是非平稳的)。

    Python代码:

    KPSS检验结果:KPSS检验-检验统计量、p-值和临界值和置信区间分别为1%、2.5%、5%和10%。对于航空乘客数据集的检验结果如下:

    平稳性检验:如果检验统计量大于临界值,则拒绝原假设(序列不是平稳的)。如果检验统计量小于临界值,则不能拒绝原假设(序列是平稳的)。对于航空乘客数据集来说,在所有置信区间,检验统计量的值都大于临界值,因此可以说该序列是不平稳的。

    在为时间序列数据集准备模型之前,通常会同时进行两种检验。有一次,这两种检验显示出相互矛盾的结果:其中一个检验结果表明该序列是平稳的,而另一个则表明该序列是非平稳的!我困惑了好几个小时,想弄清楚这是怎么回事。后来才知道,序列的平稳性有多种类型。

    综上所述,ADF检验有线性平稳或差分平稳的备择假设,而KPSS检验则是识别序列的趋势平稳。

    4. 平稳的种类

    通过了解不同类型的平稳,来解释上述检验的结果。

    严格平稳:严格平稳序列满足平稳过程的数学定义。严格平稳序列的均值、方差和协方差均不是时间的函数。我们的目标是将一个非平稳序列转化为一个严格平稳序列,然后对它进行预测。

    趋势平稳:没有单位根但显示出趋势的序列被称为趋势平稳序列。一旦去除趋势之后,产生的序列将是严格平稳的。在没有单位根的情况下,KPSS检测将该序列归类为平稳。这意味着序列可以是严格平稳的,也可以是趋势平稳的。

    差分平稳:通过差分可以使时间序列成为严格平稳的时间序列。ADF检验也称为差分平稳性检验。

    应用两种检验总会更优些,通过两种检验之后,可以确定这个序列是否是平稳的。下面,来看一下应用两种平稳检验后的可能结果:

    结果1:两种检验均得出结论:序列是非平稳的->序列是非平稳的

    结果2:两种检验均得出结论:序列是平稳的->序列是平稳的

    结果3:KPSS =平稳;ADF =非平稳->趋势平稳,去除趋势后序列严格平稳

    结果4:KPSS =非平稳;ADF =平稳->差分平稳,利用差分可使序列平稳。

    5. 时间序列的平稳化

    在熟悉了平稳性的概念及其不同的类型之后,接下来可以对序列进行平稳化操作。请记住,为了建立时间序列预测模型,必须首先将任何非平稳序列转换为平稳序列。

    差分化

    在该方法中,计算序列中连续项的差值。执行差分操作通常是为了消除均值的变化。从数学角度,差分可以写成:

    yt‘ = yt – y(t-1)

    其中yt 是t时刻的数值。

    对序列差分化后,绘制出结果:

    季节性差分

    在季节性差分中,不计算连续值之间的差异,而是计算观察值与同一季节的先前观察值之间的差异。例如,星期一的观察值将与上星期一的观察值相减。从数学角度,它可以写成:

    yt‘ = yt – y(t-n)

    变换

    变换用于对方差为非常数的序列进行平稳化。常用的变换方法包括幂变换、平方根变换和对数变换。对飞机乘客数据集进行快速对数转换和差分:

    可以看出,这个图形比先前的图形有了很大的改善。通过对这个序列进行平方根或幂变换,看看是否得出了更好的结果。欢迎在下面的评论里分享你的发现!

    尾注

    本文介绍了检验时间序列平稳性的不同方法。但并不止步于此,下一步是对得到的序列应用一个预测模型。可以参考以下文章来构建这样的模型:给初学者的时间序列预测综合指南(Beginner’s Guide to Time Series Forecast)。

    如果对本文有任何问题或反馈,可以在下面的评论部分与我联系。

    还可以在Analytics Vidhya的Android应用程序上阅读这篇文章

    作者简介:艾什瓦雅·辛格

    Aishwarya Singh

    一个热衷于探索无休止的数据科学和人工智能世界的读者。被ML(机器学习)和AI(人工智能)的无限应用所吸引,渴望在数据科学领域进行学习、探索和深入发掘。

    原文链接:

    https://www.analyticsvidhya.com/blog/2018/09/non-stationary-time-series-python/

    原文标题:

    A Gentle Introduction to Handling a Non-Stationary Time Series in Python

    ——【完】——

    译者简介:陈之炎,北京交通大学通信与控制工程专业毕业,获得工学硕士学位,历任长城计算机软件与系统公司工程师,大唐微电子公司工程师,现任北京吾译超群科技有限公司技术支持。目前从事智能化翻译教学系统的运营和维护,在人工智能深度学习和自然语言处理(NLP)方面积累有一定的经验。

    本文转自:数据派THU 微信公众号;

    版权声明:本号内容部分来自互联网,转载请注明原文链接和作者,如有侵权或出处有误请和我们联系。

    原创系列文章:

    展开全文
  • 由于平稳时间序列的均值是常数,所以当某个平稳时间序列的均值非0的时候,可以给每一个元素都减去他们的均值,而且这个均值是指每个随机变量的均值,而不是指样本序列的均值,所以只要知道随机变量是什么可以很容易...
  • 简介预测一个家庭未来三个月的用电量,估计特定时期道路上的交通流量,预测一只股票在纽约证券交易所交易的价格……这些问题都有什么共同点?它们都属于时间序列数据的范畴... 手把手教你用Python处理非平稳时间序列...
  • 时间序列(二):时间序列平稳性检测

    千次阅读 多人点赞 2021-01-30 22:32:55
    时间序列的平稳性、随机性检验 在拿到时间序列数据后,首先要对数据的随机性和平稳性进行检测, 这两个检测是时间序列预测的重要部分。根据不同检测结果需要采取...对于非平稳序列, 由于它的均值和方差不稳定, 处理
  • 平稳时间序列分析

    千次阅读 2019-12-14 17:12:01
    协方差平稳时间序列的期望和方差是有限常数,协方差只跟时间间隔有关而不随时间变化。 含义:主要分布参数(一阶和二阶矩)在时间维度上具有稳定性。 平稳是指动态变化有规律可循,受到冲击衰减。 非平稳是指动态...
  • 因而对非平稳序列的分析更普遍、更重要,创造出来的分析方法也更多。对非平稳时间序列的分析方法可以分为确定性因素分解的时序分析和随机时序分析两大类。确定性因素分解的方法把所有序列的变化都归结为4个因素(长期...
  • 以下应用有什么共同点:预测未来三个月的一个家庭的电力消耗;估计在一定时期内道路的交通量;以及预测一个股票在纽约证券交易所上交易的...首先,如果我们希望预测模型工作得很好,使时间序列平稳是关键。为什么?...
  • Stationary Series 平稳序列平稳序列有三个基本标准:1、序列的均值(mean)不应该是时间的函数(意思是不应该随时间变化),而应该是一个常数。下面的左图满足这个条件,而右图的均值受时间的变化影响。2、序列的方差...
  • 时间序列是广泛存在的随机变量列,它以时间为指标,是一种特殊的随机过程。平稳序列时间序列中的一种特殊序列,最大的特征是具有平稳性,即均值不随时间而变化,协方差只与时间差有关。
  • 平稳序列虽然名称上平稳,但并不是平稳序列的子集,它描述了另一种平稳性——平移不变性。当宽平稳序列加上正态约束后,就成为严平稳序列;严平稳序列加上二阶矩约束后吗,就成为宽平稳序列
  • Stationary Series 平稳序列 平稳序列有三个基本标准: 1、序列的均值(mean)不应该是时间的函数(意思是不应该随时间变化),而应该是一个常数。下面的左图满足这个条件,而右图的均值受时间的变化影响。 2、序列的...
  • 介绍时间序列的概念,重点讨论平稳序列的统计性质。
  • 编辑:机器学习研习院时间序列的定义一个时间序列过程(time series process)定义为一个随机过程,这是一个按时间排序的随机变量的集合,也就是将每一个时刻位置的点作为一个随机变...
  • 时间序列平稳性检验方法汇总

    千次阅读 2022-03-22 00:12:04
    当我们有一个新的时间序列数据时,怎么判断它是否是平稳的呢?时间序列平稳性检验方法,可分为三类:图形分析方法简单统计方法假设检验方法一、图形分析方法图形分析方法是一种最基本、最简单直接的方法...
  • 本文介绍了给平稳时间序列建立ARMA模型的过程。步骤为平稳性检验→模型定阶→ARMA建模→模型预测→残差白噪声检验,用到的方法主要为statsmodels.api中的各种模块与函数。
  • 时间序列-平稳

    千次阅读 2019-02-19 17:07:31
     1.2 如果一个随机过程所产生的时间序列期望和方差在任何时间过程上都是常数,并且任何两个时期之间的协方差不依赖于这两个时期的距离或之后,而不依赖于计算这两个协方差的实际时间,就称改时间序列平稳的。...
  • 第三章 平稳时间序列 在这里要先知道什么是随机变量 随机变量:设E为一个随机现象,Ω\OmegaΩ是样本空间,即随机现象的所有可能结果,如果说对于每一个ω∈Ω\omega\in\Omegaω∈Ω,总有一个实值函数X(ω)X(\omega...
  • 它们都归属于时间序列数据的概念!如果没有“时间”成分,就无法准确地预测这些结果。随着我们周围的世界产生的数据越来越多,时间序列预测已成为数据科学家必须掌握的一项越来越关键的技术。然而,时间序列却是一个...
  • 本文将重点介绍时间序列数据的平稳性检验方法。简介预测一个家庭未来三个月的用电量,估计特定时期道路上的交通流量,预测一只股票在纽约证券交易所交易的价格……这些问题都有什么共同点?它们都属于时间序列数据的...
  • 2.5 平稳时间序列的定义(严平稳、宽平稳) 2.6 正态时间序列 2.7 平稳时间序列的统计性质 2.8 自相关系数的性质 2.9 平稳时间序列的意义 2.10 平稳性的重大意义 2.11 样本自协方差函数 2.12 平稳性的...
  • 我们知道平稳序列具有许多良好的统计特性, 是传统时间序列分析的基础. 然而, 在自然界中和经济、工程等应用领域中, 我们所面对的时间序列通常具有非平稳性. 此时, 最自然的想法是通过一些简单的预处理方法将非平稳...
  • 白噪声是最简单的平稳序列,它的基于时间的线性组合是怎样的时间序列?更广泛地将有限线性组合拓展到无限,又有什么样的约束条件?
  • 主要介绍了平稳时间序列的统计性质和检验方法。
  • 怎样理解时间序列的“平稳性”?

    万次阅读 多人点赞 2018-12-10 20:40:01
    1.时间序列数据(time-series data) ,亦即单一变量按时间的先后次序产生的数据。 2.截面数据(cross-sectional data) ,亦即多个变量在同一个时间点(截面空间)上产生的数据。 3.平行/面板数据(panel data/time...

空空如也

空空如也

1 2 3 4 5 ... 20
收藏数 3,767
精华内容 1,506
关键字:

平稳时间序列的方差