时间序列分析 订阅
时间序列分析(Time-Series Analysis)是指将原来的销售分解为四部分来看——趋势、周期、时期和不稳定因素, 然后综合这些因素, 提出销售预测。强调的是通过对一个区域进行一定时间段内的连续遥感观测,提取图像有关特征,并分析其变化过程与发展规模。当然,首先需要根据检测对象的时相变化特点来确定遥感监测的周期,从而选择合适的遥感数据。 [1] 展开全文
时间序列分析(Time-Series Analysis)是指将原来的销售分解为四部分来看——趋势、周期、时期和不稳定因素, 然后综合这些因素, 提出销售预测。强调的是通过对一个区域进行一定时间段内的连续遥感观测,提取图像有关特征,并分析其变化过程与发展规模。当然,首先需要根据检测对象的时相变化特点来确定遥感监测的周期,从而选择合适的遥感数据。 [1]
信息
应    用
统计分析
外文名
Time series analysis
分    类
确定性变化分析和随机性变化分析
中文名
时间序列分析
简    介
动态数据处理的统计方法
学    科
数学
时间序列分析基础知识
时间序列是按时间顺序的一组数字序列。 [2]  时间序列的特点:时间序列建模基本步骤是:
收起全文
精华内容
参与话题
问答
  • 时间序列分析和预测(含实例及代码)

    万次阅读 多人点赞 2018-09-17 21:37:34
    导论 研究时间序列主要目的:进行预测,根据已有的时间序列数据预测未来的变化。 时间序列预测关键:确定已有的时间序列的变化模式,并假定这种模式会延续到未来。...时间序列分析就其发展历史阶段和所使...

    导论

    研究时间序列主要目的:进行预测,根据已有的时间序列数据预测未来的变化。

    时间序列预测关键:确定已有的时间序列的变化模式,并假定这种模式会延续到未来。

    时间序列预测法的基本特点
    • 假设事物发展趋势会延伸到未来
    • 预测所依据的数据具有不规则性
    • 不考虑事物发展之间的因果关系

    时间序列数据用于描述现象随时间发展变化的特征

    时间序列分析就其发展历史阶段和所使用的统计分析方法看:传统的时间序列分析和现代时间序列分析

    一、时间序列及其分解

    时间序列(time series)是同一现象在不同时间上的相继观察值排列而成的序列。根据观察时间的不同,时间序列中的时间可以是可以是年份、季度、月份或其他任何时间形式。

    时间序列:

    (1)平稳序列(stationary series)

    是基本上不存在趋势的序列,序列中的各观察值基本上在某个固定的水平上波动,在不同时间段波动程度不同,但不存在某种规律,随机波动

    (2)非平稳序列(non-stationary series)

    是包含趋势、季节性或周期性的序列,只含有其中一种成分,也可能是几种成分的组合。可分为:有趋势序列、有趋势和季节性序列、几种成分混合而成的复合型序列。

    趋势(trend):时间序列在长时期内呈现出来的某种持续上升或持续下降的变动,也称长期趋势。时间序列中的趋势可以是线性和非线性。

    季节性(seasonality):季节变动(seasonal fluctuation),是时间序列在一年内重复出现的周期波动。销售旺季,销售淡季,旅游旺季、旅游淡季,因季节不同而发生变化。季节,不仅指一年中的四季,其实是指任何一种周期性的变化。含有季节成分的序列可能含有趋势,也可能不含有趋势。

    周期性(cyclicity):循环波动(cyclical fluctuation),是时间序列中呈现出来的围绕长期趋势的一种波浪形或振荡式波动。周期性是由商业和经济活动引起的,不同于趋势变动,不是朝着单一方向的持续运动,而是涨落相间的交替波动;不同于季节变动,季节变动有比较固定的规律,且变动周期大多为一年,循环波动则无固定规律,变动周期多在一年以上,且周期长短不一。周期性通常是由经济环境的变化引起。

    除此之外,还有偶然性因素对时间序列产生影响,致使时间序列呈现出某种随机波动。时间序列除去趋势、周期性和季节性后的偶然性波动,称为随机性(random),也称不规则波动(irregular variations)。

    时间序列的成分可分为4种:趋势(T)、季节性或季节变动(S)、周期性或循环波动(C)、随机性或不规则波动(I)。传统时间序列分析的一项主要内容就是把这些成分从时间序列中分离出来,并将它们之间的关系用一定的数学关系式予以表达,而后分别进行分析。按4种成分对时间序列的影响方式不同,时间序列可分解为多种模型:加法模型(additive model),乘法模型(multiplicative model)。乘法模型:Y_t=T_t\times S_t\times C_t\times I_t

    二、描述性分析

    1、图形描述

    2、增长率分析

    是对现象在不同时间的变化状况所做的描述。由于对比的基期不同,增长率有不同的计算方法。

    (1)增长率(growth rate):增长速度,是时间序列中报告期观察值与基期观察值之比减1后的结果,用%表示。由于对比的基期不同,可分为环比增长率和定基增长率。

    环比增长率:是报告期观察值与前一时期观察值之比减1,说明现象逐期增长变化的程度;

    定基增长率是报告期观察值与某一固定时期观察值之比减1,说明现象在整个观察期内总的增长变化程度。

    设增长率为G:          环比增长率 :G_i=\frac{Y_i-Y_{i-1}}{Y_{i-1}}=\frac{Y_i}{Y_{i-1}}-1,i=1,2...,n

                                           定基增长率 :G_i=\frac{Y_i-Y_{0}}{Y_{0}}=\frac{Y_i}{Y_{0}}-1,i=1,2...,n

    (2)平均增长率(average rate of increase):平均增长速度,是时间序列中逐期环比值(环比发展速度)的几何平均数减1的结果:\bar{G}=\sqrt[n]{\frac{Y_1}{Y_{0}}\times \frac{Y_2}{Y_{1}}...\times \frac{Y_n-Y_{n-1}}{Y_{i-1}}}-1=\sqrt[n]{\frac{Y_n-Y_{n-1}}{Y_{0}}}-1   n:环比值的个数

    (3)增长率分析中应注意的问题

    i:    当时间序列中的观察出现0或负数时,不宜计算增长率。这种序列计算增长率,要么不符合数学公理,要么无法解释其实际意义。可用绝对数进行分析。

    ii:    有些情况下,不能单纯就增长率论增长率,注意增长率与绝对水平结合起来。增长率是一个相对值,与对比的基数值的大小有关。这种情况,计算增长1%的绝对值来克服增长率分析的局限性:

    增长1%的绝对值表示增长率每增长一个百分点而增加的绝对数量:增长1%的绝对值=前期水平/100

    三、时间序列预测的程序

    时间序列分析的主要目的之一是根据已有的历史数据对未来进行预测。时间序列含有不同的成分,如趋势、季节性、周期性和随机性。对于一个具体的时间序列,它可能含有一种成分,也可能同时含有几种成分,含有不同成分的时间序列所用的预测方法是不同的。预测步骤:

    第一步:确定时间序列所包含的成分,确定时间序列的类型

    第二步:找出适合此类时间序列的预测方法

    第三步:对可能的预测方法进行评估,以确定最佳预测方案

    第四步:利用最佳预测方案进行预测

    1、确定时间序列成分

    (1)确定趋势成分

    确定趋势成分是否存在,可绘制时间序列的线图,看时间序列是否存在趋势,以及存在趋势是线性还是非线性。

    利用回归分析拟合一条趋势线,对回归系数进行显著性检验。回归系数显著,可得出线性趋势显著的结论。

    (2)确定季节成分

    确定季节成分是否存在,至少需要两年数据,且数据需要按季度、月份、周或天来记录。可绘图,年度折叠时间序列图(folded annual time series plot),需要将每年的数据分开画在图上,横轴只有一年的长度,每年的数据分别对应纵轴。如果时间序列只存在季节成分,年度折叠时间序列图中的折线将会有交叉;如果时间序列既含有季节成分又含有趋势,则年度折叠时间序列图中的折线将不会有交叉,若趋势上升,后面年度的折线将会高于前面年度的折线,若下降,则后面年度的折线将会低于前面年度的折线。

    2、选择预测方法

    确定时间序列类型后,选择适当的预测方法。利用时间数据进行预测,通常假定过去的变化趋势会延续到未来,这样就可以根据过去已有的形态或模式进行预测。时间序列的预测方法:传统方法:简单平均法、移动平均法、指数平滑法等,现代方法:Box-Jenkins 的自回归模型(ARMA)。

    一般来说,任何时间序列都会有不规则成分存在,在商务和管理数据中通常不考虑周期性,只考虑趋势成分和季节成分。

    不含趋势和季节成分的时间序列,即平稳时间序列只含随机成分,只要通过平滑可消除随机波动。因此,这类预测方法也称平滑预测方法。

    3、预测方法的评估

    在选择某种特定的方法进行预测时,需要评价该方法的预测效果或准确性。评价方法是找出预测值与实际值的差距,即预测误差。最优的预测方法就是预测误差达到最小的方法。

    预测误差计算方法:平均误差,平均绝对误差、均方误差、平均百分比误差、平均绝对百分比误差。方法的选择取决于预测者的目标、对方法的熟悉程度。

    (1)平均误差(mean error):Y:观测值,F:预测值,n预测值个数

                   ME=\frac{\sum_{i=1}^{n}(Y_i-F_i)}{n}     

    由于预测误差的数值可能有正有负,求和的结果就会相互抵消,这种情况下,平均误差可能会低估误差。

    (2)平均绝对误差(mean absolute deviation)是将预测误差取绝对值后计算的平均无擦,MAD:

                  MAD=\frac{\sum_{i=1}^{n}|Y_i-F_i|}{n}

    平均绝对误差可避免误差相互抵消的问题,因而可以准确反映实际预测误差的大小。

    (3)均方误差(mean square error):通过平方消去误差的正负号后计算的平均误差,MSE:

                MSE=\frac{\sum_{i=1}^{n}(Y_i-F_i)^2}{n}

    (4)平均百分比误差和平均绝对百分比误差

    ME,MAD,MSE的大小受时间序列数据的水平和计量单位的影响,有时并不能真正反映预测模型的好坏,只有在比较不同模型对同一数据的预测时才有意义。平均百分比误差(mean percentage error,MPE)和平均绝对百分比误差(mean absolute percentage error,MAPE)则不同,它们消除了时间序列数据的水平和计量单位的影响,是反映误差大小的相对值。

    MPE=\frac{\sum_{i=1}^{n}(\frac{Y_i-F_i}{Y_i}\times 100)}{n} 

    MAPE=\frac{\sum_{i=1}^{n}(\frac{|Y_i-F_i|}{Y_i}\times 100)}{n}

    4、平稳序列的预测

    平稳时间序列只含有随机成分,预测方法:简单平均法、移动平均法、指数平滑法。主要通过对时间序列进行平滑以消除随机波动,又称平滑法。平滑法可用于对时间序列进行短期预测,也可对时间序列进行平滑以描述序列的趋势(线性趋势和非线性趋势)。

    (1)简单平均法:根据已有的t期观察值通过简单平均法来预测下一期的数值。设时间序列已有的t期观察值为Y_1,Y_2,...,Y_t,则t+1期的预测值F_{t+1}为:F_{t+1}=\frac{1}{t}(Y_1+Y_2+...+Y_t)=\frac{1}{t}\sum_{i=1}^{t} Y_i

    到了t+1期后,有了t+1期的实际值,t+1期的预测误差e_{t+1}为:e_{t+1}=Y_{t+1}-F_{t+1}

    t+2期预测值:F_{t+2}=\frac{1}{t+1}(Y_1+Y_2+...+Y_t+Y_{t+1})=\frac{1}{t+1}\sum_{i=1}^{t+1} Y_i

    简单平均法适合对较为平稳的时间序列进行预测,即当时间序列没有趋势时,用该方法比较好。但如果时间序列有趋势或季节成分,该方法的预测则不够准确。简单平均法将远期的数值和近期的数值看作对未来同等重要。从预测角度,近期的数值比远期的数值对未来有更大的作用,因此简单平均法预测的结果不够准确。

    (2)移动平均法(moving average):通过对时间序列逐期递移求得平均数作为预测值的一种预测方法,有简单移动平均法(simple moving average)和加权移动平均法(weighted moving average).

    简单移动平均将最近k期数据加以平均,作为下一期的预测值。设移动平均间隔为k(1<k<t),则t期的移动平均值为:

    \bar{Y}_{t}=\frac{Y_{t-k+1}+Y_{t-k+2}+...+Y_{t-1}+Y_{t}}{k}  是对时间序列的平滑结果,通过这些平滑值可描述出时间序列的变化形态或趋势。也可以用来预测。

    t+1期的简单移动平均预测值为:F_{t+1}=\bar{Y}_{t}=\frac{Y_{t-k+1}+Y_{t-k+2}+...+Y_{t-1}+Y_{t}}{k}

    t+2期的简单移动平均预测值为:F_{t+2}=\bar{Y}_{t+1}=\frac{Y_{t-k+2}+Y_{t-k+3}+...+Y_{t}+Y_{t+1}}{k}

    移动平均法只使用最近k期的数据,在每次计算移动平均值时,移动的间隔都为k,也适合对较为平稳的时间序列进行预测。应用关键是确定合理的移动平均间隔k。对于同一个时间序列,采用不同的移动间隔,预测的准确性是不同的。可通过试验的方法,选择一个使均方误差达到最小的移动间隔。移动间隔小,能快速反映变化,但不能反映变化趋势;移动间隔大,能反映变化趋势,但预测值带有明显的滞后偏差。

    移动平均法的基本思想:移动平均可以消除或减少时间序列数据受偶然性因素干扰而产生的随机变动影响,适合短期预测。

    (3)指数平滑法(exponential smoothing)是通过对过去的观察值加权平均进行预测,使t+1期的预测值等t期的实际观察值与t期的预测值的加权的平均值。指数平滑法是从移动平均法发展而来,是一种改良的加权平均法,在不舍弃历史数据的前提下,对离预测期较近的历史数据给予较大权数,权数由近到远按指数规律递减,因此称指数平滑。指数平滑有一次指数平滑法、二次指数平滑法、三次指数平滑法等。

    一次指数平滑法也称单一指数平滑法(single exponential smoothing),只有一个平滑系数,且观察值离预测时期越久远,权数变得越小。一次指数平滑是将一段时期的预测值与观察值的线性组合作为t+1时期的预测值,预测模型为:

    F_{t+1}=\alpha Y_t+(1-\alpha )F_t      \alpha:平滑系数(0\leq \alpha\leq 1

    t+1期的数据是t期的实际观察值与t期的预测值的加权平均。1期的预测值=1期的观察值

    2期预测值:F_{2}=\alpha Y_1+(1-\alpha )F_1=\alpha Y_1+(1-\alpha )Y_1=Y_1

    3期预测值:F_{3}=\alpha Y_2+(1-\alpha )F_2=\alpha Y_2+(1-\alpha )Y_1

    4期预测值:F_{4}=\alpha Y_3+(1-\alpha )F_3=\alpha Y_3+\alpha (1-\alpha )Y_2+ (1-\alpha )^2Y_1

    对指数平滑法的预测精度,用均方误差来=衡量:

    F_{t+1}=\alpha Y_t+(1-\alpha )F_t

              =F_t+\alpha (Y_t-F_t)

    F_{t+1}是t期的预测值F_{t}加上用\alpha调整的t期预测误差(Y_t-F_t)。

    使用指数平滑法时, 关键问题是确定一个合适的平滑系数\alpha,不同的\alpha对预测结果产生不同的影响。

    \alpha=0,预测值仅仅是重复上一期的预测结果;\alpha=1,预测值就是上一期的实际值;

    \alpha越接近1,模型对时间序列变化的反应就越及时,因为它给当前的实际值赋予了比预测值更大的权数;

    \alpha越接近0,给当前的预测值赋予了更大的权数,模型对时间序列变化的反应就越慢。

    当时间序列有较大随机波动时,选较大\alpha,以便能很快跟上近期的变化;当时间序列比较平稳时,选较小\alpha

    实际应用中,需考虑预测误差,用均方误差衡量预测误差大小。确定\alpha时,可选择几个\alpha进行预测,然后找出预测误差最小的作为最后的\alpha值。

    与移动平均法一样,一次指数平滑法可用于对时间序列进行修匀,以消除随机波动,找出序列的变化趋势。

    用一次指数平滑法进行预测时,一般\alpha取值不大于0.5,若大于0.5,才能接近实际值,说明序列有某种趋势或波动过大。

    阻尼系数  \beta=1-\alpha ,阻尼系数越小,近期实际值对预测结果的影响越大,反之,越小。阻尼系数是根据时间序列的变化特性来选取。

    5、趋势型序列的预测

    时间序列的趋势可分为线性趋势和非线性趋势,若这种趋势能够延续到未来,就可利用趋势进行外推预测。有趋势序列的预测方法主要有线性趋势预测、非线性趋势预测和自回归模型预测。

    (1) 线性趋势预测

    线性趋势(linear trend)是指现象随着时间的推移而呈现稳定增长或下降的线性变化规律。

    趋势方程:\hat{Y}_t=b_0+b_1t     \hat{Y}_t:时间序列Y_t的预测值;b_1是趋势线斜率,表示时间t 变动一个单位,观察值的平均变动数量

    (2) 非线性趋势预测

    序列中的趋势通常可认为是由于某种固定因素作用同一方向所形成的。若这种因素随时间推移按线性变化,则可对时间序列拟合趋势直线;若呈现出某种非线性趋势(non-linear trend),则需要拟合适当的趋势曲线。

    i:   指数曲线(exponential curve):用于描述以几何级数递增或递减的现象,即时间序列的观察值Y_t按指数规律变化,或者时间序列的逐期观察值按一定的增长率增长或衰减。一般的自然增长及大多数经济序列都有指数变化趋势。

    趋势方程:\hat{Y}_t=b_0b_1^{t}     b_0,b_1为待定系数

    b_1>1,则增长率随着时间t的增加而增加;若b_1<1,则增长率随着时间t的增加而降低;若b_0>0,b_1<1,则预测值\hat{Y}_t逐渐降低以到0为极限。

    为确定b_0,b_1,可采用线性化手段将其化为对数直线形式,两端取对数:lg\hat{Y}_t=lgb_0+tlgb_1

    根据最小二乘原理,按直线形式的常数确定方法求得 lgb_0,lgb_1,求出 lgb_0,lgb_1后,再取其反对数,即可得到b_0,b_1

    \left\{\begin{matrix}\sum lgY=nlgb_0+lgb_1\sum t\\\sum t lgY_t=lgb_0\sum t+lgb_1\sum t^2\end{matrix}\right.

    ii:   多阶曲线:

    有些现象变化形态复杂,不是按照某种固定的形态变化,而是有升有降,在变化过程中可能有几个拐点。这时就需要拟合多项式函数。当只有一个拐点时,可拟合二项曲线,即抛物线;当有两个拐点时,需要拟合三阶曲线;有k-1个拐点时,需要拟合k阶曲线。

    6、复合型序列的分解预测

    复合型序列是指含有趋势、季节、周期和随机成分的序列。对这类序列的预测方法是将时间序列的各个因素依次分解出来,然后进行预测。由于周期成分的分析需要有多年的数据,实际中很难得到多年的数据,因此采用的分解模型为:Y_t=T_t\times S_t\times I_t

    预测方法有:季节性多元回归模型、季节自回归模型和时间序列分解法预测。

    分解法预测步骤:

    第一步:确定并分离季节成分。计算季节指数,以确定时间序列中的季节成分。然后将季节成分从时间序列中分离出去,即用每一个时间序列观察值除以相应的季节指数,以消除季节性。

    第二步:建立预测模型并进行预测。对消除了季节成分的时间序列建立适当的预测模型,并根据这一模型进行预测。

    第三步:计算最后的预测值。用预测值乘以相应的季节指数,得到最终的预测值。

    (1)确定并分离季节成分

    季节性因素分析是通过季节指数来表示各年的季节成分,以此描述各年的季节变动模式。

    i:  计算季节指数(seasonal index)

    季节指数刻画了序列在一个年度内各月或各季度的典型季节特征。在乘法模型中,季节指数以其平均数等于100%为条件而构成的,反映了某一月份或季度的数值占全年平均值的大小。若现象的发展没有季节变动,则各期的季节指数应等于100%;若某一月份或季度有明显的季节变化,则各期的季节指数应大于或小于100%。因此,季节变动的程度是根据各季节指数与其平均数(100%)的偏差程度来测定的。

    季节指数计算方法较多,移动平均趋势剔除法步骤:

    第一步:计算移动平均值(若是季节数据,采用4项移动平均,月份数据则采用12项移动平均),并对其结果进行中心化处理,即将移动平均的结果再进行一次二项移动平均,即得出中心化移动平均值(CMA)。

    第二步:计算移动平均的比值,即季节比率,即将序列的各观察值除以相应的中心化移动平均值,然后计算出各比值的季度或月份平均值。

    第三步:季节指数调整。由于各季节指数的平均数应应等于1或100%,若根据第二步计算的季节比率的平均值不等于1,则需要进行调整。具体方法:将第二步计算的每个季节比率的平均值除以它们的总平均值。

    ii:  分离季节成分

    计算出季节指数后,可将各实际观察值分别除以相应的季节指数,将季节成分从时间序列中分离出去:\frac{Y}{S}=\frac{T*S*I}{S}=T*I

    结果即为季节成分分离后的序列,反映了在没有季节因素影响下时间序列的变化形态。

    iii: 建立预测模型并进行预测

    7、时序案例分析

    https://blog.csdn.net/mengjizhiyou/article/details/104765862

     

    参考:贾俊平《统计学》第六版

    《统计学》pdf及课后答案:链接: https://pan.baidu.com/s/1dZPW0smz2cO-67zfn1BFyQ 提取码: ktxq 

    展开全文
  • 时间序列分析个人学习笔记1

    千次阅读 2018-09-02 11:27:50
    时间序列分析:最系统的方法就是,回答一些由时间相关性带来的数学上与统计上的问题。 时间序列分析的第一步:仔细观察数据,得出用于总结数据中所含信息的统计分析方法。 得出方法之前我们需要证明时间序列的分析...

    传统统计模型的劣势:假设这些与时间有关的临近的样本点之间的关系是独立同分布的

    时间序列分析:最系统的方法就是,回答一些由时间相关性带来的数学上与统计上的问题。

    时间序列分析的第一步:仔细观察数据,得出用于总结数据中所含信息的统计分析方法。

    得出方法之前我们需要证明时间序列的分析方法是存在的:时间域方法(time domain approach)和频率域方法(frequency domain approach)。
    时间域方法看中对关系的研究,比如今天发生的事对明天发生的事有着怎样的影响?
    频率域方法看中对周期的研究,比如说某个经济周期是怎么扩张或者缩减的?

    例1,Johnson & Johnson 银行的每季度获利数据表

    install.packages(“astsa”)//安装astsa的包
    library(astsa)
    plot(jj, type=”o”, ylab=”Quarterly Earnings per Share”)

    图1
    数据的特点:呈增长的趋势并叠加一些常规的变化。
    这个特点在周期内重复。

    例2 全球变暖
    图2
    对于这一组数据我们更关心变化趋势而不是周期性。

    例3 语音数据
    一段语音数据中每一秒10000数据对于音节aaaa….hhhh的纪录
    图3

    例4 Dow Jones Industrial Average
    图4
    虽然数据显示平均值为0,但是高度不稳定的数据成群体出现,我们希望分析数据预测将来的变化,模型ARCH和GARCH,还有stochastic volatility 模型都是 去处理这个问题的。

    例5 鱼的数量与氧含量
    两组数据一组为鱼的数量,一组为海洋表面含氧量,显然两组数据是有关系的,transfer function 模型就是用于此种情况。
    图5

    例6 核磁共振影像

    测试大脑的五个部分对于同一刺激(刷子刷手)的反应,五部分相互独立,分析方法是由传统统计方法发展而来的。
    图是皮质(cortex)和丘脑(thalamus)&小脑(cerebellum)受到刺激时的血压变化图。
    图6

    例7 地震和爆炸
    图7
    图代表了地震&爆炸之后的两个阶段,希望区分地震和爆炸的波形,比较重要的一个特点就是第一阶段振幅和第二阶段振幅的比率,地震和爆炸是不同的。我们可以用谱分析来测定地震和爆炸的相同周期成分的不同,同时我们还希望对于未知源头的爆炸或者地震预测前后两个阶段的等级,这些都需要time series discriminant分析.

    时间序列的本质就是去发展一个数学模型对样本数据提供貌似真实的描述。
    时间序列定义:由时间索引的随机变量的集合
    时间序列就是一个随机变量列x1,x2,,xn,其中x1代表第一个时间点的值,以此类推。

    例子8 White Noise
    WtWN(0,σw2)
    三个特点:独立同分布(iid);平均值为0(常数);方差为常数。
    特殊情况:Gaussian white noise,所有随机变量为独立正态分布。
    WN来源于对于对于白光的模仿,一些可能的周期性扰动与WN表现出相同的特点。

    例9 Moving Averages and Filtering(过滤)
    Moving Average and Filtering 是wn的线性组合,用来过滤掉一些扰动。
    WtWN(0,σ2)
    Vt=13Wt1+13Wt+13Wt+1
    对比white noise,慢的扰动显现出来了,快的扰动被筛除了。
    下面的图更像例5中的SOI:
    图9

    例10 Autoregression(Self-regression)
    核磁共振影像、鱼的新增数量曲线、语音数据的曲线显然不是Moving Average and Filtering,有一个扰动必然是占支配地位,表现出正弦曲线的特征.
    Xt是Autoregression
    X1=Wt
    Xt=Xt10.9Xt2+Wt
    周期性是最大的特点,t时间的值在之后还会出现,是为“回归”。
    但是如果假设
    X0=0
    是不满足Autoregression的(?),但是当t足够大的时候,是近似于Autoregression的。
    图10

    例11 Random Walk with Drift
    Always return;
    赌博中常用到;
    例2中的全球温度;
    Xt为Random Walk with Drift:
    Xt=σ+Xt1+Wt σ是常数,是Drift,σ为0的时候叫做Random Walk;
    Wt为WN;
    X0=0
    进一步,可以推出:
    Xt=σt+j=1tWj
    我们可以发现当sigma为0的时候,t时刻的值就是t-1时刻的值加上一个完全随机的wn.
    t时间的值是上一个时间的值加上一个微小的扰动。
    图11

    例12 Signal in Noise
    许多现实中的时间序列都可以看成是一个潜在的有固定周期变化的信号被一个随机的噪音污染,比如例6的核磁共振影像就能清楚的看到周期。
    Xt是Signal in Noise:
    Xt=Acos(2πwt+ϕ)+Wt
    A是振幅,w是扰动的频率,ϕ是相位移动;
    SNR=Aσw;
    SNR越大越容易检测到信号,图中中间的那个最容易识别,最低下的最不容易识别:
    图12

    展开全文
  • (十一)时间序列分析和预测 时间序列数据用于描述现象随时间发展变化的特征。 时间序列(times series)是同一现象在不同时间的相继观察值排列而形成的序列。经济数据大多数以时间序列的形式给出。 时间序列及其...

    (十二)时间序列分析和预测

    时间序列数据用于描述现象随时间发展变化的特征。

    时间序列(times series)是同一现象在不同时间的相继观察值排列而形成的序列。经济数据大多数以时间序列的形式给出。

    时间序列及其分解

    时间序列可以分为平稳序列和非平稳序列两大类。

    平稳序列是基本上不存在趋势的序列。这类序列中的各观察值基本上在某个固定的水平上波动,虽然在不同的时间段波动的程度不同,但并不存在某种规律,波动可以看成是随机的,如图所示:

    非平稳序列(non-stationary series)是包含趋势、季节性或周期性的序列,它可能只含有其中一种成分,也可能含有几种成分。因此非平稳序列又可以分为有趋势的序列、有趋势和季节性的序列、几种成分混合而成的复合型序列。

    趋势(Trend):是时间序列在长期内呈现出来的某种持续上升或持续下降的变动,也称长期趋势。时间序列中的趋势可以是线性的,也可以是非线性的。

    季节性(seasonality)也称季节变动(seasonal fluctuation),它是时间序列在一年内重复出现的周期性波动。例如:在商业活动中,常常听到的“销售旺季”或“销售淡季”这类术语。其本质上指的是一种周期性的变化。

    含有季节成分的序列可能含有趋势,也可能不含有趋势。

    周期性(cyclicity)也称循环波动(cyclical fluctuation),是时间序列中呈现出来的围绕长期趋势的一种波浪形或震荡式变动。周期性通常是由商业和经济活动引起的,它不同于趋势变动,不是朝着单一方向的持续运动,而是涨落相同的交替波动;它也不同于季节变动,季节变动有比较固定的规律,而且变动周期大多为一年,循环波动则无固定规律,变动周期多在一年以上,且周期长短不一。周期性通常是由经济环境的变化引起的。

    除此之外,还有些偶然性因素对时间序列产生影响,致使时间序列呈现出某种随机波动。时间序列中除去趋势、周期性和季节性之后的偶然性波动称为随机性(randomness),也称不规则波动(irregular variations)。 

    时间序列的成分可以分为四种:趋势(T)、季节性或季节变动(S)、周期性或循环波动(C)、随机性或不规则波动(I)。

    构成要素:长期趋势,季节变动,循环变动,不规则变动。
    1)长期趋势( T )现象在较长时期内受某种根本性因素作用而形成的总的变动趋势。
    2)季节变动( S )现象在一年内随着季节的变化而发生的有规律的周期性变动。
    3)循环变动( C )现象以若干年为周期所呈现出的波浪起伏形态的有规律的变动。
    4)不规则变动(I )是一种无规律可循的变动,包括严格的随机变动和不规则的突发性影响很大的变动两种类型。


    时间序列类型

    绝对数时间序列


    时期序列:由时期总量指标排列而成的时间序列 。
    时期序列的主要特点有:
    1)序列中的指标数值具有可加性。
    2)序列中每个指标数值的大小与其所反映的时期长短有直接联系。
    3)序列中每个指标数值通常是通过连续不断登记汇总取得的。


    时点序列:由时点总量指标排列而成的时间序列
    时点序列的主要特点有:
    1)序列中的指标数值不具可加性。
    2)序列中每个指标数值的大小与其间隔时间的长短没有直接联系。
    3)序列中每个指标数值通常是通过定期的一次登记取得的。

    相对数时间序列

    把一系列同种相对数指标按时间先后顺序排列而成的时间序列叫做相对数时间序列。


    平均数时间序列

    平均数时间序列是指由一系列同类平均指标按时间先后顺序排列的时间序列。

    编制时间序列数据时需要注意的问题

    保证序列中各期指标数值的可比性

    • 时期长短最好一致
    • 总体范围应该一致
    • 指标的经济内容应该统一
    • 计算方法应该统一
    • 计算价格和计量单位可比

     


    增长率分析

    是对现象在不同时间的变化状况所做的描述。由于对比的基期不同,增长率有不同的计算方法。

    (1)增长率(growth rate):增长速度,是时间序列中报告期观察值与基期观察值之比减1后的结果,用%表示。由于对比的基期不同,可分为环比增长率和定基增长率。

    环比增长率:是报告期观察值与前一时期观察值之比减1,说明现象逐期增长变化的程度;

    定基增长率是报告期观察值与某一固定时期观察值之比减1,说明现象在整个观察期内总的增长变化程度。

    设增长率为G:          环比增长率 :

     

                                       定基增长率 :

     

    (2)平均增长率(average rate of increase):平均增长速度,是时间序列中逐期环比值(环比发展速度)的几何平均数减1的结果:

       n:环比值的个数

    (3)增长率分析中应注意的问题

    • 当时间序列中的观察出现0或负数时,不宜计算增长率。这种序列计算增长率,要么不符合数学公理,要么无法解释其实际意义。可用绝对数进行分析。
    • 有些情况下,不能单纯就增长率论增长率,注意增长率与绝对水平结合起来。增长率是一个相对值,与对比的基数值的大小有关。这种情况,计算增长1%的绝对值来克服增长率分析的局限性:增长1%的绝对值表示增长率每增长一个百分点而增加的绝对数量:增长1%的绝对值=前期水平/100

    时间序列预测的程序

    时间序列分析的主要目的之一是根据已有的历史数据对未来进行预测。时间序列含有不同的成分,如趋势、季节性、周期性和随机性。对于一个具体的时间序列,它可能含有一种成分,也可能同时含有几种成分,含有不同成分的时间序列所用的预测方法是不同的。

    预测步骤:

    第一步:确定时间序列所包含的成分,确定时间序列的类型

    第二步:找出适合此类时间序列的预测方法

    第三步:对可能的预测方法进行评估,以确定最佳预测方案

    第四步:利用最佳预测方案进行预测

    1、确定时间序列成分

    (1)确定趋势成分

    确定趋势成分是否存在,可绘制时间序列的线图,看时间序列是否存在趋势,以及存在趋势是线性还是非线性。

    利用回归分析拟合一条趋势线,对回归系数进行显著性检验。回归系数显著,可得出线性趋势显著的结论。

    (2)确定季节成分

    确定季节成分是否存在,至少需要两年数据,且数据需要按季度、月份、周或天来记录。可绘图,年度折叠时间序列图(folded annual time series plot),需要将每年的数据分开画在图上,横轴只有一年的长度,每年的数据分别对应纵轴。如果时间序列只存在季节成分,年度折叠时间序列图中的折线将会有交叉;如果时间序列既含有季节成分又含有趋势,则年度折叠时间序列图中的折线将不会有交叉,若趋势上升,后面年度的折线将会高于前面年度的折线,若下降,则后面年度的折线将会低于前面年度的折线。

    2、选择预测方法
    确定时间序列类型后,选择适当的预测方法。利用时间数据进行预测,通常假定过去的变化趋势会延续到未来,这样就可以根据过去已有的形态或模式进行预测。时间序列的预测方法:传统方法:简单平均法、移动平均法、指数平滑法等,现代方法:Box-Jenkins 的自回归模型(ARMA)。

    一般来说,任何时间序列都会有不规则成分存在,在商务和管理数据中通常不考虑周期性,只考虑趋势成分和季节成分。

    不含趋势和季节成分的时间序列,即平稳时间序列只含随机成分,只要通过平滑可消除随机波动。因此,这类预测方法也称平滑预测方法。

    3、预测方法的评估
    在选择某种特定的方法进行预测时,需要评价该方法的预测效果或准确性。评价方法是找出预测值与实际值的差距,即预测误差。最优的预测方法就是预测误差达到最小的方法。

    预测误差计算方法:平均误差,平均绝对误差、均方误差、平均百分比误差、平均绝对百分比误差。方法的选择取决于预测者的目标、对方法的熟悉程度。

    (1)平均误差(mean error):Y:观测值,F:预测值,n预测值个数

                  

    由于预测误差的数值可能有正有负,求和的结果就会相互抵消,这种情况下,平均误差可能会低估误差。

    (2)平均绝对误差(mean absolute deviation)是将预测误差取绝对值后计算的平均无擦,MAD:

            

    平均绝对误差可避免误差相互抵消的问题,因而可以准确反映实际预测误差的大小。

    (3)均方误差(mean square error):通过平方消去误差的正负号后计算的平均误差,MSE:

         

    (4)平均百分比误差和平均绝对百分比误差

    ME,MAD,MSE的大小受时间序列数据的水平和计量单位的影响,有时并不能真正反映预测模型的好坏,只有在比较不同模型对同一数据的预测时才有意义。平均百分比误差(mean percentage error,MPE)和平均绝对百分比误差(mean absolute percentage error,MAPE)则不同,它们消除了时间序列数据的水平和计量单位的影响,是反映误差大小的相对值。

     

     

    平稳序列的预测

    平稳时间序列只含有随机成分,预测方法:简单平均法、移动平均法、指数平滑法。

    主要通过对时间序列进行平滑以消除随机波动,又称平滑法。平滑法可用于对时间序列进行短期预测,也可对时间序列进行平滑以描述序列的趋势(线性趋势和非线性趋势)。

    (1)简单平均法:根据已有的t期观察值通过简单平均法来预测下一期的数值。设时间序列已有的t期观察值为

    ,则t+1期的预测值为:

    到了t+1期后,有了t+1期的实际值,t+1期的预测误差为:e_{t+1}=Y_{t+1}-F_{t+1}

     

    t+2期预测值:

    简单平均法适合对较为平稳的时间序列进行预测,即当时间序列没有趋势时,用该方法比较好。但如果时间序列有趋势或季节成分,该方法的预测则不够准确。简单平均法将远期的数值和近期的数值看作对未来同等重要。从预测角度,近期的数值比远期的数值对未来有更大的作用,因此简单平均法预测的结果不够准确。

    (2)移动平均法(moving average):通过对时间序列逐期递移求得平均数作为预测值的一种预测方法,有简单移动平均法(simple moving average)和加权移动平均法(weighted moving average).

    简单移动平均将最近k期数据加以平均,作为下一期的预测值。设移动平均间隔为k(1<k<t),则t期的移动平均值为:

    是对时间序列的平滑结果,通过这些平滑值可描述出时间序列的变化形态或趋势。也可以用来预测。

    t+1期的简单移动平均预测值为:

    t+2期的简单移动平均预测值为:

    移动平均法只使用最近k期的数据,在每次计算移动平均值时,移动的间隔都为k,也适合对较为平稳的时间序列进行预测。应用关键是确定合理的移动平均间隔k。对于同一个时间序列,采用不同的移动间隔,预测的准确性是不同的。可通过试验的方法,选择一个使均方误差达到最小的移动间隔。移动间隔小,能快速反映变化,但不能反映变化趋势;移动间隔大,能反映变化趋势,但预测值带有明显的滞后偏差。

    移动平均法的基本思想:移动平均可以消除或减少时间序列数据受偶然性因素干扰而产生的随机变动影响,适合短期预测。

    (3)指数平滑法(exponential smoothing)是通过对过去的观察值加权平均进行预测,使t+1期的预测值等t期的实际观察值与t期的预测值的加权的平均值。指数平滑法是从移动平均法发展而来,是一种改良的加权平均法,在不舍弃历史数据的前提下,对离预测期较近的历史数据给予较大权数,权数由近到远按指数规律递减,因此称指数平滑。指数平滑有一次指数平滑法、二次指数平滑法、三次指数平滑法等。

    一次指数平滑法也称单一指数平滑法(single exponential smoothing),只有一个平滑系数,且观察值离预测时期越久远,权数变得越小。一次指数平滑是将一段时期的预测值与观察值的线性组合作为t+1时期的预测值,预测模型为:F_{t+1}=\alpha Y_t+(1-\alpha )F_t      \alpha:平滑系数(0\leq \alpha\leq 1

    t+1期的数据是t期的实际观察值与t期的预测值的加权平均。1期的预测值=1期的观察值

    2期预测值:F_{2}=\alpha Y_1+(1-\alpha )F_1=\alpha Y_1+(1-\alpha )Y_1=Y_1

    3期预测值:F_{3}=\alpha Y_2+(1-\alpha )F_2=\alpha Y_2+(1-\alpha )Y_1

    4期预测值:F_{4}=\alpha Y_3+(1-\alpha )F_3=\alpha Y_3+\alpha (1-\alpha )Y_2+ (1-\alpha )^2Y_1

    对指数平滑法的预测精度,用均方误差来=衡量:

    F_{t+1}=\alpha Y_t+(1-\alpha )F_t

              =F_t+\alpha (Y_t-F_t)

    是t期的预测值加上用调整的t期预测误差(Y_t-F_t)。

    使用指数平滑法时, 关键问题是确定一个合适的平滑系数\alpha,不同\alpha的对预测结果产生不同的影响。

    \alpha=0,预测值仅仅是重复上一期的预测结果;\alpha=1,预测值就是上一期的实际值;

    \alpha越接近1,模型对时间序列变化的反应就越及时,因为它给当前的实际值赋予了比预测值更大的权数;

    \alpha越接近0,给当前的预测值赋予了更大的权数,模型对时间序列变化的反应就越慢。

    当时间序列有较大随机波动时,选较大\alpha,以便能很快跟上近期的变化;当时间序列比较平稳时,选较小\alpha

    实际应用中,需考虑预测误差,用均方误差衡量预测误差大小。确定时,可选择几个\alpha进行预测,然后找出预测误差最小的作为最后的\alpha值。

    与移动平均法一样,一次指数平滑法可用于对时间序列进行修匀,以消除随机波动,找出序列的变化趋势。

    用一次指数平滑法进行预测时,一般取值不大于0.5,若大于0.5,才能接近实际值,说明序列有某种趋势或波动过大。

    阻尼系数 \beta=1-\alpha  ,阻尼系数越小,近期实际值对预测结果的影响越大,反之,越小。阻尼系数是根据时间序列的变化特性来选取。

    指数平滑法

    指数平滑法实际上是一种特殊的加权移动平均法。

    其特点是:

    第一,指数平滑法进一步加强了观察期近期观察值对预测值的作用,对不同时间的观察值所赋予的权数不等,从而加大了近期观察值的权数,使预测值能够迅速反映市场实际的变化。权数之间按等比级数减少,此级数之首项为平滑常数a,公比为(1- a)。

    第二,指数平滑法对于观察值所赋予的权数有伸缩性,可以取不同的a 值以改变权数的变化速率。如a取小值,则权数变化较迅速,观察值的新近变化趋势较能迅速反映于指数移动平均值中。因此,运用指数平滑法,可以选择不同的a 值来调节时间序列观察值的均匀程度(即趋势变化的平稳程度)。

    据平滑次数不同,指数平滑法分为:一次指数平滑法、二次指数平滑法和三次指数平滑法等。


    趋势型序列的预测

    趋势预测分析法亦称时间序列预测分析法,是根据事业发展的连续性原理,应用数理统计方法将过去的历史资料按时间顺序排列,然后再运用一定的数字模型来预计、推测计划期产(销)量或产(销)额的一种预测方法。
    由于趋势测计划期间的销售数量或销售金额预测分析法所采取的数学方法不同,又可分为:

    • 算术平均法。以过去若干时期的销售量(或销售金额)的算术平均数作为计划期的销售预测数。这一方法的优点是计算简单,但由于取的是平均值,因而是比较粗糙的,测出的预计数量与实际数量会发生较大的误差,所以这种方法只适用于销售量比较稳定的产品,如没有季节性的食品、日用品等。
    • 移动加权平均法。是根据过去若干时间的销售量(或销售金额)按其距计划期的远近分别进行加权(近期所加权数大些,远期所加权数小些;然后计算其加权平均数,作为计划期的销售预测数。所谓“移动”是对计算平均数的讨期不断往后推移。
    • 指数平滑法。在预则计划期销售量(或销售金额)时,导入平滑系数(或称加权因子)进行计算。指数平滑法与移动加权平均法实质上是近似的,其优点是可以排除在实际销售中所包含的偶然因素的影响。但确定平滑指数的值还带着一定的主观成分。平滑系数越大,则近期实际数对预测结果的影响越大,反之则小。所以采用较小的平滑系数,使此法的平均数能反映观察值变动的长期趋势;也可以采用较的平滑系数,使此法的平均数能反映观察值丘期的变动趋势,以便进行近期的销售预测,

     


    复合型序列的分解预测

    复合型序列是指含有趋势、季节、周期和随机成分的序列。

    这类序列的预测方法通常是将时间序列的各个因素依次分解出来,然后进行预测。

    由于周期成分的分析需要有多年的数据,实际中很难得到多年的数据,因此采用的分解模型为:

    \large Y_{t} = T_{t}\times S_{t} \times I_{t}

    这一模型表示该时间序列中含有趋势成分、季节成分和随机成分。

    这类序列的预测方法主要有季节性多元回归模型、季节自回归模型和时间序列分解法预测等。

    分解法预测通常按下面的步骤进行:

    第1步:确定并分离季节成分。

    第2步:建立预测模型并进行预测。

    第3步:计算最后的预测值。

                 用预测值乘以相应的季节指数,得到最终的预测值。

    季节指数(seasonal index)刻画了序列在一个年度内各月或各季节的典型季节特征。

    季节指数的计算方法有多种,例如平均趋势剔除法。

    “移动平均趋势剔除法”来测定季节变动趋势。其基本步骤如下:

    第一,先根据各年的季度(或月度)资料(Y)计算四季(或12个月)的移动平均数,然后为了“正位”,再计算二季(月)移动平均数,作为各期的长期趋势值(T)。

    第二,将实际数值(Y)除以相应的移动平均数(T),得到各期的Y/T。这就是消除了长期趋势影响的时间数列,它是一个相对数,称为季节指数。其结果为表中第四列数值。

    第三,将Y/T重新按“同期平均法”计算季节比率的方式排列。然后,按照该方法要求,先计算“异年同季平均数”,然后再计算“异年同季平均数的平均数”,即消除长期趋势变动后,新数列的序时平均数;最后,计算季节比率并画图显示。


    季节波动

    季节波动是指某些社会现象由于受到社会因素和自然因素的影响,在一年之内随着季节的更替而呈现的有规律性的周期性波动。在一年之内,由于季节的变动,会使某些社会经济现象(一定的时间序列)产生规律性的变化,这种规律性变化通常称之为季节波动。如食品、服装、某些季节性特点很强的产品或商品等,它们的生产和消费都随季节的变换而呈现周期性的波动,出现“旺季”和“淡季”。

    季节波动具有三个明显的特征:
    (1)季节波动有一定的规律性和周期性;
    (2)季节波动每年重复出现,具有重复性;
    (3)季节波动的波动轨迹具有相似性。 

    测定季节波动的方法很多,常用的两种方法为:同期平均法和趋势剔除法。 
    同期平均法
    这种方法是测定季节波动最简便的方法。它是以若干年资料数据求出同月(季)的平均水平与全年总月(季)水平,二者对比得出各月(季)的季节指数来表明季节波动的程度。按月平均法可以分为直接按(季)月平均法和比率按月平均法两种。  


    1、直接按月平均法
    直接按月(季)平均法将整个时问序列的趋势值视为常数。计算步骤如下:
    (1)计算各年同月(季)的平均数;
    (2)计算各年所有月份(或季度)的总平均数;
    (3)计算季节指数。 [4] 
    2、比例按月(季)平均法
    这种方法是在按月(季)平均之前,先将历年各月(季)的数据同其本年的月(季)平均数相比,得出说明该年度的季节比率;然后再将各年度同期(月或季)的比率进行平均,求出季节指数。 


    移动平均趋势剔除法
    在具有明显的长期趋势变动的数列中,为了测定季节波动,必须先将趋势变动因素加以剔除。假定趋势变动、季节波动、循环波动和不规则变动对时间序列影响可以用乘法模型反映,用移动平均趋势剔除法测定季节波动的步骤如下:
    (1)对原时间序列求移动平均数,作为相应时期的趋势值。
    (2)剔除原数列中的趋势变动,即将原数列各项除以移动平均数的对应时间数据。
    (3)以消除趋势变动后的数列计算季节指数,测定季节波动。 

     

    展开全文
  • 使用R语言进行时间序列分析

    万次阅读 多人点赞 2018-04-08 10:50:32
    一、时间序列的定义 时间序列是将统一统计值按照时间发生的先后顺序来进行排列,时间序列分析的主要目的是根据已有数据对未来进行预测。一个稳定的时间序列中常常包含两个部分,那么就是:有规律的时间序列+噪声。...

    一、时间序列的定义 

    时间序列是将统一统计值按照时间发生的先后顺序来进行排列,时间序列分析的主要目的是根据已有数据对未来进行预测。

    一个稳定的时间序列中常常包含两个部分,那么就是:有规律的时间序列+噪声。所以,在以下的方法中,主要的目的就是去过滤噪声值,让我们的时间序列更加的有分析意义。

    二、时间序列的预处理

    1、平稳性检验:

    拿到一个时间序列之后,我们首先要对其稳定性进行判断,只有非白噪声的稳定性时间序列才有分析的意义以及预测未来数据的价值。

    所谓平稳,是指统计值在一个常数上下波动并且波动范围是有界限的。如果有明显的趋势或者周期性,那么就是不稳定的。一般判断有三种方法:

    • 画出时间序列的趋势图,看趋势判断
    • 画自相关图和偏相关图,平稳时间序列的自相关图和偏相关图,要么拖尾,要么截尾。
    • (关于拖尾截尾的概念:https://blog.csdn.net/xianyuhenxian/article/details/60602828)
    • 检验序列中是否存在单位根,如果存在单位根,就是非平稳时间序列。
    • (关于单位根检验:http://bbs.pinggu.org/thread-2412454-1-1.html)

    在R语言中,DF检测是一种检测稳定性的方法,如果得出的P值小于临界值,则认为是数列是稳定的。

    2、白噪声检验

    白噪声序列,又称为纯随机性序列,序列的各个值之间没有任何的相关关系,序列在进行无序的随机波动,可以终止对该序列的分析,因为从白噪声序列中是提取不到任何有价值的信息的。

    3、平稳时间序列的参数特点

    均值和方差为常数,并且具有与时间无关的自协方差。

    三、时间序列建模步骤

    • 拿到被分析的时间序列数据集。
    • 对数据绘图,观测其平稳性。若为非平稳时间序列要先进行d阶差分运算后化为平稳时间序列,此处的d即为ARIMA(p,d,q)模型中的d;若为平稳序列,则用ARMA(p,q)模型。所以ARIMA(p,d,q) 模型区别于ARMA(p,q)之处就在于前者的自回归部分的特征多项式含有d个单位根。 
    • 对得到的平稳时间序列分别求得其自相关系数ACF 和偏自相关系数PACF,通过对自相关图和偏自相关图的分析,得到最佳的阶层 p 和阶数 q。由以上得到的d、q、p ,得到ARIMA模型。 
    • 模型诊断。进行诊断分析,以证实所得模型确实与所观察到的数据特征相符。若不相符,重新回到第(3)步。

    四、自回归综合移动平均模型ARIMA

    首先我们先了解AR(自回归模型)和MA(移动平均模型)

    AR(自回归模型):当存在xt = fxt-1 fxt-2 + ..+fp xt-p+ut .时,其中ut是白噪声过程,则这个线性过程成为p阶自回归过程。

    一般我们常用的即为1阶以及2阶自回归即:xt = fxt-1 ut,xt = fxt-1 fxt-2 ut。

    自回归模型平稳必要非充分条件为所有系数相加<1

    MA(移动平均模型):移动平均即将时间序列中的若干项进行算术平均得到的一系列平均数,若平均的数据项数为k,则成为k期的平均移动。相应的,还有加权平均移动法,即将特定期数的值进行加权计算平均值。

    ARMA(自回归移动平均模型):

    自回归滑动平均模型(ARMA)
    如果时间序列Yt满足:
    则称时间序列为服从(p,q)阶自回归滑动平均混合模型。或者记为φ(B)
    (摘自百度百科,MA的体现形式有所出入,请仔细体会)

    ARIMA(自回归差分移动平均模型):

    有了以上基础之后,我们便很容易理解ARIMA模型了。

    前边我们提到,非稳定性模型可以通过差分的方式使之平稳化,而ARIMA即在参数中比ARMA多了一个差分过程,如果ARMA的公式为ARMA(P,Q),那么ARIMA即为ARIMA(P,D,Q)这里的d即为差分的意思,代表是几阶差分。

    五、指数平滑法

      基本原理:指数平滑法是移动平均法中的一种,其特点在于给过去的观测值不一样的权重,即较近期观测值的权数比较远期观测值的权数要大。根据平滑次数不同,指数平滑法分为一次指数平滑法、二次指数平滑法和三次指数平滑法等。但它们的基本思想都是:预测值是以前观测值的加权和,且对不同的数据给予不同的权数,新数据给予较大的权数,旧数据给予较小的权数。
           方法应用:指数平滑法是生产预测中常用的一种方法。也用于中短期经济发展趋势预测,所有预测方法中,指数平滑是用得最多的一种。
    指数平滑法的基本公式:St=a*yt+(1-a)*St-1 式中,
      St--时间t的平滑值;
      yt--时间t的实际值;
      St-1--时间t-1的平滑值;
      a--平滑常数,其取值范围为[0,1]

    据平滑次数不同,指数平滑法分为:一次指数平滑法、二次指数平滑和三次指数平滑法等。

    具体可以参考:https://blog.csdn.net/u013527419/article/details/52822622

    六、R语言中实现案例

    #时间序列相关案例
    
    #ts方法构建时间序列介绍
    a<-ts(1:30,frequency = 12,start = c(2011,3))
    print(a)
    # > print(a)
    # Jan Feb Mar Apr May Jun Jul Aug Sep Oct Nov Dec
    # 2011           1   2   3   4   5   6   7   8   9  10
    # 2012  11  12  13  14  15  16  17  18  19  20  21  22
    # 2013  23  24  25  26  27  28  29  30   
    str(a)
    attributes(a)
    
    #在ts函数的参数中,1:30代以1-30为基础建立30个时间序列值,frequence=7代表以周循环,=12代表以月循环,=4代表以季度循环
    #start 代表起始的日期
    
    #将时间序列拆分成趋势成分、季节成分、随机成分
    #所谓的趋势成分是指长时间间隔的大体运动方向,季节成分是指季节性的变化,随机成分是指重复但非周期的波动,最终是随机成分
    #R自带的AirPassengers中很好演示了时间序列
    plot(AirPassengers)
    install.packages("tseries")
    install.packages("forecast")
    library(tseries)
    library(forecast)
    #同样可以使用tsdisplay函数显示ACF和PACF图,用来确定arima函数的参数
    tsdisplay(AirPassengers)
    #使用decompose()函数将其拆分为不同成分
    dc<-decompose(AirPassengers)
    
    #打印出四种趋势图
    plot(dc)


    #打印出关于季节性趋势的图表
    season<-dc$figure
    plot(season,type = "b",xaxt="n",xlab = "")
    #构建arima模型,我们首先使用forcast包里的auto.arima进行参数估计,然后再使用arima
    a<-auto.arima(AirPassengers)
    print(a)
    # > print(a)
    # Series: AirPassengers 
    # ARIMA(2,1,1)(0,1,0)[12] 
    # 
    # Coefficients:
    #   ar1     ar2      ma1
    # 0.5960  0.2143  -0.9819
    # s.e.  0.0888  0.0880   0.0292
    # 
    # sigma^2 estimated as 132.3:  log likelihood=-504.92
    # AIC=1017.85   AICc=1018.17   BIC=1029.35
    
    
    fit<-arima(AirPassengers,order = c(2,1,1),seasonal = list(order=c(0,1,0),period=12))
    print(fit)
    fore=predict(fit,n.head=24)
    U<-fore$pred+2*fore$se
    L<-fore$pred-2*fore$se
    ts.plot(AirPassengers,fore$pred,U,L,col=c(1,2,4,4),lty=c(1,1,2,2))
    install.packages("urca")
    library(urca)
    ur.df(AirPassengers)
    
    # ############################################################### 
    # # Augmented Dickey-Fuller Test Unit Root / Cointegration Test # 
    # ############################################################### 
    # 
    # The value of the test statistic is: -0.3524 
    -0.3524小于5%的小概率时间,所以是稳定的?

    本案例中最终预测曲线没有画出上下界,尚未找到原因。

    另外,时间序列中存在时间序列聚类和时间序列分类的问题,尚待总结。


    参考书目:

    A Complete Tutorial on Time Series Modeling in R 

    《时间序列预测实践教程》-清华大学出版社

    《时间序列分析28讲视频》-中国科技大学

     时间序列完全教程:https://blog.csdn.net/Earl211/article/details/50957029



    展开全文
  • 时间序列分析

    万次阅读 多人点赞 2017-03-22 17:04:51
    http://blog.csdn.net/pipisorry/article/details/62053938时间序列简介时间序列是时间间隔不变的情况下收集的时间点集合。这些集合被分析用来了解长期发展趋势,为了预测未来或者表现分析的其他形式。但是什么时间...
  • 数据挖掘之时间序列分析

    万次阅读 多人点赞 2018-08-12 23:45:16
    时间序列分析的目的是给定一个已被观测了的时间序列,预测该序列的未来值。 表1 常用的时间序列模型 模型名称 描述 平滑法 常用于趋势分析和预测,利用修匀技术,削弱短期随机波动对序列的影响,使...
  • 【Python】时间序列分析完整过程

    万次阅读 多人点赞 2019-05-20 10:48:21
    1. 导言 1.1 基本定义   根据维基百科上对时间序列的定义,我们简单将其理解为: 时间序列:一系列以时间顺序作为索引的数据点...  咱们先来看看,对时间序列数据分析,需要用到哪些库吧 ~ import numpy as np ...
  • EXCEL篇—时间序列分析(季节指数法)

    万次阅读 多人点赞 2019-08-13 13:35:42
    之前跟大家一起分享了如何用EXCEL进行回归分析,现在跟大家一起来学习一下如何用EXCEL做时间序列分析。 在百科里,时间序列分析分析的解释是这样的:时间序列(或称动态数列)是指将同一统计指标的数值按其发生的...
  • 7 methods to perform Time Series forecasting Method 1 – Start with a Naive Approach Method 2 – Simple average Method 3 – Moving average Method 4 – Single Exponential smoothing ...
  • 《应用时间序列分析王燕 课后习题答案
  • 1.时间序列分析 时间序列的定义: 在统计研究中,常用按时间顺序排列的一组随机变量X1,X2,...,Xt...X_1,X_2,...,X_t...X1​,X2​,...,Xt​...来表示一个随机事件的时间序列,简记为{Xt}.\{ X_t \}.{Xt​}. 用x1,x2,....
  • 时间序列分析及应用(R语言)(原书第2版)》以易于理解的方式讲述了时间序列模型及其应用,内容包括趋势、平稳时间序列模型、非平稳时间序列模型、模型识别、参数估计、模型诊断、预测、季节模型、时间序列回归...
  • 王燕时间序列分析 R语言 案例和习题,用于R语言的操作练习
  • 笔记:一、检验:1、平稳性检验:图检验方法: 时序图检验:该序列有明显的趋势性或周期性,则不是平稳序列 自相关图检验:(acf函数)平稳序列具有短期相关性,即随着延迟期数k的增加,平稳序列的自相关系数ρ会...
  • Matlab时间序列分析

    万次阅读 多人点赞 2018-11-13 18:53:46
    在引入时间序列前,先介绍几个matlab函数 matlab中的gallery函数简析 Matlab 中的 gallery 函数是一个测试矩阵生成函数。当我们需要对某些算法进行测试的时候,可以利用gallery函数来生成各种性质的测试矩阵。其用法...
  • 时间序列分析基于R王燕,全文有目录。时间序列分析是应用统计学的核心基础课之一,也是计量经济学和统计预测学的核心内容。作为数理统计学的一个专业分支,时间序列分析有它非常特殊的、自成体系的一套分析方法...
  • 时间序列分析时间序列概念 时间序列概念 很显然这部分并不在我想说的范围之列,但是可以简要概括一下: 首先 时间序列是带时间的序列,是变量而不是定值,有观测值而已。 时间序列平稳性检验的要点: (1)观察...
  • 时间序列分析 课后答案 王振龙 pdf 是一个网友自己做的 我看了一下挺不错的 上传一下供大家使用
  • 是北大何书元的应用时间序列分析课后习题答案详解,具体步骤都有,很好的参考资料。
  • 应用时间序列分析习题答案(人民大学出版社,王燕编著)
  • 应用时间序列分析王燕答案答案比较全自己专业学的时间序列就是这本书
  • 时间序列分析.pdf

    热门讨论 2009-06-22 05:11:30
    本书从应用的角度出发,试图借助计算机的存贮功能和计算功能来抽象掉其深奥的数学理论和复杂的运算,从而使只具一般数学知识的读者便可掌握和运用时间序列分析方法。在阐述中,尽可能回避严格的数学推导和证明,而从...
  • 本书的目的在于为学生、研究者和预测者提供关于动态系统、经济计量学和时间序列分析方面的概览。从第一个原理开始,汉密尔顿的明析介绍使得新旧进展皆适合于大学一年级学生和非专业人员。另外,时间序列分析从内容...
  • 本书有如下特色:(1)内容齐全新颖,包括确定性时间序列分析,线性ARMA模型,波动率模型,向量自回归模型,单位根检验和协整,以及一些非线性模型,目前还没有一本中文教材包括所有这些内容;(2)强调如何对经济...
  • 希望能帮到你们。是时间序列分析课后答案,希望对你们有用。
  • 第一章 时间序列分析简介按照时间的顺序把随机事件变化发展的过程记录下来就构成了一个时间序列。对时间序列进行观察、研究、找寻它变化发展的规律,预测它将来的走势就是时间序列分析。描述型时序分析:通过直观的...
  • 基于R语言的实战项目——应用时间序列分析-R软件陪同_吴喜之
  • 应用时间序列分析 【作 者】王燕 [同作者作品] 【出 版 社】 中国人民大学出版社 【书 号】 7300066542 【出版日期】 2005 年7月 【开 本】 16 【页 码】 262 【版 次】1-1 作为数理统计学的一个专业分支,时间...
  • 这是一本用R语言时间序列分析的好书,内容丰富而且注重应用,不仅介绍了经典的时间序列分析方法,还介绍了最新的多元时间序列分析的方法,作者为北大教授吴喜之。
  • 【06】应用时间序列分析王燕) 【07】Analysis_of_Integrated_and_Cointegrated_Time_Series_with_R 【08】Applied Econometrics with R 【09】Time Series Analysis_ With Applications in R

空空如也

1 2 3 4 5 ... 20
收藏数 313,630
精华内容 125,452
关键字:

时间序列分析