精华内容
下载资源
问答
  • 滑动平均模型

    千次阅读 多人点赞 2019-03-01 10:23:39
    指数加权平均算法的原理 在书上看到了滑动平均模型,不懂什么意思,然后博客上有一篇写的很明白,摘抄了一段,然后附上书中的代码。 TensorFlow中的滑动平均模型使用的是滑动平均(Moving Average)算法,又称为...

    指数加权平均算法的原理

    在书上看到了滑动平均模型,不懂什么意思,然后博客上有一篇写的很明白,摘抄了一段,然后附上书中的代码。

    TensorFlow中的滑动平均模型使用的是滑动平均(Moving Average)算法,又称为指数加权移动平均算法(exponenentially weighted average),这也是ExponentialMovingAverage()函数的名称由来。 
    先来看一个简单的例子,这个例子来自吴恩达老师的DeepLearning课程,个人强烈推荐初学者都看一下。 
    开始例子。首先这是一年365天的温度散点图,以天数为横坐标,温度为纵坐标,你可以看见各个小点分布在图上,有一定的曲线趋势,但是并不明显。
     
    接着,如果我们要看出这个温度的变化趋势,很明显需要做一点处理,也即是我们的主题,用滑动平均算法处理。 
    首先给定一个值v0,然后我们定义每一天的温度是a1,a2,a3····· 
    接着,我们计算出v1,v2,v3····来代替每一天的温度,也就是上面的a1,a2,a3 
    计算方法是:v1 = v0 * 0.9 + a1 (1-0.9),v2= v1 0.9 + a2 (1-0.9),v3= v2 0.9 + a3 (1-0.9)···,也就是说,每一天的温度改变为前一天的v值 0.9 + 当天的温度 * 0.1,vt = v(t-1) * 0.9 + at * 0.1,把所有的v计算完之后画图,红线就是v的曲线: 
     
    v值就是指数加权平均数,整个过程就是指数加权平均算法,它很好的把一年的温度曲线给拟合了出来。把0.9抽象为β,总结为vt = v(t-1) * β + at * (1-β)。

    β这个值的意义是什么?实际上vt ≈ 1/(1 - β) 天的平均温度,例如:假设β等于0.9,1/(1 - β) 就等于10,也就是vt等于前十天的平均温度,这个说可能不太看得出来;假设把β值调大道接近1,例如,将β等于0.98,1/(1-β)=50,按照刚刚的说法也就是前50天的平均温度,然后求出v值画出曲线,如图所示: 
     
    绿线就是β等于0.98时候的曲线,可以明显看到绿线比红线的变化更迟,红线达到某一温度,绿线要过一阵子才能达到相同温度。因为绿线是前50天的平均温度,变化就会更加缓慢,而红线是最近十天的平均温度,只要最近十天的温度都是上升,红线很快就能跟着变化。所以直观的理解就是,vt是前1/(1-β)天的平均温度。 
    再看看另一个极端情况:β等于0.5,意味着vt≈最近两天的平均温度,曲线如下黄线: 
     
    和原本的温度很相似,但曲线的波动幅度也相当大!

    然后说一下这个滑动平均模型和深度学习有什么关系:通常来说,我们的数据也会像上面的温度一样,具有不同的值,如果使用滑动平均模型,就可以使得整体数据变得更加平滑——这意味着数据的噪音会更少,而且不会出现异常值。但是同时β太大也会使得数据的曲线右移,和数据不拟合。需要不断尝试出一个β值,既可以拟合数据集,又可以减少噪音。 
    滑动平均模型在深度学习中还有另一个优点:它只占用极少的内存 
    当你在模型中计算最近十天(有些情况下远大于十天)的平均值的时候,你需要在内存中加载这十天的数据然后进行计算,但是指数加权平均值约等于最近十天的平均值,而且根据vt = v(t-1) * β + at * (1-β),你只需要提供at这一天的数据,再加上v(t-1)的值和β值,相比起十天的数据这是相当小的数据量,同时占用更少的内存。

    偏差修正

    指数加权平均值通常都需要偏差修正,TensorFlow中提供的ExponentialMovingAverage()函数也带有偏差修正。

    首先看一下为什么会出现偏差,再来说怎么修正。当β等于0.98的时候,还是用回上面的温度例子,曲线实际上不是像绿线一样,而是像紫线: 
     
    你可以注意到在紫线刚刚开始的时候,曲线的值相当的低,这是因为在一开始的时候并没有50天(1/(1-β)为50)的数据,而是只有寥寥几天的数据,相当于少加了几十天的数据,所以vt的值很小,这和实际情况的差距是很大的,也就是出现的偏差。 
    而在TensorFlow中的ExponentialMovingAverage()采取的偏差修正方法是:使用num_updates来动态设置β的大小 

    在数据迭代的前期,数据量比较少的时候,(1+num_updates)/(10+num_updates)的值比较小,使用这个值作为β来进行vt的计算,所以在迭代前期就会像上面的红线一样,和原数据更加接近。举个例子,当天数是第五天,β为0.98,那么(1+num_updates)/(10+num_updates) = 6/15 = 0.4,相当于最近1.6天的平均温度,而不是β=0.98时候的50天,这样子就做到了偏差修正。

    滑动平均模型的代码实现

    看到这里你应该大概了解了滑动平均模型和偏差修正到底是怎么回事了,接下来把这个想法对应到TensorFlow的代码中。

    首先明确一点,TensorFlow中的ExponentialMovingAverage()是针对权重weight和偏差bias的,而不是针对训练集的。如果你现在训练集中实现这个效果,需要自己设计代码。 
    为什么要对w和b使用滑动平均模型呢?因为在神经网络中, 
    更新的参数时候不能太大也不能太小,更新的参数跟你之前的参数有联系,不能发生突变。一旦训练的时候遇到个“疯狂”的参数,有了滑动平均模型,疯狂的参数就会被抑制下来,回到正常的队伍里。这种对于突变参数的抑制作用,用专业术语讲叫鲁棒性,鲁棒性就是对突变的抵抗能力,鲁棒性越好,这个模型对恶性参数的提抗能力就越强。 
    在TensorFlow中,ExponentialMovingAverage()可以传入两个参数:衰减率(decay)和数据的迭代次数(step),这里的decay和step分别对应我们的β和num_updates,所以在实现滑动平均模型的时候,步骤如下: 
    1、定义训练轮数step 
    2、然后定义滑动平均的类 
    3、给这个类指定需要用到滑动平均模型的变量(w和b) 
    4、执行操作,把变量变为指数加权平均值

    实现代码如下:

    import tensorflow as tf
    
    v1 = tf.Variable(0, dtype=tf.float32)
    step = tf.Variable(0, trainable=False)
    ema = tf.train.ExponentialMovingAverage(0.99, step)
    maintain_averages_op = ema.apply([v1])
    
    with tf.Session() as sess:
        
        # 初始化
        init_op = tf.global_variables_initializer()
        sess.run(init_op)
        print (sess.run([v1, ema.average(v1)]))
        
        # 更新变量v1的取值
        sess.run(tf.assign(v1, 5))
        sess.run(maintain_averages_op)
        print (sess.run([v1, ema.average(v1)]))
        
        # 更新step和v1的取值
        sess.run(tf.assign(step, 10000))  
        sess.run(tf.assign(v1, 10))
        sess.run(maintain_averages_op)
        print (sess.run([v1, ema.average(v1)])   )    
        
        # 更新一次v1的滑动平均值
        sess.run(maintain_averages_op)
        print(sess.run([v1, ema.average(v1)]))    

    原文:https://blog.csdn.net/m0_38106113/article/details/81542863

    展开全文
  • 分布滞后模型

    千次阅读 2021-01-31 21:15:26
    即模型中不仅包含解释变量的当前值,还包含它们的滞后值(过去值),这样的模型称为分布滞后模型(distribution-lag model),不能直接使用最小二乘法(OLS)估计,会遇到多重共线性、损失自由度、滞后长度难以确定...

    在涉及时间序列数据的回归分析中,一般由于经济变量自身、决策者心理、技术、制度等方面的原因,解释变量需要经过一段时间才能完全作用于因变量,同时由于经济活动的连续性,因变量的当前变化也往往受到自身过去取值水平的影响,即模型中不仅包含解释变量的当前值,还包含它们的滞后值(过去值),这样的模型称为分布滞后模型(distribution-lag model)。
    分布滞后模型可表示为:
    y t = α + β 0 x t + β 1 x t − 1 + β 2 x t − 2 + ⋯ + β k x t − k + μ t ( 1 ) {{y}_{t}}=\alpha +{{\beta }_{0}}{{x}_{t}}+{{\beta }_{1}}{{x}_{t-1}}+{{\beta }_{2}}{{x}_{t-2}}+\cdots +{{\beta }_{k}}{{x}_{t-k}}+{{\mu }_{t}} (1) yt=α+β0xt+β1xt1+β2xt2++βkxtk+μt(1)

    y t = α + β 0 x t + β 1 x t − 1 + β 2 x t − 2 + ⋯ + μ t ( 2 ) {{y}_{t}}=\alpha +{{\beta }_{0}}{{x}_{t}}+{{\beta }_{1}}{{x}_{t-1}}+{{\beta }_{2}}{{x}_{t-2}}+\cdots +{{\mu }_{t}}(2) yt=α+β0xt+β1xt1+β2xt2++μt(2)
    式(1)为有限滞后模型,式(2)为无限滞后模型。其中 k k k为滞后解释变量的滞后期长度。

    例:消费滞后。按照一般规律,人们的消费不仅依赖于当期收入,还依赖于前期收入,即人们会分期消费。假定某人收入每年增加1000元,那么这种收入的增加对该消费者的年消费支出会产生什么影响?它也许会在收入增加后的第一年增加400元的消费支出,第二年增加300元,第三年增加200元,把余下的100元作为储蓄。到第三年末此人的消费将增加900元。则消费函数为 y t = α + 0.4 x t + 0.3 x t − 1 + 0.2 x t − 2 + μ t {{y}_{t}}=\alpha +0.4{{x}_{t}}+0.3{{x}_{t-1}}+0.2{{x}_{t-2}}+{{\mu }_{t}} yt=α+0.4xt+0.3xt1+0.2xt2+μt
    在这里插入图片描述
    分布滞后模型的核心思想是多元回归,其一般步骤为:
    (1)确定滞后期;
    (2)选择适当的方法对模型进行估计;
    (3)对所得的回归方程和回归系数进行显著性检验;
    (4)分析滞后效应。

    第一步:确定滞后期

    对于分布滞后模型,首先要确定能够达到的最大滞后期,可以从一个很大的滞后期开始,而不对分布滞后的形状施加任何约束,然后看模型的拟合是否会随滞后期的减小而恶化。也可以通过一些统计检验获取信息,通过多个统计检验综合判断。常用的统计检验有:

    (1)相关系数

    对于序列 X = { x 1 , x 2 , ⋯   , x n } X=\left\{ {{x}_{1}},{{x}_{2}},\cdots ,{{x}_{n}} \right\} X={x1,x2,,xn} Y = { y 1 , y 2 , ⋯   , y n } Y=\left\{ {{y}_{1}},{{y}_{2}},\cdots ,{{y}_{n}} \right\} Y={y1,y2,,yn},二者在滞后 l l l处的相关系数
    R ( l ) = ∑ t = l + 1 n ( x t − x ˉ ) ( y t − l − y ˉ ) ∑ t = l + 1 n ( x t − x ˉ ) 2 ∑ t = 1 n − l ( y t − y ˉ ) 2 R\left( l \right)=\frac{\sum\limits_{t=l+1}^{n}{\left( {{x}_{t}}-\bar{x} \right)\left( {{y}_{t-l}}-\bar{y} \right)}}{\sqrt{\sum\limits_{t=l+1}^{n}{{{\left( {{x}_{t}}-\bar{x} \right)}^{2}}}}\sqrt{\sum\limits_{t=1}^{n-l}{{{\left( {{y}_{t}}-\bar{y} \right)}^{2}}}}} R(l)=t=l+1n(xtxˉ)2 t=1nl(ytyˉ)2 t=l+1n(xtxˉ)(ytlyˉ)
    x ˉ = 1 n − l ∑ t = l + 1 n x t , y ˉ = 1 n − l ∑ t = 1 n − l y t \bar{x}=\frac{1}{n-l}\sum\limits_{t=l+1}^{n}{{{x}_{t}}},\bar{y}=\frac{1}{n-l}\sum\limits_{t=1}^{n-l}{{{y}_{t}}} xˉ=nl1t=l+1nxt,yˉ=nl1t=1nlyt
    其中, l l l的最大取值为 n / 2 {}^{n}/{}_{2} n/2。当 l l l的值从0变化到 n / 2 {}^{n}/{}_{2} n/2时就可以得到多个 R ( l ) R\left( l \right) R(l),令 R ( l ) R\left( l \right) R(l)最大值所对应的滞后为 l max ⁡ {{l}_{\max }} lmax,如果 R ( l max ⁡ ) > σ ( σ ∈ [ 0 , 1 ] R\left( {{l}_{\max }} \right)>\sigma (\sigma \in \left[ 0,1 \right] R(lmax)>σσ[0,1]为用户定义的阈值),那么就说时间序列 X , Y X,Y X,Y具有滞后相关性。
    在这里插入图片描述
    由上图可知,当l=6时,R(l)最大,即居民蛋消费价格指数和棉花产值相关系数最大为0.77,若用户指定的阈值 σ > 0.5 \sigma>0.5 σ>0.5 ,则认为居民蛋消费价格指数和棉花产值具有滞后相关性,且棉花产值滞后于居民蛋消费价格指数的量为6。

    (2)调整的判定系数 R ˉ 2 {{\bar{R}}^{2}} Rˉ2

    依次添加滞后项,直到 R 2 {{R}^{2}} R2取得极大值,对应的滞后期为最优

    R ˉ 2 = 1 − ( 1 − R 2 ) n − 1 n − k − 1 , R 2 = E S S T S S = 1 − R S S T S S {{\bar{R}}^{2}}=1-\left( 1-{{R}^{2}} \right)\frac{n-1}{n-k-1},{{R}^{2}}=\frac{ESS}{TSS}=1-\frac{RSS}{TSS} Rˉ2=1(1R2)nk1n1,R2=TSSESS=1TSSRSS
    其中 R S S = ∑ i = 1 n ( y − y ^ ) 2 , E S S = ∑ i = 1 n ( y ^ − y ˉ ) 2 , T S S = ∑ i = 1 n ( y − y ˉ ) 2 RSS=\sum\limits_{i=1}^{n}{{{\left( y-\hat{y} \right)}^{2}}},ESS=\sum\limits_{i=1}^{n}{{{\left( \hat{y}-\bar{y} \right)}^{2}}},TSS=\sum\limits_{i=1}^{n}{{{\left( y-\bar{y} \right)}^{2}}} RSS=i=1n(yy^)2,ESS=i=1n(y^yˉ)2,TSS=i=1n(yyˉ)2分别为残差平方和、回归平方和、总平方和, n n n为数据数量, k k k为变量个数。

    (3)施瓦茨( S C SC SC)准则

    依次添加滞后项,直到 S C SC SC达到极小值,对应的滞后期为最优
    S C = ln ⁡ ( R S S n ) + k + 1 n ln ⁡ n SC=\ln \left( \frac{RSS}{n} \right)+\frac{k+1}{n}\ln n SC=ln(nRSS)+nk+1lnn
    其中 R S S = ∑ i = 1 n ( y − y ^ ) 2 RSS=\sum\limits_{i=1}^{n}{{{\left( y-\hat{y} \right)}^{2}}} RSS=i=1n(yy^)2为残差平方和, n n n为数据数量, k k k为变量个数。

    (4)赤池( A I C AIC AIC)准则

    依次添加滞后项,直到 A I C AIC AIC达到极小值,对应的滞后期为最优
    A I C = ln ⁡ ( R S S n ) + 2 ( k + 1 ) n AIC=\ln \left( \frac{RSS}{n} \right)+\frac{2\left( k+1 \right)}{n} AIC=ln(nRSS)+n2(k+1)
    其中 R S S = ∑ i = 1 n ( y − y ^ ) 2 RSS=\sum\limits_{i=1}^{n}{{{\left( y-\hat{y} \right)}^{2}}} RSS=i=1n(yy^)2为残差平方和, n n n为数据数量, k k k为变量个数。
    例如,有某产品1990年-2008年的库存和销售额数据。
    在这里插入图片描述
    依次添加滞后项,即当期时 Y t = α + β 0 X t {{Y}_{t}}=\alpha +{{\beta }_{0}}{{X}_{t}} Yt=α+β0Xt;添加滞后一期项时, Y t = α + β 0 X t + β 1 X t − 1 + β 2 x t − 2 + ⋯ + β k x t − k + μ t ( 1 ) {{Y}_{t}}=\alpha +{{\beta }_{0}}{{X}_{t}}+{{\beta }_{1}}{{X}_{t-1}}+{{\beta }_{2}}{{x}_{t-2}}+\cdots +{{\beta }_{k}}{{x}_{t-k}}+{{\mu }_{t}} (1) Yt=α+β0Xt+β1Xt1+β2xt2++βkxtk+μt(1);添加滞后二期项时, Y t = α + β 0 X t + β 1 X t − 1 + β 2 X t − 2 {{Y}_{t}}=\alpha +{{\beta }_{0}}{{X}_{t}}+{{\beta }_{1}}{{X}_{t-1}}+{{\beta }_{2}}{{X}_{t-2}} Yt=α+β0Xt+β1Xt1+β2Xt2…依次对各模型进行最小二乘法(OLS)估计,得到判定系数 R ˉ 2 {{\bar{R}}^{2}} Rˉ2 S C SC SC A I C AIC AIC,根据 S C SC SC A I C AIC AIC最小,判定系数 R ˉ 2 {{\bar{R}}^{2}} Rˉ2最大,最优滞后期应为2。
    在这里插入图片描述

    第二步:模型估计

    分布滞后模型估计不能直接使用最小二乘法(OLS)估计,会遇到多重共线性、损失自由度、滞后长度难以确定等问题。所以实践中很少用OLS方法直接估计分布滞后模型,一般使用限定诸 β \beta β遵从某种先验变化的模式或理论模式。对于有限分布滞后模型,常用的修正估计方法有经验加权法、阿尔蒙多项式法(Almon)等;对于无限分布滞后模型,主要通过适当的模型变换转化为自回归模型进行估计,代表性的方法有考伊克法(Koyck)等。下面介绍有限分布滞后模型的两种估计方法。

    (1)经验加权法

    根据实际经济问题的特点及经验判断,对滞后变量赋予一定的权数,利用这些权数构成各滞后变量的线性组合,以形成新的变量,再应用最小二乘法进行估计。基本思路是设法减少模型中被估计的参数个数,模型中参数的个数主要由解释变量的个数来决定,要减少模型中被估计的参数个数,就要对解释变量进行归并,并通过解释变量的归并,消除或削弱多重共线性问题。该方法的优点是简单易行、少损失自由度、避免多重共线性。缺点是权数设置主观随意性大。通常的做法是依据先验信息,多选几组权数进行估计模型,最后选择能通过统计和计量经济检验的模型。根据滞后结构特点,常使用的权数类型有:

    • 递减滞后结构
      例如,消费函数中近期收入对消费的影响较大,而远期收入的影响将越来越小;如果设滞后期为2,各期权数取成 1 / 2    , 1 / 4    , 1 / 6    {1}/{2}\;,{1}/{4}\;,{1}/{6}\; 1/2,1/4,1/6
      则组合成新的解释变量: w t = 1 2 x t + 1 4 x t − 1 + 1 6 x t − 2 {{w}_{t}}=\frac{1}{2}{{x}_{t}}+\frac{1}{4}{{x}_{t-1}}+\frac{1}{6}{{x}_{t-2}} wt=21xt+41xt1+61xt2
      估计模型(此时模型已无多重共线性): y t = α + β w t + ε t {{y}_{t}}=\alpha +\beta {{w}_{t}}+{{\varepsilon }_{t}} yt=α+βwt+εt
      用最小二乘法得到 α , β \alpha ,\beta α,β的估计值,将 w t {{w}_{t}} wt带入原模型得, β ^ 0 = β ^ 2 , β ^ 1 = β ^ 4 , β ^ 2 = β ^ 6 {{\hat{\beta }}_{0}}=\frac{{\hat{\beta }}}{2},{{\hat{\beta }}_{1}}=\frac{{\hat{\beta }}}{4},{{\hat{\beta }}_{2}}=\frac{{\hat{\beta }}}{6} β^0=2β^,β^1=4β^,β^2=6β^
    • 不变滞后结构
      设滞后期为2,各期权数为 1 / 3    {1}/{3}\; 1/3,则 w t = 1 3 ( x t + x t − 1 + x t − 2 ) {{w}_{t}}=\frac{1}{3}\left( {{x}_{t}}+{{x}_{t-1}}+{{x}_{t-2}} \right) wt=31(xt+xt1+xt2)
      同理得到原模型各参数的估计值为: β ^ i = β ^ 3 {{\hat{\beta }}_{i}}=\frac{{\hat{\beta }}}{3} β^i=3β^
    • A型滞后结构
      例如,历年投资对产出的影响一般为A型滞后结构,设滞后期为4,各期权数为 1 / 6    , 1 / 4    , 1 / 2    , 1 / 4    , 1 / 6    {1}/{6}\;,{1}/{4}\;,{1}/{2}\;,{1}/{4}\;,{1}/{6}\; 1/6,1/4,1/2,1/4,1/6,则 w t = 1 6 x t + 1 4 x t − 1 + 1 2 x t − 2 + 1 4 x t − 3 + 1 6 x t − 4 {{w}_{t}}=\frac{1}{6}{{x}_{t}}+\frac{1}{4}{{x}_{t-1}}+\frac{1}{2}{{x}_{t-2}}+\frac{1}{4}{{x}_{t-3}}+\frac{1}{6}{{x}_{t-4}} wt=61xt+41xt1+21xt2+41xt3+61xt4
      同理得到原模型各参数的估计值 β ^ 0 = β ^ 6 , β ^ 1 = β ^ 4 , β ^ 2 = β ^ 2 , β ^ 3 = β ^ 4 , β ^ 4 = β ^ 6 {{\hat{\beta }}_{0}}=\frac{{\hat{\beta }}}{6},{{\hat{\beta }}_{1}}=\frac{{\hat{\beta }}}{4},{{\hat{\beta }}_{2}}=\frac{{\hat{\beta }}}{2},{{\hat{\beta }}_{3}}=\frac{{\hat{\beta }}}{4},{{\hat{\beta }}_{4}}=\frac{{\hat{\beta }}}{6} β^0=6β^,β^1=4β^,β^2=2β^,β^3=4β^,β^4=6β^
      在这里插入图片描述
    (2)阿尔蒙(Almon)多项式法

    为了消除多重共线性的影响,阿尔蒙于1965年提出利用有限多项式来减少待估计参数的个数,以消除多重共线性及参数估计中的自由度损失。现实生活中,解释变量系数随滞后期的变化轨迹并不完全遵从几何级数衰减的假定,其变化形式多种多样。
    在这里插入图片描述
    对于有限分布滞后模型
    y t = α + β 0 x t + β 1 x t − 1 + β 2 x t − 2 + ⋯ + β k x t − k + μ t {{y}_{t}}=\alpha +{{\beta }_{0}}{{x}_{t}}+{{\beta }_{1}}{{x}_{t-1}}+{{\beta }_{2}}{{x}_{t-2}}+\cdots +{{\beta }_{k}}{{x}_{t-k}}+{{\mu }_{t}} yt=α+β0xt+β1xt1+β2xt2++βkxtk+μt
    可改写为
    y t = α + ∑ i = 0 k β i x t − i + μ t {{y}_{t}}=\alpha +\sum\limits_{i=0}^{k}{{{\beta }_{i}}{{x}_{t-i}}}+{{\mu }_{t}} yt=α+i=0kβixti+μt
    其中 β i = a 0 + a 1 i + a 2 i 2 + a 3 i 3 + ⋯ + a m i m {{\beta }_{i}}={{a}_{0}}+{{a}_{1}}i+{{a}_{2}}{{i}^{2}}+{{a}_{3}}{{i}^{3}}+\cdots +{{a}_{m}}{{i}^{m}} βi=a0+a1i+a2i2+a3i3++amim,一般多项式次数 m m m取2或者3,很少超过4;且多项式的次数 m m m小于最大滞后期 k k k。即参数 β i {{\beta }_{i}} βi可近似的用一个关于滞后期 i i i的低阶多项式表示,进而减少模型中的参数。取 m = 2 m=2 m=2为例进一步说明阿尔蒙方法,有阿尔蒙多项分布滞后模型
    在这里插入图片描述
    其中, z 0 t = ∑ i = 0 k x t − i , z 1 t = ∑ i = 0 k i x t − i , z 2 t = ∑ i = 0 k i 2 x t − i {{z}_{0t}}=\sum\limits_{i=0}^{k}{{{x}_{t-i}}},{{z}_{1t}}=\sum\limits_{i=0}^{k}{i{{x}_{t-i}}},{{z}_{2t}}=\sum\limits_{i=0}^{k}{{{i}^{2}}{{x}_{t-i}}} z0t=i=0kxti,z1t=i=0kixti,z2t=i=0ki2xti。如果随机误差项 μ \mu μ满足经典线性回归的假定,该模型仍可采用最小二乘法估计,且 α \alpha α a i {{a}_{i}} ai的估计值将具有全部的优良统计性质。估计出诸 a a a,进而估计出原始的 β \beta β系数
    在这里插入图片描述
    阿尔蒙多项式的应用示例。
    在这里插入图片描述
    阿尔蒙方法的优点:在阿尔蒙模型中,解释变量不再是x,而是x的线性组合,多重线性可以相对减弱;在使用阿尔蒙方法时,不必担心因滞后变量出现可能产生的估计问题(非随机解释变量和序列相关问题),它依然可以用最小二乘法进行估计;可以拟合一个足够低次的多项式,使估计系数的个数要比原先的系数的个数少很多。
    阿尔蒙方法的缺点:(a)滞后期的最大长度和多项式的次数是一种主观判断。若选择了过小的长度将导致“漏掉有关变量”的偏倚,这时系数虽然可以用OLS估计,但系数的方差不那么有效;(b)z变量的个数(m+1) 与m有关,一旦确定了滞后期k和多项式次数m就可以构造出诸z。然而z变量是x变量的线性组合,虽然多重共线问题可以减轻,但并不能消除。因此,在确定选择多项式的次数时,必须先肯定多重共线性的问题可以用前面给的技术方法进行处理。

    第三步:模型检验与评估

    • 回归方程的显著性检验

    统计量: F = E S S / k R S S / ( n − k − 1 ) ∼ F ( k , n − k − 1 ) F=\frac{ESS/k}{RSS/\left( n-k-1 \right)}\sim F\left( k,n-k-1 \right) F=RSS/(nk1)ESS/kF(k,nk1)
    其中 R S S = ∑ i = 1 n ( y − y ^ ) 2 , E S S = ∑ i = 1 n ( y ^ − y ˉ ) 2 RSS=\sum\limits_{i=1}^{n}{{{\left( y-\hat{y} \right)}^{2}}},ESS=\sum\limits_{i=1}^{n}{{{\left( \hat{y}-\bar{y} \right)}^{2}}} RSS=i=1n(yy^)2,ESS=i=1n(y^yˉ)2分别为残差平方和、回归平方和, n n n为数据数量, k k k为变量个数。若 F > F α F>{{F}_{\alpha }} F>Fα p < α p<\alpha p<α,则回归方程显著。

    • 回归系数的显著性检验
      统计量: t i = β ^ i / l i i R S S / ( n − k − 1 ) ∼ t ( n − k − 1 ) {{t}_{i}}=\frac{{{{\hat{\beta }}}_{i}}/\sqrt{{{l}^{ii}}}}{\sqrt{RSS/\left( n-k-1 \right)}}\sim t\left( n-k-1 \right) ti=RSS/(nk1) β^i/lii t(nk1)
      其中 R S S = ∑ i = 1 n ( y − y ^ ) 2 RSS=\sum\limits_{i=1}^{n}{{{\left( y-\hat{y} \right)}^{2}}} RSS=i=1n(yy^)2为残差平方和, n n n为数据数量, k k k为变量个数, l i i {{l}^{ii}} lii L − 1 {{L}^{-1}} L1的第 i i i个对角元素,而 L − 1 = X ~ ′ X ~ {{L}^{-1}}={\tilde{X}}'\tilde{X} L1=X~X~, X ~ \tilde{X} X~是中心化的数据阵。若 t > t α t>{{t}_{\alpha }} t>tα p < α p<\alpha p<α,则回归系数显著。
      在这里插入图片描述
    • 回归直线对观测值的拟合程度
      拟合优度 R 2 {{R}^{2}} R2 R 2 = E S S T S S = 1 − R S S T S S {{R}^{2}}=\frac{ESS}{TSS}=1-\frac{RSS}{TSS} R2=TSSESS=1TSSRSS
      调整的判定系数 R ˉ 2 {{\bar{R}}^{2}} Rˉ2 R ˉ 2 = 1 − ( 1 − R 2 ) n − 1 n − k − 1 {{\bar{R}}^{2}}=1-\left( 1-{{R}^{2}} \right)\frac{n-1}{n-k-1} Rˉ2=1(1R2)nk1n1
      其中 R S S = ∑ i = 1 n ( y − y ^ ) 2 , E S S = ∑ i = 1 n ( y ^ − y ˉ ) 2 , T S S = ∑ i = 1 n ( y − y ˉ ) 2 RSS=\sum\limits_{i=1}^{n}{{{\left( y-\hat{y} \right)}^{2}}},ESS=\sum\limits_{i=1}^{n}{{{\left( \hat{y}-\bar{y} \right)}^{2}}},TSS=\sum\limits_{i=1}^{n}{{{\left( y-\bar{y} \right)}^{2}}} RSS=i=1n(yy^)2,ESS=i=1n(y^yˉ)2,TSS=i=1n(yyˉ)2分别为残差平方和、回归平方和、总平方和, n n n为数据数量, k k k为变量个数。 R 2 {{R}^{2}} R2 R ˉ 2 {{\bar{R}}^{2}} Rˉ2越接近于1,说明回归直线对观测值的拟合程度越好;反之,越接近于零说明回归直线对观测值的拟合程度越差。

    第四步:滞后效应分析

    分布滞后变量模型的各系数体现了解释变量的当期值和各期滞后值对被解释变量的不同影响程度。

    • 滞后效应的乘数分析
      对于分布滞后模型 y t = α + β 0 x t + β 1 x t − 1 + β 2 x t − 2 + ⋯ + β k x t − k + μ t {{y}_{t}}=\alpha +{{\beta }_{0}}{{x}_{t}}+{{\beta }_{1}}{{x}_{t-1}}+{{\beta }_{2}}{{x}_{t-2}}+\cdots +{{\beta }_{k}}{{x}_{t-k}}+{{\mu }_{t}} yt=α+β0xt+β1xt1+β2xt2++βkxtk+μt
      β 0 {{\beta }_{0}} β0:短期乘数,表示解释变量变化一个单位对同期被解释变量所产生的影响,即短期影响;
      β i ( i > 0 ) {{\beta }_{i}}(i>0) βi(i>0):延期乘数或动态乘数,反映解释变量在各滞后时期的单位变化对 y t {{y}_{t}} yt产生的影响,即滞后影响。
      ∑ i = 0 s β i \sum\limits_{i=0}^{s}{{{\beta }_{i}}} i=0sβi:为(s期)中期乘数,反映了解释变量对 y t {{y}_{t}} yt的s期累计影响;
      ∑ i = 0 ∞ β i \sum\limits_{i=0}^{\infty }{{{\beta }_{i}}} i=0βi:为长期乘数,表示 x t {{x}_{t}} xt变动一单位对 y t {{y}_{t}} yt产生的累计总影响。
      利用乘数可以分析解释变量对解释变量的滞后影响过程。
      例如, y ^ t = α ^ + 0.4 x t + 0.3 x t − 1 + 0.2 x t − 2 {{\hat{y}}_{t}}=\hat{\alpha }+0.4{{x}_{t}}+0.3{{x}_{t-1}}+0.2{{x}_{t-2}} y^t=α^+0.4xt+0.3xt1+0.2xt2,则短期乘数为0.4,延期乘数为0.3/0.2,长期乘数为0.9。即当收入增加1元时,消费者将在本期增加0.4元的消费,下一期增加0.3元,再下期增加0.2元,增加1元收入对消费的长期作用为0.9元。
    • 滞后效应的速度分析
      乘数效用比: D s = s = ∑ i = 0 s β i ∑ i = 0 ∞ β i {{D}_{s}}=\frac{s}{}\text{=}\frac{\sum\limits_{i=0}^{s}{{{\beta }_{i}}}}{\sum\limits_{i=0}^{\infty }{{{\beta }_{i}}}} Ds=s=i=0βii=0sβi
      D s {{D}_{s}} Ds为截止到第 s s s期为止的乘数效应比,它反映了 x t {{x}_{t}} xt的变动在经历 s s s期后,对 y t {{y}_{t}} yt的影响所达到的程度,使 D s {{D}_{s}} Ds达到某个百分比(如90%)的 s s s值越小,则作用时间越快,滞后时间越短。
      平均滞后时间: M L T = ∑ i = 0 ∞ i β i ∑ i = 0 ∞ β i MLT\text{=}\frac{\sum\limits_{i=0}^{\infty }{i{{\beta }_{i}}}}{\sum\limits_{i=0}^{\infty }{{{\beta }_{i}}}} MLT=i=0βii=0iβi
      M L T MLT MLT为平均滞后时间(或平均滞后),实际上是以各期延期乘数为权数的、各滞后期的加权平均数,反映了滞后期的平均长度,其值越小,则平均滞后期越短,表明 y y y x x x变化的反映速度越快。
      在这里插入图片描述
      ps:初衷是通过撰写博文记录自己所学所用,实现知识的梳理与积累;将其分享,希望能够帮到面临同样困惑的小伙伴儿。如发现博文中存在问题,欢迎随时交流~~
    展开全文
  • 此外,包括省级和市级环境法律在内的66%的地方立法滞后问题,平均滞后时间为2547.8天。 此外,国家环境法律与地方环境法律之间存在许多法律冲突。 为了帮助中国建立和谐统一的环境法律体系,本研究提出了一些建议...
  • 本文用一正压模式,采用滞后平均法(LAF)对2000年热带气旋进行路径集合预报试验,并与基于热带气旋初始结构扰动的集合预报方法进行了比较分析,结果表明LAF方法对热带气旋路径预报具有较好的改进作用。但LAF的集合...
  • 用法:[v,lag]=ami(x,y,lag) 计算可能存在滞后的 x 和 y 的相互平均信息。 v 是平均互信息。 (相关单位见下) x & y 是时间序列。 (列向量) 滞后是时间滞后的向量。 (滞后 > 0 时 V 中的峰值意味着 y 领先于 x...
  • 移动平均(Moving Average)

    万次阅读 2019-01-06 17:41:01
    移动平均(Moving Average,MA),又称移动平均线,简称均线。作为技术分析中一种分析时间序列的常用工具,常被应用于股票价格序列。移动平均可过滤高频噪声,反映出中长期低频趋势,辅助投资者做出投资判断。 根据...

    作者:石川
    链接:https://zhuanlan.zhihu.com/p/38276041
    来源:知乎
    已获得作者同意转载。
     

    1 前言

    移动平均(Moving Average,MA),又称移动平均线,简称均线。作为技术分析中一种分析时间序列的常用工具,常被应用于股票价格序列。移动平均可过滤高频噪声,反映出中长期低频趋势,辅助投资者做出投资判断。

    根据计算方法的不同,流行的移动平均包括简单移动平均、加权移动平均、指数移动平均,更高阶的移动平均算法则有分形自适应移动平均、赫尔移动平均等。这其中,简单移动平均又最为常见。下图为上证指数日线的 5 个不同计算窗口(20 日,50 日,120 日,200 日,300 日)的简单移动平均线。

    简单移动平均(Simple Moving Average, SMA)就是对时间序列直接求等权重均值,因此使用简单。但其最令人诟病的就是它的滞后性。从上图不难看出,随着计算窗口 T 的增大,移动平均线越来越平滑,但同时也越来越滞后。以 120 日均线为例,在 2015 年 6 月份之后的大熊市开始了很长一段时间之后,120 日均线才开始呈现下降趋势。如果我们按照这个趋势进行投资,那这个滞后无疑造成了巨额的亏损。

    事实上,任何移动平均算法都会呈现一定的滞后性。它以滞后性的代价换来了平滑性,移动平均必须在平滑性和滞后性之间取舍。然而,滞后性是怎么产生的呢?简单移动平均在时间上滞后多少呢?有没有什么高级的移动平均算法能在保证平滑性的同时将滞后性减小到最低呢?这些就是本文要回答的问题。

    2 移动平均的本质

    移动平均的本质是一种低通滤波。它的目的是过滤掉时间序列中的高频扰动,保留有用的低频趋势。如何从时间序列中抽取出真正的低频趋势呢?无论采取哪种移动平均算法,理论上的计算方法都相同,下面我们简要说明。同时,我们也会清晰地阐述该计算方法仅在理论上有效,而在实际应用中是无法实现的,并由此揭示产生滞后性的原因。

    假设我们有一个时间序列 y = \{\cdots, y_{t-2}, y_{t-1}, y_t, y_{t+1}, y_{t+2}, \cdots\},如下图所示。另外,假设我们有一个作用在时域 t 上的过滤函数 F(注:这个 F 的具体形式根据不同的移动平均算法而不同)。

    在理论上,在任意 t 时刻的低频滤波(用 x_t 表示)在数学上可以表示为该时间序列 y 和过滤函数 F在整个时域上的卷积,即

    x_t=\sum_{i=-\infty}^\infty F_iy_{t-i}

    其中, F_i 为过滤函数 F 在时刻 i 的取值。由于在实际中不可能用到无穷多的数据,因此可以考虑给过滤加一个窗函数,即过滤函数 F 只在窗口长度 T 内有效、在窗口之外为 0,如下图所示:

    加入长度为 T 的窗函数后,在时刻t的低频滤波变为该时间序列 y 和过滤函数 F 在这个窗口内的卷积:

    x_t=\sum_{i=t-(T-1)/2}^{t+(T-1)/2}F_iy_{t-i}

    然而,无论是否使用加窗函数,上述公式最大的问题是,在计算 t 时刻的低频分量时,利用到了未来的数据。换句话说,理论上的低通滤波(或者移动平滑)必须要用事后数据,其假设所有数据都发生后再在全局上计算所有时点的低频分量。但这在实时数据中是不可能的,因为在任何当前时刻 t,我们都没有未来数据可以利用。

    正因如此,在实际应用中,我们无法使用 t-(T-1)/2t+(T-1)/2 之间的数据,只能退而求其次使用 t-(T-1)t 之间的数据。这相当于我们把计算低频趋势的过滤窗函数在时域上向左平移 (T-1)/2 个单位,如下图所示:

    如此处理后,对于实时数据,在当前时刻 t 的低频滤波变为该时间序列 y 和过滤函数 Ft-T+1t 之间的卷积:

    x_t=\sum_{i=t-T+1}^t F_iy_{t-i}

    没有未来数据便是滞后的根本原因。

    对于简单移动平均来说,在窗口 T 内,过滤函数在每个时点的取值都是 1/T。利用上述公式计算得到的实际上是 t-(T-1)/2 时刻(而非 t 时刻)的低频趋势,而我们把它当作 t 时刻的低频趋势使用,这便产生了 (T-1)/2 的滞后。当我们使用简单移动平均时,在当前时刻 t ,对于给定的时间窗口 T ,我们仅能求出 t-(T-1)/2 时刻之前的低频趋势,而无法求出 t-(T-1)/2 之后的低频趋势。这也解释了为什么时间窗口 T 越大,滞后 (T-1)/2 越多。这就是为什么看股票数据里面 MA20、MA30、MA50 等日均线这种,计算均线的窗口 T 越大,得到的移动平滑曲线越滞后。

    既然无论如何都没有未来数据,那么是否意味着我们就只能接受移动平均的滞后性呢?答案是否定的。换个角度来考虑这个问题,滞后性说明由简单移动平均计算得到的低频趋势对近期的最新数据不够敏感。这是由于它在计算低频趋势时,对窗口内所有的数据点都给予相同的权重。按着这个思路延伸,自然的想法就是在计算移动平均时,给近期的数据更高的权重,而给窗口内较远的数据更低的权重,以更快的捕捉近期的变化。由此便得到了加权移动平均和指数移动平均。

    3 加权移动平均

    在计算加权移动平均(Weighted Moving Average, WMA)时,窗口内的过滤函数的取值从当前数据到之前第 T-1 期的数据依次线性递减。因此,第 t-i 期的 F_{t-i}2(T-i)/(T(T+1)), i = 0,1,\cdots,T-1。该权重是 i 的单调线性递减函数。下图为 T=15 时不同 i 的取值对应的权重(图片来自 wiki)。

    在确定了权重后, t 时刻的加权移动平均(记为 \mbox{WMA}_t )由下式得到:

    \mbox{WMA}_t=\frac{Ty_t+(T-1)y_{t-1}+\cdots+2y_{t-T+2}+y_{t-T+1}}{T(T+1)/2}

    值得一提的是,由于严格的按照线性递减,因此权重会最终在当前时刻之前的第 T 期时点衰减为 0。

    以上证指数过去 10 年的日数据为例,下图比较了 T = 100 时的简单移动平均和加权移动平均的过滤效果。加权移动平均比简单移动平均对近期的变化更加敏感,尤其是在牛熊市转换的时候,加权移动平均的滞后性小于简单移动平均。但是,由于仅采用线性权重衰减,加权移动平均仍然呈现出滞后性。

    4 指数移动平均

    指数移动平均(Exponential Moving Average, EMA)和加权移动平均类似,但不同之处是各数值的加权按指数递减,而非线性递减。此外,在指数衰减中,无论往前看多远的数据,该期数据的系数都不会衰减到 0,而仅仅是向 0 逼近。因此,指数移动平均实际上是一个无穷级数,即无论多久远的数据都会在计算当期的指数移动平均数值时有一定的作用,只不过离当前太远的数据权重非非常低,因此它们的作用往往可以忽略。

    在实际应用中, t 时刻的指数移动平均(记为 \mbox{EMA}_t )可以按如下方法得到:

    \mbox{EMA}_t=\left\{ \begin{array}{ll} y_1,&t=1\\ \alpha\times y_t+(1-\alpha)\times\mbox{EMA}_{t-1},&t>1 \end{array} \right.

    其中 \alpha 表示权重的衰减程度,取值在 0 和 1 之间。 \alpha越大,过去的观测值衰减的越快。虽然指数移动平均是一个无穷级数,但在实际应用时,我们也经常看到 T 期指数移动平均的说法。这里的 T 是用来计算 \alpha的参数,它不表示指数衰减在 T 期后结束。 \alphaT 的关系为 \alpha=2/(T+1)下图为 T=15 时不同时刻的权重(图片来自 wiki)。可以看到,任何一期的权重都不会衰减到 0。

    下图比较了 T=100 时简单移动平均、加权移动平均和指数移动平均的平滑效果。指数移动平均由于对近期的数据赋予了更高的权重,因此它比加权移动平均对近期的变化更加敏感,但这种效果在本例中并不显著,指数移动平均也存在一定的滞后。

    \alpha=1/T 时,得到的指数移动平均又称为修正移动平均(Modified Moving Average,MMA)或平滑移动平均(SMoothed Moving Average,SMMA),它们在应用中也十分常见。比如,在计算技术指标 ADX 的时候,就应用到了平滑移动平均。

    无论是加权还是指数移动平均,它们都是通过对近期的数值赋予更高的权重来提高低频趋势对近期变化的敏感程度。然而,它们的计算表达式(或算法结构)是固定的,在整个时间序列上的各个时点都使用同样的结构(即一成不变的权重分配方法)计算移动平均,而不考虑时间序列自身的特点。

    一个优秀的移动平均算法计算出来的均线应在时间序列自身波动不明显的时点足够平滑,而在时间序列自身发生巨变时迅速捕捉、将滞后最小化。要想达到这种效果,就必须利用时间序列自身的特点。分形自适应移动平均算法就是这样一个有力的工具。

    5 分形自适应移动平均

    顾名思义,分形自适应移动平均(FRactal Adaptive Moving Average,FRAMA)利用了投资品价格序列的分形特征。简单的说,该算法通过一个简单的公式计算从时间序列从当前时点往前 2T 长度的时间窗口内的分形维数 D ,并利用分形维数进一步求解指数移动平均的参数 \alpha

    分形维数描述时间序列的趋势,其取值在 1 到 2 之间,越大说明趋势越明显,越小说明时间序列越随机。因此,通过连续的计算时间序列局部的分形维数,该算法可以动态的、自适应的根据时间序列的特征计算平滑所用的参数。由于 \alphaD 的减函数,因此 D 越大(趋势越明显),\alpha 越小,即指数平滑时对过去的数值衰减的越慢; D 越小(随机性越强), \alpha 越大,即指数平滑时对过去的数值衰减的越快、对最新数据的变化越敏感。

    具体的,对于当前时点 t 和给定的窗口 T ,该方法用到了三个时间窗口,即 tt-T+1 (记为窗口 W_1 ,长度为 T ), t-Tt-2T+1 (记为窗口 W_2 ,长度为 T ),以及 tt-2T+1 (记为窗口 W ,长度为 2T )。不难看出, W = W_1+W_2 。该方法的步骤如下:

    计算 FRAMA 均线的步骤:

    1. 用窗口 W_1 内的最高价和最低价计算 N_1 = (最高价 – 最低价) / T
    2. 用窗口 W_2 内的最高价和最低价计算 N_2 = (最高价 – 最低价) / T
    3. 用窗口 W 内的最高价和最低价计算 N_3 = (最高价 – 最低价) / (2T)
    4. 计算分形维数 D = [\log(N_1+N_2) – \log(N_3)] / \log(2)
    5. 计算指数移动平均的参数 \alpha = \exp(-4.6\times(D-1)),并使其满足在 0.01 和 1 之间
    6. \alpha 带入指数移动平均的公式求解 t 时刻的 FRAMA 移动平均值

    下图比较了 T=100 时指数移动平均以及分形自适应移动平均的平滑效果。很明显,由于利用了时间序列自身的分形特征,FRAMA 均线对滞后性的提高非常明显,这意味着在价格趋势发生变化的时候它捕捉的更加及时。当然,取决于选取的参数,FRAMA 均线在一些局部可能不够平滑,它体现了一种动态的对平滑度和灵敏度的取舍。

    6 赫尔移动平均

    最后,我们再介绍一种业界常用的高级移动平均算法,即赫尔移动平均(Hull Moving Average,HMA)。它由 Alan Hull 发明,故由此得名。该算法最大的特点是在减少滞后的同时有效的提高了均线的平滑程度。

    在本文中,我们并不对它背后的逻辑做太多的剖析,这将留到今后介绍。我们直接给出它的计算步骤。对于给定的窗口 T

    计算 HMA 均线的步骤:

    1. 计算窗口为 T/2 的加权移动平均,并把结果乘以 2(如果 T/2 不是整数则取整)
    2. 计算窗口为 T 的加权移动平均
    3. 用第 1 步的结果减去第 2 部的结果,得到一个新的时间序列
    4. 以第 3 步得到的时间序列为对象,计算窗口为 \sqrt T ,的加权移动平均(如果 \sqrt T 不是整数则取整)

    上述步骤的数学表达式为 \mbox{HMA} = \mbox{WMA}((2\times \mbox{WMA}(y, \mbox{int}(T/2)) – \mbox{WMA}(y, T)), \mbox{int}(\sqrt T))

    最后,比较 T=100 时分形自适应移动平均和赫尔移动平均的平滑效果。令人惊喜的看到,HMA 均线有着不输 FRAMA 均线的灵敏性(滞后性非常低),并且在局部也提高了平滑性,确实做到了在保证平滑性的同时最大的降低了滞后性。

    7 结语

    作为技术分析的利器,移动平均线人人都在看、人人都在用。可又有多少人想得清楚、用的明白呢?本文详尽的分析了移动平均技术的本质,揭示了滞后性产生的原因。通过对五种不同过滤技术的分析和对比,说明了高级的移动平均技术(比如 FRAMA 和 HMA)可以有效的降低滞后性并保证均线的平滑性。

     

    展开全文
  • 与之相反,采用考虑吸附滞后效应的煤层气藏物质平衡方程确定的气藏地质储量值及平均含水饱和度变化值与实际值之间的误差较小,说明了所构建的煤层气藏物质平衡方程的有效性和正确性,可准确地评价煤层气藏的可采储量和...
  • 滞后算子(lag operator)

    万次阅读 2018-07-24 20:04:38
    在时间序列分析中,滞后算子(lag operator (L))或后移算子(backshift operator (B))对时间序列的元素进行操作以产生前一个元素。例如,给定一些时间序列   然后 或者类似的:  对全部 或者等价...

     

    在时间序列分析中,滞后算子(lag operator (L))或后移算子(backshift operator (B))对时间序列的元素进行操作以产生前一个元素。例如,给定一些时间序列

     


    然后


    或者类似的:

     对全部

    或者等价的

     


    其中L是滞后算子。有时用反移位的符号B代替。注意,滞后运算符可以被提升到任意整数幂,比如

     和

    滞后多项式

    也可以使用滞后算子的多项式,这是ARMA(自回归移动平均)模型的常用符号。例如,

     


    指定AR(p)模型。

    滞后算子的多项式称为滞后多项式,因此,例如,ARMA模型可以简明地指定为

     


    其中, 

     和 

     分别代表滞后多项式



    滞后算子的多项式遵循类似的乘法和除法规则,与变量的数和多项式一样。例如,

     与

     意思是一样的。

    与变量的多项式一样,滞后算子中的多项式可以使用多项式长除法除以另一个多项式。通常将一个这样的多项式除以另一个,当每个多项式具有有限阶数(最高指数)时,得到无穷多项式。

    注意 

     表示系数之和:

    展开全文
  • 空间滞后模型

    千次阅读 2021-01-02 13:49:30
    一,非空间滞后 滞后变量通常是从时间角度解释:我们把变量的前期值,即带有滞后作用的变量成为滞后变量。含有滞后变量的模型就是滞后变量模型。 比如我们的消费支出不仅取决于当前收入,还在一定程度上与过去的收入...
  • 2019工程伦理慕课答案(2019秋)习题及期末答案

    万次阅读 多人点赞 2019-11-08 18:19:53
    第一章习题(下) 单选题 (1/1 point) 下列哪一项不是工程与技术的区别 内容和性质 目的 活动主体 任务、对象和思维方式 单选题 (1/1 point) 下列哪一项不是工程活动的特征 ...计划、设计、建造...
  • SPSS(十九)SPSS之时间序列模型(图文+数据集)

    万次阅读 多人点赞 2019-06-17 22:32:38
    Autocorrelation Chart:做单个序列,任意滞后(包括负的滞后,也就是超前)的自相关和偏相关图 对序列图的初步观察结果作进一步确认(检验其是不是白噪声序列) 重点关心主要的相关趋势,然后再对模型进一步修正...
  • 滞后变量模型

    千次阅读 2018-10-09 22:31:28
    滞后变量模型 滞后变量模型 自动估值模型 [编辑] 目录 [隐藏] 1 滞后变量模型的概述 2 滞后效应与产生滞后效应的原因 3 滞后变量模型的分类 4 滞后变量模型估计时存在的问...
  • 文章目录导航经典单方程计量 经济学模型:专门问题5.1虚拟变量模型一、虚拟变量的引入二、虚拟变量的设置原则5.2滞后变量模型一、滞后变量模型二、分布滞后模型的参数估计三、自回归模型的参数估计四、格兰杰因果...
  • AMI 计算并绘制平均互信息 (ami) 以及不同时间滞后值的单变量或双变量时间序列的相关性。 用法: [amis corrs] = ami(xy,nBins,nLags) 输入: xy:单变量 (x) 或双变量 ([xy]) 时间序列数据。 如果给出双变量时间...
  • 时间序列模型(1)--移动平均

    千次阅读 2021-03-02 11:40:40
    因此,需要进行修正,修正的方法是作二次移动平均,利用移动平均滞后偏差的规律来建立直线趋势的预测模型。这就是趋势移动平均法。 一次移动的平均数为: Mt(1)=1N(y^t+...+y^t−N+1) M_{t}^{\left( 1 \right)}=\frac...
  • 本文说明了R包dlnm实现分布式滞后线性和非线性模型(DLM和DLNM)的建模框架的开发。首先,本文描述了除时间序列数据之外的DLM / DLNM方法的一般化方法,在Gasparrini [2014]中有更详细的描述。此外,此插图还说明了...
  • 天线基础与HFSS天线设计流程

    万次阅读 多人点赞 2019-04-28 15:10:10
    E1为沿x轴方向的线极化波幅度,E2为沿y轴方向的线极化波幅度,δ为Ey滞后于Ex的相位角。 若E1=0,则波是沿y轴方向极化的;若E2=0,则波是沿x轴方向极化的。若δ=0且E1=E2,则如图的OA轴方向上线极化的。 若E1=...
  • 在此,我们开发了分布式滞后非线性模型(DLNM),这是一个可以同时代表非线性暴露-反应依赖性和滞后效应的建模框架。这种方法是基于 "交叉基准 "的定义,这是一个双维的函数空间,它同时描述了沿预测空间和其发生的...
  • 参数# 描述 大小 可选------ -------------- ---- -------- 1 个日期 1xN 否2 高价 1xN 否3 低价 1xN 否4 开盘价 1xN 否5 收盘价 1xN 否6 体积 1xN 是7 移动平均滞后 1 1xN 是8 移动平均滞后 2 1xN 是如果不提供...
  • 依据50日移动平均值连接起来所画成的线,就是50日移动平均线,或者简称50日移动均线。同理,MA200d就是200日移动平均值,连起来就是200日移动均线。 让我们暂且忽略这每日究竟取哪个时间点的价格的微小误差问题。...
  • matlab的素描代码尼波 转换滞后(最终可能会变得很复杂) 什么是niwaves ? Matlab编写了许多用于询问神经成像中复杂...:根据社区成员身份和平均延迟对延迟矩阵进行重新lag_sort 。 可以另外绘制重新排序的滞后矩阵以
  • 时间序列模型 (二):移动平均

    万次阅读 多人点赞 2019-04-21 22:18:52
    时间序列模型 (二):移动平均法 时间序列模型 (三):指数平滑法 时间序列模型 (四):差分指数平滑法、 自适应滤波法v 时间序列模型 (五): 趋势外推预测方法 时间序列模型 (六):平稳时间序列模型 :...
  • (一)、什么是一阶滞后滤波? 一阶滞后滤波是一种数据平滑的手段,通过对本次采样值与上次滤波输出,做概率加权叠加,有效的使得了每次数据的滤波结果不仅仅与本次采样有关还与上次的输出有关,保证了每次的滤波输出...
  • 第三代移动平均线 MetaTrader 指标 — 是标准移动平均线(MA)的先进版,在较长MA时段执行简单的减少滞后性的程序。这种方法由M. Duerschner首次描述于他的文章Gleitende Durchschnitte 3.0 (德语)。当前版设定λ = ...
  • 平均值滤波算法是比较常用,也比较简单的滤波算法。在滤波时,将N个周期的采样值计算平均值,算法非常简单。当N取值较大时,滤波后的信号比较平滑,但是灵敏度差;相反N取值较小时,滤波平滑效果差,但灵敏度好。 ...
  • 我们研究了MFD环路尺寸与拥堵异质性(密度的标准偏差)和网络性能(平均乘客出行时间)之间的关系,发现两者均与环路宽度直接相关,而与环路高度则弱相关。 此外,我们根据拥塞发生和偏移时间将MFD环路分为两个部分...
  • 年),为了克服这些问题,我们为自相关图窗口中的滞后开发了一个参数化条件强度函数。 这比现有技术的偏差要小得多,并且允许我们使用最大似然方法进行更严格的统计,例如参数估计,并检查节律性特征是否受其他协...
  • python 写的对于单个表格做时间滞后性质的分析 1、注意 1)单个表格需要是两列数据(x,y) 2)不能有标题行 3)代码实现了x对y序列的时间滞后分析,改一下顺序便可以做y对x 4)本人在另外一篇博客中有批量读取excel...
  • 这个版本的赫尔均线令滞后更小,并且仍然保持赫尔均线的平滑,从而令其更 "快速"。
  • 在得出Galí和Gertler(1999)和Holmberg(2006)的混合新凯恩斯氏菲利普斯曲线(HNKPC)时,假定后向公司将其价格指数设为上期新设定的平均价格加上上期的通货膨胀率,从而得出在菲利普斯曲线方程中,该方程将当前...

空空如也

空空如也

1 2 3 4 5 ... 20
收藏数 11,679
精华内容 4,671
关键字:

平均滞后