精华内容
下载资源
问答
  • 均值回归理论,均值回归法则是指万物最终都将回归于其长期的均值 均值回归(reversion to the mean)法则是指万物最终都将回归于其长期的均值。当事物发展严重偏离其长期均值时,总有内在力量令其回归,所谓盛极必衰...

     均值回归理论,均值回归法则是指万物最终都将回归于其长期的均值

    均值回归(reversion to the mean)法则是指万物最终都将回归于其长期的均值。
    当事物发展严重偏离其长期均值时,总有内在力量令其回归,所谓盛极必衰,否极泰来,而且,这种现象周而复始。均值回归理论是金融学的一个重要概念,属于数学定量分析方法。
    均值回归是指股票价格无论高于或低于价值中枢(或均值)都会以很高的概率向价值中枢回归的趋势。至于何时发生均值回归,则属于“随机漫步”的范畴。

    《随机漫步的傻瓜》---寻找你的投资原则,查理芒格说:当成功概率很高的时刻,下最大的赌注,其余时间按兵不动 - 流风,飘然的风 - 博客园
    https://www.cnblogs.com/zdz8207/p/all-suijimanbu-gailv.html

    均值回归从理论上讲应具有必然性。
    根据这个理论,一种上涨或者下跌的趋势不管其延续的时间多长都不能永远持续下去,最终均值回归的规律一定会出现:涨得太多了,就会向平均值移动下跌;跌得太多了,就会向平均值移动上升。

    与趋势跟踪赌趋势的继续不同,均值回归则是赌趋势的反转。巴菲特的逆向投资策略,索罗斯的反身理论,其本质都是均值回归理论的应用,所不同的是前者是价值低估的投资,后者则是泡沫破灭的投机。

    均值回归理论在一定程度上或一定范围内对股票价格进行预测,对于长线投资者具有重要指导意义。

    请记住均值回归理论,洞悉了时间的秘密,就会真正洞悉财富的秘密。

    --------------
    什么是均值回归原理?

    在 1875 年,查尔斯 . 达尔文的大侄子弗朗西斯 . 高尔顿(Francis Galton)发现了中值回归理论,这位业余数学家的发现解释了为什么骄兵必败,为什么云层内层看上去总是银色。如果我们认为事物总要回归 " 常态 ",并且基于这样的预期来做任何决策的时候,我们就是在应用中值回归的理论。

    均值回归从理论上讲应具有必然性。因为有一点是肯定的,股票价格不能总是上涨或下跌,一种趋势不管其持续的时间多长都不能永远持续下去。
    在一个趋势内,股票价格呈持续上升或下降,我们称之为均值回避 ( Mean Aversion ) 。
    当出现相反趋势时就呈均值回归 ( Mean Reversion ) 。到目前为止,均值回归理论仍不能解决的或者说不能预测的是回归的时间间隔,即回归的周期呈 " 随机漫步 "。

    不同的股票市场,回归的周期会不一样,就是对同一个股票市场来说,每次回归的周期也不一样。
    正的收益与负的收益回归的幅度与速度不可能一样。
    因为它们之间并没有必然的联系,回归的幅度与速度也具有随机性。
    对称的均值回归才是不正常的、偶然的,这一点也被实证检验所证实。

     

    转载于:https://www.cnblogs.com/zdz8207/p/all-junzhihuigui.html

    展开全文
  • 时间序列之AR(自回归模型)

    千次阅读 2019-02-10 13:37:40
  • 多元回归理论及R语言实现

    千次阅读 多人点赞 2018-04-06 00:00:00
    点击蓝字关注这个神奇的...建立回归模型的一般过程为:1)建立理论回归模型2)估计模型参数3)回归模型检验4)模型诊断5)利用回归方程进行预测以下用思维导图展示回归分析的各个过程:以下是RStudio实现过程:1、
        

    点击蓝字关注这个神奇的公众号~

    640?wx_fmt=gif&wxfrom=5&wx_lazy=1

    作者:吴数,金融学在读研究生,R语言爱好者


    回归分析是研究两个变量之间的不确定性关系,考察变量之间的数量变化规律,通过回归方程的形式描述和反映这种关系,帮助人们挖掘出变量之间隐藏的规律。


    建立回归模型的一般过程为:

    1)建立理论回归模型

    2)估计模型参数

    3)回归模型检验

    4)模型诊断

    5)利用回归方程进行预测


    以下用思维导图展示回归分析的各个过程:

    640?wx_fmt=png&wxfrom=5&wx_lazy=1


    以下是RStudio实现过程:

    1、建立模型及显著性检验

    首先是载入数据,在此用的是UCI的一个数据集,包含13种汽车车型的相关指标,共398个样本。选可行驶的公里数MPG作为因变量y,排气量displace、马力horsepower、自重weigh为自变量,分别设为x1、x2、x3,各变量均为数值型。

    利用car包中的scatterplotMatrix函数绘制矩阵散点图,以便观察自变量与因变量的关系,可以看到,y与各自变量之间呈现出一定的线性关系。

    640?wx_fmt=png


    640?wx_fmt=png


    640?wx_fmt=png



    所以下一步建立回归方程,将y对x1、x2、x3三个变量进行多元回归。通过summary函数显示model.lm对象中的详细信息。

    可以看到,调整R2为0.704;回归方程显著性的F检验中,P值小于显著性水平α(假设取0.05),表明选择线性模型合理。

    640?wx_fmt=png


    在回归系数显著性检验中,x1不显著,所以把x1直接剔除。再次进行回归,此时调整R2=0.704,回归方程显著,且各回归系数在显著性水平0.001下显著,所以该模型可用。

    640?wx_fmt=png


    2、回归诊断

    (1)残差项的正态性检验和等方差性检验

    借助残差图进行,从右上Q-Q图可见,仍有部分残差点有规律地落在对角线之外;从左边两个图可见,误差项的方差随着y的拟合值而变化,尤其在y的拟合值>20之后,残差的方差有所增大。所以可近似地认为不满足残差项的正态性、等方差假定。

    640?wx_fmt=png


    640?wx_fmt=png


    基于残差不满足正态性、等方差性,所以对模型进行改进,对y进行对数变换后再回归。

    640?wx_fmt=png


    640?wx_fmt=png


    可见残差的正态性、等方差性基本上得到了满足,而且R2比之前的0.7049还大,说明建立对数模型是合理的。

    用car包中的ncvTest函数再次检验异方差,P值>0.05所以基本上满足了等方差性。

    640?wx_fmt=png


    (2)多重共线性检验

    从多重共线性检验效果来看,VIF<10,多重共线性还可以容忍。如果存在多重共线性可以直接删除变量,也可以通过岭回归等有偏估计处理。

    640?wx_fmt=png


    (3)自相关检验

    自相关关系主要存在于时间序列数据中,当然截面数据也有可能存在自相关,这种情况通常是由于遗漏了某些重要的解释变量或者模型设定偏误导致的。在截面数据中,对于异方差的处理一般就是添加忽略掉的解释变量或者调整模型,也可以用序列相关稳健标准误修正相应的方差。在时间序列数据中当以上方法不能满足时则需要用一阶差分法、广义差分法、序列相关稳健标准误等。

    640?wx_fmt=png


    P值<0.05,说明残差存在自相关性,这里采用尼威-韦斯特稳健标准误修正相应的方差,它能够同时针对异方差、自相关进行修正,这种方法估计出的参数与OLS的相同,只是修正了参数的方差,消除自相关、异方差的存在带来的不良后果。

    640?wx_fmt=png


    (4)异常值检测

    利用car包中的influencePlot函数可以将各类异常值可视化。横坐标为杠杆值,纵坐标是学生化残差,圆圈大小表示库克距离的大小。可见117号观测点是强影响点,388号为离群点,14号为高杠杆值点。

    640?wx_fmt=png


    640?wx_fmt=png


    对于强影响点的删除需要谨慎,删除或者包含强影响点都可能会导致回归方程的截距和斜率产生很大的变化。可以先把异常值删除,再重新回归。

    至此,最终回归模型已确立:。表示在x3一定的条件下,x2每增加100个单位,y将会减少26个单位。




     大家都在看 

    2017年R语言发展报告(国内)

    R语言中文社区历史文章整理(作者篇)

    R语言中文社区历史文章整理(类型篇)

    640?wx_fmt=jpeg

    公众号后台回复关键字即可学习

    回复 R                  R语言快速入门及数据挖掘 
    回复 Kaggle案例  Kaggle十大案例精讲(连载中)
    回复 文本挖掘      手把手教你做文本挖掘
    回复 可视化          R语言可视化在商务场景中的应用 
    回复 大数据         大数据系列免费视频教程 
    回复 量化投资      张丹教你如何用R语言量化投资 
    回复 用户画像      京东大数据,揭秘用户画像
    回复 数据挖掘     常用数据挖掘算法原理解释与应用
    回复 机器学习     人工智能系列之机器学习与实践
    回复 爬虫            R语言爬虫实战案例分享

    展开全文
  • 建立回归模型的一般过程为:1)建立理论回归模型2)估计模型参数3)回归模型检验4)模型诊断5)利用回归方程进行预测以下是RStudio实现过程:1、建立模型及显著性检验getwd()setwd("E:")A=read.csv("...

    回归分析是研究两个变量之间的不确定性关系,考察变量之间的数量变化规律,通过回归方程的形式描述和反映这种关系,帮助人们挖掘出变量之间隐藏的规律。


    建立回归模型的一般过程为:

    1)建立理论回归模型

    2)估计模型参数

    3)回归模型检验

    4)模型诊断

    5)利用回归方程进行预测


    以下是RStudio实现过程:

    1、建立模型及显著性检验

    getwd()
    setwd("E:")
    A=read.csv("多元回归数据.csv")#读取数据集
    A
    fix(A)#修改变量名字
    A=A[,-c(5,6)]#删除x4,x5两个变量
    A
    library(car)
    scatterplotMatrix(~y+x1+x2+x3,data=A,main="散点图")#绘制各个变量的散点图

    利用car包中的scatterplotMatrix函数绘制矩阵散点图,以便观察自变量与因变量的关系,可以看到,y与各自变量之间呈现出一定的线性关系。或者用plot(A) A为数据集名称 直接画图。或者plot(Y~X1);abline(lm(Y~X1))



    所以下一步建立回归方程,将y对x1、x2、x3三个变量进行多元回归。通过summary函数显示model.lm对象中的详细信息。

    可以看到,调整R2为0.704;回归方程显著性的F检验中,P值小于显著性水平α(假设取0.05),表明选择线性模型合理。


    在回归系数显著性检验中,x1不显著,所以把x1直接剔除。再次进行回归,此时调整R2=0.704,回归方程显著,且各回归系数在显著性水平0.001下显著,所以该模型可用。


    2、回归诊断

    (1)残差项的正态性检验和等方差性检验

          借助残差图进行,从右上Q-Q图可见,仍有部分残差点有规律地落在对角线之外;从左边两个图可见,误差项的方差随着y的拟合值而变化,尤其在y的拟合值>20之后,残差的方差有所增大。所以可近似地认为不满足残差项的正态性、等方差假定。residuls(remodel.lm)即可提取残差列。


    基于残差不满足正态性、等方差性,所以对模型进行改进,对y进行对数变换后再回归。



    可见残差的正态性、等方差性基本上得到了满足,而且R2比之前的0.7049还大,说明建立对数模型是合理的。

    用car包中的ncvTest函数再次检验异方差,P值>0.05所以基本上满足了等方差性。

    (2)多重共线性检验

    从多重共线性检验效果来看,VIF<10,多重共线性还可以容忍。如果存在多重共线性可以直接删除变量,也可以通过岭回归等有偏估计处理。

    (3)自相关检验

    自相关关系主要存在于时间序列数据中,当然截面数据也有可能存在自相关,这种情况通常是由于遗漏了某些重要的解释变量或者模型设定偏误导致的。在截面数据中,对于异方差的处理一般就是添加忽略掉的解释变量或者调整模型,也可以用序列相关稳健标准误修正相应的方差。在时间序列数据中当以上方法不能满足时则需要用一阶差分法、广义差分法、序列相关稳健标准误等。

    残差自相关的 Durbin-Watson 检验:


    library(lmtest)
    x <- rnorm(100)
    y <- 2 * x + rt(100,9)
    res <- lm(y~x)
    dwtest(res)

            Durbin-Watson test

    data:  res 
    DW = 1.80, p-value = 0.1498
    alternative hypothesis: true autocorrelation is greater than 0 

    接受原假设

    或者用bgtest()检验


    P值<0.05,说明残差存在自相关性,这里采用尼威-韦斯特稳健标准误修正相应的方差,它能够同时针对异方差、自相关进行修正,这种方法估计出的参数与OLS的相同,只是修正了参数的方差,消除自相关、异方差的存在带来的不良后果。

    尼威-韦斯特稳健标准误能同时修正异方差和序列相关,而且只对大样本(50以上)有效,修正后参数系数不变,但标准误已改变,所以t值等等就改变。

    (4)异常值检测

    利用car包中的influencePlot函数可以将各类异常值可视化。横坐标为杠杆值,纵坐标是学生化残差,圆圈大小表示库克距离的大小。可见117号观测点是强影响点,388号为离群点,14号为高杠杆值点。


    对于强影响点的删除需要谨慎,删除或者包含强影响点都可能会导致回归方程的截距和斜率产生很大的变化。可以先把异常值删除,再重新回归。

    至此,最终回归模型已确立:。表示在x3一定的条件下,x2每增加100个单位,y将会减少26个单位。

    展开全文
  • ARMA自回归移动平均模型 金融时间序列分析:8. MA模型实例(Python) 金融时间序列分析:7. MA滑动平均模型 金融时间序列分析:6. AR模型实例 金融时间序列分析:5. AR模型实例(Python) 金融...
  • spark学习回归理论和实战房价预测

    千次阅读 2018-10-19 23:02:36
    1. 2. 3. spark提供的回归算法: 线性回归算法概述: 线性回归算法原理   最小二乘法 ...这是代价函数, 随机在于随机取n的数,没有都选,这样节省时间,1/2代表调节...
  • 自回归模型

    万次阅读 多人点赞 2018-08-17 22:39:28
    自回归模型(Autoregressive Model,简称 AR 模型)是最常见的平稳时间序列模型之一。接下将介绍 AR 模型的定义、统计性质、建模过程、预测及应用。 一、AR 模型的引入 考虑如图所示的单摆系统。设 xt 为第 t ...
  • 线性回归-理论

    千次阅读 2014-07-03 12:11:38
    线性回归(Linear Regression) "回归"的由来 Francis Galton,英国生物学家,他研究了父母身高与子女身高之间关系后得出,若父母身高高于平均大众身高,则其子女身高倾向于倒退生长,即会比其父母身高矮...
  • 回归分析之理论

    千次阅读 2017-09-17 08:10:07
    2015年的机器学习博客其实都是看《机器学习实战》这本书时学到的,说实话当时也是知其然,不知其所以然,以至于对其理解不深刻,好多细节和理论知识都搞的是乱七八糟,自从工作之后再去看一个算法,思考的比之前多了...
  • VAR(向量自回归)模型

    万次阅读 多人点赞 2020-06-14 10:03:34
    VAR(向量自回归)模型是基于数据统计性质建立起来的模型,它把系统中的每个内生变量作为系统里所有其它内生变量滞后值的函数进行构建模型,从而把单变量的自回归模型推广到了多元时间序列组成的向量自回归模型。...
  • 机器学习算法(8)之多元线性回归分析理论详解

    万次阅读 多人点赞 2018-08-29 16:28:27
    前言:当影响因变量的因素是多个时候,这种一个变量同时与多个变量的回归问题就是多元回归,分为:多元线性回归和多元非线性回归。线性回归(Linear regressions)和逻辑回归(Logistic regressions)是人们学习算法的第...
  • 时间序列分析的理论基础很简单:设若时间序列(或随机过程)的任一元素yty_t与其前期元素(yt−1、yt−2y_{t-1}、y_{t-2}等)之间存在着某种关联,则我们可以根据该时间序列的既往观测值来预测其在未来的取值。...
  • 逻辑回归算法梳理(从理论到示例)

    万次阅读 多人点赞 2019-03-29 09:25:34
    逻辑回归算法的原理
  • 向量自回归模型

    万次阅读 2018-08-04 12:30:23
    **VAR**:多方程联立形式,在模型的每一个方程中,内生变量对模型的全部内生变量的滞后值进行回归,从而估计全部内生变量的动态关系。 **用途**:VAR常用于预测相互联系的时间序列系统及分析随机扰动对变量系统的...
  • 机器学习系列(3)_逻辑回归应用之Kaggle泰坦尼克之灾

    万次阅读 多人点赞 2015-11-12 12:07:12
    时间:2015年10月。 出处: 声明:版权所有,转载请注明出处,谢谢。手把手机器学习之逻辑回归应用——Kaggle泰坦尼克之灾1.引言先说一句,年末双十一什么的一来,真是非(mang)常(cheng)欢(gou)乐(le)!然后push...
  • 澳大利亚在2008 - 2009年全球金融危机期间发生了这种情况。澳大利亚政府发布了一揽子刺激计划,其中包括2008年12月的... 也就是说,它们不是建立在一些经济学理论的基础上,这些理论强加了方程式的理论结构。假...
  • 时间序列回归模型

    千次阅读 2014-09-11 11:18:05
    ... 写成无穷AR模型: 模型Yt` = et + pi1*Yt-1` + pi2*Yt-2` + ....... 同样写成AR(无穷)模型): ... 最后,我们在考察Yt`对Xt`回归(OLS)的残差项的ACF,PACF,EACF即可以获得Zt的p,d,q参数. `  
  • 自回归处理的是相关问题,也就是序列间相关。一阶相关的模型建立在变量取值仅和前一期相关的基础上。关于估计方法,此时参数的估计虽然保持无偏性,但已失去有效性,不是UMVUE,也不能用t检验考察其显著性。方法...
  • 今天要学习的话题是逻辑回归,逻辑回归也是一种有监督学习方法(supervised machine learning)。逻辑回归一般用来做预测,也可以用来做分类,预测是某个类别^.^!线性回归相比大家都不陌生了,y=k
  • 澳大利亚在2008 - 2009年全球金融危机期间发生了这种情况。澳大利亚政府发布了一揽子刺激计划,其中包括2008年12月的... 也就是说,它们不是建立在一些经济学理论的基础上,这些理论强加了方程式的理论结构。假...
  • 时间序列与因素回归的区别

    千次阅读 2019-04-26 13:50:21
    浅谈时间序列与因素回归 这篇想谈谈时间序列和因素回归的关系,什么时候两个可以相互替代,什么时候不能相互替代。 什么是时间序列?时间序列(或称动态数列)是指将同一统计指标的数值按其发生的时间先后顺序排列而...
  • 损失函数作为建模的一个重要环节,一个针对模型、数据集都合适的损失函数对于建模的好坏至关重要,现查询相关资料,将常见的分类、回归损失函数及常用的 Tensorflow 代码总结于此,仅用于学习交流。
  • 造成多重共线性的原因有一下几种:1、解释变量都享有共同的时间趋势;2、一个解释变量是另一个的滞后,二者往往遵循一个趋势;3、由于数据收集的基础不够宽,某些解释变量可能会一起变动;4、某些解释变量间存在某种...
  • 时间序列初级理论

    千次阅读 2017-10-23 09:11:52
    前言 数学特征 1 一般随机变量的数学特征 11 期望 12 方差 13 协方差 14 相关系数 2 随机变量序列的一些数学特征 21 随机变量序列 ...23 协方差函数 24 相关系数 ...111 弱宽平稳时间序列的数学特征 ...1
  • 向量自回归模型(VAR)及其R语言实现

    万次阅读 多人点赞 2018-05-17 15:53:55
    最近在写向量自回归的论文,无论是百度还是Google,都没能找到特别合适的R环境下中文资料,大都是Eviews做出来的。所以写这么一篇blog来分享下自己的经验。 注:本文着重介绍VAR的R实现,具体学术性质的东西请参阅...
  • https://github.com/manfrezord/MediumArticles/blob/main/LM-Algorithm.ipynb 总结 科技发展使得执行几年前可能要花费很长时间的计算变得更加容易。 但是,了解所有这些计算的来源始终很重要。 进行线性和非线性...
  • R语言解读自回归模型

    千次阅读 2016-08-19 11:17:15
    自回归模型(Autoregressive model),简称AR模型,是统计上一种处理时间序列的方法,用来描述当前值与历史值之间的关系,用变量自身的历史时间数据对自身进行预测,自回归模型必须满足平稳性的要求。比如,时间序列...
  • Stata 中的向量自回归模型(VAR)

    万次阅读 多人点赞 2018-11-21 12:09:44
    在单变量回归中,一个平稳的时间序列 yty_tyt​ 经常被模型化为 AR 过程: yt=α0+α1yt−1+α2yt−2+⋯+αkyt−k+ϵt y_t=\alpha_0+\alpha_1 y_{t-1}+\alpha_2 y_{t-2}+\dots +\alpha_k y_{t-k}+\epsilon_t yt​...

空空如也

空空如也

1 2 3 4 5 ... 20
收藏数 52,370
精华内容 20,948
关键字:

时间自回归理论