精华内容
下载资源
问答
  • 企业违约概率的系统风险因子测度——基于经济转型的因素模型分析,李关政,,本文通过将经济转型纳入系统风险因子序列,构建基于经济转型的因素模型(ETM),对影响我国企业违约概率的系统风险因子进行全面
  • 股票多因子模型的回归验

    千次阅读 2019-04-26 10:50:31
    精通各种概率模型和统计方法,擅长不确定性随机系统的建模及优化。知乎专栏:https://zhuanlan.zhihu.com/mitcshi。 **摘要:**收益率均值和因子暴露在截面上的关系就是多因子模型研究的问题。本文讨论一些平时在...

    转 股票多因子模型的回归检验

    作者:石川,量信投资创始合伙人,清华大学学士、硕士,麻省理工学院博士;精通各种概率模型和统计方法,擅长不确定性随机系统的建模及优化。知乎专栏:https://zhuanlan.zhihu.com/mitcshi。

    **摘要:**收益率均值和因子暴露在截面上的关系就是多因子模型研究的问题。本文讨论一些平时在使用多因子模型时遇到的常见问题,如截面回归 vs 时序回归、使用 portfolio returns 和宏观经济指标作为因子有什么不同、以及因子暴露应该如何确定等。

    引言:
    这是迄今为止我写的最重要的文章,没有之一。

    本文的题目是股票多因子模型的回归检验。说它重要,是因为在多因子模型被用于资产定价(选股)越来越普及的今天,很多人不一定搞清楚了多因子模型中常见的时间序列回归、截面回归之间到底有什么区别,以及它们在本质上又是何其相似;不一定搞清楚在使用多因子模型给资产定价时,需要关注的 statistical tests 目标到底是什么;不一定搞清楚在回归残差存在时序或截面相关性时,模型参数的 standard errors 可能完全是不准确的以至于给出错误的推断……

    本文旨在讨论一些平时在使用多因子模型时可能遇到的各种困惑(比如什么时候用截面回归、什么时候用时序回归;使用 portfolio returns 作为因子和其他比如宏观经济指标作为因子有什么不同等)。由于篇幅有限,我会把写作重点放在对核心概念的解读上。此外,在本文中还会涉及对 Barra 模型的一些思考。

    文章的最后一节将会安利写作时使用的主要参考文献(下文中对于时序和截面回归的讲解、以及对 Fama-MacBeth 回归的说明来自 John Cochrane 的经典教材 Asset Pricing 以及他在芝加哥大学的同名网上课程的相关部分),感兴趣的小伙伴在阅读本文后可以进一步参考。

    最后一个小建议:请在一个能静下心来思考的心境下和环境中阅读此文。

    1.多因子模型的回归测试

    多因子模型是 Asset Pricing(资产定价)的一种常见方法(其他的方法还包括 consumption-based model 等)。一个多因子模型(假设 K 个因子)的表达式如下:
    0_1535510129126_360截图20180829103516774.jpg

    其中 R_i 代表股票 i 的超额收益;β_i 为股票 i 的 K × 1 阶因子暴露(factor exposure,也称因子载荷 factor loading)向量;λ 为 K × 1 阶因子收益率均值向量;E[.] 为数学求期望公式。

    多因子模型研究的核心问题是股票的(超额)收益率期望在截面上(即不同的股票之间)为什么会有差异 —— 根据模型,如果一支股票在因子上的暴露(β_i)高,则它的期望收益(E[R_i])也应该更高。

    “ The central economic question is why average returns vary across assets; expected returns of an asset should be high if that asset has high betas or risk exposure to factors that carry high risk premia.”

    虽然本文才刚开始,不过让我们停一停,take a break。我想再强调一下上面这句话:多因子模型研究的是个股收益率均值在截面上(cross-sectional)的差异。我们不关心个股的收益率 R_i 在时间序列上是如何随着每期因子收益率来波动的(这是 model of variance),我们只关心 R_i 的期望E[R_i] 在截面上和对应的 β_i 之间的关系(这是 model of the mean)。

    我们选择的因子代表了收益率的一种结构。一旦结构给定后,个股(或者任何一个投资组合)的预期收益率就完全由它在这些因子上的暴露决定了 —— 暴露高,预期收益率就高;预期收益率是因子暴露的线性函数。怎样找到最好的因子结构 —— 即哪些因子使得个股在截面上的预期收益率区分度高 —— 就是因子模型研究的问题。

    仍然晦涩?用下面这个图解释一下(因为要做图,所以假设单因子,比如 CAPM 模型)。下图中横坐标为 β_i,纵坐标为 E[R_i],每个点代表一支股票。根据因子模型,每个股票的预期收益率 E[R_i] 和 β_i 成正比。图中这条直线就代表 E[R_i] = β_i × λ,它的斜率 λ 就是因子的预期收益。由于所有的股票收益率都仅仅是样本数据,因此即便 E[R_i] = β_i × λ 完美满足,在每个样本内,E[R_i] 和 β_i × λ 之间也有残差,正如图中的 α_i 所示。

    0_1535510376168_360截图20180829103910351.jpg

    因为一共有 N 支股票,因此这张图中的直线反映的是 N 个 E[R_i] 和 N 个对应的 β_i 在截面上的关系 —— 正如前文反复强调的,多因子模型反映的是收益率均值和因子暴露在截面上的关系。

    我们最熟悉的因子模型无疑是 CAPM,它因为只有一个市场因子所以是多因子模型的一个特例。人们最早的猜测是市场因子的收益率和个股在该因子上的 β 就可以解释截面上不同股票收益率之间的区别。但大量的实证结果显示如果我们把个股的 E[R_i] 和它们针对市场因子的 β_i 画出来,则实际的斜率较模型的结果来说太小了,说明仅仅用单一市场因子无法很好的解释 E[R_i] 在截面上的差别。

    这之后,Black、Jensen 以及 Scholes 提出了 Black CAPM,它在 CAPM 的基础上又加入了一个因子,使得这个双因子模型更好的解释 E[R_i] 在截面上的差别。再后来,Fama 和 French 提出了大名鼎鼎的三因子模型,它在市场因子的基础上加入 HML 和 SMB 两个因子。这些努力都是为了能够更好的解释我们在股票收益率数据中观察到的 E[R_i] 在截面上的差别。

    拿来一个多因子模型,应该怎么定量的评估它能否很好的解释 E[R_i] 呢?我们应该关注三点:Estimate(估计)、Standard Errors(标准误)、以及 Test(检验),见下表。

    0_1535510467267_360截图20180829104052767.jpg

    对于截面关系式 E[R_i] = β_i’λ + α_i,我们使用回归分析(既可以通过时序回归、也可以是截面回归,后面会具体讲)确定参数 α、β、λ 的估计值和标准误。只有有了准确的(无偏且相合)估计值和正确的标准误,才能评价因子是否有效(比如正确计算因子收益率 λ 的置信区间,从而判断这个因子是否有风险溢价)。下文会谈到,由于残差 α 在截面以及时序(特别是截面)上有相关性,因此在标准误的计算上必须格外小心。

    在上述截面关系式中,α_i 代表了个股 i 的定价错误(pricing error)。如果我们能够在统计上证明所有股票的 α_i 都很接近零,那么这个多因子模型就是很好的模型 —— 这些因子能够较好的解释个股截面预期收益率的差别。因此,多因子模型的回归检验中的重中之重、也是我们唯一关注的 test,就是所有这些 α_i 联合起来是否在统计上足够接近零。

    “ We want to know whether all the pricing errors are jointly equal to zero.”

    根据上述说明,多因子模型的回归检验可以简单总结成以下几点:

    1. 挑选因子,计算个股在这些因子上的暴露 β_i;
    2. 找到个股(超额)收益率均值 E[R_i] 和因子暴露 β_i 在截面上的关系;
    3. 计算每个个股的定价错误 α_i,联合检验这些 α_i 是否在统计上为零。

    无论我们用什么因子(基本面因子、宏观经济因子、技术面因子);无论在确定截面关系时我们采用时序回归还是截面回归;对多因子模型的最终评判都转化成一个核心问题 —— 这些 α_i 联合起来是否在统计上为零。

    下面先来看看如何通过时间序列回归找到截面关系。

    2.时间序列回归

    如果模型中的因子是 portfolio returns(即使用投资组合收益率作为因子),那么可以通过**时间序列回归(time-series regression)**来分析 E[R_i] 和 β_i 在截面上的关系。

    例如,Fama and French (1993) 提出了影响深远的三因子模型,它里面的三个因子,即市场、HML、SMB 都是投资组合的收益率。其中 HML 和 SMB 是通过 BP 和市值将股票排序然后做多一部分并同时做空一部分来构建的投资组合。以 HML 为例,它代表着 high book-to-market ratio 公司相对于 low book-to-market ratio 公司的超额收益。该因子叫做 HML 因子而非 BP 因子,其意义也是强调因子本身是一个投资组合的收益率,而非 BP。Fama 和 French 用这三个投资组合的收益率来解释个股或者其他投资组合在截面上的收益率。顺便提一句,关于三因子模型的重要性以及其作用,Fama and French (1996) 给出了非常详尽的解读,非常值得一读。

    令 f_t 表示 t 期因子向量(不同投资组合的收益率);使用 f_t 对每支个股 i 的收益率 R_it 做时间序列回归:

    0_1535510805255_360截图20180829104633285.jpg

    上述时间序列回归中,回归方程右侧的 regressors 是因子收益率 f_t,左侧的变量是 R_it,回归得到的系数是个股 i 在因子上的暴露 β_i,截距 α_i,以及随机的残差 ε_it。

    将上述时间序列回归结果在时序上取均值可得(下式中 E_T[.] 中下标 T 表示在时序上取均值):

    0_1535510836799_360截图20180829104704478.jpg

    上式正是个股期望收益率和因子暴露在截面上的关系式。当因子本身是投资组合时,我们只需要在时序上做回归得到因子暴露和截距。虽然只做了时序回归,但是通过在时序上取均值就可以从时序回归中得出 E[R_i] 和 β_i 在截面上的关系。比较上面两个关系式不难发现,时间序列回归中的截距 α_i 恰恰就是截面关系式中的个股 i 的定价错误。

    Black, Jensen and Scholes (1972) 基于如上的论述给出了时序回归法中求解因子预期收益率的简单方法 —— 因子收益率 f_t 在时序上的均值就是因子的预期收益率:

    0_1535510930543_360截图20180829104838198.jpg

    下面仍然以单因子这种最简单的情况来画图看看通过上述时间序列回归得到的预期收益率和 β_i 的截面关系长什么样子。图中的红色直线为 E[R_i] = β_iE[f],当 β_i = 0 时,E[R_i] = 0;此外,如果我们用给因子模型解释因子投资组合自己,由于因子组合的 β_i = 1,因此有 E[R_i] = E[f]。以上论述说明时间序列回归得到的 E[R_i] = β_iE[f] 这条直线一定会经过 (0, 0) 和 (1, E[f]) 两点。

    0_1535510990123_360截图20180829104933422.jpg

    图中所有蓝黑色的点代表着个股;红色的点代表着因子投资组合。时间回归再按时间求均值而得到的因子模型 E[R_i] = β_iE[f] 就是经过原点和红点的那条红色直线。所有蓝黑色点(个股)到这条红线的距离就是个股的定价错误 α_i,这条时序回归得到的直线并不是以最小化 α_i 的平方和为目的求出的,这是时序回归和下一节要介绍的截面回归的最大差别(截面回归是以最小化 α_i 的平方和为目标的)。

    得到了回归模型的参数,下一步就是计算各种参数的标准误、以及检验我们唯一关注的问题:所有股票的错误定价 α_i 联合起来是否在统计上为零。

    在时间序列回归残差 ε_it 不相关且方差相同(homoskedastic)时,时序回归参数的标准误可以由 OLS(ordinary least square)的标准公式给出。此外,如果 ε_it 满足 IID Normal,Gibbons, Ross and Shanken (1989) 给出了 α_i 的检验统计量(又称为 GRS test statistic):

    0_1535511101184_360截图20180829105121926.jpg

    0_1535511135024_360截图20180829105201992.jpg

    然而,一旦 ε_it 之间存在相关性或者异方差性,传统 OLS 的标准误公式就是错误的,且上述 α_i 的检验统计量也是有问题的。在这种情况下,就要请出大杀器 Generalized Method of Momentums(GMM)。它由 Lars Peter Hansen 于 1982 年提出(Hansen 1982),GMM 可以解决 OLS 中残差的相关性和异方差性的问题,得到准确的估计以及标准误。GMM 是 Hansen 于 2013 获得诺贝尔经济学奖的原因之一,足见其在计量经济学中的重要性。具体如何使用 GMM 超出本文的范畴,感兴趣的读者可以参考本文最后一节安利的参考文献。

    以上就是通过时间序列回归得到多因子模型的过程。最重要的三点总结如下:

    1. 因子必须是 portfolio returns,才可只进行时间序列回归而无需进一步的截面回归;时序回归得到了投资品在这些因子上的暴露 β_i;时序回归中得到的 α_i(截距项)就是截面关系上个股的定价错误。

    2. 将时序回归结果在时间上取均值,就得到个股收益率和因子暴露在截面上的关系。该关系的确定不以最小化 α_i 的平方和为目标。

    3. 在时序回归残差 ε_it 满足 IID Normal 的条件下,可以通过 GRS test 来检验 α_i;否则则可以通过 GMM 来检验 α_i。

    3.截面回归

    下面来看看截面回归(cross-sectional regression)截面回归的最大好处是,因子可以不是 portfolio returns。比如因子可以是 GDP、CPI、利率这些宏观经济指标。显然,它们的因子取值不是收益率,因子收益率需要通过截面回归得到。但是在那之前,我们必须先通过时间序列回归得到个股在不同因子上的暴露。因此,截面回归的第一步仍然是时序回归,以确定因子暴露。

    有的小伙伴可能会问,那些因子取值(比如 GDP 的取值、CPI 的取值)不能直接当作 β_i 吗?答案是否定的。首先这没有意义,因为时序上我们关注的是这些因子的变化对个股收益率变化的解释程度(model of variance),这由个股收益率对这些因子的敏感程度,即时序回归的系数 β_i,而非因子本身的大小决定。第二,行业不同、基本面存在差异的公司受宏观经济的影响也不同,因此它们在同样宏观经济指标上的暴露势必不同。

    一般的,假设因子不是 portfolio returns,首先进行时序回归确定 β_i:

    0_1535511415751_360截图20180829105635502.jpg

    上式和前一节时序回归中的表达式几乎一样,唯一的例外是这里的截距项我特意用了 a_i,而非 α_i,这是因为如果因子本身不是投资组合收益率,则该截距并不是稍后我们通过截面回归得到的个股的定价错误。

    得到 β_i 后,进行第二步 —— **截面回归,从而确定每个因子的预期收益率。**在截面回归时,回归表达式的右侧 regressors 是 β_i,左侧是个股的预期收益率(即在整个 T 期的收益率均值)E[R_i]。因此,截面回归的表达式为:

    0_1535511473708_360截图20180829105734062.jpg

    回归的目标是找到因子预期收益率 λ,和代表股票定价错误的残差 α_i。仍以单因子为例说明通过截面回归得到的个股收益率均值和因子暴露的关系(下图)。假设在截面回归时采用 OLS。此外,定价理论暗示除 α_i 之外,截面收益率均值应该仅由 β_i 决定,因此一般来说截面回归没有截距项(当然我们也可以加上)。在这样的假定下,截面回归 OLS 将通过原点并最小化所有个股残差 α_i 的平方和。

    0_1535511532248_360截图20180829105836710.jpg

    当残差 α_i 满足 IID 时,回归测试的 estimate、standard errors、以及我们关注的 α_i 的检验分别为:

    0_1535511579066_360截图20180829105914198.jpg

    虽然上面给出了 OLS 截面回归下各种关注变量的表达式,但不幸的是,这并没有太多用。这是因为在截面上个股的残差存在明显的相关性。这种相关性虽然不会影响 OLS 的估计,但是会使 OLS 给出的标准误存在巨大的误差(低估)。为此,可以使用 GLS(generalized least squares)取代 OLS。GLS 考虑了残差的协方差因此可以得到准确的标准误。但是,由于必须估计残差的协方差矩阵,在现实中使用 GLS 存在巨大的障碍。如果有上千支股票,那么协方差矩阵中有太多的参数需要估计,不切实际。

    怎么办呢?再次请出大杀器 —— GMM,它可以轻松的求出我们需要的各种量(Hansen 功不可没啊)。另外值得一提的是,在截面回归时用到的 β_i 并不是已知、真实的,而是从时间序列回归得出的估计值,它们称为 generated regressors,存在误差。Shanken (1992) 给出了解决该问题的修正方法,称为 Shanken correction。利用 Shanken correction 和 GMM,就可以检验 α_i 是否为零了。

    好了,又到了我们小结的时候了:

    1. 截面回归不要求因子是 portfolio returns,应用更加广泛(当然因子也可以是 portfolio returns)。但是截面回归的第一步仍然是通过时间序列回归得到的是投资品在因子上的暴露 β_i。第二步才是截面回归。因此截面回归又称为 two-pass regression estimate。

    2. 得到 β_i 后,使用个股的平均收益率 E[R_i] 和 β_i 进行截面回归(一共 N 个点,每个点对应一对儿 E[R_i] 和 β_i),回归得到因子的期望收益率 λ 和个股的残差 α_i。常见的回归方法是 OLS —— 以最小化残差平方和为目标,或 GLS —— 考虑残差之间的相关性。

    3. 由于 β_i 是估计值,且 α_i 的协方差矩阵难以估计,更方便的办法是使用大杀器 GMM 得到准确的估计以及检验 α_i 是否为零。

    4.时序回归 vs 截面回归
    前面两节分别介绍了时序回归和截面回归。有意思的一点是,当因子是投资组合时,我们既可以使用时序回归又可以使用截面回归。那么它们二者的区别是什么呢?

    下图以单因子为例,直观的比较了二者的区别。在时序回归中,我们仅仅在时序上对每支个股做一次回归,然后通过在在时序上取均值(E_T[.])来得到隐含的截面关系,因此时序回归的 E[R_i] = β_iλ 必然经过原点和作为因子投资组合的平均收益率所对应的点 (1, E_T[f])。反观截面回归,它利用时序回归得到的 β_i 和股票在时序上的均值 E[R_i] 进行了第二次回归。以 OLS 为例,这个截面回归将要最小化所有个股残差 α_i 的平方和。

    0_1535511766838_360截图20180829110226982.jpg

    和时序回归得到的最终 E[R_i] = β_iλ 关系式相比,截面回归利用了所有个股的数据。从某种意义上来说,这更合理。对于时序回归,因子的平均收益率就是该因子组合在 T 期收益率上的均值:λ = E_T[f]。而对于截面回归来说,因子收益率通过 OLS 或 GLS 确定,取值和 E_T[f] 不同。这是二者最大的区别。

    此外,当多个因子同时进行截面回归时,根据 Barra 纯因子模型的理论,得到的因子收益率是纯因子组合的收益率 —— 即截面回归后得到的因子组合中个股的权重与最初构建因子时使用的个股权重会有所不同。纯因子组合较其他因子组合有一定的优势,这有助于更好的评判因子的风险溢价。

    时序回归和截面回归有时也被同时使用来检验模型(选择的因子)是否有意义。考虑下面这个例子。假如我们选了一个因子,E[R_i] 和 β_i 在截面上的关系如图中那些蓝黑色圆点表示。如果我们进行时序回归(图中红线),会得到一个正的因子预期收益率;而如果我们进行带有截距项 γ 的截面回归,即 E[R_i] = γ + β_iλ + α_i),则会得到完全不同的结果(图中蓝线):负的因子预期收益率。两个模型的背离说明因子的选择有问题,需要进一步考察。

    0_1535511812158_360截图20180829110319440.jpg

    5.Fama-MacBeth 回归

    1973 年,Fama 和 MacBeth 提出了 Fama-MacBeth Regression(Fama and MacBeth 1973),目的是为了检验 CAPM。Fama-MacBeth 也是一个两步截面回归检验方法;它非常巧妙排除了残差在截面上的相关性对标准误的影响,在业界被广泛使用。这篇文章也是计量经济学领域被引用量最高的文章之一。

    Fama-MacBeth 回归的第一步仍然是通过时间序列回归得到个股收益率在因子上的暴露 β_i,这一步和本文第三节截面回归中的第一步一致。

    在第二步截面回归中,Fama-MacBeth 在每个时间 t 上进行了一次截面回归,这是 Fama-MachBeth 和上面的截面回归最大的不同:

    0_1535511902845_360截图20180829110443774.jpg

    比较一下上式和本文第三节截面回归中的表达式。在一般的截面回归中,我们首先在时序上对 R_it, t = 1, 2,…,T 取均值,得到个股的平均收益率 E[R_i]。之后用 E[R_i] 和 β_i, i = 1, 2, …, N 在截面上做回归,因此这里只做了一次截面回归。

    而 Fama-MacBeth 截面回归时在每个 t 做一次独立的截面回归(如果有 T = 500 期数据,这就意味着进行 500 次截面回归),然后把这 T 次截面回归得到的参数取均值作为回归的 estimate:

    0_1535511936256_360截图20180829110524024.jpg

    **上述方法的巧妙之处在于它把 T 期的回归结果当作 T 个独立的样本。**参数的standard errors 刻画的是样本统计量在不同样本间是如何变化的。在传统的截面回归中,我们只进行一次回归,得到 λ 和 α 的一个样本估计。而在 Fama-MacBeth 截面回归中,我们把T期样本点独立处理,得到 T 个 λ 和 α 的样本估计。由此便能很容易且正确的求出 λ 和 α 的标准误:

    0_1535511996403_360截图20180829110618788.jpg

    此外,通过 T 个 α 的估计值,很容易求出残差的协方差矩阵并由此检验个股的定价错误是否联合为零。从上面的描述不难看出,Fama-MacBeth 截面回归和传统截面回归的区别是:

    Fama-MacBeth 截面回归先在不同的 t 上分别用 R_it 和做回归,再把回归的结果 λ_t 和 α_it 在时序上取均值得到 λ = E[λ_t] 和 α = E[α_it];

    传统截面回归是先把 R_it 在时序上取均值得到 E[R_it] 然后再进行一次截面回归,直接得到 λ 和 α。

    所以简单来说,Fama-MacBeth 先回归再均值;而传统截面回归先均值再回归。当截面回归中的 regressor,即 β_i,在所有 T 期上不变时,上述两种截面回归得到的 estimate 是一致的(Fama-MacBeth 在处理残差的截面相关性上仍然有优势)。

    在 Fama and MacBeth (1973) 中,作者在时序回归求解 β_i 时采用了滚动窗口,因此 β_i 在不同的 t 是会发生变化的。如果我们用所有样本数据来一次估计 β_i,那么它们在所有 T 期的取值相同。

    由上面的介绍可知,Fama-MacBeth 回归的最大优点是它排除了残差截面相关性对标准误的影响。股票的残差收益率在截面上具有很高的相关性,因此该修正对于准确计算标准误至关重要。下面来说说它的不足。

    首先,Fama-MacBeth 回归对于残差在时序上的相关性无能为力。如果残差在时序上存在相关性,则需要对Fama-MacBeth 回归得到的标准误进一步修正。Petersen (2009) 分析了不同的回归技术在分析面板数据(panel data)时由于忽略残差的时序或截面相关性而导致不准确的标准误(低估了其真实值)。这篇文章非常值得一读。其次,上文提到,在截面回归中用到的 β_i 并不是已知的,而是通过时间序列得到的估计值(generated regressors),因此存在误差。Fama-MacBeth 回归对此也无能为力,需要 Shanken correction。

    如今我们有了 GMM 这样的大杀器,能够方便的处理残差的各种相关性。但不要忘记,Fama-MacBeth 回归比 GMM 早提出了近 10 年!在没有 GMM 或其他更先进方法的年代,Fama-MacBeth 回归通过在截面回归时“先回归、再均值”的思路巧妙的排除了残差截面相关性的影响,得到了学术界的广泛认可,影响深远。时至今日,在计量经济学做面板分析的文章中,仍有约 1/3 的文章采用 Fama-MacBeth 回归(Petersen 2009)。

    Fama-MacBeth 回归的要点总结如下:

    1. Fama-MacBeth 回归也是一种截面回归,因子可以是 portfolio returns,也可以是别的指标。和普通截面回归一样,它的第一步也是通过时间序列回归得到的是投资品在因子上的暴露 β_i。

    2. 得到 β_i 后,在每期(共 T 期)的截面上使用个股的收益率 R_it 和 β_i 进行截面回归,回归得到该期因子的收益率 λ_t 和个股的残差 α_it。通过 T 次截面回归、得到 T 个的估计后,将它们取均值得到因子收益率均值 λ = E[λ_t] 和个股残差均值 α = E[α_it]。

    3. Fama-MacBeth 回归排除了残差截面相关性对标准误的影响,但是对时序相关性无能为力。

    6.对 Barra 模型的思考

    本节是开放性的讨论,陈述对 Barra 模型的一些思考。Barra 模型和本文第二、三节介绍的时序和截面回归都有所不同。

    Barra 的多因子模型考虑了行业因子和来自基本面和技术面的风格因子。Barra 的模型也是截面回归模型。但是和本文中介绍的模型不同之处是:在 Barra 模型中,因子暴露并非来自时间序列回归,而是直接来自基本面或者技术面数据本身。我查阅了前后几代 Barra 的文档,比如 Grinold and Kahn (1994),Menchero et al. (2011),Orr et al. (2012),得到的都是上述结论。

    举个例子,比如我们熟悉的 Book-to-Market ratio。在 Fama-French 三因子模型中,BP 被用来构建了一个 HML 投资组合,而这个投资组合的收益率作为因子,个股在这个因子上的暴露由时间序列回归确定,与个股实际的 BP 无关。而在 Barra 模型中,BP 直接被用来当作因子,个股在因子上的暴露就是使用财报中 Book value 和股价计算出来的比例经过必要的标准化确定的。

    有了因子暴露后,Barra 和传统截面回归一样,是通过截面回归来确定每个因子的收益率(纯因子模型)。所以**,Barra 模型(业界代表)和学术界流行的因子模型最大的不同就是因子暴露 β 的确定。**

    对于风格因子来说(行业因子我们一会儿另说),这两种确定 β 的方法在我看来各有千秋。时间序列回归得到的 β,它的变化注定是缓慢的,且回归中也有大量的噪声。直接用基本面或者技术面数据作为 β,可以更快的捕捉公司的变化。

    然而,使用基本面或者技术面数据直接作为 β 则必须进行标准化(原始数据拿来直接当作因子暴露会有很大问题)。我在本文反复强调了因子模型是分析个股平均收益率在截面上随 β 的变化,即预期收益率的大小完全由股票在因子上的暴露大小决定。试想一下,如果我们用不经过标准化的市值作为因子暴露,如果公司 A 的市值是 B 的市值的 100 倍,那难道我们能说市值因子的收益率对 A 的收益率的影响是对 B 的收益率的影响的 100 倍吗?显然是不能的。所以对于市值因子,常见的是首先取对数,然后再进行标准化。对于其他的风格因子,也需要采用相应的标准化处理。在 Barra 的文档中对如何标准化因子暴露有详细的说明。

    对于行业因子,Barra 将因子暴露处理成 binary 变量 —— 比如工商银行在银行业的暴露是 1,在其他行业的暴露为 0(对于业务涉及不同行业的大公司,Barra 允许该公司以不同权重属于多个行业)。我认为这个处理值得考量。假如某个公司属于行业 X,但是它的收益率和行业 Y 更相关,那么从建模的角度是不是把该公司算作行业 Y 更有道理?对于行业因子暴露,可以尝试使用个股的收益率和行业的收益率做时间序列回归,将回归系数当作行业因子的暴露。我不清楚 Barra 是否尝试过上述方法,但这是一个值得思考的问题。

    7.结语
    首先,感谢你看到这里。我知道文章很长,我写的也很痛苦,但我觉着它很重要。

    本文介绍了股票多因子模型的回归检验。希望你看完后能够对常见的时序回归、截面回归、Fama-MacBeth 回归、以及 Barra 模型等有更深的理解;对如何确定因子暴露,如何计算因子收益率,以及回归检验的终极目标是什么(所有残差 α_i 是否在统计上为零)有清晰的认识。

    作为你看到这里的感谢和鼓励,我放个彩蛋 —— 检验 is NOT everything!

    考虑下面两个因子模型,图中每个点代表一个股票。图中给出了它们残差 α_i 的置信区间。按照统计检验的思路,左图中大部分残差的置信区间都和那条截面回归关系式没有交集,说明我们要拒绝原假设,即 α_i 统计上不为零;右图中大部分残差的置信区间和截面回归关系式相交,我们接受原假设。但显然,左边的模型更好的反映出股票收益率和因子暴露在截面上的关系;而右边的模型表现出的关系则非常弱(从这些点看不出 E[R_i] 随 β_i 的增大而增大)。所以,从 economic sense 来说,显然左边的模型更好。

    0_1535512362300_360截图20180829111226040.jpg

    最后再来一点点评价。从投资的角度,我们希望因子本身有清晰合理的解释,但是从多因子模型的角度来说,只要这些因子收益率均值能在截面上解释个股的预期收益率,那这个模型就是好模型(所以在因子选股时,我们会重点关注因子的 IC 和 IR 这些指标)。因子开发属于 empirical work,HML、SMB 是从 real stock return 中挖掘出来的,它们在解释截面收益率均值时有很好的效果。至于 HML,SMB 为什么有效、背后的含义是什么,搞清楚它们能提升我们使用因子的信心,但是对于评价一个因子模型的好坏并不重要。

    好了,这回真的写完了!最后就是来安利我写作本文时最重要的参考文献:芝加哥大学 Booth 商学院的 John Cochrane 教授的著作 Asset Pricing(Cochrane 2005)。该书曾获得 Paul A. Samuelson Award for Outstanding Scholarly Writing on Lifelong Financial Security,足见其地位。它值得任何对资产定价感兴趣的人认真读、仔细读、反复读。

    除了这本书外,对我帮助巨大的是 UChicago Online 发布到网上的 Cochrane 教授的 Asset Pricing 这门课程。感兴趣的朋友可以搜来看一看(大概要翻墙)。Cochrane 教授讲的非常生动、到位,听完再结合他的书一看,那收获自然是大大的。

    0_1535512411040_360截图20180829111320128.jpg

    在介绍 Asset Pricing 这门课的时候,Cochrane 教授谈到:

    The math in real, academic, finance is not actually that hard. Understanding how to use the equations, and see what they really mean about the world... that's hard, and that's what I hope will be uniquely rewarding about this class.

    译:在现实和学术中,金融中的数学其实并不难。难的是理解如何使用这些方程,以及它们对这个世界的真正意义。这是我希望这门课能带给你独特收获的地方。”

    我也真心希望本文在你使用多因子模型的道路上起到一点点帮助。

    参考文献

    Black, F., M. C. Jensen, and M. Scholes (1972). The Capital Asset Pricing Model: Some empirical Tests. In Michael Jensen, Ed., Studies in the Theory of Capital Markets, Praeger, New York NY.

    Cochrane, J. H (2005). Asset Pricing (revised edition). Princeton University Press.

    Fama, E. F. and K. R. French (1993). Common Risk Factors in the Returns on Stocks and Bonds. Journal of Financial Economics, Vol. 33(1), 3 – 56.

    Fama, E. F. and K. R. French (1996). Multifactor Explanations of Asset Pricing Anomalies. The Journal of Finance, Vol. 51(1), 55 – 84.

    Fama, E. F. and J. D. MacBeth (1973). Risk, Return, and Equilibrium: Empirical Tests. The Journal of Political Economy, Vol. 81(3), 607 – 636.

    Gibbons, M. R., S. A. Ross, and J. Shanken (1989). A Test of the Efficiency of a Given Portfolio. Econometrica, Vol. 57(5), 1121 – 1152.

    Grinold R. and R. N. Kahn (1994). Multiple-Factor Models of Portfolio Risk. In A Practitioners Guide to Factor Models.

    Hansen, L. P. (1982). Large Sample Properties of Generalized Method of Moments Estimators. Econometrica, Vol. 50(4), 1029 – 1054.

    Menchero, J., D. J. Orr, and J. Wang (2011). The Barra US Equity Model (USE4). MSCI Barra Research Notes.

    Orr, D. J., I. Mashtaler, and A. Nagy (2012). The Barra China Equity Model (CNE5), Empirical Notes. MSCI.

    Petersen, M. A. (2009). Estimating Standard Errors in Finance Panel Data Sets: Comparing Approaches. The Review of Financial Studies, Vol. 22(1), 435 – 480.

    Shanken, J. (1992). On the Estimation of Beta-Pricing Models. The Review of Financial Studies, Vol. 5(1), 1 – 33.

    来源:量信投资     作者:石川    已获得转载授权。

    ==============================================================

    推荐阅读:

    多因子选股之有效因子 https://www.myquant.cn/community/topic/690
    多因子策略之冗余因子 https://www.myquant.cn/community/topic/695
    多因子选股之策略的实现 https://www.myquant.cn/community/topic/708/2

     


    展开全文
  • 精通各种概率模型和统计方法,擅长不确定性随机系统的建模及优化。知乎专栏:https://zhuanlan.zhihu.com/mitcshi。 **摘要:**收益率均值和因子暴露在截面上的关系就是多因子模型研究的问题。本文讨论一些平时在...

    转 股票多因子模型的回归检验

    作者:石川,量信投资创始合伙人,清华大学学士、硕士,麻省理工学院博士;精通各种概率模型和统计方法,擅长不确定性随机系统的建模及优化。知乎专栏:https://zhuanlan.zhihu.com/mitcshi。

    **摘要:**收益率均值和因子暴露在截面上的关系就是多因子模型研究的问题。本文讨论一些平时在使用多因子模型时遇到的常见问题,如截面回归 vs 时序回归、使用 portfolio returns 和宏观经济指标作为因子有什么不同、以及因子暴露应该如何确定等。

    引言:
    这是迄今为止我写的最重要的文章,没有之一。

    本文的题目是股票多因子模型的回归检验。说它重要,是因为在多因子模型被用于资产定价(选股)越来越普及的今天,很多人不一定搞清楚了多因子模型中常见的时间序列回归、截面回归之间到底有什么区别,以及它们在本质上又是何其相似;不一定搞清楚在使用多因子模型给资产定价时,需要关注的 statistical tests 目标到底是什么;不一定搞清楚在回归残差存在时序或截面相关性时,模型参数的 standard errors 可能完全是不准确的以至于给出错误的推断……

    本文旨在讨论一些平时在使用多因子模型时可能遇到的各种困惑(比如什么时候用截面回归、什么时候用时序回归;使用 portfolio returns 作为因子和其他比如宏观经济指标作为因子有什么不同等)。由于篇幅有限,我会把写作重点放在对核心概念的解读上。此外,在本文中还会涉及对 Barra 模型的一些思考。

    文章的最后一节将会安利写作时使用的主要参考文献(下文中对于时序和截面回归的讲解、以及对 Fama-MacBeth 回归的说明来自 John Cochrane 的经典教材 Asset Pricing 以及他在芝加哥大学的同名网上课程的相关部分),感兴趣的小伙伴在阅读本文后可以进一步参考。

    最后一个小建议:请在一个能静下心来思考的心境下和环境中阅读此文。

    1.多因子模型的回归测试

    多因子模型是 Asset Pricing(资产定价)的一种常见方法(其他的方法还包括 consumption-based model 等)。一个多因子模型(假设 K 个因子)的表达式如下:
    0_1535510129126_360截图20180829103516774.jpg

    其中 R_i 代表股票 i 的超额收益;β_i 为股票 i 的 K × 1 阶因子暴露(factor exposure,也称因子载荷 factor loading)向量;λ 为 K × 1 阶因子收益率均值向量;E[.] 为数学求期望公式。

    多因子模型研究的核心问题是股票的(超额)收益率期望在截面上(即不同的股票之间)为什么会有差异 —— 根据模型,如果一支股票在因子上的暴露(β_i)高,则它的期望收益(E[R_i])也应该更高。

    “ The central economic question is why average returns vary across assets; expected returns of an asset should be high if that asset has high betas or risk exposure to factors that carry high risk premia.”

    虽然本文才刚开始,不过让我们停一停,take a break。我想再强调一下上面这句话:多因子模型研究的是个股收益率均值在截面上(cross-sectional)的差异。我们不关心个股的收益率 R_i 在时间序列上是如何随着每期因子收益率来波动的(这是 model of variance),我们只关心 R_i 的期望E[R_i] 在截面上和对应的 β_i 之间的关系(这是 model of the mean)。

    我们选择的因子代表了收益率的一种结构。一旦结构给定后,个股(或者任何一个投资组合)的预期收益率就完全由它在这些因子上的暴露决定了 —— 暴露高,预期收益率就高;预期收益率是因子暴露的线性函数。怎样找到最好的因子结构 —— 即哪些因子使得个股在截面上的预期收益率区分度高 —— 就是因子模型研究的问题。

    仍然晦涩?用下面这个图解释一下(因为要做图,所以假设单因子,比如 CAPM 模型)。下图中横坐标为 β_i,纵坐标为 E[R_i],每个点代表一支股票。根据因子模型,每个股票的预期收益率 E[R_i] 和 β_i 成正比。图中这条直线就代表 E[R_i] = β_i × λ,它的斜率 λ 就是因子的预期收益。由于所有的股票收益率都仅仅是样本数据,因此即便 E[R_i] = β_i × λ 完美满足,在每个样本内,E[R_i] 和 β_i × λ 之间也有残差,正如图中的 α_i 所示。

    0_1535510376168_360截图20180829103910351.jpg

    因为一共有 N 支股票,因此这张图中的直线反映的是 N 个 E[R_i] 和 N 个对应的 β_i 在截面上的关系 —— 正如前文反复强调的,多因子模型反映的是收益率均值和因子暴露在截面上的关系。

    我们最熟悉的因子模型无疑是 CAPM,它因为只有一个市场因子所以是多因子模型的一个特例。人们最早的猜测是市场因子的收益率和个股在该因子上的 β 就可以解释截面上不同股票收益率之间的区别。但大量的实证结果显示如果我们把个股的 E[R_i] 和它们针对市场因子的 β_i 画出来,则实际的斜率较模型的结果来说太小了,说明仅仅用单一市场因子无法很好的解释 E[R_i] 在截面上的差别。

    这之后,Black、Jensen 以及 Scholes 提出了 Black CAPM,它在 CAPM 的基础上又加入了一个因子,使得这个双因子模型更好的解释 E[R_i] 在截面上的差别。再后来,Fama 和 French 提出了大名鼎鼎的三因子模型,它在市场因子的基础上加入 HML 和 SMB 两个因子。这些努力都是为了能够更好的解释我们在股票收益率数据中观察到的 E[R_i] 在截面上的差别。

    拿来一个多因子模型,应该怎么定量的评估它能否很好的解释 E[R_i] 呢?我们应该关注三点:Estimate(估计)、Standard Errors(标准误)、以及 Test(检验),见下表。

    0_1535510467267_360截图20180829104052767.jpg

    对于截面关系式 E[R_i] = β_i’λ + α_i,我们使用回归分析(既可以通过时序回归、也可以是截面回归,后面会具体讲)确定参数 α、β、λ 的估计值和标准误。只有有了准确的(无偏且相合)估计值和正确的标准误,才能评价因子是否有效(比如正确计算因子收益率 λ 的置信区间,从而判断这个因子是否有风险溢价)。下文会谈到,由于残差 α 在截面以及时序(特别是截面)上有相关性,因此在标准误的计算上必须格外小心。

    在上述截面关系式中,α_i 代表了个股 i 的定价错误(pricing error)。如果我们能够在统计上证明所有股票的 α_i 都很接近零,那么这个多因子模型就是很好的模型 —— 这些因子能够较好的解释个股截面预期收益率的差别。因此,多因子模型的回归检验中的重中之重、也是我们唯一关注的 test,就是所有这些 α_i 联合起来是否在统计上足够接近零。

    “ We want to know whether all the pricing errors are jointly equal to zero.”

    根据上述说明,多因子模型的回归检验可以简单总结成以下几点:

    1. 挑选因子,计算个股在这些因子上的暴露 β_i;
    2. 找到个股(超额)收益率均值 E[R_i] 和因子暴露 β_i 在截面上的关系;
    3. 计算每个个股的定价错误 α_i,联合检验这些 α_i 是否在统计上为零。

    无论我们用什么因子(基本面因子、宏观经济因子、技术面因子);无论在确定截面关系时我们采用时序回归还是截面回归;对多因子模型的最终评判都转化成一个核心问题 —— 这些 α_i 联合起来是否在统计上为零。

    下面先来看看如何通过时间序列回归找到截面关系。

    2.时间序列回归

    如果模型中的因子是 portfolio returns(即使用投资组合收益率作为因子),那么可以通过**时间序列回归(time-series regression)**来分析 E[R_i] 和 β_i 在截面上的关系。

    例如,Fama and French (1993) 提出了影响深远的三因子模型,它里面的三个因子,即市场、HML、SMB 都是投资组合的收益率。其中 HML 和 SMB 是通过 BP 和市值将股票排序然后做多一部分并同时做空一部分来构建的投资组合。以 HML 为例,它代表着 high book-to-market ratio 公司相对于 low book-to-market ratio 公司的超额收益。该因子叫做 HML 因子而非 BP 因子,其意义也是强调因子本身是一个投资组合的收益率,而非 BP。Fama 和 French 用这三个投资组合的收益率来解释个股或者其他投资组合在截面上的收益率。顺便提一句,关于三因子模型的重要性以及其作用,Fama and French (1996) 给出了非常详尽的解读,非常值得一读。

    令 f_t 表示 t 期因子向量(不同投资组合的收益率);使用 f_t 对每支个股 i 的收益率 R_it 做时间序列回归:

    0_1535510805255_360截图20180829104633285.jpg

    上述时间序列回归中,回归方程右侧的 regressors 是因子收益率 f_t,左侧的变量是 R_it,回归得到的系数是个股 i 在因子上的暴露 β_i,截距 α_i,以及随机的残差 ε_it。

    将上述时间序列回归结果在时序上取均值可得(下式中 E_T[.] 中下标 T 表示在时序上取均值):

    0_1535510836799_360截图20180829104704478.jpg

    上式正是个股期望收益率和因子暴露在截面上的关系式。当因子本身是投资组合时,我们只需要在时序上做回归得到因子暴露和截距。虽然只做了时序回归,但是通过在时序上取均值就可以从时序回归中得出 E[R_i] 和 β_i 在截面上的关系。比较上面两个关系式不难发现,时间序列回归中的截距 α_i 恰恰就是截面关系式中的个股 i 的定价错误。

    Black, Jensen and Scholes (1972) 基于如上的论述给出了时序回归法中求解因子预期收益率的简单方法 —— 因子收益率 f_t 在时序上的均值就是因子的预期收益率:

    0_1535510930543_360截图20180829104838198.jpg

    下面仍然以单因子这种最简单的情况来画图看看通过上述时间序列回归得到的预期收益率和 β_i 的截面关系长什么样子。图中的红色直线为 E[R_i] = β_iE[f],当 β_i = 0 时,E[R_i] = 0;此外,如果我们用给因子模型解释因子投资组合自己,由于因子组合的 β_i = 1,因此有 E[R_i] = E[f]。以上论述说明时间序列回归得到的 E[R_i] = β_iE[f] 这条直线一定会经过 (0, 0) 和 (1, E[f]) 两点。

    0_1535510990123_360截图20180829104933422.jpg

    图中所有蓝黑色的点代表着个股;红色的点代表着因子投资组合。时间回归再按时间求均值而得到的因子模型 E[R_i] = β_iE[f] 就是经过原点和红点的那条红色直线。所有蓝黑色点(个股)到这条红线的距离就是个股的定价错误 α_i,这条时序回归得到的直线并不是以最小化 α_i 的平方和为目的求出的,这是时序回归和下一节要介绍的截面回归的最大差别(截面回归是以最小化 α_i 的平方和为目标的)。

    得到了回归模型的参数,下一步就是计算各种参数的标准误、以及检验我们唯一关注的问题:所有股票的错误定价 α_i 联合起来是否在统计上为零。

    在时间序列回归残差 ε_it 不相关且方差相同(homoskedastic)时,时序回归参数的标准误可以由 OLS(ordinary least square)的标准公式给出。此外,如果 ε_it 满足 IID Normal,Gibbons, Ross and Shanken (1989) 给出了 α_i 的检验统计量(又称为 GRS test statistic):

    0_1535511101184_360截图20180829105121926.jpg

    0_1535511135024_360截图20180829105201992.jpg

    然而,一旦 ε_it 之间存在相关性或者异方差性,传统 OLS 的标准误公式就是错误的,且上述 α_i 的检验统计量也是有问题的。在这种情况下,就要请出大杀器 Generalized Method of Momentums(GMM)。它由 Lars Peter Hansen 于 1982 年提出(Hansen 1982),GMM 可以解决 OLS 中残差的相关性和异方差性的问题,得到准确的估计以及标准误。GMM 是 Hansen 于 2013 获得诺贝尔经济学奖的原因之一,足见其在计量经济学中的重要性。具体如何使用 GMM 超出本文的范畴,感兴趣的读者可以参考本文最后一节安利的参考文献。

    以上就是通过时间序列回归得到多因子模型的过程。最重要的三点总结如下:

    1. 因子必须是 portfolio returns,才可只进行时间序列回归而无需进一步的截面回归;时序回归得到了投资品在这些因子上的暴露 β_i;时序回归中得到的 α_i(截距项)就是截面关系上个股的定价错误。

    2. 将时序回归结果在时间上取均值,就得到个股收益率和因子暴露在截面上的关系。该关系的确定不以最小化 α_i 的平方和为目标。

    3. 在时序回归残差 ε_it 满足 IID Normal 的条件下,可以通过 GRS test 来检验 α_i;否则则可以通过 GMM 来检验 α_i。

    3.截面回归

    下面来看看截面回归(cross-sectional regression)截面回归的最大好处是,因子可以不是 portfolio returns。比如因子可以是 GDP、CPI、利率这些宏观经济指标。显然,它们的因子取值不是收益率,因子收益率需要通过截面回归得到。但是在那之前,我们必须先通过时间序列回归得到个股在不同因子上的暴露。因此,截面回归的第一步仍然是时序回归,以确定因子暴露。

    有的小伙伴可能会问,那些因子取值(比如 GDP 的取值、CPI 的取值)不能直接当作 β_i 吗?答案是否定的。首先这没有意义,因为时序上我们关注的是这些因子的变化对个股收益率变化的解释程度(model of variance),这由个股收益率对这些因子的敏感程度,即时序回归的系数 β_i,而非因子本身的大小决定。第二,行业不同、基本面存在差异的公司受宏观经济的影响也不同,因此它们在同样宏观经济指标上的暴露势必不同。

    一般的,假设因子不是 portfolio returns,首先进行时序回归确定 β_i:

    0_1535511415751_360截图20180829105635502.jpg

    上式和前一节时序回归中的表达式几乎一样,唯一的例外是这里的截距项我特意用了 a_i,而非 α_i,这是因为如果因子本身不是投资组合收益率,则该截距并不是稍后我们通过截面回归得到的个股的定价错误。

    得到 β_i 后,进行第二步 —— **截面回归,从而确定每个因子的预期收益率。**在截面回归时,回归表达式的右侧 regressors 是 β_i,左侧是个股的预期收益率(即在整个 T 期的收益率均值)E[R_i]。因此,截面回归的表达式为:

    0_1535511473708_360截图20180829105734062.jpg

    回归的目标是找到因子预期收益率 λ,和代表股票定价错误的残差 α_i。仍以单因子为例说明通过截面回归得到的个股收益率均值和因子暴露的关系(下图)。假设在截面回归时采用 OLS。此外,定价理论暗示除 α_i 之外,截面收益率均值应该仅由 β_i 决定,因此一般来说截面回归没有截距项(当然我们也可以加上)。在这样的假定下,截面回归 OLS 将通过原点并最小化所有个股残差 α_i 的平方和。

    0_1535511532248_360截图20180829105836710.jpg

    当残差 α_i 满足 IID 时,回归测试的 estimate、standard errors、以及我们关注的 α_i 的检验分别为:

    0_1535511579066_360截图20180829105914198.jpg

    虽然上面给出了 OLS 截面回归下各种关注变量的表达式,但不幸的是,这并没有太多用。这是因为在截面上个股的残差存在明显的相关性。这种相关性虽然不会影响 OLS 的估计,但是会使 OLS 给出的标准误存在巨大的误差(低估)。为此,可以使用 GLS(generalized least squares)取代 OLS。GLS 考虑了残差的协方差因此可以得到准确的标准误。但是,由于必须估计残差的协方差矩阵,在现实中使用 GLS 存在巨大的障碍。如果有上千支股票,那么协方差矩阵中有太多的参数需要估计,不切实际。

    怎么办呢?再次请出大杀器 —— GMM,它可以轻松的求出我们需要的各种量(Hansen 功不可没啊)。另外值得一提的是,在截面回归时用到的 β_i 并不是已知、真实的,而是从时间序列回归得出的估计值,它们称为 generated regressors,存在误差。Shanken (1992) 给出了解决该问题的修正方法,称为 Shanken correction。利用 Shanken correction 和 GMM,就可以检验 α_i 是否为零了。

    好了,又到了我们小结的时候了:

    1. 截面回归不要求因子是 portfolio returns,应用更加广泛(当然因子也可以是 portfolio returns)。但是截面回归的第一步仍然是通过时间序列回归得到的是投资品在因子上的暴露 β_i。第二步才是截面回归。因此截面回归又称为 two-pass regression estimate。

    2. 得到 β_i 后,使用个股的平均收益率 E[R_i] 和 β_i 进行截面回归(一共 N 个点,每个点对应一对儿 E[R_i] 和 β_i),回归得到因子的期望收益率 λ 和个股的残差 α_i。常见的回归方法是 OLS —— 以最小化残差平方和为目标,或 GLS —— 考虑残差之间的相关性。

    3. 由于 β_i 是估计值,且 α_i 的协方差矩阵难以估计,更方便的办法是使用大杀器 GMM 得到准确的估计以及检验 α_i 是否为零。

    4.时序回归 vs 截面回归
    前面两节分别介绍了时序回归和截面回归。有意思的一点是,当因子是投资组合时,我们既可以使用时序回归又可以使用截面回归。那么它们二者的区别是什么呢?

    下图以单因子为例,直观的比较了二者的区别。在时序回归中,我们仅仅在时序上对每支个股做一次回归,然后通过在在时序上取均值(E_T[.])来得到隐含的截面关系,因此时序回归的 E[R_i] = β_iλ 必然经过原点和作为因子投资组合的平均收益率所对应的点 (1, E_T[f])。反观截面回归,它利用时序回归得到的 β_i 和股票在时序上的均值 E[R_i] 进行了第二次回归。以 OLS 为例,这个截面回归将要最小化所有个股残差 α_i 的平方和。

    0_1535511766838_360截图20180829110226982.jpg

    和时序回归得到的最终 E[R_i] = β_iλ 关系式相比,截面回归利用了所有个股的数据。从某种意义上来说,这更合理。对于时序回归,因子的平均收益率就是该因子组合在 T 期收益率上的均值:λ = E_T[f]。而对于截面回归来说,因子收益率通过 OLS 或 GLS 确定,取值和 E_T[f] 不同。这是二者最大的区别。

    此外,当多个因子同时进行截面回归时,根据 Barra 纯因子模型的理论,得到的因子收益率是纯因子组合的收益率 —— 即截面回归后得到的因子组合中个股的权重与最初构建因子时使用的个股权重会有所不同。纯因子组合较其他因子组合有一定的优势,这有助于更好的评判因子的风险溢价。

    时序回归和截面回归有时也被同时使用来检验模型(选择的因子)是否有意义。考虑下面这个例子。假如我们选了一个因子,E[R_i] 和 β_i 在截面上的关系如图中那些蓝黑色圆点表示。如果我们进行时序回归(图中红线),会得到一个正的因子预期收益率;而如果我们进行带有截距项 γ 的截面回归,即 E[R_i] = γ + β_iλ + α_i),则会得到完全不同的结果(图中蓝线):负的因子预期收益率。两个模型的背离说明因子的选择有问题,需要进一步考察。

    0_1535511812158_360截图20180829110319440.jpg

    5.Fama-MacBeth 回归

    1973 年,Fama 和 MacBeth 提出了 Fama-MacBeth Regression(Fama and MacBeth 1973),目的是为了检验 CAPM。Fama-MacBeth 也是一个两步截面回归检验方法;它非常巧妙排除了残差在截面上的相关性对标准误的影响,在业界被广泛使用。这篇文章也是计量经济学领域被引用量最高的文章之一。

    Fama-MacBeth 回归的第一步仍然是通过时间序列回归得到个股收益率在因子上的暴露 β_i,这一步和本文第三节截面回归中的第一步一致。

    在第二步截面回归中,Fama-MacBeth 在每个时间 t 上进行了一次截面回归,这是 Fama-MachBeth 和上面的截面回归最大的不同:

    0_1535511902845_360截图20180829110443774.jpg

    比较一下上式和本文第三节截面回归中的表达式。在一般的截面回归中,我们首先在时序上对 R_it, t = 1, 2,…,T 取均值,得到个股的平均收益率 E[R_i]。之后用 E[R_i] 和 β_i, i = 1, 2, …, N 在截面上做回归,因此这里只做了一次截面回归。

    而 Fama-MacBeth 截面回归时在每个 t 做一次独立的截面回归(如果有 T = 500 期数据,这就意味着进行 500 次截面回归),然后把这 T 次截面回归得到的参数取均值作为回归的 estimate:

    0_1535511936256_360截图20180829110524024.jpg

    **上述方法的巧妙之处在于它把 T 期的回归结果当作 T 个独立的样本。**参数的standard errors 刻画的是样本统计量在不同样本间是如何变化的。在传统的截面回归中,我们只进行一次回归,得到 λ 和 α 的一个样本估计。而在 Fama-MacBeth 截面回归中,我们把T期样本点独立处理,得到 T 个 λ 和 α 的样本估计。由此便能很容易且正确的求出 λ 和 α 的标准误:

    0_1535511996403_360截图20180829110618788.jpg

    此外,通过 T 个 α 的估计值,很容易求出残差的协方差矩阵并由此检验个股的定价错误是否联合为零。从上面的描述不难看出,Fama-MacBeth 截面回归和传统截面回归的区别是:

    Fama-MacBeth 截面回归先在不同的 t 上分别用 R_it 和做回归,再把回归的结果 λ_t 和 α_it 在时序上取均值得到 λ = E[λ_t] 和 α = E[α_it];

    传统截面回归是先把 R_it 在时序上取均值得到 E[R_it] 然后再进行一次截面回归,直接得到 λ 和 α。

    所以简单来说,Fama-MacBeth 先回归再均值;而传统截面回归先均值再回归。当截面回归中的 regressor,即 β_i,在所有 T 期上不变时,上述两种截面回归得到的 estimate 是一致的(Fama-MacBeth 在处理残差的截面相关性上仍然有优势)。

    在 Fama and MacBeth (1973) 中,作者在时序回归求解 β_i 时采用了滚动窗口,因此 β_i 在不同的 t 是会发生变化的。如果我们用所有样本数据来一次估计 β_i,那么它们在所有 T 期的取值相同。

    由上面的介绍可知,Fama-MacBeth 回归的最大优点是它排除了残差截面相关性对标准误的影响。股票的残差收益率在截面上具有很高的相关性,因此该修正对于准确计算标准误至关重要。下面来说说它的不足。

    首先,Fama-MacBeth 回归对于残差在时序上的相关性无能为力。如果残差在时序上存在相关性,则需要对Fama-MacBeth 回归得到的标准误进一步修正。Petersen (2009) 分析了不同的回归技术在分析面板数据(panel data)时由于忽略残差的时序或截面相关性而导致不准确的标准误(低估了其真实值)。这篇文章非常值得一读。其次,上文提到,在截面回归中用到的 β_i 并不是已知的,而是通过时间序列得到的估计值(generated regressors),因此存在误差。Fama-MacBeth 回归对此也无能为力,需要 Shanken correction。

    如今我们有了 GMM 这样的大杀器,能够方便的处理残差的各种相关性。但不要忘记,Fama-MacBeth 回归比 GMM 早提出了近 10 年!在没有 GMM 或其他更先进方法的年代,Fama-MacBeth 回归通过在截面回归时“先回归、再均值”的思路巧妙的排除了残差截面相关性的影响,得到了学术界的广泛认可,影响深远。时至今日,在计量经济学做面板分析的文章中,仍有约 1/3 的文章采用 Fama-MacBeth 回归(Petersen 2009)。

    Fama-MacBeth 回归的要点总结如下:

    1. Fama-MacBeth 回归也是一种截面回归,因子可以是 portfolio returns,也可以是别的指标。和普通截面回归一样,它的第一步也是通过时间序列回归得到的是投资品在因子上的暴露 β_i。

    2. 得到 β_i 后,在每期(共 T 期)的截面上使用个股的收益率 R_it 和 β_i 进行截面回归,回归得到该期因子的收益率 λ_t 和个股的残差 α_it。通过 T 次截面回归、得到 T 个的估计后,将它们取均值得到因子收益率均值 λ = E[λ_t] 和个股残差均值 α = E[α_it]。

    3. Fama-MacBeth 回归排除了残差截面相关性对标准误的影响,但是对时序相关性无能为力。

    6.对 Barra 模型的思考

    本节是开放性的讨论,陈述对 Barra 模型的一些思考。Barra 模型和本文第二、三节介绍的时序和截面回归都有所不同。

    Barra 的多因子模型考虑了行业因子和来自基本面和技术面的风格因子。Barra 的模型也是截面回归模型。但是和本文中介绍的模型不同之处是:在 Barra 模型中,因子暴露并非来自时间序列回归,而是直接来自基本面或者技术面数据本身。我查阅了前后几代 Barra 的文档,比如 Grinold and Kahn (1994),Menchero et al. (2011),Orr et al. (2012),得到的都是上述结论。

    举个例子,比如我们熟悉的 Book-to-Market ratio。在 Fama-French 三因子模型中,BP 被用来构建了一个 HML 投资组合,而这个投资组合的收益率作为因子,个股在这个因子上的暴露由时间序列回归确定,与个股实际的 BP 无关。而在 Barra 模型中,BP 直接被用来当作因子,个股在因子上的暴露就是使用财报中 Book value 和股价计算出来的比例经过必要的标准化确定的。

    有了因子暴露后,Barra 和传统截面回归一样,是通过截面回归来确定每个因子的收益率(纯因子模型)。所以**,Barra 模型(业界代表)和学术界流行的因子模型最大的不同就是因子暴露 β 的确定。**

    对于风格因子来说(行业因子我们一会儿另说),这两种确定 β 的方法在我看来各有千秋。时间序列回归得到的 β,它的变化注定是缓慢的,且回归中也有大量的噪声。直接用基本面或者技术面数据作为 β,可以更快的捕捉公司的变化。

    然而,使用基本面或者技术面数据直接作为 β 则必须进行标准化(原始数据拿来直接当作因子暴露会有很大问题)。我在本文反复强调了因子模型是分析个股平均收益率在截面上随 β 的变化,即预期收益率的大小完全由股票在因子上的暴露大小决定。试想一下,如果我们用不经过标准化的市值作为因子暴露,如果公司 A 的市值是 B 的市值的 100 倍,那难道我们能说市值因子的收益率对 A 的收益率的影响是对 B 的收益率的影响的 100 倍吗?显然是不能的。所以对于市值因子,常见的是首先取对数,然后再进行标准化。对于其他的风格因子,也需要采用相应的标准化处理。在 Barra 的文档中对如何标准化因子暴露有详细的说明。

    对于行业因子,Barra 将因子暴露处理成 binary 变量 —— 比如工商银行在银行业的暴露是 1,在其他行业的暴露为 0(对于业务涉及不同行业的大公司,Barra 允许该公司以不同权重属于多个行业)。我认为这个处理值得考量。假如某个公司属于行业 X,但是它的收益率和行业 Y 更相关,那么从建模的角度是不是把该公司算作行业 Y 更有道理?对于行业因子暴露,可以尝试使用个股的收益率和行业的收益率做时间序列回归,将回归系数当作行业因子的暴露。我不清楚 Barra 是否尝试过上述方法,但这是一个值得思考的问题。

    7.结语
    首先,感谢你看到这里。我知道文章很长,我写的也很痛苦,但我觉着它很重要。

    本文介绍了股票多因子模型的回归检验。希望你看完后能够对常见的时序回归、截面回归、Fama-MacBeth 回归、以及 Barra 模型等有更深的理解;对如何确定因子暴露,如何计算因子收益率,以及回归检验的终极目标是什么(所有残差 α_i 是否在统计上为零)有清晰的认识。

    作为你看到这里的感谢和鼓励,我放个彩蛋 —— 检验 is NOT everything!

    考虑下面两个因子模型,图中每个点代表一个股票。图中给出了它们残差 α_i 的置信区间。按照统计检验的思路,左图中大部分残差的置信区间都和那条截面回归关系式没有交集,说明我们要拒绝原假设,即 α_i 统计上不为零;右图中大部分残差的置信区间和截面回归关系式相交,我们接受原假设。但显然,左边的模型更好的反映出股票收益率和因子暴露在截面上的关系;而右边的模型表现出的关系则非常弱(从这些点看不出 E[R_i] 随 β_i 的增大而增大)。所以,从 economic sense 来说,显然左边的模型更好。

    0_1535512362300_360截图20180829111226040.jpg

    最后再来一点点评价。从投资的角度,我们希望因子本身有清晰合理的解释,但是从多因子模型的角度来说,只要这些因子收益率均值能在截面上解释个股的预期收益率,那这个模型就是好模型(所以在因子选股时,我们会重点关注因子的 IC 和 IR 这些指标)。因子开发属于 empirical work,HML、SMB 是从 real stock return 中挖掘出来的,它们在解释截面收益率均值时有很好的效果。至于 HML,SMB 为什么有效、背后的含义是什么,搞清楚它们能提升我们使用因子的信心,但是对于评价一个因子模型的好坏并不重要。

    好了,这回真的写完了!最后就是来安利我写作本文时最重要的参考文献:芝加哥大学 Booth 商学院的 John Cochrane 教授的著作 Asset Pricing(Cochrane 2005)。该书曾获得 Paul A. Samuelson Award for Outstanding Scholarly Writing on Lifelong Financial Security,足见其地位。它值得任何对资产定价感兴趣的人认真读、仔细读、反复读。

    除了这本书外,对我帮助巨大的是 UChicago Online 发布到网上的 Cochrane 教授的 Asset Pricing 这门课程。感兴趣的朋友可以搜来看一看(大概要翻墙)。Cochrane 教授讲的非常生动、到位,听完再结合他的书一看,那收获自然是大大的。

    0_1535512411040_360截图20180829111320128.jpg

    在介绍 Asset Pricing 这门课的时候,Cochrane 教授谈到:

    The math in real, academic, finance is not actually that hard. Understanding how to use the equations, and see what they really mean about the world... that's hard, and that's what I hope will be uniquely rewarding about this class.

    译:在现实和学术中,金融中的数学其实并不难。难的是理解如何使用这些方程,以及它们对这个世界的真正意义。这是我希望这门课能带给你独特收获的地方。”

    我也真心希望本文在你使用多因子模型的道路上起到一点点帮助。

    参考文献

    Black, F., M. C. Jensen, and M. Scholes (1972). The Capital Asset Pricing Model: Some empirical Tests. In Michael Jensen, Ed., Studies in the Theory of Capital Markets, Praeger, New York NY.

    Cochrane, J. H (2005). Asset Pricing (revised edition). Princeton University Press.

    Fama, E. F. and K. R. French (1993). Common Risk Factors in the Returns on Stocks and Bonds. Journal of Financial Economics, Vol. 33(1), 3 – 56.

    Fama, E. F. and K. R. French (1996). Multifactor Explanations of Asset Pricing Anomalies. The Journal of Finance, Vol. 51(1), 55 – 84.

    Fama, E. F. and J. D. MacBeth (1973). Risk, Return, and Equilibrium: Empirical Tests. The Journal of Political Economy, Vol. 81(3), 607 – 636.

    Gibbons, M. R., S. A. Ross, and J. Shanken (1989). A Test of the Efficiency of a Given Portfolio. Econometrica, Vol. 57(5), 1121 – 1152.

    Grinold R. and R. N. Kahn (1994). Multiple-Factor Models of Portfolio Risk. In A Practitioners Guide to Factor Models.

    Hansen, L. P. (1982). Large Sample Properties of Generalized Method of Moments Estimators. Econometrica, Vol. 50(4), 1029 – 1054.

    Menchero, J., D. J. Orr, and J. Wang (2011). The Barra US Equity Model (USE4). MSCI Barra Research Notes.

    Orr, D. J., I. Mashtaler, and A. Nagy (2012). The Barra China Equity Model (CNE5), Empirical Notes. MSCI.

    Petersen, M. A. (2009). Estimating Standard Errors in Finance Panel Data Sets: Comparing Approaches. The Review of Financial Studies, Vol. 22(1), 435 – 480.

    Shanken, J. (1992). On the Estimation of Beta-Pricing Models. The Review of Financial Studies, Vol. 5(1), 1 – 33.

    来源:量信投资     作者:石川    已获得转载授权。

    ==============================================================

    推荐阅读:

    多因子选股之有效因子 https://www.myquant.cn/community/topic/690
    多因子策略之冗余因子 https://www.myquant.cn/community/topic/695
    多因子选股之策略的实现 https://www.myquant.cn/community/topic/708/2

     


    《算法导论 第三版英文版》_高清中文版

    《深度学习入门:基于Python的理论与实现》_高清中文版

    《深入浅出数据分析》_高清中文版

    《Python编程:从入门到实践》_高清中文版

    《Python科学计算》_高清中文版

    《深度学习入门:基于Python的理论与实现》_高清中文版

    《深入浅出数据分析》_高清中文版

    《Python编程:从入门到实践》_高清中文版


    展开全文
  • 石川:异象、因子和多因子模型

    千次阅读 2019-08-16 22:48:01
    Anomalies, Factors, and Multi-...精通各种概率模型和统计方法,擅长不确定性随机系统的建模及优化。知乎专栏: https://zhuanlan.zhihu.com/mitcshi。 未经授权,严禁转载。 摘 要 本文解释了异象、因子以及因...

    Anomalies, Factors, and Multi-Factor Models
    原创: 石川 川总写量化 2月13日

    作者:石川,量信投资创始合伙人,清华大学学士、硕士,麻省理工学院博士;精通各种概率模型和统计方法,擅长不确定性随机系统的建模及优化。知乎专栏:

    https://zhuanlan.zhihu.com/mitcshi。

    未经授权,严禁转载。

    本文解释了异象、因子以及多因子模型的区别和联系;梳理了从异象到因子再到模型背后的逻辑;介绍了学术界研究多因子模型的主流统计手段。

    1

    引言

    在 empirical asset pricing 和 factor investing 中,anomalies(异象)、factors(因子)以及 multi-factor models(多因子模型)是三个常见的概念。从这些概念出发又能很自然的引发出一系列问题:

    1. 什么是 anomalies;什么是 factors?

    2. Anomalies 和 factors 有什么区别?

    3. 一个 multi-factor model 中应该包含多少个 factors?

    4. 学术界有哪些主流的 multi-factor models?

    5. 如何比较并在不同的 multi-factor models 之间取舍?

    在过去几十年里,海外学术界对上述问题进行了大量的探索,留下了很多宝贵的实证结果和分析手段。而对于像你、我一样进行因子投资的投资者来说,搞清楚这些问题对于构建系统和全面的因子投资分析体系至关重要。本文试图回答上述五个问题。

    在开始之前,先来唠两句标题。这是我第一次使用纯英文标题,倒是也没有什么特别的原因。对于文章标题,我一贯的看法是杜绝惊世骇俗,只求言简意赅、切中要害,再有就是“读来有感觉”。本文的标题翻译中文是“异象、因子和多因子模型”,实在平淡无奇,所以就索性用英文了。

    2

    Anomalies

    多因子模型是 empirical asset pricing 的一种常见方法;其研究的核心问题是找到一组能够解释股票预期收益率截面差异的因子(见《股票多因子模型的回归检验》)。假使我们根据基本面特征或量价指标(或 whatever,下面统称为特征)挑选出一揽子股票并构建多空投资组合;如果该组合的收益率无法被用于 asset pricing 的多因子模型解释,则称该特征为一个异象(anomaly)。

    在数学上,这意味着该组合有模型无法解释的 α 收益率:以使用该特征构建的多空组合收益率为被解释变量放在回归方程的左侧,以多因子模型中因子收益率为解释变量放在回归方程的右边,进行时序回归,回归的截距项就是 α 收益率;如果 α 显著不为零,则说明该特征是一个异象。

    在这里插入图片描述
    举个例子。《获取 α 的新思路:科技关联度》一文介绍了 Lee et al. (2018) 这篇文章;使用科技关联度选股的多空对冲投资组合获得了主流多因子模型无法解释的 α 收益率(下图),因此它是一个异象。

    从有效市场假说的观点出发,市场中不应该存在很多异象。当然,有效市场假说并不完美,再加上学术界几十年来的“不懈努力”,针对美股挖掘出了 400+ 个异象,这些异象在样本内的统计检验中都获得了很高的 t-statistics。

    产生如此多的异象主要有两个原因:

    第一个也是最主要的一个原因是数据挖掘。在 p-hacking 的激励和 multiple testing 的盛行下,大量所谓的异象在样本内被挖出。Harvey, Liu and Zhu (2016) 研究了学术界发表的 316 个所谓显著异象,并指出再考虑了 multiple testing 的影响后,异象收益率的 t-statistic 至少要超过 3.0(而非人们传统认为的 5% 的显著性水平对应的 2.0)才有可能是真正有效、而非来自运气。

    第二个原因和回归方程右侧的定价模型有关。比如,如果仅以 CAPM 为定价模型,那么很多异象都能获得 CAPM 无法解释的 α 收益率;随着定价模型中因子个数的增加,更多的异象变得不再显著。然而,真正的定价模型是未知的。

    谈及对异象的研究,不能不提的一篇文章是 Hou, Xue and Zhang (2017)。这篇长达 146 页的文章惊人的复现了学术界提出的 447 个异象,涵盖动量(57个)、价值/成长(68个)、投资(38个)、盈利(79个)、无形资产(103个)、以及交易摩擦(102个)六大类。下图节选了少量动量类异象说明,感受一下。

    在这里插入图片描述

    对于这 447 个异象,当排除了微小市值股票的影响后,其中 286 个(64%)不再显著(在 5% 的显著性水平下,下同);如果按照 Harvey, Liu and Zhu (2016) 的建议把 t-statistic 阈值提升到 3.0,则其中 380 个(85%)异象不再显著;最后,如果使用 Hou, Xue and Zhang (2015) 提出的 4 因子模型作为定价模型,那么其中 436 个(98%)异象不再显著,剩余存活的仅有 11 个。

    好一个数据挖掘!

    除此之外,Linnainmaa and Roberts (2018) 花费了很大的经历构建了全新的样本外数据,研究了美股中源于会计数据的 36 个异象在样本内、外的表现的差异。分析表明,绝大部分异象在样本外明显失效,它们的失效说明这些异象并非来自未知风险以及错误定价这两种解释,而更有可能仅仅是数据挖掘的产物。

    3

    Factors

    上一节介绍了异象,本节就来看看什么是因子(factors)。一个异象是可能成为一个优秀因子的;然而由于异象之间的相关性,并不是所有异象都是因子。

    一个因子应该能够对解释资产(可以是个股也可以是个股组成的投资组合)预期收益率的截面差异有显著的增量贡献。如果异象满足上述条件,它就可以被称之为一个因子。在这个定义中,有两个关键词值得解读,它们是“解释”和“增量贡献”:

    1. “解释”说明这个异象(或者潜在因子)已经从回归方程的左侧移到了回归方程的右侧,它被用来当作解释变量来对资产的收益率做回归,考察它是否能够解释预期收益率的截面差异。

    2. “增量贡献”暗示着同时考虑多个异象(因子)时,由于它们之间不完全独立,需要排除相关性的影响。

    举个例子。我们知道价值因子是一个靠谱的选股因子。然而,很多指标 —— 比如 E/P 或 B/P 都可以用来构建价值因子的 High-Minus-Low 组合。如果同时基于 E/P 和 B/P 构建了 HML_EP 和 HML_BP 两个因子,它们之间的相关性注定是非常高的。一旦选择了其中之一作为价值因子,另一个对于资产预期收益率截面差异解释能力的增量贡献就不再显著、无法成为因子。

    从资产定价的理论角度来说,多因子模型中的因子之间应尽可能独立;但是从投资实践来说,上面例子中的 E/P 和 B/P 可以被同时使用构建一个 HML 价值因子,这有助于降低波动且增加因子的鲁棒性。

    在从一揽子异象中筛选因子时,常见的做法是将它们同时作为回归分析中的解释变量,采用 Fama-MacBeth Regression(Fama and MacBeth 1973)来分析这些异象的收益率是否显著。在这方面,Green, Hand and Zhang (2017) 是一个很好的例子。

    Green, Hand and Zhang (2017) 使用 Fama-MacBeth Regression 同时检验 94 个异象,并考虑了 multiple testing 对 t-statistic 以及 p-value 造成的影响,最终发现仅有 12 个异象可能成为潜在的因子:1. 账面市值比;2. 现金;3. 分析师数量的变化;4. 盈余公告宣告收益;5. 一个月的动量;6. 六个月动量的变化;7. 盈利同比增长的季度数量;8. 年度研发支出占市值的比重;9. 收益波动性;10. 股票换手率;11. 股票换手率的波动性;12. 零交易的天数。

    上述结果告诉我们:在修正 multiple testing 的数据挖掘、以及考察了不同异象的相关性之后,真正能够解释资产预期收益率截面差异的独立因子少之又少。

    4

    Multi-Factor Models

    现在我们已经了解了异象,并通过回归分析从异象中找出了因子,接下来就是挑选因子构建多因子模型了。在构建多因子模型时,两个必须要回答的问题是:(1)选择多少个因子合适?(2)选择哪些因子更好?学术界对于第一个问题的共识为主流因子模型奠定了基调;而第二个问题则涉及不同多因子模型之间的比较。

    对于第一个问题,我们总可以仅使用一个因子,比如 CAPM 模型仅使用了市场因子;又或者我们可以使用许多因子。一个极端的情况是把每个上市公司作为一个因子,每个公司的股票只在自己公司的因子上有暴露,在代表其他公司的因子上零暴露。这样的模型显然能完美解释股票预期收益率的截面差异,但在现实中没人会那么用。以样本内过拟合为代价,更多的因子总能更好的解释收益率的截面差异。

    在学术界,“几个因子合适”这个问题所遵循的准则是 The Law of Parsimony(简约法则),它还有一个更为人熟知的名字 —— Occam’s razor(奥卡姆剃刀)。如果从 ICAPM(Intertemporal CAPM)的角度来理解多因子模型,每个因子代表某种 state variable;而 state variable 是投资者想要对冲的某种风险。从这个意义上说,因子的个数应该是有限的。

    依据简约法则,学术界主流的多因子模型包括以下几个(按时间顺序、排名不分先后,不完整 list),它们的因子个数均在 3 到 5 个之间:

    Fama-French 三因子模型(Fama and French 1993):多因子模型的开山鼻祖,包括 MKT,HML 以及 SMB 三因子。

    Carhart 四因子模型(Carhart 1997):在 Fama-French 三因子模型上加上了动量 MOM 因子。

    Novy-Marx 四因子模型(Novy-Marx 2013):包含 MKT,HML,MOM 以及 PMU 四个因子;其中 PMU 所用的财务指标是 Gross Profit-to-Asset,代表 profitability 维度。

    Fama-French 五因子模型(Fama and French 2015):Fama 和 French 在其三因子模型的基础上加入了 CMA 和 RMW 两个因子,分别代表 investment 和 profitability 两个维度。

    Hou-Xue-Zhang 四因子模型(Hou, Xue and Zhang 2015):包含 MKT,SMB,IVA 以及 ROE;其中 IVA 是 total assets 的年增长率,代表 investment 维度。

    Stambaugh-Yuan 四因子模型(Stambaugh and Yuan 2016):包含 MKT,SMB,MGMT 和 PERF 四个因子。MGMT 和 PERF 分别使用了 6 个和 5 个指标,代表和 management 以及 performance 相关的两个 mispricing 因子。虽然该模型只有四个因子,但它用到的基本面和量价指标多达 12 个。

    Daniel-Hirshleifer-Sun 三因子模型(Daniel, Hirshleifer and Sun 2018):在 MKT 的基础上,使用 PEAD 和 FIN 两个指标作为短期和长期行为因子(behavioral factors)的代理指标,构建了三因子模型。该模型由于包括了传统的 MKT 风险因子,又包括行为因子,故称为复合模型。这也是一篇比较新的文章,对因子模型提供了新的思路,我会在下周的文章中重点介绍。

    如何比较不同的多因子模型呢?学术界主要有以下三种方法:

    1. GRS tests;

    2. Mean-Variance Spanning tests;

    3. Bayesian approach。

    GRS tests(Gibbons, Ross and Shanken 1989)检验 n 个资产在给定因子模型下的定价错误(pricing error)—— 即 α —— 是否在统计上联合为零(jointly equal to zero)。在比较两个多因子模型时,使用两个模型的因子互为资产和定价模型进行检验。

    举个例子。《中国版的 Fama-French 三因子模型,了解一下?》一文中比较了两个不同版本的价值和市值因子的效果。结果(下表)显示,当使用 SMB 和 VMG 为因子模型时,FFSMB 和 FFHML 的定价错误可以认为是零(p-value = 0.41);反过来,当使用 FFSMB 和 FFHML 为定价模型时,SMB 和 VMG 依然存在显著不为零的定价错误(p-value 是 10 的 -13 次方这个量级)。这意味着 SMB 和 VMG 优于 FFSMB 和 FFHML。

    在这里插入图片描述

    Mean-Variance Spanning tests 考察 n 个已知资产构建的 mean-variance 有效前沿能否包含某个新资产(Huberman and Kandel 1987)。在比较两个多因子模型时,使用每个模型的因子构建有效前沿,并逐一检验其能否包含另一个模型中的因子。

    举个例子。《美股上一个跨越时间尺度的趋势因子》介绍了一个新的趋势因子。考虑新的趋势因子和三个已有因子(SREV、MOM 以及 LREV)的回归模型如下:

    在这里插入图片描述

    检验结果显著的拒绝原假设,说明已有三因子无法解释新的趋势因子。

    最后来看看 Bayesian approach。假设比较两个多因子模型 M_1 和 M_2;相关数据集用 D 表示。令 prob(M_1) 和 prob(M_2) 为这两个模型的先验概率,且有 prob(M_1) + prob(M_2) = 1(这里假设把多个模型两两比较)。根据贝叶斯定理有:

    在这里插入图片描述

    上式中,prob(θ_i) 是模型 i 参数的先验分布,prob(D|θ_i) 是模型 i 的似然函数。上述贝叶斯方法的核心在于确定 prob(θ_i)。根据 Pastor and Stambaugh (2000) 以及 Barillas and Shanken (2018) 的理论,它和以两个模型中的全部因子作为资产所构成的投资组合的预期最大夏普率的平方与市场夏普率的比值有关。

    使用贝叶斯方法,Stambaugh and Yuan (2016) 比较了他们的四因子模型(记为 M-4)和 Fama-French 五因子模型(记为 FF-5)以及 Hou-Xue-Zhang 四因子模型(记为 q-4)。下图中,左图是 M-4 和 FF-5 模型的比较;右图是 M-4 和 q-4 模型的比较。图中,横坐标均为先验,即两模型中全部因子能达到的最大预期夏普率平方和市场夏普率的比值;纵坐标为不同模型的后验概率。

    在这里插入图片描述

    结果说明,当先验这个比值分别大于 1.05 和 1.2 的时候,M-4 因子模型就分别强于 FF-5 和 q-4 模型。显然,使用多个因子得到的最大夏普率很容易是市场夏普率的 1.05 或 1.2 倍,意味着数据更加倾向于支持 M-4 模型。

    需要特别强调的是,无论采用哪种方法,比较多因子模型的目的是为了得到新的启发,而非一定要排个一二三四。这些因子模型之间孰优孰劣并无定论,它们的提出丰富了我们对于 empirical asset pricing 的理解并指导着因子投资。

    5

    多因子模型复杂度的讨论

    在结束本文之前,再来简单讨论下构建因子模型时遵循的 The Law of Parsimony。

    在美国金融协会 2018 年的年会上,Daniel, Hirshleifer and Sun (2018) 报告了他们的复合因子模型,并对模型复杂度和模型的解释效果做了探讨,颇有新意。具体的,他们提出了两个 Parsimony Index,通过惩罚因子和用于构建因子的指标个数来计算模型复杂度。

    第一个 Parsimony Index = 零减去模型中所有因子使用的全部指标数之和;由此可知该 index 取值为负,越大(即越接近零)说明模型越简单。如果一个指标被用于多个因子中,则在计算该 index 时需要多次计算它。

    第二个 Parsimony Index = 零减去模型中的因子和指标个数之和;同上,该 index 取值为负,越大(即越接近零)说明模型越简单。它和前者的区别为:(1)除指标外,也考虑了对因子个数的惩罚;(2)如果某指标被用于多个因子中,其只被计算一次。

    按照上述定义,本文第四节介绍的主流因子模型的两个 Parsimony Index 取值分别为:

    在这里插入图片描述

    使用上述 7 个因子模型来检验 34 个异象,根据 5% 显著性水平下显著的异象的个数以及所有异象的平均 α 收益率的绝对值分别作为模型解释力度,最后将模型解释力度和这两个 Parsimony Index 分别做回归以观察解释度和模型复杂度之间的关系。结果如下。
    在这里插入图片描述

    以 5% 显著性水平的异象个数作为解释力度:

    在这里插入图片描述

    以全部异象平均 |α| 为解释力度:

    随着模型复杂度的提升(表现为 Parsimony Index 的取值更小),模型的解释力度上升(体现为 5% 显著性下的异象变少和异象平均 |α| 降低)。这个结论符合预期,它也再次强调了不同因子模型之间的好坏并无定论 —— 我们总能通过增加模型复杂度来提升模型(样本内)的解释效果,因此需要在模型复杂度和样本内的解释力度之间取舍。

    在 The Law of Parsimony 的指导思想下,一个优秀的因子模型通常有较少的因子或者基本面或量价特征;而作为使用者,我们应该尽量搞清楚每一个因子背后代表的风险。

    6

    结语

    这篇文章没有告诉你哪个异象能赚取 α。

    这篇文章没有告诉你哪个因子能赚取高性价比的 β。

    这篇文章也没有告诉你哪家的多因子模型更胜一筹。

    OK, enough for “自我否定”。既然如此,为什么要写这篇文章呢?如今,学术论文和卖方报告中开发出新“因子”的速度已远超我能理解、消化的速度。以学术界的 447 个异象为例,如果每周写一篇介绍一个,要写 9 年。异象被当作“因子”来使用,但它背后往往没有合理的金融学解释(即无法代表合理的系统性风险),或者没有用已有因子对其分析从而评判它对解释股票预期收益率截面差异的增量贡献,仅仅是数据挖掘的产物。它们中大多数根本不是因子,甚至连异象都谈不上。出于这个原因,我希望能介绍一些方法,帮助因子投资的践行者去伪存真。这就是写作本文的初衷。

    这篇文章回答了开篇提出的五个问题;解释了异象、因子以及多因子模型的区别和联系;梳理了从异象到因子再到模型,一步步使用多因子模型背后的逻辑;介绍了学术界在研究多因子时使用的主流统计手段。希望它能够作为一个完善的工具箱,为你的多因子研究和投资添一分助力。

    (全文完)

    延伸阅读,其他有关因子投资的文章链接如下:

    《股票多因子模型的回归检验》

    《解释股票截面预期收益差异的独立因子》

    《未知风险,错误定价,还是数据迁就?》

    《在追逐 p-value 的道路上狂奔,却在科学的道路上渐行渐远》

    《你用因子,他也用因子;你没赚钱,他却赚钱了》

    《出色不如走运 (III)?》

    《出色不如走运 (II)?》

    参考文献

    Barillas, F. and J. Shanken (2018). Comparing asset pricing models. Journal of Finance, Vol. 73(2), 715 – 754.

    Carhart, M. M. (1997). On Persistence in Mutual Fund Performance. Journal of Finance, Vol. 52(1), 57 – 82.

    Daniel, K. D., D. A. Hirshleifer and L. Sun (2018). Short- and long-horizon behavioral factors. Columbia Business School Research Paper No. 18-5. Available at SSRN: https://ssrn.com/abstract=3086063.

    Fama, E. F. and K. R. French (1993). Common Risk Factors in the Returns on Stocks and Bonds. Journal of Financial Economics, Vol. 33(1), 3 – 56.

    Fama, E. F. and K. R. French (2015). A Five-Factor Asset Pricing Model. Journal of Financial Economics, Vol. 116(1), 1 – 22.

    Fama, E. F. and J. D. MacBeth (1973). Risk, return, and equilibrium: empirical tests. Journal of Political Economy, Vol. 81(3), 607 – 636.

    Green, J., J. R. M. Hand and X. F. Zhang (2017). The characteristics that provide independent information about average U.S. monthly stock returns. Review of Financial Studies, Vol. 30(12), 4389 – 4436.

    Gibbons, M. R., S. A. Ross and J. Shanken (1989). A test of the efficiency of a given portfolio. Econometrica, Vol. 57(5), 1121 – 1152.

    Harvey, C. R., Y. Liu and H. Zhu (2016). … and the cross-section of expected returns. Review of Financial Studies, Vol. 29(1), 5 – 68.

    Hou, K., C. Xue and L. Zhang (2015). Digesting anomalies: An investment approach. Review of Financial Studies, Vol. 28(3), 650 – 705.

    Hou, K., C. Xue and L. Zhang (2017). Replicating Anomalies. Fisher College of Business Working Paper No. 2017-03-010; Charles A. Dice Center Working Paper No. 2017-10. Available at SSRN: https://ssrn.com/abstract=2961979.

    Huberman G. and S. Kandel (1987). Mean-variance spanning. Journal of Finance, Vol. 42(4), 873 – 888.

    Lee, C. M. C., S. T. Sun, R. Wang and R. Zhang (2018). Technological Links and Return Predictability. Journal of Financial Economics, forthcoming.

    Linnainmaa, J. T. and M. R. Roberts (2018). The history of the cross-section of stock returns. Review of Financial Studies, Vol. 31(7), 2606 – 2649.

    Liu, J., R. F. Stambaugh and Y. Yuan (2018). Size and Value in China. Journal of Financial Economics, forthcoming.

    Novy-Marx, R. (2013). The other side of value: The gross profitability premium. Journal of Financial Economics, Vol. 108 (1), 1 – 28.

    Pastor, L. and R. F. Stambaugh (2000). Comparing asset pricing models: an investment perspective. Journal of Financial Economics, Vol. 56(3), 335 – 381.

    Stambaugh, R. F. and Y. Yuan (2016). Mispricing Factors. Review of Financial Studies, Vol. 30(4), 1270 – 1315.

    展开全文
  • 论文研究-Copula函数在多因子模型系数估计中的应用.pdf, 主要研究用多因子模型刻画金融资产收益率时, 因子载荷系数的合理估计问题.以因子系数的金融意义为出发点,并结合...
  • 结构化概率模型

    千次阅读 2018-12-09 21:00:41
    机器学习的算法经常会涉及到在非常的随机变量上的概率分布。通常,这些概率分布涉及到的直接相互作用都是介于非常少的变量之间的。使用单个函数来描述整个联合概率分布是非常低效的 (无论是计算上还是统计上)。 ...

    机器学习的算法经常会涉及到在非常多的随机变量上的概率分布。通常,这些概率分布涉及到的直接相互作用都是介于非常少的变量之间的。使用单个函数来描述整个联合概率分布是非常低效的 (无论是计算上还是统计上)。

    我们可以把概率分布分解成许多因子的乘积形式,而不是使用单一的函数来表示概率分布。例如,假设我们有三个随机变量 a, b 和 c,并且 a 影响 b 的取值,b 影响 c 的取值,但是 a 和 c 在给定 b 时是条件独立的。我们可以把全部三个变量的概率分布重新表示为两个变量的概率分布的连乘形式:

    这种分解可以极大地减少用来描述一个分布的参数数量。每个因子使用的参数数目是它的变量数目的指数倍。这意味着,如果我们能够找到一种使每个因子分布具有更少变量的分解方法,我们就能极大地降低表示联合分布的成本。

    我们可以用图来描述这种分解。这里我们使用的是图论中的 ‘‘图’’ 的概念:由 一些可以通过边互相连接的顶点的集合构成。当我们用图来表示这种概率分布的分 解,我们把它称为 结构化概率模型(structured probabilistic model)或者 图模型(graphical model)

    有两种主要的结构化概率模型:有向的和无向的。两种图模型都使用图 G,其中图的每个节点对应着一个随机变量,连接两个随机变量的意味着概率分布可以表示成这两个随机变量之间的直接作用

    上图是关于随机变量 a, b, c, d 和 e 的有向图模型。该图模型使我们能够快速看出此分布的一些性质。例如,a 和 c 直接相互影响,但 a 和 e 只有通 过 c 间接相互影响。这幅图对应的概率分布可以分解为:

    无向(undirected)模型使用带有无向边的图,它们将分解表示成一组函数;不 像有向模型那样,这些函数通常不是任何类型的概率分布。G 中任何满足两两之间有边连接的顶点的集合被称为团。无向模型中的每个团 C(i) 都伴随着一个因子 φ(i)(C(i))。这些因子仅仅是函数,并不是概率分布。每个因子的输出都必须是非负的,但是并没有像概率分布中那样要求因子的和或者积分为 1。

    随机变量的联合概率与所有这些因子的乘积 成比例(proportional)——意味着 因子的值越大则可能性越大。当然,不能保证这种乘积的求和为 1。所以我们需要除 以一个归一化常数 Z 来得到归一化的概率分布,归一化常数 Z 被定义为 φ 函数乘 积的所有状态的求和或积分。概率分布为:

    上图是关于随机变量 a, b, c, d 和 e 的无向图模型。该图模型使我们能够快速看出此分布的一些性质。例如,a 和 c 直接相互影响,但 a 和 e 只有通 过 c 间接相互影响。这幅图对应的概率分布可以分解为:

     

     

     

     

     

     

     

     

     

    展开全文
  • 概率模型

    2019-12-20 00:04:41
    概率模型引入概率模型的分类马尔可夫性定义图的最大团概率无向图的因子分解优缺点 引入 图是指由结点以及连接结点的边组成的集合。结点和边的集合分别记作V和E,图记作G=<V,E>。图分为有向图和无向图,...
  • 有雨为1,无雨为0)的相关系数,挑选相关性较好的因子两两作点聚图,求出点聚图上九点滑动平均的降水概率,建立优势波分型下的分对数(LOGIT)模型,用PPM法作逐日晴雨预报。用本回归模型对1983年进行试报,1984年4月应
  • 在相对论谐振子势能模型(RHOPM)中研究了一个QCD夸克簇系统,并预测了RHOPM中离子,质子和氘核的电磁形态因子。 然后将计算的理论结果与现有的实验数据进行比较,发现这三个目标粒子的理论预测与实验数据之间有很...
  • 注:由于在CSDN中画图和输入公式非常麻烦,所以我选择了手写后拍照截图来表示,可能稍有模糊,请各位看官担待。 下面开始正文叙述: 马尔科夫随机场(Markov Random Field,MRF)是典型的马尔科夫网,这是一种著名...
  • 最好的概率模型简介

    千次阅读 2014-11-14 13:51:08
    介绍 定义 概率模型(Graphical Model)是概率论和图论之间的桥梁,概率模型的基本想法来自模块的概念,即一个复杂系统是由简单的部分所联合而成...很经典的多元概率系统,比如混合模型因子分析,隐含马尔
  • 概率模型学习(1)——基础

    千次阅读 2016-10-25 15:57:58
    联合分布:为了用规则化的概率推理来完成推测一个或个变量的可能值,需要在某些随机变量的可能值空间上构造一个联合分布。 将分布“分解”为一些更小的因子,使每一个因子定义在一个更小的概率空间上。联合分布...
  • 马尔可夫随机场(MRF)是典型的马尔可夫网,是一种著名的无向图模型。每个节点表示一个或一组变量,节点之间之间的边表示...在马尔可夫随机场中,个变量之间的联合概率分布能基于团分解为因子的乘积,每个因子
  • Conditional Probability ...因为求解概率分母Z的时候,涉及到众多变量的众多组合情况,需要求的因子了。 Conditional Probability with Evidence 条件概率的计算上,虽然分子只是连乘了几个不同的因子,变量后我
  • 精通各种概率模型和统计方法,擅长不确定性随机系统的建模及优化。知乎专栏:https://zhuanlan.zhihu.com/mitcshi。未经授权,严禁转载。 摘要:Newey-West 调整是计量经济学中的经典方法,在多因子模型回归分析中...
  • 精通各种概率模型和统计方法,擅长不确定性随机系统的建模及优化。知乎专栏:https://zhuanlan.zhihu.com/mitcshi。未经授权,严禁转载。 摘要:Newey-West 调整是计量经济学中的经典方法,在多因子模型回归分析中...
  • 精通各种概率模型和统计方法,擅长不确定性随机系统的建模及优化。知乎专栏:https://zhuanlan.zhihu.com/mitcshi。未经授权,严禁转载。 摘要:Newey-West 调整是计量经济学中的经典方法,在多因子模型回归分析中...
  • 贝叶斯网络是很多概率模型的基础,对于slam研究也是一项必须掌握的数学理论工具。 一. 马尔可夫链以及隐马尔可夫模型 1.1 概念 我们先来了解一下马尔可夫相关的概念。 马尔可夫性质(Markov property):在随机过程中...
  • 似然函数值越大,模型拟合越好,但是我们不能简单地测量模型拟合精度,这导致模型中越来越的未知参数,并且变得越来越复杂的模型会导致过度匹配。 因此,一个好的模型应该是拟合精度和未知参数数量的组合,以优化...
  • 多因子回归检验中的NeweyWest整

    千次阅读 2019-05-06 17:49:43
    精通各种概率模型和统计方法,擅长不确定性随机系统的建模及优化。知乎专栏:https://zhuanlan.zhihu.com/mitcshi。未经授权,严禁转载。 摘要:Newey-West 调整是计量经济学中的经典方法,在多因子模型回归分析中...
  • 精通各种概率模型和统计方法,擅长不确定性随机系统的建模及优化。知乎专栏:https://zhuanlan.zhihu.com/mitcshi。未经授权,严禁转载。 摘要:Newey-West 调整是计量经济学中的经典方法,在多因子模型回归分析中...
  • 同时,提出基于组合消除的知识约简方法,旨在解决关联关系矩阵中重复知识因子多、矩阵维数高导致存储和计算困难的问题.最后通过铝电解槽况判断的案例分析,验证了贝叶斯概率语义网模型的合理性、可行性和有效性.
  • 本文档详细给出了TOTLDA和LDA两个主题概率模型的参数估计需要用到的后验概率的推导过程,并采用了两种方法,对主题概率模型研究人员具有很好的启发意义!Gibbs Sampling Derivation for LDA and ToT, Han Xiao, Ping...
  • 多因子回归检验中的NeweyWest调整

    千次阅读 2019-02-27 13:29:41
    多因子回归检验中的 Newey-West 调整...精通各种概率模型和统计方法,擅长不确定性随机系统的建模及优化。知乎专栏:https://zhuanlan.zhihu.com/mitcshi。未经授权,严禁转载。 摘要:N...
  • 最后,我们使用了我们最近提出的具有这些衰减宽度新值的统一模型,计算了相对论重离子对撞机和大强子对撞机能量在中心状态下各种夸克态的存活概率。 这项研究提供了在有限温度下各种夸克态的光谱性质及其在不同碰撞...
  • 为研究激光经运动漫反射目标后光场统计的特性,结合像素光子计数器(MPPC)的光子统计模型,并利用光子统计二阶矩和均值,得到描述光子数波动的Fano因子。然后对该因子进行曲线拟合,得到衡量赝热光场光子分布杂乱...
  • 然后利用D-S 合成规则构造的概率分配函数作为权值因子, 对子模型输出进行融合以得到多模型的输出; 最后结合ARIMA 模型对静态多模型输出进行动态校正. 仿真研究与工业应用的结果表明, 所提出的方法具有良好的预测...
  • 有向图与无向图 有向概率模型或贝叶斯网络:因果关系 ...有向图模型因子概率分布、无需全局归一(有向图的联合概率分布是根据因果关系,从前乘到后, 参考最大熵马尔科夫模型:https://blog.csdn.net/asdfsadfasdfsa...
  • 交通事件持续时间是事故管理研究中最重要的指数之一,应用半参数比例风险模型和参数加速失效模型分析了因素事件持续时间及其危险因子之间的关系.利用浙江省某高速公路3年内采集的事件数据,通过对交通事件各状态...
  • 混合高斯模型(Gaussian Mixture Model,简称GMM)是用高斯概率密度函数(正态分布曲线)精确地量化事物,将一个事物分解为若干的基于高斯概率密度函数(正态分布曲线)形成的模型。通俗点讲,无论观测数据集如何...

空空如也

空空如也

1 2 3 4 5 ... 8
收藏数 145
精华内容 58
关键字:

多因子概率模型