精华内容
下载资源
问答
  • 对于需要用时间序列数据反映的过程变量, 综合考虑该类指标的时间序列均值、方 差或偏度等特征, 将包含企业风险演化趋势信息的时间序列数据映射为一个截面值, 从而使风险评估模型具有处理 动态信息的能力....
  • 穆迪风险评估模型

    2018-03-14 22:20:34
    Moody RiskCal Model是一系列评估非上市公司违约风险模型。每个模型针对某个地理区域或行业,并体现了当地贷款、监管操作和会计准则
  • 将风险矩阵法引入信息安全风险评估,构建了以专家二维矩阵、Borda排序和层次分析法为评估流程的风险评估模型,将定性的过程定量化,提高了评估的客观性。最后以校控制与网络实验室为评估对象进行实例计算。
  • 传统的信息安全风险评估较少涉及对背景知识关联分析所导致的隐私泄露风险。针对基于关联分析的大数据隐私泄露风险问题,以隐私资产、 隐私威胁因子和隐私存储有效时间为要素建立隐私泄露风险指标体系、 定义风险计算...
  • 论文研究-基于遗传规划方法的商业银行信用风险评估模型.pdf, 利用遗传规划方法研究了我国商业银行的信用风险评估问题 ,并使用我国商业银丢失实际数据对模型进行了实证...
  • 为了探索职业健康风险评估模型在煤矿职业病危害评价中的应用,选取某大型煤矿5个主要工段的12个主要工序,运用罗马尼亚风险评估模型(Romanian model)和国际采矿与金属委员会风险评估模型(ICMM)对某煤矿进行风险评估并...
  • 数字档案图形风险评估模型的存储库-DiAGRAM 有关更多详细信息, 。 入门 安装依赖项 devtools :: install_deps() devtools :: install_version( " gRain " , " 1.3-0 " ) devtools :: install() 运行应用 参见inst...
  • 为实现智能配电网风险评估,提出一种新型智能配电网风险评估模型。根据当前智能配电网发展情况,构建融合宏观风险和微观指标的智能配电网多级风险评估体系,使其尽可能全面地覆盖网络风险管理过程中的关键性风险因素...
  • 基于大数据的个人信用风险评估模型研究
  • 不确定性环境下NIS安全风险评估模型,冯楠,解晶,如何在不确定性条件下进行风险辨识以及风险概率估计是网络信息系统安全风险评估中亟待解决的关键问题之一。本文提出了一种基于遗
  • 大学生创业贷款个人信用风险评估模型,方秋莲,于莉, 本文选取毕业内三年创业贷款的大学生为研究对象,采用能反映大学生个人信用的评价体系进行问卷调查,调查数据作为分析依据,并�
  • 基于人性假设的物流外包风险评估模型,胡婧,,随着市场竞争的加剧,企业为了实现资源的最优化利用,逐步认识到应该专注于核心业务,而将非核心业务如物流等外包给专业的公司。
  • 以煤矿安全隐患排查治理风险为研究对象,分析隐患排查闭环管理全过程,并基于此建立了隐患排查治理能力纵向评估指标体系,融合熵值法和集对分析理论,建立了煤矿安全隐患排查治理风险纵向评估模型,为企业更好地了解自身...
  • DREAD风险评估模型

    千次阅读 2021-04-08 18:56:31
    风险评估模型很重要,任何一个风险,需要经过系统的评估才能确定风险的实际危害程度。毕竟安全也是一门科学。 本文介绍DREAD风险评估模型。 DREAD是原来微软的风险评估威胁系统的一部分。这里有一篇微软的论文 link...

    风险评估模型很重要,任何一个风险,需要经过系统的评估才能确定风险的实际危害程度。毕竟安全也是一门科学。

    本文介绍DREAD风险评估模型。

    DREAD是原来微软的风险评估威胁系统的一部分。这里有一篇微软的论文 link。由于此模型不稳定,比如可发现性难衡量、可复现性很多场景下不重要等,实际使用过程中有时评分十分不准确,所以微软在2008年可能弃用了此模型,例如,在ASRC中,微软使用Bug Bar来定义威胁风险。

    DREAD提供了5个维度,进行威胁评级,每个维度0-10分。通过最后的评分确定威胁的严重程度。
    以下是DREAD各维度介绍。

    维度描述评分
    Damage 危害程度风险会造成怎样的危害?包括:系统受危害程度,泄露信息的数据敏感性,资金资产损失,公关法律风险。0:无损失;
    5:一般损失
    10:巨大损失
    Reproducibility 可复现性重现攻击是否容易,风险是否可以稳定复现。0 :管理员也难以复现。
    5:授权用户需要复杂步骤。
    7 :身份验证用户可通过简单步骤复现。
    10 :只是一个Web浏览器即可复现。
    Exploitability 利用难度需要多少成本才能实现这个攻击,关注的重点是利用难度。0:无法利用
    2:利用条件非常苛刻,难以利用
    4:利用有一定难度,利用非常复杂
    6:高级攻击者资质工具利用
    3分:中级攻击者利用
    10:新手可在简单工具下轻松利用
    Affected users影响面可理解为系统业务的重要程度,重要业务好边缘业务对用户的影响是不同的。0 :无影响
    2.5:影响个别个人/雇主。
    6 :一些个人或雇主权限的用户,非全部。
    8 :影响管理用户。
    10 :影响所有用户
    Discoverability 发现难度是否能被外界轻易发现,外界发现此风险是否需要较高成本。0 :需要源代码或管理访问权限。
    5:可通过监听HTTP请求发现。
    8 :已公开poc,可轻松发现。
    10:在Web浏览器地址栏或表单中可见。
    展开全文
  • 借鉴信息安全风险评估理论,以国家安全资产、开放数据脆弱性和安全威胁作为主要安全风险要素,构建政府开放数据的安全风险评估模型,利用层次分析法和模糊综合评价法对政府开放数据的安全风险进行量化评估,并通过...
  • 引入可信度概念,提出了一种基于模糊Petri网的安全风险评估模型以及模糊推理算法,同时结合层次分析法,采取定性与定量分析相结合的方法进行安全评估。实例分析表明:与传统的综合风险评估方法相比,基于模糊Petri网...
  • 就移动支付风险的分析及风险值的计算理论方面开展工作,在贝叶斯网络的基础上,针对移动支付的主要组成主体,提出移动支付风险评估模型,通过使用该模型进行移动支付风险评估不仅可以对目前移动支付的风险进行评估,...
  • 分析了数据业务中存在的风险,指出了目前对数据保护所存在的问题,提出了以保护数据安全为目的的数据风险评估模型、评估方法及评估过程,为抵御入侵、保护数据安全提供了一种新的方法及手段。
  • 依据最新的国际、国内风险评估标准,提出一个基本的3层评估体系结构和以威胁为中心的风险评估模型,将其他风险要素的评估结果统一到威胁风险评估中,清晰呈现了4个风险要素之间的关系,并适合于定性、定量或综合评估方法...
  • 本研究通过选择与中小企业(SME)的企业资源计划(ERP)实施阶段相关的某些关键陷阱,提出了一种风险评估模型。 该模型可用于预测将导致ERP实施失败的风险影响。 本文是评估中小企业ERP决策的持续研究的一部分,涉及...
  • 本项目选取了五种大数据新算法,包括支持向量机(SVM)、决策树、随机森林、自适应提升(AdaBoost)和梯度提升决策树(GBDT),在中国人民银行征信中心的大规模样本上进行了个人风险评估模型的构建,并从三方面进行...

    上世纪80年代,美国费埃哲公司基于逻辑回归算法构建了费埃哲信用评分体系,并成为美国信用评分市场的巨头。然而,随着大数据建模技术的日新月异,许多新算法、新技术层出不穷。本项目选取了五种大数据新算法,包括支持向量机(SVM)、决策树、随机森林、自适应提升(AdaBoost)和梯度提升决策树(GBDT),在中国人民银行征信中心的大规模样本上进行了个人风险评估模型的构建,并从三方面进行评估。首先,从模型的准确性和可解释性方面综合对比各算法构建的模型在个人信用风险评估中的效果。之后使用时点外测试样本,对各算法构建的模型的外部时点稳定性进行了评估。

    项目背景

    目前,中国人民银行征信中心的信用报告数字解读体系参考了美国个人消费信用评估公司费埃哲开发的费埃哲信用评分体系。费埃哲信用评分体系构建于上世纪80年代,其核心算法是逻辑回归。 随着统计分析和大数据建模技术的进步,算法的发展日新月异,形成了包括决策树、随机森林、神经网络分析与自适应提升(AdaBoost)等在内的许多新算法新技术,而这些大数据新算法在目前征信中心的数据集上的准确性、稳定性与可解释性仍有待验证评估。

    为此,中国人民银行征信中心联合北京至信普林科技有限公司,选取了五种大数据新算法,分别为支持向量机(SVM)、决策树、随机森林、自适应提升(AdaBoost)和梯度提升决策树(GBDT),全面评估和比较上述五种算法在个人信用风险评估模型中的效果,包括稳定性、准确性与可解释性,以进一步理解相关算法在评分上的优势与短板。对新型评分模型的探索与试验有助于为征信中心积累模型算法经验,与国际领先的建模方法接轨,同时以新颖的信用评估模型作为战略储备,为打造我国自有的信用评分体系积累经验。

    算法介绍

    支持向量机(Support Vector Machine,SVM)是一种分类学习算法。支持向量机(SVM)的基本模型是定义在特征空间上的间隔最大的线性分类器。线性支持向量机与逻辑回归类似,都是给每一个变量赋予一个权重因子,最终变量的加权和作为预测的依据。同时支持向量机(SVM)可以使用核函数将变量映射到高维空间,从而提升模型效果。然而这种方法的主要缺点是训练速度慢,难以直接运用到大规模数据,因此本项目仅对线性支持向量机进行了测试。

    决策树(Decision Tree)是一种基本的分类与回归方法。决策树模型呈树形结构,可以认为“是否”判断规则(if-then)的集合,也可以看作定义在特征空间与类空间上的条件概率分布。其主要优点是训练速度快,预测速度也很快。相对于线性模型,决策树还可以处理非线性数据。此外,决策树模型可解释性非常强,对于数据的适应能力也很强;其缺点则是单棵决策树容易过拟合。

    随机森林(Random Forest)由多棵决策树组成,每棵决策树擅长特定人群、重点关注特定变量,然后一起决策,作出最终判断。随机森林在构建每棵决策树时,通过样本和变量两个维度进行随机抽样。随机森林的优点是训练速度快,可以很好地进行并行化,能够处理大规模数据。

    自适应提升(Adaptive Boosting,AdaBoost)核心思想是利用同一训练样本的不同加权版本,训练一组弱分类器(Weak Learner),然后把这些弱分类器以加权的形式集成起来,形成一个最终的强分类器(Strong Learner)。在每一步迭代过程中,被当前弱分类器分错的样本的权重会相应得到提高,被当前弱分类器分对的样本的权重则会相应降低。弱分类器的权重则根据当前分类器的加权错误率来确定。自适应提升(AdaBoost)的优点是不容易产生过拟合,预测效果好。

    梯度提升决策树(Gradient Boosting Decision Tree,GBDT)与自适应提升(AdaBoost)在很多方面类似,也是子模型之间相互协作,不同的是后一个子模型对前一个模型的失误进行修正。梯度提升决策树(GBDT)模型预测的时候,对于输入的一个样本实例,首先会赋予一个初值,然后会遍历每一棵决策树,每棵树都会对预测值进行调整修正,最后得到预测的结果。

    逻辑回归适合处理线性数据,而实际问题往往是非线性的,特别是在信用风险评估场景下。支持向量机(SVM)能够通过核函数等方法处理非线性数据,然而在样本量大时训练速度太慢。决策树能够处理非线性数据,但是单棵决策树对数据十分敏感,容易产生过拟合问题。随机森林通过采样来减小计算量,同时能够利用并行方式进行模型训练,因而适合处理大规模高维数据。自适应提升(AdaBoost)和梯度提升决策树(GBDT)在基本决策树模型的基础上,通过数据权重变换等方式,能够将一个弱模型变成强模型,同时能够有效避免过拟合问题。

    建模流程

    本次研究使用的数据集为征信中心数据库存储的1265万人的个人征信数据,具体包括2010年7月31日时间点的贷款记录、贷记卡记录、准贷记卡记录、特殊交易记录和查询记录。采用自2010年7月31日至2012年7月31日之间个人违约情况的记录定义表现变量,表现变量取值范围为0(未逾期)和1(逾期90天以上)。

    项目建模的流程如下:(1)首先对原始数据进行分析,研究原始数据各字段的含义并分析数据质量;(2)基于分析结果,确定刻画个人信用的七大类统计指标, 包括历史还款信息、帐户类型和数量、正在使用和已结清帐户信息、信用时长、新开帐户信息、查询信息和特殊交易信息;(3)对部分连续型指标采用单变量决策树的方法进行分栏处理;(4)利用大数据算法构建个人信用风险评估模型;(5)对各算法构建的模型效果进行评估和分析。

    本项目中数据的分析、处理与建模等均是基于派森(Python) 环境。②

    效果评估

    本项目主要从准确性,稳定性,可解释性三个方面来评估模型。其中准确性指标包括感受性曲线下面积(ROC_AUC)和区分度指标(Kolmogorov-Smirnov,KS),稳定性指标主要参考群体稳定指数(Population Shift Index,PSI)。可解释性可通过指标重要度来进行评估,其中指标重要度用于衡量各个解释变量对算法预测结果影响的程度。感受性曲线下面积(ROC_AUC)、区分度指标(KS)和群体稳定指数(PSI)的具体含义如下:

    感受性曲线下面积(ROC_AUC)

    感受性曲线下面积(ROC_AUC)是一个从整体上评价模型准确性的指标,是感受性曲线(ROC)与横轴之间的面积。相比于其他评价指标,感受性曲线(ROC)具有一定的稳定性,它不会因为正负样本分布的变化而产生不同的曲线。感受性曲线(ROC)通过真阳率(True Positive Rate, TPR)和假阳率(False Positive Rate, FPR)两个指标进行绘制。感受性曲线(ROC)示意如图1所示。感受性曲线下面积(ROC_AUC)取值范围为[0,1],取值越大,代表模型整体准确性越好。

    区分度指标(KS)

    区分度指标(KS)是度量具体模型下正常样本和违约样本分布的最大差距,首先按照样本的信用分数或预测违约率从小到大进行排序,然后计算每一个分数或违约率下好坏样本的累计占比。正常和违约样本的累计占比差值的最大值即为区分度指标(KS)。区分度指标(KS)的示意如图2所示。区分度指标(KS)小于0.2代表模型准确性差,超过0.75则代表模型准确性高。

    群体稳定指数(PSI)

    模型是在特定时间点开发的,是否对外部样本有效需要经过稳定性测试。群体稳定指数(Population Stability Index,PSI)是最常用的模型稳定性评价指标。群体稳定指数(PSI)的计算公式为:

    其中预期占比(Expected%)和实际占比(Actual%)分别表示在模型训练样本和测试样本中,对应分数段或违约率段内的人群占比。一般而言,群体稳定指数(PSI)小于0.1代表模型稳定性高,群体稳定指数(PSI)大于0.1小于0.25代表模型稳定性中等,群体稳定指数(PSI)大于0.25代表模型稳定性较差。

    2010年样本测试。我们首先在2010年样本上进行建模,评估各模型的准确性与可解释性。2010年样本是指2010年表现变量取值为0(未逾期)和1(逾期90天以上)的人群,样本大小约为1000万。选取样本的70%作为训练样本构建模型,30%作为测试样本评估模型效果。各模型的感受性曲线下面积(ROC_AUC)和区分度指标(KS)分别如图3所示和图4所示。

    从上述结果可以看出,集成算法(随机森林,梯度提升决策树,自适应提升)建立的模型表现更好,感受性曲线下面积(ROC_AUC)指标达到0.95以上。 支持向量机(SVM)的准确性表现最差,这与数据样本大,在项目环境下无法使用核函数有关。决策树表现一般,感受性曲线下面积(ROC_AUC)指标分别为0.9477。 具体地,如果以区分度指标(KS)作为衡量标准,自适应提升(AdaBoost)表现最好,区分度指标(KS)达到0.7803。其他模型的表现排序为:随机森林>梯度提升决策树(GBDT)>决策树>支持向量机(SVM)。

    在可解释性方面,通过各算法计算指标重要度以帮助对结果进行解读。综合考虑所有模型生成的指标重要度而得出的综合排序如表1所示。

    从各模型指标重要度综合排序来看,对个人信用评估影响最大的因素分别是:逾期情况、正常还款比例、免担保贷款、授信额度使用率、信用年限等。可见,影响大数据新算法预测结果的都是可解释性较高的统计指标。与传统的逻辑回归模型相比,大数据算法不需要太多的变量选择和变量评估工作,能够在模型的构建过程中自动选取重要的变量,并对变量的重要性进行自动评估。

    外部时点样本测试。为了评估模型在外部时点样本上的表现,我们对大数据新算法模型在外部时点样本上进行了测试。其中外部时点样本选取截至2011年3月31日时间点的纪录,样本总人数约为1300万。使用2010年训练样本所训练的模型在外部时点样本上进行测试,分析比较其在外部时点样本上的准确性和稳定性。

    各模型的性能评价指标如图5与表2所示,其中2010年表示模型在2010年测试样本上的表现,2011年表示模型在2011年测试样本上的表现。

    对比模型在2010年及2011年样本上的预测结果,在准确性方面,决策树、随机森林、自适应提升(AdaBoost)的感受性曲线下面积(ROC_AUC)有所下降,而梯度提升决策树(GBDT)的感受性曲线下面积(ROC_AUC)有所提升;决策树、自适应提升(AdaBoost)的区分度指标(KS)有所下降,而逻辑回归、随机森林、梯度提升决策树(GBDT)和支持向量机(SVM)的区分度指标(KS)有所提升。整体来说,准确性方面各模型在2011年测试样本上的表现与在2010年测试样本上的表现无明显差异,表现稳定。从群体稳定指数(PSI)来看,自适应提升(AdaBoost)和支持向量机(SVM)稳定性最好(PSI<0.1),而决策树与梯度提升决策树(GBDT)的稳定性次之(0.1<PSI<0.25),随机森林的稳定性较低(PSI>0.25)。

    总结

    为了评估大数据新算法在个人信用风险评估模型中使用效果,中国人民银行征信中心联合北京至信普林科技有限公司,从准确性、稳定性和可解释性三个方面对主流的大数据算法的模型构建效果进行了综合评估。项目选取了五种大数据新算法,包括决策树、随机森林、自适应提升(AdaBoost)、梯度提升决策树(GBDT)和支持向量机(SVM),在千万级别的大规模样本中进行个人风险评估模型的构建和分析。

    在2010年1000万样本上的分析结果表明,自适应提升(AdaBoost)、梯度提升决策树(GBDT)和随机森林三种集成算法准确性表现最佳,决策树准确性次之,支持向量机(SVM)的准确性最差。同时,对外部时点样本的分析结果表明,自适应提升(AdaBoost)和支持向量机(SVM)稳定性高,决策树、梯度提升决策树(GBDT)稳定性中,随机森林稳定性低。在可解释性方面,大数据新算法都能够对统计指标的重要度作出评估,统计指标综合排序靠前的统计指标的解释性较好。综合来看,部分大数据算法(如自适应提升)在准确性和稳定性上均表现优异,可以作为我国新一代信用风险评估模型的战略储备。

    大数据算法是模型构建的工具,其结果不是绝对的,如何根据数据特征和算法特性构建合适的模型也是非常关键的。在实际模型开发过程中,需要业务专家和数据科学团队在数据逻辑的理解和建模指标的选取上紧密合作。此外,数据科学团队需要对算法的核心原理有着深刻的理解,并且具备快速的算法实现能力,强大的大规模数据处理能力,才能充分利用大数据算法开发出高性能的信用风险评估模型。

    展开全文
  • 根据实时运行条件下故障率参数的时变特性,应用马尔可夫理论推导了TCSC核心部件以及整个线路的状态概率计算公式,并基于运行风险理论建立了条件相关的故障率模型,该模型定量考虑了负荷随机波动、元件老化以及气温...
  • 为了解决目前信息安全风险评估系统中存在的主观性强、静态评估等问题,该文提出了一种基于生物免疫学危险理论的信息安全风险评估模型DT-RA,采用危险信号触发机制,能够应对不断变化的信息系统和网络环境,然后给出...
  • 为了解决这个问题,以开发者的视角,通过解构 Mashup应用的开发过程,集静态和动态安全风险因素于一体,透视 Mashup应用的组件和行为特征,提出 Mashup应用的定 量风险评估框架,定义风险评估模型,在满足假设条件基础上,...
  • 本书内容包括:系统元件的停运模型、停运模型中的参数估计、风险评估方法基础、电力系统的风险评估方法等
  • 建立一个基于等级保护和贝叶斯网络的信息安全测评数据拓扑结构,对等级保护测评数据通过专家经验定性识别形成贝叶斯网络先验概率,通过历史资料形成的条件概率定量...通过上述风险评估过程使被测评机构感知风险态势。
  • 进一步利用4个设置和4个没有设置全红清空时间的交叉12每年平均发生的正交直角碰撞次数y和闯红灯违规比率nRLV以及速度离差VSD,开发了交叉口的正交直角碰撞风险评估模型.采用多元线性回归分析,给出了该模型的具体...
  • 风险评估模型蒙特卡洛模型Note from Towards Data Science’s editors: While we allow independent authors to publish articles in accordance with our rules and guidelines, we do not endorse each author’s ...

    风险评估模型蒙特卡洛模型

    Note from Towards Data Science’s editors: While we allow independent authors to publish articles in accordance with our rules and guidelines, we do not endorse each author’s contribution. You should not rely on an author’s works without seeking professional advice. See our Reader Terms for details.

    Towards Data Science编辑的注意事项: 尽管我们允许独立作者按照我们的 规则和指南 发表文章 ,但我们不认可每位作者的贡献。 您不应在未征求专业意见的情况下依赖作者的作品。 有关 详细信息, 请参见我们的 阅读器条款

    A common problem when evaluating a portfolio manager is that the history of returns is often so short that estimates of risk and performance measures can be highly unreliable. A similar problem occurs when testing a new trading strategy. Even if you have a fairly long history for the strategy’s performance, often you only have observations over a single market cycle which can make it difficult to evaluate how your strategy would have held up in other markets. If you trade stocks you have probably heard the refrain: “I’ve never seen a bad back test”.

    在评估投资组合经理时,一个常见的问题是收益的历史通常很短,以至于风险和绩效指标的估计可能非常不可靠。 测试新的交易策略时会发生类似的问题。 即使您对策略的执行历史已有很长的历史,但通常您只能在单个市场周期中观察到,这可能使您难以评估您的策略在其他市场中的表现。 如果您交易股票,您可能会听到这样的话:“我从未见过糟糕的回测”。

    One method to address this deficiency is through Factor Model Monte Carlo (FMMC). FMMC can be used to estimate a factor model based on a set of financial and economic factors that reliably explain the returns of the fund manager. We can then simulate returns to determine how the manager would have performed in a wide variety of market environments. The end result is a model that produces considerably better estimates for risk and performance than if we simply used the return series available to us.

    解决此缺陷的一种方法是通过因素模型蒙特卡洛(FMMC) 。 FMMC可用于基于一组可靠地解释基金经理收益的财务和经济因素来估计因素模型。 然后,我们可以模拟收益,以确定经理在各种市场环境中的表现。 最终结果是,与仅使用可用的收益序列相比,该模型可以更好地估算风险和绩效。

    任务和设置 (The Task and Set Up)

    For this case study, we will be analyzing the returns for the new hedge fund Aric’s Hedge Fund; hereafter known as AHF. The hedge fund case is particularly interesting because hedge funds can use leverage, invest in any asset class, go long or short, and use many different instruments. Hedge funds are often very secretive about their strategy and holdings. Thus, having a reliable risk model to explain the source of their returns is essential.

    在本案例研究中,我们将分析新对冲基金Aric's Hedge Fund的回报; 以下简称AHF 。 对冲基金的案例特别有趣,因为对冲基金可以利用杠杆,投资于任何资产类别,做多或做空以及使用许多不同的工具。 对冲基金通常对其策略和持股非常保密。 因此,拥有可靠的风险模型来解释其收益的来源至关重要。

    Keep in mind that Aric’s Hedge Fund is not a real hedge fund (I’m Aric, I don’t have a hedge fund), but this is a real series of returns. I obtained the returns for a hedge fund in operation that we invest in where I work so the results of this study are applicable to a real-world scenario.

    请记住,Aric的对冲基金不是真正的对冲基金(我是Aric,我没有对冲基金), 但这是一系列真实的回报。 我获得了对冲基金的回报,该对冲基金投资于我工作的地方,因此本研究的结果适用于现实情况。

    We have data for Aric’s Hedge Fund from January 2010 to March 2020. For the purpose of this post and evaluating the accuracy of our model we will pretend as though AHF is pretty new to the scene and that we only have data from January 2017 through March 2020. To overcome the data deficiency, we will build a factor model on the basis of this “observed data” and then utilize the entire data series to evaluate the accuracy of our simulation for assessing the risk and performance statistics.

    我们拥有2010年1月至2020年3月Aric对冲基金的数据。出于这篇文章的目的,并评估我们模型的准确性,我们将假装 AHF尚不成熟,并且我们仅提供2017年1月至3月的数据。 2020年。为克服数据不足,我们将在此“观察数据”的基础上建立一个因子模型,然后利用整个数据系列来评估模拟的准确性,以评估风险和绩效统计数据。

    The below graph shows the cumulative return of AHF since January 2010. The data to the right of the red line represents the “observed period”.

    下图显示了自2010年1月以来AHF的累计收益。红线右侧的数据代表“观察期”。

    Image for post

    We will be conducting the analysis in R using the extensive library of packages available therein including: PerformanceAnalytics and quantmod. Aside from the hedge fund returns series, all of the factor data can be obtained freely from Yahoo! Finance, the Federal Reserve Bank of St. Louis FRED Database, and the Credit Suisse Hedge Fund Indices; you have to sign up for Credit Suisse to access the indices, but still…free.

    我们将使用其中提供的广泛的软件包库在R中进行分析,包括: PerformanceAnalyticsquantmod 。 除了对冲基金收益系列以外,所有因子数据都可以从Yahoo!免费获得。 金融 ,圣路易斯联邦储备银行FRED数据库瑞士信贷对冲基金指数 ; 您必须注册瑞士信贷才能访问该指数,但仍然…免费。

    模型估计 (Model Estimation)

    A common technique in empirical finance is to explain changes in asset prices based on a set of common risk factors. The simplest and most well-known factor model is the Capital Asset Pricing Model (CAPM) of William Sharpe. The CAPM is specified as follows:

    经验金融中的一种常见技术是基于一组常见风险因素来解释资产价格的变化。 最简单和最著名的因素模型是William Sharpe的资本资产定价模型(CAPM)。 CAPM指定如下:

    Image for post

    Where:

    哪里:

    • ri = Return of asset ‘i’

      ri =资产“ i”的收益
    • m = Return of market index ‘m’

      m =市场指数“ m”的回报
    • ∝= Excess return

      ∝ =超额收益
    • ẞ = Exposure to the Market Risk factor

      ẞ=暴露于市场风险因素
    • Ɛi = Idiosyncratic error term

      = i =特异误差项

    Market risk, or “systematic” risk, serves as a summary measure for all of the risks to which financial assets are exposed. This may include recessions, inflation, changes in interest rates, political turmoil, natural disasters, etc. Market risk is usually proxied by the returns on a large index like the S&P 500 and cannot be reduced through diversification.

    市场风险或“系统性”风险,是金融资产​​所面临的所有风险的汇总度量。 这可能包括衰退,通货膨胀,利率变化,政治动荡,自然灾害等。市场风险通常由标普500指数等大型指数的回报所替代,并且无法通过多元化降低。

    ẞ (i.e. Beta) represents an asset’s exposure to market risk. A Beta = 1 would imply that the asset is as risky as the market, Beta >1 would imply more risk than the market, while a Beta < 1 would imply less risk.

    ẞ(即Beta)代表资产的市场风险。 Beta = 1表示资产的风险与市场一样,Beta> 1的风险比市场高,而Beta <1的风险比市场低。

    Ɛ is idiosyncratic risk and represents the portion of the return that cannot be explained by the Market Risk factor.

    Ɛ是特质风险,代表不能由市场风险因素解释的收益部分。

    We will extend the CAPM to include additional risk factors which the literature have shown to be important for explaining asset returns. Aric’s Hedge Fund runs a complicated strategy using many different asset classes and instruments so it’s certainly plausible that it would be exposed to a broader set of risks beyond the traditional market index. The general form of our factor model is as follows:

    我们将把CAPM扩展到包括其他风险因素,这些因素已被文献证明对于解释资产收益很重要。 Aric的对冲基金使用许多不同的资产类别和工具来执行一项复杂的策略,因此,它可能会面临比传统市场指数更广泛的风险。 我们的因子模型的一般形式如下:

    Image for post

    All the above says is that returns (r) are explained by a set of risk factors j=1…k where r j is the return for factor ‘j’ and ẞ j is the exposure. Ɛ is the idiosyncratic error. Thus, if we can estimate the ẞ j, then we can leverage the long history of factor returns (r j) calculate conditional returns for AHF. Finally, if we can reasonably estimate the distribution of Ɛ then we can build randomness into AHF’s return series. This enables us to fully capture the variety of returns that we could observe.

    上面所说的全部是,回报(r)由一组风险因子j = 1…k解释,其中rj是因子“ j”的回报,而ẞj是风险敞口。 Ɛ是特质错误。 因此,如果我们可以估计ẞj,那么我们就可以利用长期的要素收益率(rj)计算AHF的条件收益率。 最后,如果我们可以合理估计distribution的分布,则可以将随机性构建到AHF的收益序列中。 这使我们能够充分捕捉我们可以观察到的各种回报。

    The FMMC method will take place in three parts:

    FMMC方法将分为三个部分:

    • Part A: Data Acquisition, Clean Up and Processing

      A部分:数据采集,清理和处理
    • Part B: Model Estimation

      B部分:模型估算
    • Part C: Monte Carlo Simulation

      C部分:蒙特卡洛模拟

    A部分:数据采集,清理和处理 (Part A: Data Acquisition, Clean Up and Processing)

    For the factor model I will be using a set of financial and economic variables aimed at measuring different sources of risk and return. Again, all the data used in this study are freely available from Yahoo! Finance, the FRED Database, and Credit Suisse.

    对于因子模型,我将使用一组金融和经济变量,旨在衡量风险和回报的不同来源。 同样,本研究中使用的所有数据均可从Yahoo!免费获得。 金融,FRED数据库和瑞士信贷。

    We’ll begin with the FRED data. Next to each variable I have placed the unique identifier that you can query from the database.

    我们将从FRED数据开始。 在每个变量旁边,我放置了可以从数据库查询的唯一标识符。

    FRED Variables:

    FRED变量:

    • 5-Year Inflation Expectations, 5-Years Forward. (T5YIFRM)

      未来5年通胀预期,未来5年。 (T5YIFRM)
    • Term Spread: 10-Year minus 3-month Treasury Yield Spread. (T10Y3M)

      期限利差:10年期减去3个月的美国国债收益率利差。 (T10Y3M)
    • Credit spread premium: Moody’s Baa corp bond yield minus 10-year Treasury yield. (BAA10Y)

      信用利差溢价:穆迪的Baa公司债券收益率减去10年期美国国债收益率。 (BAA10Y)
    • 3-month T-bill rate. (DGS3MO)

      3个月期国库券利率。 (DGS3MO)
    • TED Spread: 3-Month LIBOR Minus 3-Month Treasury Yield. (TEDRATE)

      TED利差:3个月伦敦银行同业拆借利率减去3个月国库券收益率。 (TEDRATE)
    • International bond yield: 10-Year government bond yields for Euro Area. (IRLTLT01EZM156N)

      国际债券收益率:欧元区10年期政府债券收益率。 (IRLTLT01EZM156N)
    • Corporate Bond Total Return Index: ICE BofAML Corp bond master total return index; in levels. (BAMLCC0A0CMTRIV)

      公司债券总收益指数:ICE BofAML Corp债券主总收益指数; 在水平上。 (BAMLCC0A0CMTRIV)
    • CBOE Volatility Index (i.e. the VIX). (VIXCLS)

      CBOE波动率指数(即VIX)。 (VIXCLS)
    • CBOE Volatility Index of US 10-Year Treasuries (i.e. the Treasury VIX). (VXTYN)

      美国10年期美国国债(即美国国债VIX)的CBOE波动率指数。 (VXTYN)

    The FRED API leaves something to be desired and does not allow you to pull data in a consistent way. The returns of AHF are monthly so our model will need to be estimated using monthly data. However, FRED retrieves data at the highest available frequency so daily data always comes in as daily. Furthermore, the data is retrieved from the beginning of the series, so you end up getting a lot of NAs. As such, we will need to do a little clean up before we proceed.

    FRED API有一些不足之处,并且不允许您以一致的方式提取数据。 AHF的回报是每月的,因此我们的模型需要使用每月的数据进行估算。 但是,FRED会以最高可用频率检索数据,因此每日数据始终以每日形式出现。 此外,数据是从本系列的开始检索的,因此您最终会获得很多NA。 因此,在继续之前,我们需要进行一些清理。

    The following segments of R code show loading the identifiers into variables and separate queries to FRED for the daily and monthly data. The daily data is cleaned and converted to a monthly frequency. I’ve tried to comment the code as much as possible so you can see what’s happening.

    R代码的以下各节显示将标识符加载到变量中,并分别向FRED查询每日和每月数据。 每日数据将被清理并转换为每月一次。 我尝试了尽可能多地注释代码,以便您可以看到发生了什么。

    The FRED data is good to go. The other set of variables that we will need are financial market indices. Growth, Value and Size indices feature prominently in asset pricing models such as the Fama-French 3-Factor Model and I take the same approach here. Returns from financial indices are obtained from the venerable Yahoo! Finance.

    FRED数据很好。 我们将需要的另一组变量是金融市场指数。 增长,价值和规模指数在诸如Fama-French 3-Factor Model之类的资产定价模型中具有突出的地位,在此我采用相同的方法。 财务指数的收益来自古老的Yahoo! 金融。

    Yahoo! Finance Variables:

    雅虎! 财务变量:

    • Value: Russell 1000 Value Index (^RLV)

      值:罗素1000价值指数(^ RLV)
    • Growth: Russell 1000 Growth Index (^RLG)

      成长:罗素1000成长指数(^ RLG)
    • Size: Russell 2000 Index (^RUT)

      大小:罗素2000指数(^ RUT)
    • Market: S&P 500 Index (^GSPC)

      市场:标普500指数(^ GSPC)
    • International: MSCI EAFE (EFA)

      国际:MSCI EAFE(EFA)
    • Bonds: Barclays Aggregate Bond Index (AGG)

      债券:巴克莱综合债券指数(AGG)

    Lastly, we’ll load in the hedge fund specific indices courtesy of Credit Suisse (CS). Obtaining the index requires a few extra steps as the data needs to manually downloaded to Excel from the Credit Suisse website and then loaded into R. Each index corresponds to a specific hedge fund strategy.

    最后,我们将根据瑞士信贷(CS)的数据加载对冲基金的特定指数。 获取索引需要一些额外的步骤,因为需要将数据从瑞士信贷网站手动下载到Excel,然后加载到R中。每个索引对应于特定的对冲基金策略。

    Credit Suisse Variables:

    瑞士信贷变量:

    • Convertible Bond Arbitrage Index (CV_ARB)

      可转换债券套利指数(CV_ARB)
    • Emerging and Frontier Markets Index (EM_MRKT)

      新兴和前沿市场指数(EM_MRKT)
    • Equity Market Neutral Index (EQ_Neutral)

      股市中性指数(EQ_Neutral)
    • Event Driven Index (EVT_DRV)

      事件驱动索引(EVT_DRV)
    • Distressed Opportunities Index (DISTRESS)

      苦恼机会指数(DISTRESS)
    • Multi-Strategy Event Driven Index (MS_EVT)

      多策略事件驱动索引(MS_EVT)
    • Event Driven Risk Arbitrage Index (RISK_ARB)

      事件驱动风险套利指数(RISK_ARB)
    • Fixed Income Arbitrage Index (FI_ARB)

      固定收益套利指数(FI_ARB)
    • Global Macro Index (GL_MACRO)

      全球宏观指数(GL_MACRO)
    • Equity Long-Short Index (EQ_LS)

      股票多空指数(EQ_LS)
    • Managed Futures Index (MNGD_FT)

      管理期货指数(MNGD_FT)
    • Multi-Strategy Hedge Fund Index (MS_HF)

      多策略对冲基金指数(MS_HF)

    B部分:模型估算 (Part B: Model Estimation)

    Recall that for the purpose of this case study we are “pretending” as though we only have data for AHF from January 2017 through March 2020 (i.e. the sample period). In reality we have data going back to January 2010. We will use the data in the sample period to calibrate the factor model and then compare the results from the simulation to the long-run risk and performance over the full period of January 2010 to March 2020.

    回想一下,就本案例研究而言,我们“假装”为好像我们只有从2017年1月到2020年3月(即采样期)的AHF数据。 实际上,我们拥有的数据可以追溯到2010年1月。我们将使用采样期间的数据来校准因子模型,然后将模拟结果与2010年1月至3月整个期间的长期风险和绩效进行比较2020年。

    Model estimation has 2-steps:

    模型估算分为两步:

    1. Estimate a Factor Model: Using the common “short” history of asset and factor returns, compute a factor model with intercept, factor betas j=1…k, and residuals

      估计因子模型:使用常见的资产和因子收益的“短”历史记录,计算具有截距,因子beta j = 1…k和残差的因子模型

    2. Estimate Error Density: Use the residuals from the factor model to fit a suitable density function from which we can draw.

      估计误差密度:使用因子模型中的残差来拟合一个合适的密度函数,我们可以从中得出该密度函数。

    I have proposed 27 risk factors to explain the returns of AHF, but I don’t know ahead of time which form the best prediction. It could be that some factors are irrelevant and reduce the explanatory power of the model. In order to select an optimal model, I use an Adjusted-R2 based best-subset selection algorithm available through the package. leaps performs an exhaustive, regression-based search across the proposed variables and selects the model with the highest Adjusted-R2. The algorithm proposes the following 14-factor model with Adjusted-R2 of .9918:

    我已经提出了27个风险因素来解释AHF的回报,但是我不知道是什么构成最佳预测。 可能某些因素无关紧要,从而降低了模型的解释力。 为了选择最佳模型,我使用了可通过软件包使用的基于Adjusted-R2的最佳子集选择算法。 jumps对建议的变量进行详尽的,基于回归的搜索,并选择具有最高Adjusted-R2的模型。 该算法提出以下14因子模型,其中Adj​​usted-R2为.9918:

    • Russell 1000 Value (RLV)

      罗素1000值(RLV)
    • Russell 2000 Index (RUT)

      罗素2000指数(RUT)
    • S&P 500 (GSPC)

      标普500(GSPC)
    • MSCI EAFE (EFA)

      MSCI EAFE(EFA)
    • Barclays Aggregate Bond Index (AGG)

      巴克莱综合债券指数(AGG)
    • Corporate Bond Total Return Index (Corp.TR)

      公司债券总回报指数(Corp.TR)
    • VIX

      VIX
    • Treasury VIX (T.VIX)

      财政部国库券(T.VIX)
    • Convertible Bond Arbitrage Index (CV_ARB)

      可转换债券套利指数(CV_ARB)
    • Equity Market Neutral Index (EQ_Neutral)

      股市中性指数(EQ_Neutral)
    • Multi-Strategy Event Driven Index (MS_EVT)

      多策略事件驱动索引(MS_EVT)
    • Equity Long-Short Index (EQ_LS)

      股票多空指数(EQ_LS)
    • Managed Futures Index (MNGD_FT)

      管理期货指数(MNGD_FT)
    • Multi-Strategy Hedge Fund Index (MS_HF)

      多策略对冲基金指数(MS_HF)

    Now that we have selected our variables, we can estimate the calibrated factor model and see how it does.

    既然我们已经选择了变量,我们就可以估计校准因子模型并查看其效果。

    Image for post

    Based on the results of the regression, we observe that AHF is significantly exposed to traditional sources of risk. Specifically, AHF appears to trade equity and debt and may employ derivatives to either hedge or speculate.

    基于回归结果,我们观察到AHF明显暴露于传统风险源。 具体而言,AHF似乎在买卖股票和债务,并可能使用衍生工具对冲或进行投机。

    Positive exposure to both the S&P 500 (GSPC) and MSCI (EFA) indices suggests that AHF trades global equity and has a long bias. The positive value for AGG further suggests they trade fixed income but may have a slight preference for Treasuries based on the negative coefficient for the corporate bond total return index (corp. tr). The generally significant results for the various hedge fund strategies suggests that AHF employs a complex trading strategy and may use derivatives such as futures (highly significant value for the CS Managed Futures Index, MGND_FT). Futures may be used to either hedge positions or target access to a specific market.

    标普500(GSPC)和MSCI(EFA)指数的正面敞口表明AHF交易全球股票并且具有长期偏见。 AGG的正值进一步表明它们交易固定收益,但基于公司债券总回报指数(corp。tr)的负系数,可能会稍微偏爱国债。 各种对冲基金策略的总体意义重大,这表明AHF采用了复杂的交易策略,并可能使用诸如期货之类的衍生产品(CS管理期货指数MGND_FT的显着价值)。 期货可用于对冲头寸或目标进入特定市场。

    The plot of AHF’s realized returns v. the fitted values from the model demonstrates a high degree of fit and explanatory power.

    AHF的已实现回报与该模型的拟合值的关系图显示出高度的拟合度和解释力。

    Image for post

    C部分:模拟 (Part C: Simulation)

    Parametric and non-parametric Monte Carlo methods are both widely applied in empirical finance, but either presents challenges for estimation.

    参数和非参数蒙特卡罗方法都广泛应用于经验金融中,但都给估计带来挑战。

    Parametric estimation of factor densities requires fitting a large multivariate, fat-tailed probability distribution; which in our specific case would contain 14 variables. Correlations can be notoriously unstable and inaccurate estimation of the variance-covariance matrix would bias the distribution from which we will draw the factor returns. This problem may be overcome by employing copula methods, but this adds to the complexity of the model. On balance, we would prefer to avoid parametric estimation if possible.

    因子密度的参数估计需要拟合较大的多元胖尾概率分布; 在我们的特定情况下,它将包含14个变量。 相关性可能是非常不稳定的,方差-协方差矩阵的不正确估计会偏向于分布我们将得出因子收益的分布。 通过使用copula方法可以解决此问题,但这增加了模型的复杂性。 总而言之,如果可能的话,我们宁愿避免参数估计。

    A potential alternative is non-parametric estimation. To conduct a non-parametric simulation, we could bootstrap the observed, discrete empirical distribution that assigns a probability of 1/T to each of the observed factor returns for t=1…T. This would serve as a proxy to the true density of factor returns and allow us to bypass the messy process of estimating the correlations. However, bootstrap resampling can result in the duplication of some values and the omission of others and while this may be appropriate for inference, it does not provide an obvious advantage in our application.

    潜在的替代方法是非参数估计。 为了进行非参数模拟,我们可以引导观察到的离散经验分布,该分布为t = 1…T的每个观察到的因子收益分配1 / T的概率。 这可以代替要素收益率的真实密度,并允许我们绕过估计相关性的麻烦过程。 但是,自举重采样可能导致某些值重复,而导致其他值遗漏,虽然这可能适合推断,但在我们的应用程序中并未提供明显的优势。

    A more efficient method is simply to take the relatively long history of factor returns as given and add each of the residuals. Simply put, we have 123 months of factor returns (January 2010-March 2020) and 39 residuals (based on the results of the calibration portfolio which spans January 2017-March 2020). If we add each of the 39 residuals to the 123 factor returns, we can produce 123×39 scenarios for the return of AHF (4797 observations in total). This large sample should be capable of providing us with good insight into the tails of AHF’s return distribution and has the advantage of utilizing all of the observed data.

    一种更有效的方法就是简单地考虑给定的相对较长的要素收益历史并添加每个残差。 简而言之,我们有123个月的因子回报(2010年1月至2020年3月)和39个残差(基于跨越2017年1月至2020年3月的校准产品组合的结果)。 如果将39个残差中的每个残差加到123个因子回报中,就可以为123个AHF回报生成123×39个场景(总共4797个观测值)。 这个大样本应该能够为我们提供对AHF收益分布的尾巴的良好洞察,​​并具有利用所有观测数据的优势。

    The simulation proceeds as follows:

    仿真过程如下:

    • Use the calibrated model and factor returns to form predictions for the returns of AHF for January 2010 through March 2020.

      使用校正后的模型和因子收益形成对2010年1月至2020年3月AHF收益的预测。
    • For each of the “i”, i = 1…123, estimated returns, add each of the “j”, j=1…39, residuals.

      对于每个“ i”,i = 1…123,估计收益,将每个“ j”,j = 1…39,残差相加。

    绩效分析 (Performance Analysis)

    Recall that when we introduced this exercise we pretended as though we only had the performance history of AHF from January 2017 through March 2020. Such a short history of performance alone provides only limited insight into the risk/return features of a fund manager over a relatively narrow window of market conditions. To address this shortcoming and provide a more accurate picture of performance we have proposed using Factor Model Monte Carlo (FMMC). The factor model was calibrated using the short, common history of factor and fund returns. The Monte Carlo experiment used factor returns over a longer horizon (January 2010 through March 2020) and the realized factor model residuals to construct 4797 simulated returns for AHF.

    回想一下,当我们引入此练习时,我们假装我们只有从2017年1月到2020年3月才有AHF的业绩历史。仅凭如此短暂的业绩历史,就只能相对有限地了解基金经理的风险/收益特征。市场条件窗口狭窄。 为了解决此缺点并提供更准确的性能描述,我们建议使用因素模型蒙特卡洛(FMMC)。 因子模型是使用较短的常见因子和基金收益历史进行校准的。 蒙特卡洛实验使用更长范围内(2010年1月至2020年3月)的要素收益率和已实现的要素模型残差来构造AHF的4797个模拟收益率。

    To evaluate the performance of our model we will focus on the results for the mean annual return and volatility as well as the venerable Sharpe and Sortino Ratios. Let’s see how we did.

    为了评估模型的性能,我们将重点关注平均年收益率和波动率以及可追溯的夏普和索蒂诺比率的结果。 让我们看看我们是如何做到的。

    1. Average Return

    1.平均回报

    The table below depicts the mean (i.e. average) annual return for the factor model Monte Carlo (FMMC), full history of AHF (January 2010-March 2020) and the truncated/”observed” history (January 2017-March 2020):

    下表描述了因子模型蒙特卡洛(FMMC),AHF的完整历史记录(2010年1月至2020年3月)和截断/“观察到的”历史记录(2017年1月至2020年3月)的平均(即平均)年收益:

    Image for post

    Immediately we can see the improvement that the FMMC model has over the Truncated period. The FMMC model is able to fully capture the return dynamic of AHF while the Truncated return substantially underestimates full history mean.

    马上我们可以看到FMMC模型在截断期间的改进。 FMMC模型能够完全捕获AHF的返回动态,而截断的返回则大大低估了整个历史均值。

    2. Volatility

    2.波动性

    Accurate estimation of the mean alone cannot support the claim that our model is robust. Of equal importance is the volatility. The below table shows the annualized volatility (i.e. standard deviation) for each of the periods under consideration:

    仅凭均值的准确估计就不能支持我们的模型稳健的说法。 波动同样重要。 下表显示了所考虑的每个时期的年度波动率(即标准差):

    Image for post

    Both the FMMC and Truncated estimates slightly undershoot the realized volatility of AHF over the full period. However, both estimated are very close.

    FMMC和“截断”估计都略微低于AHF在整个时期内已实现的波动性。 但是,两者估计都非常接近。

    3. Sharpe Ratio

    3.夏普比率

    With the mean and volatility estimates in hand, we can now calculate the Sharpe Ratio. The Sharpe Ratio is calculated as follows:

    有了平均值和波动率估算值,我们现在可以计算夏普比率。 夏普比率计算如下:

    Image for post

    For most of the test period (January 2010-March 2020) the risk-free rate as proxied by the yield on the 3-month T-Bill was very close to 0%. For simplicity we will adopt 0% as the risk-free rate for our calculations. The below table shows the results:

    在大多数测试期间(2010年1月至2020年3月),由3个月国库券收益率所代表的无风险利率非常接近0%。 为简单起见,我们将采用0%作为无风险利率进行计算。 下表显示了结果:

    Image for post

    The FMMC estimate shows dramatic improvement over the Truncated for estimating the Sharpe Ratio of AHF. This is not necessarily surprising as above we showed the mean return for the Truncated period to be poor while the estimate for the FMMC was quite close. Naturally this will feed into the results for Sharpe, but, again, the results show the utility of the FMMC approach.

    FMMC估计值比截断值(用于估计AHF的Sharpe比率)显着提高。 这不一定是令人惊讶的,因为上面我们显示了截断期的平均收益很低,而FMMC的估算却非常接近。 自然,这将被纳入Sharpe的结果中,但是结果再次显示了FMMC方法的实用性。

    4. Sortino Ratio

    4. Sortino比率

    Finally, we turn to the Sortino Ratio. Sortino is similar to Sharpe, but instead of total volatility, it is focused on what is termed “downside volatility”; or the standard deviation of returns below a stated threshold. Typically, the threshold is set to 0%; the idea being that volatile, positive returns are not considered “bad” because you are still making money, but volatile negative returns suggest an outsized chance of large losses. A higher ratio is considered better. The Sortino Ratio is calculated as follows:

    最后,我们转到Sortino比率。 Sortino与Sharpe类似,但不是总波动率,而是着眼于所谓的“下行波动率”。 或低于规定门槛的收益标准偏差。 通常,阈值设置为0%; 之所以这样的想法是,因为您仍在赚钱,所以波动的正收益不被认为是“坏”的,但是波动的负收益表明出现巨额亏损的可能性很大。 比率越高越好。 Sortino比率计算如下:

    Image for post

    The table depicts the results:

    下表描述了结果:

    Image for post

    The FMMC estimate is very close to the full period and accurately expresses the volatility of the downside returns. We see marked improvement over the Truncated estimate which is lower due to a combination of a lower average return and more downside volatility.

    FMMC的估计非常接近整个周期,并准确表示了下行收益的波动性。 我们看到,由于平均收益较低和下行波动较大,两者的总和比截断后的估计要低得多。

    结论性意见 (Concluding Comments)

    Manager evaluation is one of the oldest and most common problems in investment finance. When the track record of the manager is short it can be difficult to assess the efficacy of the strategy which has ramifications for both fund managers and fund allocators.

    经理评估是投资金融中最古老,最常见的问题之一。 如果经理的业绩记录很短,则可能难以评估该策略的有效性,这对基金经理和基金分配者都有影响。

    In this post, we introduced Factor Model Monte Carlo (FMMC) as a possible solution to the short history problem and used the real world example of Aric’s Hedge Fund (AHF) to demonstrate its efficacy. By using a factor model and the common, short history of fund and factor returns, we estimated the exposure of AHF to different sources of economic and market risk. We were then able to simulate the returns of the AHF to construct a longer history of returns with the goal of gaining improved insight into the fund’s long term performance.

    在本文中,我们介绍了因素模型蒙特卡洛(FMMC)作为短期历史问题的可能解决方案,并使用了Aric对冲基金(AHF)的真实示例来证明其有效性。 通过使用因子模型以及常见的短期资金和因子收益历史,我们估计了AHF暴露于不同的经济和市场风险来源的风险。 然后,我们能够模拟AHF的收益,以构建更长的收益历史,目的是获得对基金长期业绩的更深入了解。

    The results from the FMMC method showed dramatic improvement over using the short history of returns in isolation. Using the full history of returns for AHF as a comparison, we see that the FMMC method accurately models the return, volatility, Sharpe and Sortino Ratios of the fund. By comparison, the truncated history of returns severely underestimated the performance of AHF which would have the consequence of misleading investors.

    FMMC方法的结果表明,与单独使用较短的收益历史相比,有了显着的改进。 使用AHF的全部收益历史作为比较,我们可以看到FMMC方法可以准确地模拟基金的收益,波动率,夏普和Sortino比率。 相比之下,截短的收益历史严重低估了AHF的业绩,这可能会误导投资者。

    Factor Model Monte Carlo has proven to be an effective technique for modeling risk and return for complex strategies and serves as a powerful addition to the fund analyst’s tool kit.

    因子模型蒙特卡洛(Monte Carlo)已被证明是对复杂策略的风险和回报建模的有效技术,并且是基金分析师工具包的有力补充。

    Until next time, thanks for reading!

    直到下一次,感谢您的阅读!

    Aric Lux.

    阿里克斯·勒克斯(Aric Lux)。

    Originally published at http://lightfinance.blog on August 28, 2020.

    最初于 2020年8月28日 发布在 http://lightfinance.blog 上。

    翻译自: https://towardsdatascience.com/better-portfolio-performance-with-factor-model-monte-carlo-in-r-3910d0a6ceb6

    风险评估模型蒙特卡洛模型

    展开全文
  • 第三方物流企业自身违约风险评估模型,李倩,张圣忠,为了降低第三方物流企业的信用风险损失,文章提出从企业外部不可控性违约风险因素和内部可控性违约风险因素两方面构建第三方物流
  • 基于支持向量机的商业银行信用风险评估模型,刘闽,林成德,本文将支持向量机(Support Vector Machine,SVM)用于建立商业银行的信用风险评估模型。通过与MDA以及神经网络模型的比较,证实了该方法�

空空如也

空空如也

1 2 3 4 5 ... 20
收藏数 59,498
精华内容 23,799
关键字:

风险评估模型