精华内容
下载资源
问答
  • 展开全部一、理论模型的设计对所要研究的经济现象进行深入的分析,根据研究的目的,62616964757a686964616fe58685e5aeb931333339666135选择模型中将包含的因素,根据数据的可得性选择适当的变量来表征这些因素,并...

    展开全部

    一、理论模型的设计对所要研究的经济现象进行深入的分析,根据研究的目的,62616964757a686964616fe58685e5aeb931333339666135选择模型中将包含的因素,根据数据的可得性选择适当的变量来表征这些因素,并根据经济行为理论和样本数据显示出的变量间的关系,设定描述这些变量之间关系的数学表达式,即理论模型。例如上节中的生产函数就是一个理论模型。理论模型的设计主要包含三部分工作,即选择变量、确定变量之间的数学关系、拟定模型中待估计参数的数值范围。1.确定模型所包含的变量在单方程模型中,变量分为两类。作为研究对象的变量,也就是因果关系中的“果”,例如生产函数中的产出量,是模型中的被解释变量;而作为“原因”的变量,例如生产函数中的资本、劳动、技术,是模型中的解释变量。确定模型所包含的变量,主要是指确定解释变量。可以作为解释变量的有下列几类变量:外生经济变量、外生条件变量、外生政策变量和滞后被解释变量。其中有些变量,如政策变量、条件变量经常以虚变量的形式出现。严格他说,上述生产函数中的产出量、资本、劳动、技术等,只能称为“因素”,这些因素间存在着因果关系。为了建立起计量经济学模型,必须选择适当的变量来表征这些因素,这些变量必须具有数据可得性。于是,我们可以用总产值来表征产出量,用固走资产原值来表征资本,用职工人数来表征劳动,用时间作为一个变量来表征技术。这样,最后建立的模型是关于总产值、固定资产原值、职工人数和时间变量之间关系的数学表达式。下面,为了叙述方便,我们将“因素”与“变量”间的区别暂时略去,都以“变量”来表示。关键在于,在确定了被解释变量之后,怎样才能正确地选择解释变量。首先,需要正确理解和把握所研究的经济现象中暗含的经济学理论和经济行为规律。这是正确选择解释变量的基础。例如,在上述生产问题中,已经明确指出属于供给不足的情况,那么,影响产出量的因素就应该在投入要素方面,而在当前,一般的投入要素主要是技术、资本与劳动。如果属于需求不足的情况,那么影响产出量的因素就应该在需求方面,而不在投入要素方面。这时,如果研究的对象是消费品生产,应该选择居民收入等变量作为解释变量;如果研究的对象是生产资料生产,应该选择固定资产投资总额等变量作为解释变量。由此可见,同样是建立生产模型,所处的经济环境不同、研究的行业不同,变量选择是不同的。其次,选择变量要考虑数据的可得性。这就要求对经济统计学有透彻的了解。计量经济学模型是要在样本数据,即变量的样本观测值的支持下,采用一定的数学方法估计参数,以揭示变量之间的定量关系。所以所选择的变量必须是统计指标体系中存在的、有可靠的数据来源的。如果必须引入个别对被解释变量有重要影响的政策变量、条件变量,则采用虚变量的样本观测值的选取方法。第三,选择变量时要考虑所有入选变量之间的关系,使得每一个解释变量都是独立的。这是计量经济学模型技术所要求的。当然,在开始时要做到这一点是困难的,如果在所有入选变量中出现相关的变量,可以在建模过程中检验并予以剔除。从这里可以看出,建立模型的第一步就已经体现了计量经济学是经济理论、经济统计学和数学三者结合的思想。在选择变量时,错误是容易发生的。下面的例子都是从已有的计量经济学应用研究成果中发现的,代表了几类容易发生的错误。例如农副产品出口额=-107.66+0.13×社会商品零售总额十0.22×农副产品收购额这里选择了无关的变量,因为社会商品零售总额与农副产品出口额无直接关系,更不是影响农副产品出口额的原因。再如生产资料进口额=0.73×轻工业投资+0.21×出口额+0.18×生产消费+67.60×进出口政策这里选择了不重要的变量,因为轻工业投资对生产资料进口额虽有影响,但不是重要的,或者说是不完全的,重要的是全社会固定资产投资额,应该选择这个变量。再如农业总产值=0.78+0.24×粮食产量+0.05×农机动力—0.21×受灾面积这里选择了不独立的变量,因为粮食产量是受农机动力和受灾面积影响的,它们之间存在相关性。值得注意的是上述几个模型都能很好地拟合样本数据,所以绝对不能把对样本数据的拟合程度作为判断模型变量选择是否正确的主要标准。变量的选择不是一次完成的,往往要经过多次反复。2.确定模型的数学形式选择了适当的变量,接下来就要选择适当的数学形式描述这些变量之间的关系,即建立理论模型。选择模型数学形式的主要依据是经济行为理论。在数理经济学中,已经对常用的生产函数、需求函数、消费函数、投资函数等模型的数学形式进行了广泛的研究,可以借鉴这些研究成果。需要指出的是,现代经济学尤其注重实证研究,任何建立在一定经济学理论假设基础上的理论模型,如果不能很好地解释过去,尤其是历史统计数据,那么它是不能为人们所接受的。这就要求理论模型的建立要在参数估计、模型检验的全过程中反复修改,以得到一种既能有较好的经济学解释又能较好地反映历史上已经发生的诸变量之间关系的数学模型。忽视任何一方面都是不对的。也可以根据变量的样本数据作出解释变量与被解释变量之间关系的散点图,由散点图显示的变量之间的函数关系作为理论模型的数学形式。这也是人们在建模时经常采用的方法。在某些情况下,如果无法事先确定模型的数学形式,那么就采用各种可能的形式进行试模拟,然后选择模拟结果较好的一种。3.拟定理论模型中待估参数的理论期望值理论模型中的待估参数一般都具有特定的经济含义,它们的数值,要待模型估计、检验后,即经济数学模型完成后才能确定,但对于它们的数值范围,即理论期望值,可以根据它们的经济含义在开始时拟定。这一理论期望值可以用来检验模型的估计结果。拟定理论模型中待估参数的理论期望值,关键在于理解待估参数的经济含义。例如上述生产函数理论模型中有4个待估参数和α、β、γ和A。其中,α是资本的产出弹性,β是劳动的产出弹性,γ近似为技术进步速度,A是效率系数。根据这些经济含义,它们的数值范围应该是于集中的问题。经济变量在时间序列上的变化往往是缓慢的,例如,居民收入每年的变化幅度只有5%左右。如果在一个消费函数模型中,以居民消费作为被解释变量,以居民收入作为解释变量,以它的时间序列数据作为解释变量的样本数据,由于样本数据过于集中,所建立的模型很难反映两个变量之间的长期关系。这也是时间序列不适宜于对模型中反映长期变化关系的结构参数的估计的一个主要原因。四是模型随机误差项的序列相关问题。用时间序列数据作样本,容易引起模型随机误差项产生序列相关。这个问题后面还要专门讨论。截面数据是一批发生在同一时间截面上的调查数据。例如,工业普查数据、人口普查数据、家计调查数据等,主要由统计部门提供。用截面数据作为计量经济学模型的样本数据,应注意以下几个问题。一是样本与母体的一致性问题。计量经济学模型的参数估计,从数学上讲,是用从母体中随机抽取的个体样本估计母体的参数,那么要求母体与个体必须是一致的。例如,估计煤炭企业的生产函数模型,只能用煤炭企业的数据作为样本,不能用煤炭行业的数据。那么,截面数据就很难用于一些总量模型的估计,例如,建立煤炭行业的生产函数模型,就无法得到合适的截面数据。二是模型随机误差项的异方差问题。用截面数据作样本,容易引起模型随机误差项产生异方差。这个问题后面还要专门讨论。虚变量数据也称为二进制数据,一般取0或1。虚变量经常被用在计量经济学模型中,以表征政策、条件等因素。例如,建立我国的粮食生产计量经济学模型,以粮食产量作为被解释变量,解释变量中除了播种面积、化肥使用量、农机总动力、成灾面积等变量外,显然,政策因素是不可忽略的。1980年前后,由于实行了不同的政策,即使上述变量都没有变化,粮食产量也会发生大的变化。于是必须在解释变量中引人政策变量,用一个虚变量表示,对于1980年以后的年份,该虚变量的样本观测值为1,对于1980年以前的年份,该虚变量的样本观测值为0。也可以取0、l以外的数值,表示该因素的变化程度。例如,在工业生产模型中用虚变量表示气候对工业生产的影响,可以将不同年份气候的影响程度,分别用0、1、-1,甚至0.5、-0.5等表示。不过,这种方法应慎用,以免违背客观性。2.样本数据的质量样本数据的质量问题大体上可以概括为完整性、准确性、可比性和一致性四个方面。完整性,即模型中包含的所有变量都必须得到相同容量的样本观测值。这既是模型参数估计的需要,也是经济现象本身应该具有的特征。但是,在实际中,“遗失数据”的现象是经常发生的,尤其在中国,经济体制和核算体系都处于转轨之中。在出现“遗失数据”时,如果样本容量足够大,样本点之间的联系并不紧密的情况下,可以将“遗失数据”所在的样本点整个地去掉;如果样本容量有限,或者样本点之间的联系紧密,去掉某个样本点会影响模型的估计质量,则要采取特定的技术将“遗失数据”补上。准确性,有两方面含义,一是所得到的数据必须准确反映它所描述的经济因素的状态,即统计数据或调查数据本身是准确的;二是它必须是模型研究中所准确需要的,即满足模型对变量口径的要求。前一个方面是显而易见的,而后一个方面则容易被忽视。例如,在生产函数模型中,作为解释变量的资本、劳动等必须是投入到生产过程中的、对产出量起作用的那部分生产要素,以劳动为例,应该是投入到生产过程中的、对产出量起作用的那部分劳动者。于是,在收集样本数据时,就应该收集生产性职工人数,而不能以全体职工人数作为样本数据,尽管全体职工人数在统计上是很准确的,但其中有相当一部分与生产过程无关,不是模型所需要的。可比性,也就是通常所说的数据口径问题,在计量经济学模型研究中可以说无处不在。而人们容易得到的经济统计数据,一般可比性较差,其原因在于统计范围口径的变化和价格口径的变化,必须进行处理后才能用于模型参数的估计。计量经济学方法,是从样本数据中寻找经济活动本身客观存在的规律性,如果数据是不可比的,得到的规律性就难以反映实际。不同的研究者研究同一个经济现象,采用同样的变量和数学形式,选择的样本点也相同,但可能得到相差甚远的模型参数估计结果。为什么?原因在于样本数据的可比性。例如,采用时间序列数据作为生产函数模型的样本数据,产出量用不变价格计算的总产值,在不同年份间是可比的;资本用当年价格计算的固定资产原值,在不同年份间是不可比的。对于统计资料中直接提供的这个用当年价格计算的固定资产原值,有人直接用于模型估计,有人进行处理后再用于模型的估计,结果当然不会相同。一致性,即母体与样本的一致性。上面在讨论用截面数据作为计量经济学模型的样本数据时已经作了介绍。违反一致性的情况经常会发生,例如,用企业的数据作为行业生产函数模型的样本数据,用人均收入与消费的数据作为总量消费函数模型的样本数据,用31个省份的数据作为全国总量模型的样本数据,等等。三、模型参数的估计模型参数的估计方法,是计量经济学的核心内容。在建立了理论模型并收集整理了符合模型要求的样本数据之后,就可以选择适当的方法估计模型,得到模型参数的估计量。模型参数的估计是一个纯技术的过程,包括对模型进行识别(对联立方程模型而言)、估计方法的选择、软件的应用等内容。在后面的章节中将用大量的篇幅讨论估计问题,在此不重复叙述。四、模型的检验在模型的参数估计量已经得到后,可以说一个计量经济学模型已经初步建立起来了。但是,它能否客观揭示所研究的经济现象中诸因素之间的关系,能否付诸应用,还要通过检验才能决定。一般讲,计量经济学模型必须通过四级检验,即经济意义检验、统计学检验、计量经济学检验和预测检验。1.经济意义检验经济意义检验主要检验模型参数估计量在经济意义上的合理性。主要方法是将模型参数的估计量与预先拟定的理论期望值进行比较,包括参数估计量的符号、大小、相互之间的关系,以判断其合理性。首先检验参数估计量的符号。例如,有下列煤炭行业生产模型:煤炭产量=-108.5427+0.00067×固定资产原值+0.01527×职工人数-0.00681×电力消耗量+0.00256×木材消耗量在该模型中,电力消耗量前的参数估计量为负,意味着电力消耗越多,煤炭产量越低,从经济行为上无法解释。模型不能通过检验,应该找出原因重新建立模型。不管其他方面的质量多么高,模型也是没有实际价值的。2.统计检验统计检验是由统计理论决定的,目的在于检验模型的统计学性质。通常最广泛应用的统计检验准则有拟合优度检验、变量和方程的显著性检验等。3.计量经济学检验计量经济学检验是由计量经济学理论决定的,目的在于检验模型的计量经济学性质。通常最主要的检验准则有随机误差项的序列相关检验和异方差性检验,解释变量的多重共线性检验等。4.模型预测检验预测检验主要检验模型参数估计量的稳定性以及相对样本容量变化时的灵敏度,确定所建立的模型是否可以用于样本观测值以外的范围,即模型的所谓超样本特性。具体检验方法为:(1)利用扩大了的样本重新估计模型参数,将新的估计值与原来的估计值进行比较,并检验二者之间差距的显著性;(2)将所建立的模型用于样本以外某一时期的实际预测,并将该预测值与实际观测值进行比较,并检验二者之间差距的显著性。经历并通过了上述步骤的检验后,可以说已经建立了所需要的计量经济学模型,可以将它应用于预定的目的。五、计量经济学模型成功三要素从上述建立计量经济学模型的步骤中,不难看出,任何一项计量经济学研究、任何一个计量经济学模型赖以成功的要素应该有三个:理论、方法和数据。理论,即经济理论,所研究的经济现象的行为理论,是计量经济学研究的基础。方法,主要包括模型方法和计算方法,是计量经济学研究的工具与手段,是计量经济学不同于其他经济学分支学科的主要特征。数据,反映研究对象的活动水平、相互间联系以及外部环境的数据,或更广义讲是信息,是计量经济学研究的原料。这三方面缺一不可。一般情况下,在计量经济学研究中,方法的研究是人们关注的重点,方法的水平往往成为衡量一项研究成果水平的主要依据。这是正常的。计量经济学理论方法的研究是计量经济学研究工作者义不容辞的义务。但是,不能因此而忽视对经济学理论的探讨,一个不懂得经济学理论、不了解经济行为的人,是无法从事计量经济学研究工作的,是不可能建立起一个哪怕是极其简单的计量经济学模型的。所以,计量经济学家首先应该是一个经济学家。相比之下,人们对数据,尤其是数据质量问题的重视更显不足,在申请一项研究项目或评审一项研究成果时,对数据的可得性、可用性、可靠性缺乏认真的推敲;在研究过程中出现问题时,较少从数据质量方面去找原因。而目前的实际情况是,数据已经成为制约计量经济学发展的重要问题。六、相关分析、回归分析和因果分析从上述建立计量经济学模型的步骤中进一步看出,经典计量经济学方法的核心是采用回归分析的方法揭示变量之间的因果关系。但是,变量之间具有相关性并不等于具有因果性。这是建立计量经济学模型中一个十分重要的概念,那么首先需要对相关关系与因果关系作一简要的说明。所谓相关关系,是指两个以上的变量的样本观测值序列之间表现出来的随机数学关系,用相关系数来衡量。如果两个变量样本观测值序列之间相关系数的绝对值为1,则二者之间具有完全相关性(完全正相关或完全负相关);如果相关系数的绝对值比较大,或接近于1,则二者之间具有较强相关性;如果相关系数的绝对值为0,或接近于0,则二者之间不具有相关性。如果一个变量与其他两个或两个以上变量的线性组合之间具有相关性,那么它与每一个变量之间的相关系数称为偏相关系数。相关关系是变量之间所表现出来的一种纯数学关系,判断变量之间是否具有相关关系的依据只有数据。所谓因果关系,是指两个或两个以上变量在行为机制上的依赖性,作为结果的变量是由作为原因的变量所决定的,原因变量的变化引起结果变量的变化。因果关系有单向因果关系和互为因果关系之分。例如,劳动力与国内生产总值之间具有单向因果关系,在经济行为上是劳动力影响国内生产总值,而不是相反;但是,在国内生产总值与消费总额之间则存在经济行为上的互为因果关系,国内生产总值既决定消费总额,反过来又受消费的拉动。具有因果关系的变量之间一定具有数学上的相关关系。而具有相关关系的变量之间并不一定具有因果关系。例如中国的国内生产总值与印度的人口之间具有较强的相关性,因为二者都以较快的速度增长,但显然二者之间不具有因果关系。相关分析是判断变量之间是否具有相关关系的数学分析方法,通过计算变量之间的相关系数来实现。回归分析也是判断变量之间是否具有相关关系的一种数学分析方法,它着重判断一个随机变量与一个或几个可控变量之间是否具有相关关系。由于它的特定的功能,所以也被用来进行变量之间的因果分析。但是,仅仅依靠回归分析尚不能对变量之间的因果关系作出最后判断,必须与经济行为的定性分析相结合。这就是上面强调的建立计量经济学模型的三要素。

    本回答被网友采纳

    已赞过

    已踩过<

    你对这个回答的评价是?

    评论

    收起

    展开全文
  • 属性决策模型

    千次阅读 2019-01-23 19:54:00
    属性决策模型与层次分析法模型相比,多了一个归一化处理。 层次分析法请参考:https://blog.csdn.net/qq_41149269/article/details/86615910 归一化处理:   以下四种属性值类型非常少见,了解一下就好...

    多属性决策模型与层次分析法模型相比,多了一个归一化处理。

    层次分析法请参考:https://blog.csdn.net/qq_41149269/article/details/86615910

    归一化处理:

     

    以下四种属性值类型非常少见,了解一下就好。

    u1到u5的权重是如何计算出来的呢?请参考:https://blog.csdn.net/qq_41149269/article/details/86615910

     

     

     

    展开全文
  • 本文主要面向的读者是使用过评分卡模型建模,希望学习或者已经在使用更先进算法如GBDT类和神经网络类模型的风控建模人员。也欢迎所有对机器学习有兴趣的读者一起研讨。本文会详细分析各个算法之间的异同,帮助大家...

    本文主要面向的读者是使用过评分卡模型建模,希望学习或者已经在使用更先进算法如GBDT类和神经网络类模型的风控建模人员。也欢迎所有对机器学习有兴趣的读者一起研讨。本文会详细分析各个算法之间的异同,帮助大家打通这些模型算法之间的联系,并在工作中逐步转移到更先进的算法当中去。

    这一篇,我们会讨论多重共线性、正则化和过拟合。帮助大家从处理数据噪音的角度理解抗过拟合手段背后含义。

    先从多重共线性讲起

    在评分卡建模中,对于共线性高的变量,我们会选择一个留下,把剩余的剔除,并美其名曰增加模型稳定性。然而这对于机器学习背景的人而言是难以理解的。因为我们把特征看做是事物原本属性在经过一些噪音之后所采集到的信息,一个特征就对应于一个信道。而高共线性的特征往往来自相同的上游信息,并受到的不同的噪音影响。综合多条信道得到的信号应该比仅仅依赖于一条信道得到的信号更好。一些实际完全共线性的重复变量的确可以去除,但更多的是不完全重复的变量,仅仅因为共线性高就去除就没有充分利用其中的信息。这张图来自于《Information Theory, Inference, and Learning Algorithms》[1],用了一个很简单的例子展示了通过多个信道我们能得到更准确的信息。

    然后问题来了,评分卡建模方法说需要去掉有多重共线性的特征。而信息论说更多的信道总是好的,可以帮助降噪。(在机器学习中该理论的一个重要实现就是adaboost。)那么听谁的呢?听信息论的!和评分卡建模方法比起来,信息论作为一个广泛应用的基础理论拥有高的多的普适性。当评分卡和信息论起冲突的时候,首先应该考虑,评分卡做错了什么。

    正则项才是更好的选择

    评分卡需要丢弃共线性高的变量的一个主要原因是因为不带正则项的逻辑回归在求解共线性高的变量的系数的过程中会遇到有无穷多组解,或者解易受扰动的情况。最后的表现是模型不稳定,泛化能力弱或者直接就没法被解出。评分卡建模的选择是直接放弃高共线性的变量,以此寻求模型的稳定。一个非常直接和简单的稳定模型的手段就是加入正则项。但可能添加正则项被视为一种数学手段而非对现实的模型刻画,在评分卡建模中鲜有看到以此来对抗高共线性变量的。

    以30年前评分卡模型出现时的理论水平来看,因为求解过程中容易出现奇异矩阵或者不稳定的状况而放弃特征是或许可以的。但是现在来看,因为问题不好解就放弃宝贵的特征和数据这一行为非常地不合适的。如果模型容易受到扰动,那么就将扰动纳入到模型中是一个科学合理的选择。现在我们通过这个角度来引入正则项。

    不知道大家在最早学习机器学习的时候有没有对线性回归的模型产生过疑问。为什么建模的时候假定y上是存在噪音的而x上没有这样的假设呢?线性回归模型写成最优化问题的话是这个样子的。

    equation?tex=%5Cunderset+w%7B%5Cmathit%7Bminimize%7D%7D%3A%5Csum+_i%28y_i-w%5ETx_i%29%5E2 。这样建模的前提假设是我们观察到的y是x的经过线性变换再加上噪音后的值,既

    equation?tex=y%3Dw%5Ctext+%2A%5ETx%2B%5Cmathit%7B%5Cdelta+y%7D ,这里

    equation?tex=%5Cdelta+y 指的是在y上的噪音,

    equation?tex=w%5E%7B%5Ctext+%2A%7D 是“真实”的线性关系。但实际上我们常常遇到的问题是y和x上都是有噪音的,也就是

    equation?tex=y%3Dw%5Ctext+%2A%5ET%5Cleft%28x%2B%5Cmathit%7B%5Cdelta+x%7D%5Cright%29%2B%5Cmathit%7B%5Cdelta+y%7D ,这里

    equation?tex=%5Cdelta+x 指的是x上的噪音。

    比如说用爸妈的身高去预测他们孩子的身高,那么除了客观的基因表达之外,x和y上应该都有类似噪音才对。起码早上量身高还是晚上量身高带来的噪音造成的差异应该都是在的。而线性回归的时候爸妈的身高被认为是绝对准确的,而孩子的身高却认为是带噪音的,这显然是不合理的。

    建模的不合理也带来了模型的不稳定,削弱了模型的泛化能力。我们应该在建模的时候考虑x上噪音的作用。我们可以这样做:

    equation?tex=%5Cunderset+w%7B%5Cmathit%7Bminimize%7D%7D%3A%5Csum+_i%5Cunderset%7B%5Cdelta+x_i%7D%7B%5Ctext%7BE%7D%7D%5Cleft%28%5Cleft%28y_i-w%5ET%5Cleft%28x_i%2B%5Cmathit%7B%5Cdelta+x%7D_i%5Cright%29%5Cright%29%5E2%5Cright%29 。(其中求期望的对象也可以写成纯矩阵运算的形式:

    equation?tex=%5C%7C%28X%2B%5Cdelta+X%29w-y%5C%7C_2%5E2 ,这个式子在讨论解的稳定性的时候是会经常出现的。)在这里,

    equation?tex=%5Cmathit%7B%5Cdelta+x%7D 是噪音,而

    equation?tex=%5Clambda+ 是噪音的方差。假设我们的噪音的均值为0,且互相独立,也就是

    equation?tex=%5Ctext%7BE%7D%28%5Cdelta+x%29%3D0

    equation?tex=%5Ctext%7BE%7D%28%5Cdelta+x%5ET%5Cdelta+x%29%3D%5Clambda+I 。然后再经过化简上面的优化问题就变成了

    equation?tex=%5Cunderset+w%7B%5Cmathit%7Bminimize%7D%7D%3A%5Csum+_i%28y_i-w%5ETx_i%29%5E2%2B%5Clambda+w%5ETw 。于是乎在建模的时候考虑x上的噪音的问题就变成了在建模是加入正则项的问题,

    equation?tex=%5Clambda+w%5ETw 就是添加的L2正则项。无怪乎加入正则项可以很好地加强模型的稳定性。事实上正则项和训练加噪之间有着非常普遍的联系。在1995年的时候Christopher Bishop就证明了在神经网络训练的时候加噪和正则项之间的关系[2]。在2014年Dropout[3]被提出的时候,这个等价关系又一次被提到了。

    我在这里通过对x上噪音的讨论来引入正则项的概念是希望改变很多人对正则项的一些偏见。L2正则项有很多的解释,虽然最后仔细看来大体都是在讲同一件事,但是初学的时候非常容易引起困惑,特别是Bias–variance tradeoff[4]理论,有非常强的误导性。事实上在今天网上仍然有很多对正则项解释的错误搬运。当人们不理解一个东西的时候就会放弃去使用它。在传统风控建模的圈子里之前正则项很多时候只是被当做人工限定解空间的一种手段,它背后的意义并没有被广泛接受。在评分卡模型构建中则直接对此弃之不用,甚至可以看到前几步靠L1(Lasso)选变量,最后选完变量了,再上一把没正则项的逻辑回归,去求一个“精确”的结果这样的做法。但是当我们了解正则项背后的意义之后我们就知道,其实是带了正则项的模型更加贴近自然,更贴近真实的数据情况,因此能有更好的表现。

    更多的抗过拟手段

    在深度学习的时代,更多的抗过拟手段被开发。而其内在的本质则往往和如何去理解和控制x上的噪音有关。有一些觉得有意思的东西和大家分享一下。

    首先是之前提到的Christopher Bishop在1995年的论文[5]。在《Pattern Recognition and Machine Learning》[6]的第5.5节中也有相同的内容。在这篇文章里大家可以看到两个有趣的等价。1. 在某些情况下早停(early stop)等价于添加正则项。2.在某些情况下在训练中往x中添加噪音等价于添加正则项。然后在dropout的论文中又证明了训练中随机丢弃特征也可以在某些情况下等价于添加正则项。虽然“某些情况”的限制使得严格等价在更多的情况下是不存在的。但是通过了解研究特定情况下的等价关系可以帮助我们很好地去理解我们最常用的几种抗过拟手段之间的内在联系。

    而在深度学习中的各种数据增强方法也十分有趣。最简单的平移缩放翻转旋转裁剪对比度等方法都是在模拟照片取景时所能涉及的最简单的噪音。加盐噪音模拟了摄像时产生的噪点,白噪音则是更普遍存在的噪音。Batch Norm[7]利用batch本身的噪音在中间层做数据增强。在ICLR2019上Robert Geirhos[8]则讨论了纹理对图像识别的影响,还设计了在纹理上做数据增强的实验。

    总结

    评分卡模型需要舍弃高共线性变量的主要原因在于建模的不到位而非确有此必要。添加正则项是有效地描述x上噪音存在的一种手段,可以很好地解决高共线性带来的不稳定现象。现代机器学习中通过描述x上特定噪音存在来增加模型的泛化能力是一种普遍有效的手段,是思考如何使模型稳定的重要思考方向。

    展开全文
  • 文章目录前端一、CSS基础1.CSS概述(1)CSS样式(2)CSS语法(3)CSS添加方法二、CSS选择...盒子模型属性(1)overflow属性(2)border属性(3)padding属性(4)margin属性 前端 提示:这里可以添加本文要记录的大概


    前端

    提示:这里可以添加本文要记录的大概内容:
    例如:随着人工智能的不断发展,机器学习这门技术也越来越重要,很多人都开启了学习机器学习,本文就介绍了机器学习的基础内容。


    一、CSS基础

    1.CSS概述

    (1)CSS样式

    •CSS指的是层叠样式表(Cascading Style Sheets),也称级联样式表

    •内容和样式相分离,便于修改样式

    •外部样式表存储在 CSS 文件中

    (2)CSS语法

    CSS 规则集(rule-set)由选择器和声明块组成:
    CSS 选择器
    •选择器指向需要设置样式的 HTML 元素。
    •声明块包含一条或多条用分号分隔的声明。
    •每条声明都包含一个 CSS 属性名称和一个值,以冒号分隔。
    •多条 CSS 声明用分号分隔,声明块用花括号括起来。
    (示例):

    <body>
    <p>天使投资指早期投资,尤其指个人早期投资。</p>
    <p> VC,Venture Capital,所谓风险投资、创业投资,是相对靠
    前的非公开市场股权投资</p>
    <p> PE,Private Equity,所谓私募资本、非公开市场资本,既是
    私募股权投资的统称,又特指相对靠后的股权投资。</p>
    </body>
    
    p{                   //选择器
     font-size:12px;     /*字号*/
     color:blue;         /*文字颜色*/
     font-weight:bold;   /*加粗*/
     //属性名    属性值
    

    在这里插入图片描述
    注意
    •最后一条声明可以没有分号,但是为了以后修改
    方便,一般也加上分号。
    •为了使用样式更加容易阅读,可以将每条代码写
    在一个新行内

    (3)CSS添加方法

    (示例):
    在这里插入图片描述

    1.行内 < p style >

    <!DOCTYPE HTML>
    <html>
    <head>
    </head>
    <body>
    
    <p style = “color:red;>
    天使投资指早期投资,尤其指个人早期投资。
    </p>
    
    </body>
    </html
    

    2.内嵌样式 < style >

    <!DOCTYPE HTML>
    <html>
    <head>
    
    <style type="text/css">
    p{
    color:red; /*设置字体颜色*/
    }
    </style>
    
    </head>
    <body>
    <p>天使投资指早期投资,尤其指个人早期投资。</p>
    </body>
    </html>
    

    注意
    • 即使有公共CSS代码,也是每个页面都要定义的
    • 适合文件很少,CSS代码也不多的情况
    • 如果一个网站有很多页面,每个文件都会变大,后期维护难度也大
    3.单独文件 < link >
    外部样式表文件:style.css

    p{
     color:red;/*设置文字颜色*/
     }
    

    网页文件:1.html

    <!doctype html>
    <html>
    <head>
    <link rel="stylesheet" href="css/style.css" />
    </head>
    <body>
    <p>天使投资指早期投资,尤其指个人早期投资。</p> 
    </body>
    </html>
    

    优点
    •页面结构HTML代码与样式CSS代码完全分离
    •维护方便
    •如果需要改变网站风格,只需要修改公共CSS文件
    •可以在同一个HTML文档内部引用多个外部样式表
    4.优先级
    • 多重样式可以层叠,可以覆盖
    • 样式的优先级按照 “就近原则”
    行内样式> 内嵌样式> 链接样式> 浏览器默认样式
    (示例):

    • 外部样式表文件
    h3{
    color:red;
    text-align:left;
    font-size:8pt;
    }
    
    • 内嵌样式
    h3{
    text-align:right;
    font-size:20pt;
    }
    

    在这里插入图片描述

    二、CSS选择器

    1.选择器

    CSS选择器可以分为三大类,即id选择器、class选择器、标签选择器。它们之间可以有多种组合,有后代选择器、子选择器、伪类选择器、通用选择器、群组选择器等。

    (1)标签选择器

    (示例):
    CSS

    <style type="text/css">
    body{background-color: #ccc;
    text-align:center;
    font-size:12px; }
    h1 {font:“黑体";font-size:20px;}
    p {color:red; font-size:16px;}
    hr {width:200px;}
    </style>
    

    HTML

    <body>
    <h1>标题</h1>
    <hr>
    <p>正文的段落</p>
    版权所有
    </body>
    

    在这里插入图片描述

    (2)类别选择器

    (示例):
    CSS

    <style type="text/css"> 
    p { font-size:12px; }
    .one{ font-size:18px; }
    .two{font-size:24px; }
    </style>
    

    HTML

    <body>
    <p class="one">类别1</p>
    <p class="one">类别1</p>
    <p class="two">类别2</p>
    <p class="two">类别2</p>
    <p>普通段落中的文字</p> 
    </body>
    

    在这里插入图片描述

    (3)ID选择器

    (示例):
    CSS

    <style type="text/css">
    #one{font-size:12px;}
    #two{font-size:24px;}
    </style>
    

    HTML

    <body>
    <p id="one">文字1</p>
    <p id="two">文字2</p>
    </body>
    

    在这里插入图片描述
    与class的区别唯一性

    2.声明

    (1)嵌套声明

    (示例):
    CSS

    <style type="text/css">
    p □ span{ 
    color:red;
    }
    </style>
    

    HTML

    <body>
    <p> <span>天使投资</span> 是投资方式的一种</p>
    </body>
    

    在这里插入图片描述

    (2)集体声明

    (示例):
    CSS

    <style type="text/css">
    h1,p { text-align:center;
    }
    </style>
    

    HTML

    <body>
    <h1>欢迎访问论坛</h1>
    <p>欢迎访问论坛</p>
    </body>
    

    在这里插入图片描述

    (3)全局声明

    (示例):
    CSS

    <style type="text/css"> 
    * { 
    text-align:center; 
    } 
    </style>
    

    HTML

    <body>
    <h1>欢迎访问论坛</h1> 
    <p>欢迎访问论坛</p> 
    <h2>欢迎访问论坛</h2>
    </body>
    

    在这里插入图片描述

    三、CSS常用属性

    CSS属性有:字体属性(font)、背景属性(background)、区块属性(block)、方框属性(box)、边框属性(border)、列表属性(list-style)、定位属性(position)等。

    1.文本

    在这里插入图片描述

    1.单位
    px:像素
    em:1em——1个字符;2em——两个字符
    %:百分比
    在这里插入图片描述

    2.颜色
    red,blue,green
    颜色名http://www.w3school.com.cn/cssref/css_colors_legal.asp
    rgb(x,x,x)
    RGB 值
    每个颜色分量取值0-255
    红色:rgb(255,0,0)
    灰色:rgb(66,66,66)
    rgb(x%, x%, x%)
    RGB 百分比值 0%-100%
    红色:rgb(100%,0%,0%)
    rgba(x,x,x,x)
    RGB 值,透明度
    a值:0.0(完全透明)与 1.0(完全不透明)
    红色半透明:rgba(255,0,0,0.5)
    #rrggbb
    十六进制数
    红色: #ff0000
    红色: #f00 去掉重复位
    3.字符间距 letter-spacing
    (示例):
    CSS

    <style>
    h1 {letter-spacing:2px;}
    h2 {letter-spacing: -3px;}
    </style>
    

    HTML

    <body>
    <h1>标题内容</h1>
    <h2>文本段落主要内容</h2>
    </body>
    

    在这里插入图片描述
    4.行高 line-height
    (示例):
    CSS

    <style>
    p{font-size: 14px;
    line-height: 2em;
    }
    </style>
    

    HTML

    <body>
    <p>
    这里是web前端开发课程…
    </p>
    </body>
    

    在这里插入图片描述

    5.对齐方式 text-align
    (示例):
    CSS

    <style>
    h1{text-align: center }
    .date{text-align: right}
    .main{text-align: justify}
    </style>
    

    HTML

    <h1>CSS text-align 实例</h1>
    <p class="date">314</p>
    <p class=“main”>“当我年轻的时候,。。。</p>
    

    在这里插入图片描述
    6.装饰线 text-decoration
    (示例1):
    CSS

    <style>
    h1 {text-decoration:overline;}
    h2 {text-decoration:line-through;}
    h3 {text-decoration:underline;}
    </style>
    

    HTML

    <body>
    <h1>标题1文字</h1>
    <h2>标题2文字</h2>
    <h3>标题3文字</h3>
    </body>
    

    在这里插入图片描述
    (示例2):
    CSS

    <style type="text/css">
    a{
    text-decoration: none;
    }
    </style>
    

    HTML

    <body>
    <ul>
    <li><a href="#">链接1</a></li>
    <li><a href="#">链接2</a></li>
    <li><a href="#">链接3</a></li>
    </ul>
    </body>
    

    去掉超链接下划线
    在这里插入图片描述
    7.字体 font
    (示例):
    在这里插入图片描述
    简化font

    font: 斜体 粗体 字号/行高 字体
    font: italic bold 16px/1.5em '宋体'

    2.背景与超链接

    (1)背景属性

    空元素需要先定义元素的高度和宽度
    background
    颜色 图片 repeat
    background-color
    background-image
    url(“logo.jpg”)
    background-repeat
    repeat
    repeat-x
    repeat-y
    no-repeat

    (2)超链接

    链接的四种状态
    a:link- 普通的、未被访问的链接
    a:visited-用户已访问的链接
    a:hover -鼠标指针位于链接的上方悬停
    a:active -链接被点击的时刻
    在这里插入图片描述
    鼠标悬停放大字体
    CSS

    a{
    font-size: 22px;
    }
    a:hover{
    font-size: 120%;
    }
    

    HTML

    <a href="#">web design</a>
    

    在这里插入图片描述

    3.列表与表格

    (1)列表

    无序列表ul有序列表ol
    共用样式
    list-style所有用于列表的属性
    设置于一个声明中
    list-style-image为列表项标志设置图像
    在这里插入图片描述

    list-style-position标志的位置
    CSS

    <style type="text/css">
    .inside {
    list-style-position: inside
    }
    .outside {
    list-style-position: outside
    }
    </style>
    

    HTML

    <ul class="inside">
    <li>HTML——网页结构</li>
    <li>CSS——网页样式</li>
    <li>JS——网页交互</li>
    </ul>
    <ul class="outside">
    <li>HTML——网页结构</li>
    <li>CSS——网页样式</li>
    <li>JS——网页交互</li>
    </ul>
    

    在这里插入图片描述

    list-style-type 标志的类型
    在这里插入图片描述

    (2)表格

    width
    height
    border
    border-collapse
    在这里插入图片描述
    在这里插入图片描述
    在这里插入图片描述
    奇偶选择器:nth-child(odd|even)

    tr:nth-child(odd){
    background-color:#EAF2D3;
    }
    

    在这里插入图片描述
    表示:tr的父元素table的奇数个子元素,不管这些子元素是tr还是th

    四、盒子模型

    1.盒子模型概述

    页面上 区域、图片、导航、列表、段落,都可以是盒子
    页面中的所有元素都可以看成一个盒子,占据着一定的页面空间

    盒子模型组成

    content内容
    height高度width宽度border边框padding内边距margin外边距CSS样式属性
    在这里插入图片描述
    一个盒子的实际宽度、高度:content+padding+border+margin
    在这里插入图片描述
    CSS

    <html>
    <head>
    <style type="text/css">
    #box{
    width:100px;
    height:100px; 
    border:1px solid; 
    padding:20px;
    margin:10px;
    }
    </style>
    </head>
    

    HTML

    <body>
    <div id="box">
    内容内容内容…
    </div>
    </body>
    </html>
    

    在这里插入图片描述

    2.盒子模型属性

    (1)overflow属性

    hidden超出部分不可见
    scroll显示滚动条
    auto如果有超出部分,显示滚动条
    当内容溢出盒子框时,overflow属性取值
    在这里插入图片描述

    (2)border属性

    border-width:px、 thin、medium、thick
    border-style:dashed、dotted、solid、double
    border-color:颜色
    border:width style color

    div{
    border-width:2px;
    border-style:solid;
    border-color:red;
    }
    
    div{
    border:2px solid 
    red;
    }
    
    div{
    border-bottom:1px 
    solid red;
    }
    

    水平分割线
    CSS

    .line {
    height:1px;
    width:500px;
    border-top:1px solid #e5e5e5;
    }
    

    (3)padding属性

    CSS padding 属性定义元素边框与元素内容之间的空白区域,不可见。如果想调整盒子的大小可以调整内容区,内边距,边框。

    CSS padding 属性定义元素的内边距。padding 属性接受长度值或百分比值,但不允许使用负值。

    (4)margin属性

    <!DOCTYPE HTML>
    <html>
    <head>
    <style type="text/css">
    div{
    width:100px;
    height:100px;
    margin:15px 10px 20px 30px;
    border:1px solid red;
    }
    </style>
    </head>
    <body>
    <div id="box1">box1</div>
    <div id="box2">box2</div> 
    </body>
    </html>
    

    在这里插入图片描述
    margin的合并:垂直方向合并,水平方向不合并
    在这里插入图片描述
    水平居中
    图片、文字水平居中 text-align:center;
    div水平居中 margin:0 auto;

    (示例):
    CSS

    #newsimglist{
    text-align:center;
    font-size:0; /*否则图间有空隙*/
    }
    #newsimglist img{
    height:100px;
    width:100px;
    margin-left:5px;
    border:1px solid #0cf;
    padding:5px;
    }
    

    HTML

    <div id="newsimglist">
    <img src = "images/crisis.jpg" />
    <img src = "images/crisis.jpg" />
    <img src = "images/crisis.jpg" />
    </div>
    

    在这里插入图片描述

    CSS

    #newsimglist{
    font-size:0; /*否则图间有空隙*/
    }
    

    在这里插入图片描述

    展开全文
  • 文章目录完全背包方案数买书货币系统货币系统(NOIP)题意题解多重背包庆功会二维费用背包板子潜水员状态表示属性状态计算Code2021山东省赛分组背包问题机器分配金明的预算方案 完全背包 方案数 买书 即求不超过n元...
  • 模型推理那些事

    千次阅读 2021-05-30 08:28:50
    模型推理那些事 目前主流的深度学习框架有目前越来越多的深度学习框架、工具集以及定制化硬件使得构建、部署和跨框架管理深度学习越来越复杂。常用的深度学习框架有TensorFlow、Pytorch、MXNet和CNTK,因为训练最为...
  • 开尔文模型.ppt

    千次阅读 2020-12-23 14:53:01
    开尔文模型第三章、非线性粘弹流体的本构方程 第一节、本构方程 第二节、空间描述法和物质描述法 第三节、广义Maxwell模型 聚合物具有多层次内部结构,当其在加工流场中受外力作用时,它们的变化相当复杂,表现出与...
  • BIM模型轻量化是指在不损失模型真实性的前提下通过先进算法把模型重构并且进行更轻便更灵活地显示。BIM模型采用WebGL引擎在Web和移动端显示需要经过图形数据转换和浏览器渲染处理两个过程,这两个过程正好是BIM模型...
  • 特点:单例类只能有一个实例。...单例模式可以避免对资源的多重占用,例如一个写文件操作,由于只有一个实例在内存中,避免了对同一个资源文件的重复写操作。单例模式可以在系统设置全局的访问点,优...
  • Guido在他的博客文章Method ...Python在类的父级中查找从左到右列出的每个属性。在这种情况下,我们正在寻找__init__。所以,如果你定义class Third(First, Second):...Python将从查看First开始,如果First...
  • 解决这类问题的关键,就是模型对于特征组合和特征交叉的学习能力,因为它决定了模型对于未知特征组合样本的预测能力,而这对于复杂的推荐问题来说,是决定其推荐效果的关键点之一。 那特征交叉与深度学习模型的拟合...
  • 了解了通用渲染设置选项命令之后,需要分别对Software Render(软件渲染)、Hardware Render(硬件渲染)、Hardware 2.0 Render(硬件2.0渲染)和Vector Render(矢量渲染)各自独有的属性设置进行说明。Anti-aliasing ...
  • 现代统计模型 重难点:半参数回归模型 出勤+作业+结课论文(基于R:有创新、解决实际问题) 非参数统计分析相关知识 现代非参数统计——薛留根 科学出版社 R语言(区分大小写) 1.+、-、*、/、^(乘方) 2.赋值符号:<...
  • EMNLP 2021中预训练模型最新研究进展

    千次阅读 2021-10-11 01:24:21
    其同时具有很强的建模能力和训练效率 ReasonBERT: Pre-trained to Reason with Distant Supervision 提出了一种预训练模型ReasonBERT,它增强了语言模型在长期关系和多重(可能是混合的)上下文上进行推理的能力。...
  • 信用评分卡模型

    2021-06-19 22:54:31
    信用评分卡模型是最常见的金融风控手段之一,它是指根据客户的各种属性和行为数据,利用一定的信用评分模型,对客户进行信用评分,据此决定是否给予授信以及授信的额度和利率,从而识别和减少在金融交易中存在的交易...
  • 如何利用 YYModel 来解析嵌套模型

    千次阅读 2017-04-24 13:24:33
    利用 YYModel 对嵌套模型进行解析:  1.最外层:provinceModel(省模型) : NSString *province , NSArray*> *children (里面装的是城市模型),也需要做字典装模型,所以要在 .m 中实现协议的这个方法:  + ...
  • PHP中的多重继承

    2021-04-24 13:13:38
    小编典典Alex,大多数时候,您需要多重继承是一个信号,表明您的对象结构有些不正确。在您概述的情况下,我看到您的班级职责范围太广。如果Message是应用程序业务模型的一部分,则不应考虑呈现输出。相反,您可以...
  • 模型过拟合及模型泛化误差评估

    千次阅读 2018-11-26 11:14:22
    今天我们来深入探讨过拟合的一些高阶知识。 对于分类模型,我们总希望它是有低的训练误差和低的泛化误差。...二、过拟合与多重比较过程 三、泛化误差估计 一、过拟合产生原因 噪声导致过拟合...
  • 视频: Python实现基于LDA模型进行电商产品评论数据情感分析 前言 在21世纪人工智能大数据时代,网上购物已经成为大众生活的重要组成部分。人们在电商平台上浏览商品并购物,产生了海量的用户行为数据,用户对商品...
  • E-R模型的三个要素:实体集、联系集、属性 实体(entity):在现实世界中存在并且区别于其他对象的事物或对象, 实体集(entity set):相同类型即具有相同性质的实体集合,例如大学所有教师的集合instructor 联系...
  • 商品为什么重要商品是电商系统中最重要的业务模型,某种程度上说,电商就是围绕于商品进行的,不管在电商供应链、电商营销、还是推荐,商品都有其非常重要的地位。本文将为你介绍在电商系统中如何从概念...
  • 在做线性回归时,假设之一是要求自变量之间没有强共线性,但是用决策树模型做预测时,却没有这个要求。于是乎,查询了一下,在Quora上找到了相关答案。Is multicollinearity a problem with gradient boosted trees?...
  • FBX和DAE分别是Autodesk和Khronos旗下核心的可交换型3D模型格式,也算是当前主流的支持顶点蒙皮骨骼动画的格式,在实时渲染领域基本是无人不识了。本文主要以笔记形式记录一下读取这两种模型时的一些须注意的地方。...
  • 您可以分解您的事物,定义它们的交互,并定义要向应用程序开发人员公开的 属性、 服务和 事件。 ThingWorx模型 在ThingWorx中构建IoT解决方案始于以事物为中心的解决方案,其中,事物是创建模型的关键部分。 ...
  • 7-盒子模型

    2020-12-21 08:34:34
    盒子模型 盒子模型就是在HTML中盛装元素内容的容器。 每个盒子模型都由元素的内容(content)、内边距(padding)、边框(border) 和 外边距( margin) 组成。 div标记 <div>标记是一个块容器标记。 ...
  • 这种渐进增强的方式适用于所有支持CSS2.1伪元素及其定位属性的所有浏览器。不需要CSS3的支持。支持的浏览器:Firefox 3.5+, Safari 4+, chrome4+, opera10+, IE8+是如何实现的呢?从本质上讲,我们所创建的伪...
  • 进行网页布局的重要的属性,一个页面由多个盒子组成,每个盒子的内容都不相同 1、盒子的特性: (1)外边距(margin):盒子与其他元素之间的额距离 (2)内边距(padding):也称为填充距离,内容和边框之间的距离 ...
  • 文章目录什么是可解释模型线性回归逻辑回归树模型 什么是可解释模型 线性回归 逻辑回归 树模型
  • 文章目录CH7 Entity-Relationship Model7.1 设计过程概览7.1.1 设计阶段7.1.2 设计选择7.2 实体-联系模型7.2.1 实体集7.2.2 联系集1.联系与联系集的概念2.实体参与联系集3.角色4.联系集的属性描述5.n元联系集7.2.3...
  • 分子先导优化是药物发现的一项重要任务,重点是生成类似于候选药物但具有增强属性的分子。大多数先前的工作都集中在优化单个属性上。然而,在实际环境中,作者希望产生满足多个约束条件的分子,例如,效力和安全性。...

空空如也

空空如也

1 2 3 4 5 ... 20
收藏数 41,376
精华内容 16,550
关键字:

多重属性模型

友情链接: downsystem.zip