精华内容
下载资源
问答
  • a、总体回归函数和总体回归线确实客观唯一存在,但一般未知 b、总体回归函数的形式只能依据经济理论时间经验去设定,为简单起见,常设定为线性形式 c、总体回归函数中截距系数斜率系数,未知,待...
    • 总体回归函数(population regression function,简称 PRF)
    将总体被解释变量 Y 的 条件均值表现为解释变量 X 的函数
    17003056_UlhJ.png
     当总体回归函数是线性形式时
    17003056_G1OG.png

    • 说明
    a、总体回归函数和总体回归线确实客观唯一存在,但一般未知
    b、总体回归函数的形式只能依据经济理论和时间经验去设定,为简单起见,常设定为线性形式
    c、总体回归函数中截距系数和斜率系数,未知,待解
    d、简单线性总体回归函数中,“线性”的含义
    • 随机扰动项
      各个被解释变量的个别值与相应的条件均值的偏差,被称为随机扰动项,或随机干扰项(stochastic disturbance),或随机误差项( stochastic error),用 u 表示,它可正可负,是一个随机变量
    总体回归函数的个别值表现方式,或称随机设定形式
    17003056_wT8y.png
    • 引入随机扰动项的原因 
    a、作为未知影响因素的代表
    b、作为无法取得数据的已知影响因素的代表
    c、作为众多细小影响因素的代表
    d、作为模型设定误差的代表
    c、作为变量观测误差的代表
    e、经济现象的内在随机性


    • 样本回归函数(sample regression function,简称SRF)
    17003056_5014.png
     
    • 总体回归函数与样本回归函数
    17003056_nFan.png
    • 区别
    a、总体回归函数未知,但唯一存在,样本回归函数可求,但有很多个,随抽样的变化而变化
    b、 17003056_zu4Y.png 和  17003056_9hun.png 是确定的常数,未知;  17003056_37Dy.png 和  17003056_B38a.png 是随机变量
    c、随机扰动项 ui 不能直接观测到;残差 ei可以求出
    17003056_kkAG.png

    转载于:https://my.oschina.net/u/1785519/blog/1511502

    展开全文
  • 第二章 模型开发流程&好坏样本定义 2.1模型开发流程 2.1.1 评分模型流程图 2.1.2流程图阐述 2.2 好坏样本定义 2.2.1观察期、表现期、观察点 2.2.2举例说明 第二章 模型开发流程&好坏...

    第二章 模型开发流程&好坏样本定义

    2.1模型开发流程

    2.1.1 评分模型流程图

    这里写图片描述

    2.1.2流程图阐述

    该小结提出了一些数据指标,如果不明白没有关系,往后的文章笔者会一个个地解释这些指标的含义和计算方法

    • 数据获取:获取建模所需要的数据,一般分为内部为外部数据,内部数据例如贷款公司内部搜集存储的客户信息,例如客户在平台内部的登陆、注册、消费信息等,外部数据一般有第三方数据,例如人行征信报告、一些第三方机构提供的多头借贷等
    • EDA与数据描述,EDA全称explore data analysis,目的在于探索性地分析客户数据分布情况以及数据质量,检查数据是否为单一值、包不包含缺失以及异常数据等。同时通过各种分析手段(Gini、列联表、 χ2 χ 2 检验、相关系数)等分析变量与目标(违约与否)的关联
    • 数据准备,准备好我们需要进行建模的样本宽表,包括数据合并、清洗、转换等工作,这也是建模中最耗费时间的一项。
    • 变量选择,在数据准备好以后,未必所有的变量都需要进入模型,否则容易出现维度灾难,就是数据集过大导致开发时间过长,根据一定方法选择最优变量进入模型就成了必要的工作,常用的有IV值,逐步回归(也就是先将一个变量纳入模型,然后逐步将其他变量一个一个纳入模型训练,剔除掉不能减少AIC的变量,然后继续加入新变量,直到AIC无法再下降为止)。另外还有假如L1惩罚项,用集成学习的方法选择变量等。
    • 模型开发,利用机器学习,训练模型,常用的模型有logsitic回归、线性回归、决策树、深度学习等。
    • 模型评估,评价模型对于好坏样本的区分能力,常用的指标有ROC曲线、RECALL、PERCISION、KS值等。
    • 评分卡创建和刻度,利用模型估计出来的参数(也就是公式)将其转化为评分规则或者是风控规则。
    • 检测和报告,监控模型是否运行稳定,常用的指标有PSI、评分迁移矩阵、kendall 秩相关系数等。
    • 评分实施,模型部署上线,用于风控系统。

    2.2 好坏样本定义

    开发信用评分模型的首要目标就是知道来者是好人还是坏人,他未来会不会出现逾期、失联等。所以,如何定义一个借款人的好坏十分讲究,并不是一个人有过逾期欠款他就不是好人了,毕竟发生逾期的原因总是多方面的,有的仅仅是偶尔忘了,这部分总体还是好人,而有的是中途发生财务原因暂时无力偿还,还有的严重一点就是主观上存在坏的目的,借了钱就消失赖账,甚至是身份被骗子盗用。所以,建模过程中,为了训练出一个优质的模型,需要正确地定义好坏样本。

    2.2.1观察期、表现期、观察点

    在这里,需要明确三个定义:观察期、表现期、观察点,可以先从如下时间轴看起。
    这里写图片描述
    - 观察期:就是时间轴左侧,主要是用来生成用户特征的时间区间,不宜太长也不宜太短,一般为1年到3年左右
    - 观察点:这个点并是一个具体的时间点,而是一个时间区段,表示的是客户申请贷款的时间,用来搜集那些用来建模的客户样本,在该时间段申请的客户会是我们用来建模的样本
    - 表现期:用来定义用户是否好坏的时间区段,一般是6月到1年左右,一般最常用的是定义为坏样本的指标有:M3+逾期、M3以内逾期中定义为失联、欺诈、身份盗用等情况,这些需要看自身业务情况而定

    补充说明:
    1.观察点的设计:
    观察点的设计有额外的讲究,其中涉及到一个Mob的概念。而所谓Mob,全称month on book,等于观察点减去贷款发放时间。所以,观察点的设计在于贷款发放时间往后推Mob期,Mob的长短关系到模型的观察期以及观察期生成的时间切片变量。

    2.观察期过长或过短的影响:
    - 一个过长的观察期,可能会导致客户不在你的mob内,大批样本无法进入模型
    - 一个过短的观察期,则会导致样本无法生成足够多有效的时间切片变量

    3.时间切片变量:
    - 时间区段的行为变量,例如过去3个月平均消费金额、过去6个月消费平均次数等

    2.2.2举例说明

    假如,现在我们的模型表现期为1年,观察期为1年,观察点为什么时候呢?也就是说当我们有一个客户在2018-1-1号来申请贷款,贷款机构需要用现有的模型对该申请人进行一个申请评分,评估他未来表现期内触发坏样本属性的概率,那么该模型采用的客户样本是什么时候申请进件的?
    答案:因为上面定义的表现期是1年,那么往前推一年,观察点大概为2017-1-1号左右某段时间区间,因为观察期也是1年,所以再往前推1年(即观察期:2016-1-1到2017-1-1),利用这1年所有观察点内申请人一些信息建立模型的观察变量,然后再往后推一年(即表现期:2017-1-11到2018-1-1),所有在观察点内的申请人在这一年时间内的表现情况来定义违约。然后来训练出一个模型。对2018-1-1号的申请人进行评分。所以申请评分卡模型有着天然的滞后性,需要不断的对其模型进行监控。


    参考文献:
    [1]http://blog.csdn.net/Mr_tyting/article/details/75097681#t19
    [2]信用风险评分卡研究:马姆杜.拉法特

    展开全文
  • 总体样本的理解

    千次阅读 2016-10-26 19:19:51
    对于这个不部分的理解总是有一些不确定,所以运用起来除了记公式,套模型,几乎不能够引申理解。看了一遍最基本的定义,发现非常的简洁易懂。摘录+理解如下。在概率论章节,我们对一个变量的分布模型是已经知道的,...

    对于这个不部分的理解总是有一些不确定,所以运用起来除了记公式,套模型,几乎不能够引申理解。

    看了一遍最基本的定义,发现非常的简洁易懂。摘录+理解如下。

    在概率论章节,我们对一个变量的分布模型是已经知道的,带着这个模型再去研究或者说计算相应的性质,数字特征等。

    但是在数理统计这部分,事情的切入角度是不一样的:研究的随机变量分布是不知道的,但是我们常常需要通过一些手段来推断这个随机变量的分布。这个手段是:多次独立重复的观察,得到一些观察值。根据这些观察值,我们就可以对此变量的分布做一个合理的推断。

    首先看我们需要研究什么。比如想调查某校的学生身高,身高这个数量指标就是研究对象。全校学生的身高值是随机变量,不妨设为X,变量对应有取值范围,这里的范围就是全校学生的身高取值。X就是总体,也称之为总体X。特别强调总体X是一个随机变量,表达的是所有的取值。总体又分为有限整体还有无限整体。研究一个学校学生的身高,自然是有限整体。如果对象是全国正在使用的某种型号灯的寿命,观察值个数很多,可以认为是无限整体。

    总体的分布是未知的,它具有某种形式是可以建模的,其次,模型中含有着未知参数,这个参数将通过抽样的方式做出推断。

    被抽出的部分个体就叫做总体的一个样本。

    从整体抽出一个个体,就是对总体X进行一次观察并记录结果。在相同条件下对总体进行n次独立重复观察。将n次观察结果按照试验顺序记为 X1,X2,..,Xn 。它们是相互独立的,且都是与X具有相同分布的随机变量 X1,X2,..,Xn 称之为来自总体X的一个简单随机样本。

    特别需要理解的是:样本中的每一个取值我们也视作随机变量,因为抽样的随机性,因此每一个个体都是对总体的反应,所以和总体X是平级的,比如总体X的取值范围,在每一个个体上,取值范围也是相同的。

    对于抽取的样本,可以具体得到观察值 x1,x2,...,xn ,称之为样本值。

    抽取过程还分为有放回和无放回抽样。放回抽样用起来不方便,因此近似用不放回抽样代替。当然无限总体二者没有差别,谈不上近似。

    严格定义:设X是具有分布函数F的随机变量,若 X1,X2,..,Xn 是具有同一分布函数F,相互独立的随机变量,则称 X1,X2,..,Xn 从分布函数F(或称总体F,或者总体X)得到的容量为n的简单随机样本,简称样本。观察值 x1,x2,...,xn 称为样本值,也成为X的n个独立的观察值。

    则: F(x1,x2,...,xn)=ni=1F(xi)

    若X具有概率密度 f ,则:

    f(x1,x2,...,xn)=ni=1f(xi)

    举一个例子:设总体X的概率密度是

    f(x)={2x,0,0<x<1,

    来自总体X的样本为 X1,X2,X3,X4 ,则 X(4)=max(X1,X2,X3,X4) 的概率密度 fX(4)(x)=?

    分析:从概率分布角度看更容易解释。

    F(X(4)(x))=P(X(4)x)=P(max(X1,X2,X3,X4)x)=P(X1x,X2x,X3x,X4x)=[F(x)]4

    F(x)=0,x2,1,x<0,0x<1,

    从而 fX(4)(x)=,

    fX(4)(x)=8x7,0,0<x<1

    展开全文
  • 自相关函数/自相关曲线ACF AR(1)模型的ACF: 模型为: 当其满足平稳的必要条件|a1|&... y(t)y(t-s)的方差是有限常数,y(t)y(t-s)的协方差伽马s 除以伽马0,可求得ACF如下: 由于{rhoi}其在平稳条...
    自相关函数/自相关曲线ACF
     
    AR(1)模型的ACF:
    模型为:
    当其满足平稳的必要条件|a1|<1时(所以说,自相关系数是在平稳条件下求得的):
             y(t)和y(t-s)的方差是有限常数,y(t)和y(t-s)的协方差伽马s
             
            除以伽马0,可求得ACF如下:
            
            由于{rhoi}其在平稳条件|a1|<1下求得,所以平稳
       0<a1<1则自相关系数是直接收敛到0
       -1<a1<0则自相关系数是震荡收敛到0
     
    对于AR(2)模型的ACF:
    (略去截距项)
    两边同时乘以y(t),y(t-1),y(t-2)......得到yule-Walker方程,然后结合平稳序列的一些性质(yule-Walker方程法确确实实用了协方差只与时间间隔有关的性质),得到自相关系数如下:
                  rho0恒为1
                  
                  (二阶差分方程)
                  令人惊喜的是,这个二阶差分方程的特征方程和AR(2)模型的是一致的。
                  所以,我们的rho本就是在序列平稳的条件下求得,所以{rhoi}序列也平稳。
                 当然,其收敛形式取决于a1和a2
     
    MA(1)模型的ACF:
    模型为:
    由于y(t)的表达式是由白噪声序列中的项组成,所以不需要什么平稳条件,就可以求得rho的形式如下:
                 
    对于MA(p)模型,rho(p+1)开始,之后都为0.所以说,到了p阶之后突然阶段,变为0了。
     
     
    ARMA(1,1)模型的ACF:
    模型为:
            还是使用yule-Walker方程法
          (用到了序列平稳则协方差只与时间间隔有关的性质)得到:
            
           所以有:    
                      
     
    ARMA(p,q)模型的ACF:
      ARMA(p,q)的自相关系数满足:
           (式1)
     前p个rho值(rho1,rho2...rhop)可以看做yule-Walker方程的初始条件,其他滞后值取决于特征方程。
          (其实是这样的,rho1,rho2...rhop实际上能写出一个表达式,而rho(p+1)开始,就满足一个差分方程,而这个方程对应的特征根(即式1)方程和AR(p)对应的一模一样),所以,他会从之后q期开始衰减。
             所以,还是收敛的,不过收敛形式多样了。
           (由于我们使用了序列平稳这一条件,但是平稳只能推出ai的累积和<1(必要条件),并不能保证每个|ai|都小于1(充分条件,没说是充要条件),但是,既然我们已经用了{y(t)}平稳这一条件,而{y(t)}和{rho(t)}的特征方程是一样的,他们的特征根都应该一样,那么我觉得认为{rho(t)}也是可以的
     
     
    偏自相关系数PACF:
    为什么需要偏自相关系数?
    在AR(1)模型中,即使y(t-2)没有直接出现在模型中,但是y(t)和y(t-2)之间也相关,
    偏相关系数是在排除了其他变量的影响之后两个变量之间的相关系数。
    证明:
    然后我证明完了才发现,只要用上面AR(1)中的解就可以很直观的说明问题了。。
    所以我们需要偏自相关系数。
    y(t)和y(t-s)的偏自相关系数,排除了插入值y(t-1)到y(t-s+1)间的影响。
    所以在AR(1)过程中y(t)和y(t-2)之间的偏自相关系数为0
     
    本书采用了简单的方式:序列的每一个值减去序列的均值,得到一个新的序列如y(t*)=y(t)-mu,y(t*-1)=y(t-1)-mu
     所得的fi(11)即为偏自相关系数系数(注:由于没有插入值,所以fi(11)既是自相关系数又是偏自相关系数)
     
    如果我们要求y(t)和y(t-2)之间的偏自相关系数
    则构造方程为:,求出的fi(22)就是y(t)和y(t-2)之间的偏自相关系数。
    其实在古扎拉蒂一书中提到了偏回归系数,偏自回归系数是先做两个回归,然后再对两个回归得到的残差做回归,最终得到的偏自回归系数,和直接用多个回归元对回归子做回归得到的系数的结果是一样的。
     
    我们可以不同构造阶数的自回归模型,得到对应的偏自相关系数。
    以下将归纳出偏自相关函数(PACF)的一般表达式(即通过自相关系数求出):
                              
                              
                             其中:
    若样本量为T,则仅有T/4的滞后量可以同来计算样本PACF。
     
    AR(p)的PACF函数:
         
        意思就是对于AR(p)过程,当s>p的时候,y(t)和y(t-s)的偏自相关系数为0
        所以AR(p)的PACF图的一个特征就是在p滞后截断。
     
    MA(1)的PACF:
    模型为:
           使用滞后算子,结合级数展开,其可以写为:
           
           
          (我们应该还是站在平稳的角度考虑问题)        
            
    ARMA(p,q)的PACF:
                            
           也就是说,ARMA(p,q)模型对应的PACF图,
           其在哪一点开始陡然下降(降到很低开始趋于0)取决于p(跟AR的特点有关)
           其趋于0的方式取决于MA部分中的那些系数。
           即PACF从滞后p期开始衰减,衰减模式取决于多项式:
           
     
    一般特征总结如下:


     
    平稳序列的样本自相关。
    geometric 是几何的意思
    符号函数(一般用sign(x)表示)是很有用的一类函数,能够帮助我们在几何画板中实现一些直接实现有困难的构造。 符号函数 能够把函数的符号析离出来 。在数学和计算机运算中,其功能是取某个数的符号(正或负): 
    1. x>0sign(x)=1;
    2.  
    3. x=0sign(x)=0; 
    4.  
    5. x<0 sign(x)=-1
    的意思是,rho(1)的符号应该等于a1+beta的符号。
    ACF是几何衰减的(或许也可以称之为指数吧)
    因为根据之前对ARMA(1,1)的相关系数的分析,其结果如下:
     
    oscillating是震荡的意思
    (其实我有一个想法,既然有上述表,其实我们完全可以编写一个函数去绘制图这些类型的曲线,这样我们判断其ARMA模型就会很容易了)
     
     
     
    平稳序列的样本自相关:
    由于现实中我们无法获得总体的均值,方差和协方差,相关系数等,所以使用样本代替。
                 
                 (我们不过是用了离散变量的公式了)
     
    Box and Jenkins (1976)讨论了在{y(t)}平稳,且误差为正态分布的假设下,r(s)的分布。
     
    如果r(s)的真实值等于0(即设真实数据生成过程是一个MA(s-1)过程(P59.因为MA(q)过程的ACF在q阶之后截断为0,而ACF就是自相关系数r啊))
    则有:
             
    且在大样本下(T很大的时候,这里T是指样本个数),r(s)将服从均值为0的正态分布。
    这样看来,在大样本下r(1)~N(0,1/T),那么我们可以做显著性检验:
    注意,我们是在MA(s-1)的假设条件下,设计如下的零假设和备择假设。
    零假设为:1阶自回归在统计上不是显著的,即p=0
    备择假设: p>0(所以是单侧检验)
                     如果计算得到的r(1)>2*square(1/T)  
                     即r(1)大于两倍标准差,而0-2*sigma差不多就是正态分布右侧95%分位点。
                     于是,在拒绝域,则拒绝零假设。
    那么既然p>0,则可以接着对r(2)做显著性检验了。
    零假设为:2阶自回归在统计上不是显著的,即p=1
    备择假设: p>1(所以是单侧检验)
                      如r(1)=0.5,且T为100.则利用上述公式可计算得到var(r(2))=0.015
                      即r(2)的方差为0.015,而标准差为0.123.
                      如果计算出的r(2)>2*0.123,则可以解决零假设。
                      我们接受p>!
    如此反复地检验。(但是通常不超过T/4)
     
    Box and Jenkins 构造出Q统计量用于检验一组自相关系数是否显著异域于0.
                                       
    在所有的r(k)=0的假设下,Q渐近地~卡方(s)
    即较高的自相关系数将导致较高的Q,即如果Q大于临界值,则拒绝原假设,即至少存在一个自相关系数不为0.
    但是Q统计量的问题在于,即便是对于适度da的s,其效果也不佳。
    Ljung and Box (1978)提出了更优且在小样本中仍适用的修正的Q统计量
                                     
    如果Q大于自由度为s的卡方分布的临界值,则少存在一个自相关系数不为0.
    Q和修正的Q还可以用于检验ARMA(p,q)模型中的残差是否为白噪声过程。
    若使用ARMA(p,q)模型的残差,如果从模型中得到了s个自相关系数,则Q服从自由度为s-p-q的卡方分布(因为有p+q估计系数啊),如果模型中有截距项,则自由度为s-p-q-1。
     
    在AR(p)的零假设下(即在所有的都为0(P62.对于纯AR(p过程,其PACF在p以后就截断为0)),的方差渐进地等于1/T
     
     
                                                                                                                                             
     
     





    附件列表

     

    转载于:https://www.cnblogs.com/xuanlvshu/p/5410721.html

    展开全文
  • 机器学习中参数模型和非参数模型理解

    千次阅读 多人点赞 2019-06-28 21:07:50
    在统计学中,参数模型通常假设总体服从某个分布,这个分布可以由一些参数确定,如正态分布由均值标准差确定,在此基础上构建的模型称为参数模型;非参数模型对于总体的分布不做任何假设或者说是数据分布假设自由,...
  • 样本估计总体

    千次阅读 2019-02-12 17:50:00
    频率分布折线图和总体密度曲线 茎叶图 利用茎叶图既可以对数据的平均值方差做定量计算,也可以根据样本数据的分散与集中程度对数据的平均值方差做定性分析。 二、相关计算 样本数据的数字...
  • 本文讨论一下几点: 1, pearson 相关系数(Pearson Correlation Coeffient) --- 皮尔逊相关系数 ; 2,信息增益(InfoGain) 、卡方检验 与特征选择;3,机器学习模型中不平衡样本问题
  • 本片博文主要介绍随机采集小样本,使用交叉验证评价模型类别,使用表格查找器选择模型最优参数以及模型评估的各项指标等
  • 评分卡模型开发(十)--总体流程

    千次阅读 2018-11-23 12:57:00
    转自: ... 一、信用风险评级模型的类型 信用风险计量体系包括主体评级模型和债项评级两部分。主体评级和债项评级均有一系列评级模型组成,其中主体评级模型...
  • 过拟合与欠拟合 ...过拟合:模型过于复杂,过分捕获样本数据的特征,从而将样本数据中一些特殊特征当成了共性特征。表现为模型在训练集上的效果非常好,但是在未知数据上的表现效果不好。 进一步解释 欠...
  • 商业统计原理体会1:总体(population)和样本(sample)统计的目的统计量(观察量)样本均值(sample mean)和总体均值(population mean ) 统计的目的 上了一学期的课之后,最直观的感受就是统计学最开始是在做着...
  • 来思考视觉知识的统一表达模型和学习算法,包括场景上下文语义建模、复杂物体层次化构造(Hierarchical Composition)法和基于人类感知和认知机理的小样本机器学习理论,从而能进一步实现小数据大任务(small-data-big...
  • 生成模型和判别模型

    千次阅读 2017-12-22 21:11:12
    生成模型和判别模型  Ian在论文Generative Adversarial Nets中提出来的。  记录下自己的理解,日后忘记了也能用于复习。  本文地址:  http://blog.csdn.net/sxf1061926959/article/details/54630462 ...
  • 论文研究-MRR模型一类正态总体的极大似然估计法及检验.pdf, Madhavan等给出了一个著名的价差分解模型:MRR模型. MRR模型利用广义矩方法估计参数,这使得该模型在扩展上...
  • 假定一个事件的观测样本服从如下分布,我们如何确定总体数据的分布模型? 首先应该想到是建立线性回归模型,然而由于该变量不是正态分布的,而且是不对称的,因此不符合线性回归的假设。 常用的方法是对变量进行...
  • 机器学习中参数模型和非参数模型

    千次阅读 2019-08-23 20:25:23
    网上关于机器学习中的参数模型和非参数模型之间的解释并没有一个完全一致的解答, 有从是不是对数据的分布做了相关假设进行分析的 也有是从模型的参数量大小进行解答的 二者好像是一致的,但是个人觉得如下使用...
  • 使用ARIMA模型,您可以使用序列过去的值预测时间序列。在本文中,我们从头开始构建了一个最佳ARIMA模型,并将其扩展到Seasonal ARIMA(SARIMA)SARIMAX模型
  • PGM:图模型学习概述

    千次阅读 2016-09-18 11:31:52
    如在独立性推理讨论中,...查询一个模型的方法手工搭建网络利用一组从希望建模的那个分布中生成的样本来学习相对于总体的分布模型模型学习皮皮blog这里首先描述学习模型时的目标集合由这些目标所导致的不同评价指
  • 本文提出了一种基于少样本目标类别图像的图像翻译模型,该模型在翻译准确度、内容保留程度、图像真实度分布匹配度四个指标上都超越了现有模型的效果。   摘要 无监督的图像翻译方法通过在不同的非结构化图像数据...
  • 如何理解生成模型和判别模型

    千次阅读 2019-04-11 00:50:01
    如何理解生成模型和判别模型呢,我们以生活中的一个实例来看一下,我们如何来判断一个人所讲的语言呢?如果我们详细的学习了所有的语言的相关内容,当听到一个人所讲的语言时,就可以决定它是属于哪一种,这样的做法...
  • Logistic回归模型和判别分析方法都可以达到对样本分类的目的,比较和分析这2种方法的差异以及其各自的特点,可以为更好的应用提供参考。从类别表现、样本情况、归类函数、归类原则、预测功效等5个方面对Logistic回归...
  • 李奎元称:根据企业信用管理理论,5C原则是指考察客户信用价值的5个因素,即品行(character)...除了根据5C原则以及客户的财务状况对其资信进行评价以外,企业还可以通过资信分析模型分析客户的资信状况。根据目标
  • 总体回归函数也成为理论回归函数, 模型为 E(y | x)= a + b x 其中参数ab存在但未知,是一个期望值, 样本回归函数也成为经验回归函数 模型为 y^ = a^ + b^ x 其中a^ 、b^为根据样本数据估计出来的值,y^也是...
  • 理解对抗网络,首先要了解生成模型和判别模型。判别模型比较好理解,就像分类一样, 有一个判别界限,通过这个判别界限去区分样本。理解了生成模型和判别模型后,再来理解对抗网络就很直接了,对抗网络只是提出了一 ...
  • 这一篇文章总结的主要是模型的可解释性相关知识,但是同样涉及到了对抗样本相关的研究,所以对于对抗样本的相关攻防,同样具有比较大的参考价值。 文章介绍:在本文中,我们首先详细地阐述可解释性
  • 使用AMOS图形建立检测模型(3)

    千次阅读 2014-08-23 20:05:42
    本质上,SEM 是带一个因变量(Y)的多重线性回归模型在多变量上的扩展: y = i + Xb + e 这里 y 是因变量上包含观测得分的向量, i 是表示y-截距的单位向量, X 是连续分布或分类(编码)自变量的矩阵, B 是...
  • AI产品经理需要懂的算法和模型

    千次阅读 2018-11-28 16:57:05
    原文链接 本篇希望以精准推荐模型为案例通过全面的撰写将AI产品经理需要...这篇将主要从时下各种算法模型用于精准推荐都有其各自的优点和缺点带出我自创的精准推荐模型AI-UTAUT模型和实例解析, 顺道讲解从算法模型...
  • logistic回归模型

    千次阅读 多人点赞 2020-04-13 17:44:45
    从这一期开始,我们准备介绍一系列机器学习算法模型,主要包括logistic回归,决策树,随机森林,关联规则,朴素贝叶斯,支持向量机模型,隐式马尔可夫模型,因子分析,主成分分析,聚类,多元线性回归,时间序列,...
  • 本文说明了R包dlnm实现分布式滞后线性非线性模型(DLMDLNM)的建模框架的开发。首先,本文描述了除时间序列数据之外的DLM / DLNM方法的一般化方法,在Gasparrini [2014]中有更详细的描述。此外,此插图还说明了...
  • 总体分类,机器学习中的算法模型可以分两大类: 监督学习算法 无监督学习算法 监督学习 监督学习是指利用一组已知类别的样本调整分类器的参数,使其达到所要求性能的过程,也称为监督训练或有导师训练。 在监督...

空空如也

空空如也

1 2 3 4 5 ... 20
收藏数 36,043
精华内容 14,417
关键字:

总体模型和样本模型