精华内容
下载资源
问答
  • 作者:丁点helper来源:丁点帮你前几天的文章,我们聚焦在回归分析,今天来看看在回归分析中常常要研究的一类难点问题——交互作用的探究。交互(interaction),字面上不太好理解,但是从数学表达上却很简单。如果...

    7cccfe257f184e708bec209feff30059

    作者:丁点helper

    来源:丁点帮你

    前几天的文章,我们聚焦在回归分析,今天来看看在回归分析中常常要研究的一类难点问题——交互作用的探究。

    交互(interaction),字面上不太好理解,但是从数学表达上却很简单。

    如果想要研究两个自变量如X1和X2的交互作用,通常的做法就是将两个变量相乘,即X1*X2,然后把乘积项纳入到回归方程。

    操作起来很简单,但交互项的纳入对于回归系数的解读却带来了新的问题。

    以一个很经典的例子来说明。

    含交互项的回归方程

    多重线性回归,一般是指有多个自变量X,只有一个因变量Y。前面我们主要是以简单线性回归为例在介绍,两者的差距主要在于自变量X的数量,在只有一个X时,就称简单线性回归。

    我们想通过线性回归研究教育程度、性别对个人收入的影响,首先,不纳入交互项的回归方程为:

    bfd44586f6014fa99cd20829e33573bf

    其中,Y表示收入,X1表示“教育年限”(定量变量),X2表示“性别”(分类变量,用”0“为女性;“1“表示男性)。

    通过估计以上回归方程X1和X2的回归系数,β1和β2,即可定量地衡量出教育程度、性别对收入的影响。

    比如,β1的含义即为:控制性别后,教育程度每增加一年,个人收入增加的量。

    这是我们前面讲过的,很好理解。

    现在,我们希望考虑”教育程度“和”性别“的交互作用,因此将把两个变量的交互项纳入回归方程,即为:

    05d0000d7b464c68b5affa55366eec01

    其中,X1X2代表交互项,这里也属于多重线性回归的范畴,因为我们可以令X3=X1X2,将其视为一个新变量,则上式就可以看做是拥有三个自变量的一般线性回归。

    思考:现在方程中X1的回归系数β1还能按照上面的含义来解读吗?

    我们尝试做一下。

    要衡量X1对Y的作用,归根结底,是要看,当X1变化一个单位时,Y怎么变化(明白这一点很基础也很重要)。

    因此,我们可以这样来做:

    当X1=0时(代入有交互项的方程,下同),

    0124fee6c6d944babfa18bb089e0aa3a

    由此,可以发现,加入交互项后,X1(即教育程度),每变化一个单位(比如增加一年),收入的变化不仅取决于β1,而且还取决于β3和X2。

    因此,我们不能再直接将β1解读为教育程度对收入的影响。

    同理,β2也不能直接解读为性别对收入的影响。

    在这样的情况下,到底应该如何来对这三个回归系数进行解读呢?思路其实很简单,诀窍就是分别让X1和X2等于0。

    c5f3eb5603924cc3aa792bbbfa6e2698

    由此来看,加入交互作用后,回归系数(β1和β2)的解读需要加入一定的限定条件,比如”教育程度为0“、或者特定为“女性人群“。

    这实际上是出于简单的数学考虑:因为让一个变量等于0,我们就可以消除交互项,然后单独地分析另一个变量的效应,这种思路特别方便,大家不妨在自己的研究中使用。

    说完β1和β2,那β3怎么解读呢?严格而言,β3才是真正交互项的系数,才是做交互研究最关注的部分。

    交互项回归系数的解读

    多重线性回归,一般是指有多个自变量X,只有一个因变量Y。前面我们主要是以简单线性回归为例在介绍,两者的差距主要在于自变量X的数量,在只有一个X时,就称简单线性回归。

    上面我们讲了β1的含义是”对于女性人群,教育程度每增加一年,其收入的增加量“。很自然的想,那对于男性人群,教育每增加一年,收入增加多少呢?

    前面我们计算了,X1从0变化到1时,

    d72ffdca5f8e47ffb1fb1d2d484ebd52

    我们知道,X2表示的是性别这个变量,X2=1代表男性,那如果我们直接把X2=1代入上式呢:

    8a4aba03d57c402184a126329fa49f85

    由此,我们就得到了:对于X2=1(即男性人群),当X1增加一个单位时,Y的变化量为(β1 + β3)。

    因此,可以把(β1 + β3)解读为:对于男性人群,教育程度每增加一年,收入的增加量。

    把男性和女性放在一起对照看一下:

    β1:对于女性人群,教育程度每增加一年,其收入的增加量。

    β1 + β3:对于男性人群,教育程度每增加一年,其收入的增加量。

    现在,β3(即交互项的回归系数)的含义是不是一目了然。它表示,教育程度每增加一年时,男性和女性收入增加的差值。

    代入具体的数字看起来会更容易。

    比如,我们让β1 = 200;β2 = 300;β3 = 50,就可以很清楚地看到:

    对于女性来讲,教育程度每增加一年,收入会增加200(β1 的含义);

    对于男性来讲,教育程度每增加一年,收入会增加250(β1 + β3的含义)。

    而β3就表示,同样增加一年的教育程度,收入的增加量,男性比女性多50。

    这多出来的50就衡量了性别和教育的交互作用。

    理清了这三个系数的意义,我们再来看交互作用的真正含义,就会更加明朗:

    交互作用实际上影响的是一种关系,什么关系?X1和Y的关系,或者X2和Y的关系。

    此话怎讲?我们看,当不加入交互项的时候,无论男性还是女性,教育程度增加一年,收入的增加量是一样的,都为β1。

    这里的β1 可以视作教育程度对收入的影响,实际上是两者相关关系的量化。

    但是,加入交互作用后,教育程度增加一年,收入的增加量,男性和女性就不一样了,一个是β1 + β3,另一个是β1。

    不难发现,教育程度对收入的影响随着性别的变化发生了变化。

    所以,从本质上看,交互项衡量的了性别对【教育程度与收入关系】的影响。用括号括起来就是希望大家能看的更清楚:性别和教育的交互项影响的既不是教育程度也不是收入,而是它们两者的关系。

    如果数学基础不错,则可以将“【教育程度与收入关系】”理解为回归方程的X1(教育程度)的斜率(斜率的定义就是X1变化一个单位,对应的Y的变化量),所以,本质上,交互项影响的是斜率!

    同样地,交互项因为是乘积的形式,所以它也衡量了教育程度对(性别与收入关系)的影响。

    如何进行分析,做法其实完全一致,首先分别计算X2=0和X2=1时候,Y的变化量(代表了男女收入的差异):

    f2ddb38d05c6406fbfb3d12695ee4442

    我们知道X2表示性别,所以,根据上式,可以将β3解读为:教育程度的变化,带来的男女收入水平差异的变化,注意这里说的是”差异“,即男性工资高于女性的那一部分(如果β3是负数,则表示男性工资更低)。

    因此,综合来看,交互项是可以从两个角度去理解和解读的,这符合它进入回归方程的方式(X1X2)。

    针对具体的问题,我们都可以采取上面说的这种”归零法“去分析和拆解,即分别一个自变量等于0,然后分析另一个自变量回归系数的含义。

    同时,专门对于交互项的解读,我们要知道它刻画的其实是对回归斜率或者回归效应值(β)的影响。

    比如教育程度和性别的交互,既影响了收入对教育程度的斜率,也影响了收入对性别的斜率。

    完 谢谢观看

    展开全文
  • 多元统计分析 中,交互作用是指某因素作用随其他因素水平的不同而不同,两因素同时存在是的作用不等于两因素单独作用之和(相加交互作用)或之积(相乘交互作用)。通俗来讲就是,当两个或多个因素同时作用于一个结局时...

    原文链接:http://tecdat.cn/?p=21892 

    原文出处:拓端数据部落公众号

    引言

    多元统计分析 中,交互作用是指某因素作用随其他因素水平的不同而不同,两因素同时存在是的作用不等于两因素单独作用之和(相加交互作用)或之积(相乘交互作用)。通俗来讲就是,当两个或多个因素同时作用于一个结局时,就可能产生交互作用,又称为效应修饰作用(effect modification)。当两个因素同时存在时,所导致的效应(A)不等于它们单独效应相加(B+C)时,则称因素之间存在交互作用。当A=B+C时称不存在交互效应;当A>B+C时称存在正交互作用,又称协同作用(Synergy)。
    在一个回归模型中,我们想写的是

    当我们限制为线性模型时,我们写

    或者

    但是我们怀疑是否缺少某些因素……比如,我们错过所有可能的交互影响。我们可以交互变量,并假设

    可以进一步扩展,达到3阶

    甚至更多。

    假设我们的变量  在这里是定性的,更确切地说是二元的。

    信贷数据

    让我们举一个简单的例子,使用信贷数据集。

    Credit数据是根据个人的银行贷款信息和申请客户贷款逾期发生情况来预测贷款违约倾向的数据集,数据集包含24个维度的,1000条数据。

    该数据集将通过一组属性描述的人员分类为良好或不良信用风险。
    数据集将通过一组属性描述的人员分类为良好或不良信用风险。

    建立模型

    我们读取数据

    db=Credit

    我们从三个解释变量开始,

    
    reg=glm(Y~X1+X2+X3,data=db,family=binomial)
    summary(reg)

    没有交互的回归长这样

    这里有几种可能的交互作用(限制为成对的)。进行回归时观察到:

    交互关系可视化

    我们可以画一幅图来可视化交互:我们有三个顶点(我们的三个变量),并且可视化了交互关系

    
    plot(sommetX,sommetY,cex=1,axes=FALSE,xlab="",ylab="",
    
    for(i in 1:nrow(indices)){
    segments(sommetX[indices[i,2]],sommetY[indices[i,2]],
    text(mean(sommetX[indices[i,2:3]]),mean(sommetY[indices[i,2:3]]),
    }
    
    text(sommetX,sommetY,1:k)

    这给出了我们的三个变量

    这个模型似乎是不完整的,因为我们仅成对地看待变量之间的相互作用。实际上,这是因为(在视觉上)缺少未交互的变量。我们可以根据需要添加它们

    
    reg=glm(Y~X1+X2+X3+X1:X2+X1:X3+X2:X3,data=db,family=binomial)
    k=3
    theta=pi/2+2*pi*(0:(k-1))/k
    plot(X,Y
    for(i in 1:nrow(indices)){
    segments(X[indices[i,2]],Y[indices[i,2]],
    for(i in 1:k){
    cercle(c(cos(theta)[i]*1.18,sin(theta)[i]*1.18),.18)
    text(cos(theta)[i]*1.35,sin(theta)[i]*1.35,
    points(X,Y,cex=6,pch=1)
    

    这里得到

    如果我们更改变量的“含义”(通过重新编码,通过排列真值和假值),将获得下图

    
    glm(Y~X1+X2+X3+X1:X2+X1:X3+X2:X3,data=dbinv,family=binomial)
    plot(sommetX,sommetY,cex=1
    for(i in 1:nrow(indices)){
    segments(sommetX[indices[i,2]]
    for(i in 1:k){
    cercle(c(cos(theta)[i]*1.18,sin(theta)[i]*1.18)
    
    points(sommetX,sommetY,cex=6,pch=19)
    

    然后可以将其与上一张图进行比较

    使用5个变量,我们增加了可能的交互作用。

    然后,我们修改前面的代码

    
    formule="Y~1"
    for(i in 1:k) formule=paste(formule,"+X",i,sep="")
    for(i in 1:nrow(indices)) formule=paste(formule,"+X",indices[i,2],":X",indices[i,3],sep="")
    reg=glm(formule,data=db,family=binomial)
    plot(sommetX,sommetY,cex=1
    for(i in 1:nrow(indices)){
    segments(sommetX[indices[i,2]],sommetY[indices[i,2]],
    for(i in 1:k){
    cercle(c(cos(theta)[i]*1.18,sin(theta)[i]*1.18)
    points(sommetX,sommetY,cex=6
    

    给出了更复杂的图,

    我们也可以只采用2个变量,分别取3和4种指标。为第一个提取两个指标变量(其余形式为参考形式),为第二个提取三个指标变量,

    formule="Y~1"
    for(i in 1:k) formule=paste(formule,"+X",i,sep="")
    for(i in 1:nrow(indices)formule=paste(formule,"+X",indices[i,2],":X",indices[i,3],sep="")
    reg=glm(formule,data=db,family=binomial)
    for(i in 1:nrow(indices){
    if(!is.na(coefficients(reg)[1+k+i])){
    segments(X[indices[i,2]],Y[indices[i,2]],
    }
    for(i in 1:k){
    cercle(c(cos(theta)[i]*1.18,sin(theta)[i]*1.18),.18)
    text(cos(theta)[i]*1.35,sin(theta)[i]*1.35,
    }
    

    我们看到,在左边的部分(相同变量的三种指标)和右边的部分不再有可能发生交互作用。

    我们还可以通过仅可视化显著交互来简化图形。

    
    for(i in 1:nrow(indices)){
    if(!is.na(coefficients(reg)[1+k+i])){
    if(summary(reg)$coefficients[1+k+i,4]<.1){
    
    

    在这里,只有一个交互作用是显著的,几乎所有的变量都是显著的。如果我们用5个因子重新建立模型,

    
    for(i in 1:nrow(indices))
    formule=paste(formule,"+X",indices[i,2],":X",indices[i,3],sep="")
    reg=glm(formule,data=db,family=binomial)
    
    for(i in 1:nrow(indices){
    if(!is.na(coefficients(reg)[1+k+i])){
    if(summary(reg)$coefficients[1+k+i,4]<.1){
    
    

    我们得到


    最受欢迎的见解

    1.R语言多元Logistic逻辑回归 应用案例

    2.面板平滑转移回归(PSTR)分析案例实现

    3.matlab中的偏最小二乘回归(PLSR)和主成分回归(PCR)

    4.R语言泊松Poisson回归模型分析案例

    5.R语言回归中的Hosmer-Lemeshow拟合优度检验

    6.r语言中对LASSO回归,Ridge岭回归和Elastic Net模型实现

    7.在R语言中实现Logistic逻辑回归

    8.python用线性回归预测股票价格

    9.R语言如何在生存分析与Cox回归中计算IDI,NRI指标

    展开全文
  • 根据实验结果进行直观分析与交互作用分析对比可得: 交互作用分析可以在全面实验中准确找出最优方案。总结了激光切割镍基合金时存在的、显著影响切割质量的交互作用, 两组实验得出的最佳工艺参数以及实验中重要的影响...
  • 方差分析中的多因子交互作用

    千次阅读 2019-06-06 19:40:26
    多因子方差分析的因子交互作用可以这样理解,比如经常吃的消炎药头孢,通常会认为服用三片要比服用一片效果好,但经过实际验证测试发现,男女之间用药效果并不相同。对于男性而言,吃三片的效果好些,而对女性而言,...

           多因子方差分析的因子交互作用可以这样理解,比如经常吃的消炎药头孢,通常会认为服用三片要比服用一片效果好,但经过实际验证测试发现,男女之间用药效果并不相同。对于男性而言,吃三片的效果好些,而对女性而言,吃一片效果要更好。这种情况下,头炮剂量和性别之间便产生了了交互作用

           多因子方差分析中,当交互作用存在时,单纯去研究某个因素的作用已没有意义,需要分别探讨这个变量在另一个因素不同水平上的作用模式。

     

                                                                    有无交互项对方差分析构成的影响

           多因子方差分析可以理解为下图的形式,即模型中,工资是由基准值、受教育程度、性别、受教育程度与性别的交互作用 以及未解释的变量 等几部分构成,这其中便涉及到了多因子交互作用的问题。

            在双因素方差分析模型中,如果模型没有交互项的概念,则模型可以简化理解为:工资=教育程度+性别;如果模型带有交互项的概念,则模型可以简化理解为工资=教育程度+性别+教育程度*性别

                                                                                     是否设置交互项

           多因子方差分析中,是否需要设置交互项呢?

           在控制实验中,方差分析是否含有交互项是很明确的,如果两个因素对实验结果的影响是相互独立的,那么只需考虑主效应,使用交互的方差分析;如果两因素对实验结果的影响非独立,那么就应该使用交互项的方差分析。换个角度说,或者如果模型中只有研究变量和控制变量,此时不需要交互项,如果模型中除了研究变量和控制变量,还有调节变量,那么就需要交互项随机区组设计中,除了主要研究的变量以外,其他因素都是控制变量,只会起到降低方差分量的作用。

           在回顾性实验研究中,由于事前无法对变量进行有效的控制,而且各因素对结果的影响程度也缺乏理论体系的支撑,即变量间的交互行为没有理论判断依据,这时可以只通过检验交互项是否显著来决定模型中是否纳入交互项。

           其实,除非有理论认为交互项没有意义,否则一般都可以通过统计检验交互项的显著性去判断并决定要不要纳入交互项。

     

                                                                        方差分析中解释变量的类型

           方差分析中解释变量有研究变量、控制变量、 调节变量以及中介变量 等几种类型:

    • 研究变量:只在解释类模型中出现,是模型中最为关键的变量,例如营销场景中的销售量这个变量即为研究变量;
    • 控制变量除了研究变量外,任何对Y有影响的变量均为控制变量,这里的控制变量对于研究变量没有调节作用,控制变量只起到承担方差分量的作用。例如教育程度和年龄对收入都有影响,年龄和教育程度可能是相关的,但是年龄的变化对教育程度、对收入不存在影响;
    • 调节变量:举个例子来说明,例如公司福利费的投入对员工忠诚度的改善情况受到员工工资收入高低的影响,那么员工工资收入就是调节变量;
    • 中介变量:如果某个变量通过另一个变量来影响Y,那么另一个变量承担的角色就是中介变量。例如餐厅服务水平的提升能带来客户的满意度,客户的满意度能带来就餐的忠诚度,那么客户满意度就是中介变量。

     

                                                                             因子交互作用的等级

            假如有四个因子,则交互作用可以分为三个等级,一般说的交互作用指的是两两交互,其实两两交互已经不太好解释了,更高层级的交互作用更加难以解释,所以实际场景中多级交互作用基本不会见到。一般因子的交互状态为:无交互作用、正向交互作用以及反向交互作用几种类型。

    我的公众号:Data Analyst

    个人网站:https://www.datanalyst.net/

    展开全文
  • 重庆市税收与经济交互作用的实证分析,张扬兵,崔春林,本文基于1996年-2017年重庆市GDP和两税数据,采用平稳性检验、协整检验和OLS回归对重庆市税收与经济之间的交互作用进行了实证分析。结
  • Python有交互作用的二元方差分析1、Python有交互作用的二元方差分析2、Python代码 #yangbocsu 2021.06.11 科技园7栋 1、Python有交互作用的二元方差分析 七、(本题12分)为了比较3种松树在4个不同的地区的生长情况...

    Python有交互作用的二元方差分析


    #yangbocsu 2021.06.11 科技园7栋

    1、Python有交互作用的二元方差分析

    七、(本题12分)为了比较3种松树在4个不同的地区的生长情况有无差别,在每个地区对每种松树随机地选取5株,测量它们的胸径,得到了如下的数据
    在这里插入图片描述
    树种和地区对树的胸径有无显著影响

    在这里插入图片描述

    展开全文
  • 在既往文章中,我们已经介绍了怎么使用R语言可视化visreg包对交互作用进行可视化分析(见下), 但是使用visreg包后我们对图形的细节掌控力不够,今天我们使用重新绘制手动图形,这在SCI论文中非常实用,几乎可以...
  • 甲醛染毒和染毒恢复阶段诱导型热休克蛋白70的交互作用蛋白分析,魏薇,段燕英,目的 分析鉴定人支气管上皮细胞(HBE)在甲醛染毒和染毒恢复时,诱导型热休克蛋白70(Hsp70)的所有交互作用蛋白,为阐明甲醛暴露条件�
  • 对复杂疾病病因研究中基因-基因(环境)交互作用的3种分析方法进行了比较,剖析了它 们的适用条件和优缺点. 结果表明: 叉生分析简单易... 鉴于这3种方法在分析交互作用时各有其优点,三者联合应用于交互作用分析效 果更佳.
  • 1、数据准备 import urllib.request import matplotlib.pyplot as plt plt.style.use('ggplot') import pandas as pd # 下载同时显示进度条 def jdt(down, pic, all): """... @down : 已经下载的数据块...
  • 交互作用模式下技术创新投资策略分析,夏晖,曾勇,本文假设创新价格受到外部环境的不确定影响,采用实物期权方法将技术创新提供方和采纳方的投资策略放在一个交互模式下进行研究,
  • 月球探测车轮土交互作用实验设计与仿真分析,孙鹏,高峰,为了研制适合月面的车轮结构、提高月球车的牵引通过性和工作可靠性,需要解决车轮与月壤的交互作用这一关键问题。月壤颗粒细小,
  • 在既往文章中,我们已经介绍了怎么使用R语言对交互作用进行可视化分析(见下) 后台有粉丝问我能不能用SPSS,不用代码,直接界面操作绘制logistic回归交互项(交互作用)的可视化分析图。SPSS可以进行计算出数据...
  • 欢迎关注”生信修炼手册”!回归分析最为关联分析中最长使用的一种手段,除了可以进行协变量的校正,还可以分析各种因素间的交互作用,比如SNP与表型,SNP与环境之间的交互。具体是如何实现的呢...
  • 我用DPS做了回归方程,用降维分析得到了交互作用的二次方程。怎么用matlab画这个二次方程的三维
  • 生物学交互作用的评价应该基于是否有相加交互作用, 而流行病学研究中常运用logistic和Cox等广义线性模型, 并纳入乘积项分析因素间交互作用,其是否有意义仅反映相乘交互作用, 并不能反映两因素间相加或生物学交互...
  • 等离子体在PCB工艺中的各凹蚀因素交互作用分析.pdf
  • * 心理治疗过程 TA的治疗阶段 三结束阶段富有价值的完整治疗的最后阶段是结束 传统的心理分析没完没了而作为合约式治疗的TA有明确的时间限制结束治疗是生命必经的一种选择 治疗过程的结束由以下三个不同层面展开 ...
  • 交互作用我们在前面已经说过,就不具体说了。在SCI论文中可以起到画龙点睛,并能进一步挖掘数据之间的亚组关系,进行数据挖掘也非常实用,交互项的可视化能把交互数据之间的关系明白的展示出来,在实际论文中绝对是...
  • 甲醛和苯并(a)芘单独染毒条件下诱导型热休克蛋白70的交互作用蛋白分析,魏薇,段燕英, 目的 分析鉴定人支气管上皮细胞(HBE)在甲醛和苯并(a)芘(BaP)单独染毒时,诱导型热休克蛋白70(Hsp70)的所有交互作用...
  • Flanders互動分析系統輔助軟體介紹 郭慧龍 林建伸 一前言 有效的教學行為不但需運用適當的教學理論教師本身的教學風格及教 學行為對教學成效也有相當深遠地影響一位初執教鞭的教師往往需要相當 的時間和心力才能發展...
  • 基于混合像元光谱信息的正交试验设计与交互作用分析,韩阳,,混合像元问题不仅是遥感技术向定量化深入发展的重要障碍,而且也直接影响计算机处理地物的自动识别和分类精度。来自非朗伯体表面
  • 镍基单晶合金温度梯度下疲劳-蠕变交互作用的有限元分析,于庆民,,本文采用考虑运动强化的晶体塑性模型研究镍基单晶合金的疲劳蠕变交互作用,用有限元方法模拟了在温度梯度下单晶合金薄壁圆管模拟
  • 我用DPS做了回归方程,用降维分析得到了交互作用的二次方程。怎么用matlab画这个二次方程的三维呢 我看了人家论文上有画的,也没说什么软件画的类似于这样的 我用matlab来画,老是画不出来,老是提示这样的错误...
  • 论文研究-供应链复杂交互作用Agent的资源流分析 .pdf,
  • 在仿真研究的基础上对 ECT传感器的4个重要参数即极板张角θ,绝缘管道材料的 相对介电常数εpw,绝缘管道壁厚度 R2-R1,以及屏蔽罩与电容极板间的间距 R3-R2,进行了具 有交互作用的正交试验,用方差分析法得出了这4个...

空空如也

空空如也

1 2 3 4 5 ... 20
收藏数 248,069
精华内容 99,227
关键字:

交互作用图怎么分析