精华内容
下载资源
问答
  • 调用宏进行典型相关分析 1、按File→New→Syntax的顺序新建一个语句窗口。在语句窗口中输入下面的语句: INCLUDE 'C:\Program Files (x86)\IBM\SPSS\Statistics\22\Samples\Simplified Chinese\Canonical ...
    • 数据情况

    • 调用宏进行典型相关分析

    1、按File→New→Syntax的顺序新建一个语句窗口。在语句窗口中输入下面的语句:

    INCLUDE 'C:\Program Files (x86)\IBM\SPSS\Statistics\22\Samples\Simplified Chinese\Canonical correlation.sps'.

           CANCORR SET1=x1 x2 /

           SET2=y1 y2 y3 / .

    2、两组变量之间的相关性

    3、两组变量之间的相关性矩阵

    4、给出典型相关系数:

    由图可以看到,第一典型相关系数是0.617,第二典型相关系数是0.180

    5、典型相关性的显著性检验

    在0.05的显著性水平下,只有第一对典型相关是显著的

    6、两组典型变量的标准化系数

    由于本例中数据单位并不统一,因此我们使用两组典型变量标准化系数

    来自闭卷的第一典型变量为U1=-0.049X1-0.044X2

    来自开卷的第一典型变量为V1=-0.849X3-0.470X4+0.446X5

    从而闭卷的典型变量主要由X1和X2共同决定,但是开卷的典型变量主要由X3决定

    7、典型冗余分析

    1. 闭卷的变量被自身的第一典型变量解释了71.1%。
    2. 开卷的变量被自身的第一典型变量解释了44%5。
    展开全文
  • 典型相关分析

    千次阅读 2018-11-28 11:01:17
    典型相关分析中的CANCORR过程。

    典型相关分析是分析两组(多个)变量相关性的有效方法。基本思想是从两组变量中提取出可以代替原始变量的少数几个关键变量,然后通过分析这些变量之间的相关性来表示原始数据之间的相关性。

    CANCORR过程

    用于找到两组变量的典型变量,计算其典型相关系数。
    格式:

    proc cancorr data=数据集名;
    var variables; *指定第一组变量,必须为数值型;
    with variables; *指定第二组变量,必须为数值型;
    

    下表为四川省2003年各地区建筑业企业资产和负债数据,对其进行典型相关分析。

    代码:

    data test;     /*创建数据集*/
    input x1-x4 y1-y3; *分别为年末资产合计、年末负债合计;
    cards;
    6468979 4252306 1502374 149401 3666559 3483680 182879
    264784 165117 82666 10606 129137 124129 5008
    535969 356595 160736 3300 376477 359502 16975
    407482 232955 157959 8735 167082 153489 13593
    602889 425329 144505 15308 354905 346936 7969
    798710 530354 168332 61141 489480 469104 20376
    239813 121881 84605 25549 86106 72543 13563
    340399 174097 118905 35373 136471 101641 34830
    319118 198690 89021 15050 166321 152220 14101
    341497 192231 97259 19342 142127 135096 7031
    446381 253183 163832 19914 192986 178051 14935
    265905 142114 91898 20301 112980 96751 16229
    337206 211554 98170 11164 150469 128562 21907
    272596 131431 129071 6874 82698 75717 6981
    216802 111229 92323 3927 79823 69380 10443
    117326 66204 41121 6010 53386 37022 16364
    188150 123474 49978 7585 98383 85168 13215
    189887 126962 53175 7003 99807 93358 6449
    ;
    run;
    proc cancorr data=test; /*典型相关分析*/
    var x1-x4;      /*指定第一组的分组变量*/
    with y1-y3;     /*指定第二组的分组变量*/
    run;
    

    给出了典型相关系数的值:

    下图为第一和第二组数据中提取出来的典型变量,它们为原始数据中变量的线性组合,表中显示了系数:

    以下是基于标准化后的数据得到的结果:

    下图显示了各种相关性的信息:

    展开全文
  • 详细讲解如何用matlab的内置函数做线性分析,有例子,方法非常简单,对做线性分析的朋友很有用
  • 典型相关分析 源代码 Matlab的程序
  • 基于安徽省水泥行业B2B市场顾客的抽样调查数据,运用典型相关分析法实证研究水泥行业顾客生命周期的影响因素。利用SPSS13.O统计分析软件分析实证数据,通过因子分析、典型相关分析等方法研究顾客满意、顾客价值、...
  • 数学建模——典型相关分析相关SPSS操作

    万次阅读 多人点赞 2019-10-31 08:44:26
    文章目录一、引述1.概念2.示例说明 一、引述 ...典型相关分析用于研究两组变量(每组变量中都可能有多个指标)之间相关关系的一种多元统计方法。它能够揭示出两组变量之间的内在联系。 2.示例说明 ...

    一、引述

    1.概念

    • 典型相关分析用于研究两组变量每组变量中都可能有多个指标)之间相关关系的一种多元统计方法。它能够揭示出两组变量之间的内在联系。
    • 在一元统计分析中,用相关系数来衡量两个随机变量之间的线性相关关系用复相关系数研究一个随机变量和多个随机变量的线性相关关系。然而,这些统计方法在研究两组变量之间的相关关系时却无能为力。比如要研究生理指标与训练指标的关系居民生活环境与健康状况的关系人口统计变量(户主年龄、家庭年收入、户主受教育程度)与消费变量(每年去餐馆就餐的频率、每年出外看电影的频率)之间是否具有相关关系 ?阅读能力变量(阅读速度、阅读才能)与数学运算能力变量(数学运算速度、数学运算才能)**是否相关?这些多变量间的相关性如何分析?

    2.何为两组变量呢?

    下图是测量的20名学生的生理指标与训练指标。第一组是生理指标变量,有体重、腰围和脉搏;第二组是训练指标变量,有引体向上次数、起坐次数和跳跃次数。要求测量生理指标与训练指标这两组变量之间的关系。
    示例
    在本题中,如果我们直接对这些变量(诸如体重、胸围等变量)的相关性进行两两分析,很难得到题干所要求的测量生理指标与训练指标这两组变量之间的关系。所以,我们引入一种新的分析方法:典型相关分析。

    3. 本文主要内容

    • 本文主要目的在于介绍典型相关分析的基本思想和解题步骤以及讲解如何使用SPSS24.0解决该类数学建模问题。
    • 如果要进行论文写作,我们需要掌握典型相关分析的原理及方法。这一部分,我将在后面的专栏中结合相关获奖论文进行说明。

    二、典型相关分析

    1. 基本思路

    • 在上例中,我们可以采用这样的解决思路:由于两组变量中都含有多个变量指标,每组变量中定然会有代表性的变量。这样,找到代表性的变量,我们便可以把 多个变量与多个变量之间的相关变成两个具有代表性的变量之间的相关
    • 代表性变量:能较为综合、全面的衡量所在组的内在规律。
    • 一组变量最简单的综合形式就是该组变量的线性组合

    2. 基本思想

    典型相关分析由Hotelling提出,其基本思想和主成分分析非常相似

    • 首先在每组变量中找出变量的线性组合,使得两组的线性组合之间具有最大的相关系数
    • 然后选取和最初挑选的这对线性组合不相关的线性组合,使其配对,并选取相关系数最大的一对。
    • 如此继续下去,知道两组变量之间的相关性被提取完毕为止。
    • 被选出的线性组合配对称为典型变量,它们的相关系数称为典型相关系数。典型相关系数度量了这两组变量之间的强度。

    3. 基本思路

    • 一般情况下,假设
      在这里插入图片描述
      是两个相互关联的随机变量,分别在两组变量中选取若干有代表性的综合变量Ui、Vi,使得每一个综合变量是原变量的线性组合,即
      在这里插入图片描述

    • 当然,综合变量的组数是不确定的,如果第一组就能代表原样本数据大部分的信息,那么一组就足够了。如果第一组反映的信息不够,我们就需要找第二组数据。

    • 为了让所找到的第二组数据的信息更加有效,我们需要保证第二组数据和第一组数据不相关,即
      在这里插入图片描述

    • 对于数学的部分,我就不再过多阐述(无力.jpg)。感兴趣的同学可以自行查找资料。上面一点便是我们所要达到的终极目的。

    三、关键步骤(看不懂的话,可以先看四)

    1. 假设我们所研究的两组数据服从联合正态分布
    2. 对这两组变量的相关性进行检验(构造似然比统计量)
      • H0:两组变量的协差阵为0(两组变量无关);H1:两组变量的协差阵不为0(两组变量有关)
      • 用于检验的似然比统计量
        在这里插入图片描述
      • p值小于0.5(0.1)表示在95%(90%)的置信水平下拒绝原假设, 即认为两组变量有关。
    3. 确定典型相关变量的个数(直接看典型相关系数对应的p值即可)
    4. 利用标准化后的典型相关变量分析问题
      为了消除量纲和数量级别的影响,必须对数据先做标准化变换处理,然后再做典型相关分析。
    5. 进行典型载荷分析
    6. 计算前r个典型变量对样本总方差的贡献

    四、使用SPSS进行典型相关分析

    1.导入数据

    在这里插入图片描述
    在这里插入图片描述
    在这里插入图片描述

    2. 检验数据类型

    在这里插入图片描述
    点击左下角的变量视图
    在这里插入图片描述
    在这里插入图片描述

    3. 对数据进行典型相关分析

    在这里插入图片描述
    在这里插入图片描述
    按照题干要求将变量进行分组(按住ctrl,可以进行多个选中)
    在这里插入图片描述
    之后便得到如下内容:
    在这里插入图片描述

    4.导出分析结果

    在这里插入图片描述
    在这里插入图片描述
    于是我们便在桌面上得到了该文件。
    在这里插入图片描述

    6.修改原文件中表格的名称

    1. 下面是刚打开的原文件表格名称
      在这里插入图片描述
    2. 将文件中的表格进行重新命名,以免在后续的操作造成干扰。
      • 将所有的集合1修改成生理指标,集合2修改成训练指标。
      • 修改表格名称:典型相关性 >>> 典型相关系数
      • 修改表格内容:相关性 >>> 相关系数;显著性 >>> p值
        在这里插入图片描述
        在这里插入图片描述
        在这里插入图片描述
        在这里插入图片描述
        注:以上图片,便是我们在建模中经常使用的表格。

    五、对结果进行分析

    1.分析典型相关系数表

    在这里插入图片描述

    • 该表格的最后一列代表着检验统计量所对应的p值我们需要通过它确定典型相关系数的个数。
    • 我们知道置信水平有三个:90%、95%、99%,其对应的显著性水平分别为 0.1、0.05、0.01.
    • 观察第一行的p值,我们发现 0.05 < 0.064 < 0.1. 因此,我们知道在95%的置信水平下,生理指标与训练指标之间不存在相关性;而在90%的置信水平下,生理指标与训练指标之间存在相关性,且第一对典型变量相关性显著
    • 我们接着观察后面两个p值:0.949和0.775。说明第二对和第三对典型变量相关性不显著。
    • 由此我们可以确定典型相关系数的个数为1,即第一对典型变量的相关系数。

    2. 分析标准化典型相关系数

    • 在该分析中,我们需要写出标准化的典型变量,其个数要根据上一个分析结果所得到的典型相关系数的个数来确定。

    • 在上一个分析结果中我们知道,我们知道我们只需要第一对典型变量的相关系数,因此我们可以将第二、三对的典型变量的相关系数删除。
      在这里插入图片描述
      由此,可得到的标准化的第一对典型变量:
      在这里插入图片描述
      其中, Zi(1)和Zj(2)分别为原始变量Xi和Yj标准化后的结果。

    • 典型变量每个分量前面的系数代表着重要程度,可结合典型相关系数进行分析。

    • 结论

      • 在生理指标中,由于X2(腰围)的绝对值最大,反映生理指标的典型变量主要由腰围决定;
      • 在训练指标中,由于Y2(起坐次数)的绝对值最大,说明训练指标的典型变量主要由起坐次数所决定。
      • 同时,由于两个典型变量中腰围和起坐次数的系数是异号的(腰围为负,起坐次数为正),反映腰围和起坐次数的负相关,即腰围越小则起坐次数越多。这和客观事实是相符的。

    3. 分析典型载荷

    说明:为了节省篇幅,在这里笔者只分析生理指标的典型载荷,读者可以模仿分析训练指标的典型载荷。

    1. 分析典型载荷的目的:进行典型载荷分析有助于更好解释分析已提取的p对典型变量所谓的典型载荷分析是指原始变量与典型变量之间相关性分析
      在这里插入图片描述
    2. 分析结果
      以上结果说明生理指标的第一典型变量与体重的相关系数为-0.621,与腰围的相关系数为-0.925,与脉搏的相关系数为0.333. 从另一方面说明生理指标的第一对典型变量与体重、腰围负相关,而与脉搏正相关。其中与腰围的相关性最强生理指标的第一对典型变量主要反映了体型的胖瘦

    4. 分析已解释的方差比例

    1. 分析目的
      在进行样本典型相关分析时,我们也想了解每组变量提取出的典型变量所能解释的该组样本总方差的比例,从而定量测度典型变量所包含的原始信息量的大小
      在这里插入图片描述
    2. 数据说明(从左到右)
      1. 生理指标被自身的典型变量解释的方差比例;
      2. 生理指标被训练指标的典型变量解释的方差比例;
      3. 训练指标被自身的典型变量解释的方差比例;
      4. 训练指标被生理指标的典型变量解释的方差比例。
    3. 分析结果
    • 生理指标样本方差由自身3个典型变量解释的方差比例分别为:
      • 第一典型变量解释的方差比例:0.451;
      • 第二典型变量解释的方差比例:0.246,
      • 第三典型变量解释的方差比例:0.302;
    • 训练指标样本方差由自身3个典型变量解释的方差比例分别为:
      • 第一典型变量解释的方差比例:0.408;
      • 第二典型变量解释的方差比例:0.434;
      • 第三典型变量解释的方差比例:0.157;

    六、资料链接

    1. 资料内容:health.xlsx
      链接:https://pan.baidu.com/s/1r3JujIEG3PCfc-K5WskAag
      提取码:3exf
    展开全文
  • 一、为什么要用典型相关分析 典型相关分析研究的是两组变量之间的关系,如{x1, x2, x3}和{y1, y2, y3}两组变量之间的关系。 具体来说,变量间的相关关系可以分为以下几种: 两个变量间的线性相关关系,可用简单相关...

    一、为什么要用典型相关分析

    典型相关分析研究的是两组变量之间的关系,如{x1, x2, x3}和{y1, y2, y3}两组变量之间的关系。
    具体来说,变量间的相关关系可以分为以下几种:

    • 两个变量间的线性相关关系,可用简单相关系数
    • 一个变量与多个变量之间的线性相关关系,可用复相关系数。
    • 多个变量与多个变量间的相关关系,使用典型相关关系

    二、典型相关分析的基本原理

    典型相关分析在研究两组变量间的线性相关关系时,将每一组变量作为一个整体进行分析。它采用类似于主成分分析(PCA)的方法,在每一组变量中都选择若干个有代表性的综合指标,这些综合指标是原始变量的线性组合,代表了原始变量的大部分信息,且两组综合指标的相关程度最大。

    简单地说,对于{x1, x2, x3}和{y1, y2, y3}两组变量,我们先求出能体现x和y最大相关性的一对变量u1,v1:u1是{x1, x2, x3}的线性组合,v1是{y1, y2, y3}的线性组合。

    然后再类似的求第二、第三对典型相关变量,然后我们就得到两组典型相关变量{u1,u2,u3}和{v1,v2,v3}。三对典型相关变量是彼此不相关的,它们反应了变量组x和y之间的相关关系。

    当两组变量的数量不一致时,那么可提取到的典型变量个数就等于较少数据组的变量个数,如对于{x1, x2, x3}和{y1, y2},可提取的典型变量为2个。

    三、实例分析

    1.数据

    某个研究人员收集了600名大学新生的三个心理变量,四个学术变量(标准化考试成绩) 。他希望研究者3个心理变量与4个学术变量间的相关关系。
    也就是说,我们要分析

    • 变量组x{外向倾向,自我概念,动机水平}
    • 变量组y{阅读成绩,写作成绩,数学成绩,理科成绩}

    之间的相关关系。数据如下图所示:
    在这里插入图片描述

    2.分析

    在SPSS25中,选择:分析→相关→典型相关性,在选项中勾选成对相关性
    (备注:SPSS23前的版本没有这个选项,需要使用自定义宏)
    在这里插入图片描述

    在这里插入图片描述

    3.结果

    在这里插入图片描述
    此图反映了各变量间的相关系数,从中可以看出不同变量间的相关程度。
    如果组内变量间的相关系数高,说明两者包含的信息有重叠部分;如果组间变量相关系数高,则说明两者有一定相关性(- -!)。

    在这里插入图片描述
    此图给出了典型相关系数及其检验,结果表明前两个典型相关系数是显著的,因此我们选择前两个典型相关变量进行解释。
    具体来说,第一对典型相关变量的相关系数是0.446,p< .001;第二对典型相关变量的相关系数是0.153,p= .025

    在这里插入图片描述
    在这里插入图片描述
    上图分别是两组变量的标准化相关系数和未标准化的相关系数。
    根据此图,可以写出各典型变量的表达式,如对于第一对典型变量u1和v1:
    其标准化的表达式为(Z外向倾向表示将该变量标准化后的值):

    u1 = -0.838*Z外向倾向+0.167*Z自我概念-0.428*Z动机水平
    v1 = -0.445*Z阅读成绩-0.536*Z写作成绩-0.183*Z数学成绩+0.037*Z理科成绩
    

    非标准化的表达式为

    u1 = -1.250*外向倾向+0.237*自我概念-1.249*动机水平
    v1 = -0.044*阅读成绩-0.055*写作成绩-0.019*数学成绩+0.004*理科成绩
    

    PS:再讲解一下两者的一些不同之处:

    • 标准化的系数由于经过标准化,因此系数相互之间是可比的,用处是用于比较不同自变量对应变量的影响程度。比如在set1的标准化系数中,外向倾向的系数是-0.838,自我概念的系数是0.167,因此我们可以认为外向倾向对成绩的影响比自我概念影响更大。

    • 而未标准化的系数因为每个变量没有标准化,量纲不一样,因此不能直接用系数大小比较自变量贡献程度,它的用处是可以用于计算CCA得分,(直接用系数乘以原始数据)

    在这里插入图片描述
    上图是冗余分析的结果,它说明各典型变量对各变量组方差解释的比例。

    以上是个人对典型相关分析学习的总结笔记,如有错误,欢迎讨论和指正。

    展开全文
  • 典型相关分析系列博文: 典型相关分析(Canonical correlation analysis)(一):基本思想 、复相关系数、偏相关系数 典型相关分析(Canonical correlation analysis)(二):原始变量与典型变量之间的相关性 ...
  • 采用典型相关分析法,对两组转动矩阵进行求解; 使用转动矩阵, 求解两点云间刚性变换的旋转矩阵和平移向量, 实现了点云的配准。利用协方差矩阵特征值的比例开方值, 对待配准点云进行等比例放大, 完成了仿射配准。当...
  • 典型相关分析(Matlab实现函数)

    万次阅读 多人点赞 2018-08-28 15:23:57
    先附上自己认为写的比较好的一篇博客。 ... 同时要指出自己博文的问题:对于Matlab中canoncorr中的...典型相关分析  不仅需要考虑两个变量之间的相关程度,而且还需要考察多个变量与多个变量之间的相关性。  ...
  • 对应分析典型相关分析笔记_数学建模系列这里的对应分析典型相关分析仍然用于降维,因子分析的进阶! 对应分析:在同一张图上,直观的展现样本和属性的聚类效果,同时省去因子选择、因子轴旋转等复杂过程。具体...
  • 在SAS学习过程中记下的笔记,一些初级的过程,比较适合SAS初学, 能做的分析有描述性统计+线性回归+logistic回归+生存分析+判别分析+聚类分析+主成分+典型相关分析等等。
  • 然后采用核典型相关分析(kernel canonical correlation analysis,KCCA)来提取独立分量与位置信息之间的典型相关特征;最后结合传统定位算法如加权K近邻(weighted K nearest neighbors,WKNN)、支持向量机...
  • 用于特征降维,特征融合,相关分析等多元数据分析的广义典型相关分析(GCCA)Matlab代码实现。
  • 典型相关分析相关资料

    万次阅读 多人点赞 2012-05-20 17:29:14
    典型相关分析的基本思想 Canonical Correlation Analysis   CCA典型相关分析 (canonical correlation analysis)利用综合变量对之间的相关关系来反映两组指标之间的整体相关性的多元统计分析方法。它的基本原理...
  • 首先对传统局部方向模式(LDP)进行了改进,提出BSLDP来获取掌纹掌脉图像的纹理方向特征,然后基于典型相关分析法实现掌纹掌脉特征的有效融合,最后根据融合特征向量间的卡方距离进行匹配识别,并在CASIA-M图库及自建...
  • SPSS典型相关分析案例

    万次阅读 2014-12-10 17:58:20
    相关分析,两个变量之间密切程度的一种常见统计分析方法,能够简单有效说明两变量间存在什么关系,这些关系的常见描述语句有:线性相关、正相关、负相关等。 【数据集说明】 某公司员工的基本情况,数据集含3...
  • 数学建模6 典型相关分析

    千次阅读 2020-02-03 00:03:38
    1、典型相关分析和皮尔逊相关系数/斯皮尔曼相关系数对比 皮尔逊相关系数和斯皮尔曼相关系数针对的是两个变量的相关性,典型相关分析针对的是两组变量进行相关分析,每组变量还可以由多个变量构成。 例如:下图求...
  • R语言 典型相关分析

    2014-05-27 22:52:00
    #典型相关分析##典型相关分析是用于分析两组随机变量之间的相关程度的一种统计方法,它能够有效地揭示两组随机变量之间的相互(线性依赖)关系#例如 研究生入学考试成绩与本科阶段一些主要课程成绩的相关性#将研究...
  • 典型相关分析系列博文: 典型相关分析(Canonical correlation analysis)(一):基本思想 、复相关系数、偏相关系数 典型相关分析(Canonical correlation analysis)(二):原始变量与典型变量之间的相关性 ...
  • 典型相关分析原理(CCA)

    万次阅读 多人点赞 2020-01-21 12:29:17
    CCA典型相关分析 (canonical correlation analysis)利用综合变量对之间的相关关系来反映两组指标之间的整体相关性的多元统计分析方法。它的基本原理是:为了从总体上把握两组指标之间的相关关系,分别在两组变量中...
  • 针对线性典型相关分析法不能揭示变量间非线性关系 ,因而不适用于混沌系统等问题 ,将核典型相关分析与径向基函数神经网络相结合 ,提出了一种改进的核典型相关分析方法以解决映射空间样本未知及逆矩阵求解困难等问题。...
  • 典型相关分析(CCA)

    万次阅读 多人点赞 2014-09-14 22:12:17
    典型相关分析的基本思想 Canonical Correlation Analysis CCA典型相关分析 (canonical correlation analysis)利用综合变量对之间的相关关系来反映两组指标之间的整体相关性的多元统计分析方法。它的基本原理...
  • 典型相关分析(CCA)简述

    千次阅读 2020-10-24 09:44:18
    典型相关分析(Canonical Correlation Analysis)是研究两组变量之间相关关系的一种多元统计方法,它能够揭示出两组变量之间的内在联系。         在一元统计分析中,用相关系数来...
  • 典型相关分析系列博文: 典型相关分析(Canonical correlation analysis)(一):基本思想 、复相关系数、偏相关系数 典型相关分析(Canonical correlation analysis)(二):原始变量与典型变量之间的相关性 、...
  • 典型相关分析matlab实现代码提取TCGA数据以进行生存分析的脚本。 有关与癌症有关的更多说明,请参见 资料说明 可通过,获取公开数据。 首先,安装BiocManager::install("CNTools") ,克隆存储库git clone ...
  • 看文章《科学学研究》2010年8月一片文章时,看到典型相关分析的研究,顿时傻了,过去没学过啊。看别人还是用spss做的统计分析就更傻了,好像没哪个老师讲过这个分析。有点云里雾里。还是赶紧学习一下吧。最后那个sas...
  • 一、PCA主成分分析: 1.我们希望对数据进行有损压缩,即将属于R^n的x投影为属于R^l的c,有编码函数f(x)=c,使得损失的信息尽量少。同时有对应的解码函数g(c)约等于x。 2.PCA由我们确定的解码函数而定,为了简化...
  • 典型相关分析(CCA)相关资料

    千次阅读 2012-11-05 09:34:29
    典型相关分析的基本思想 Canonical Correlation Analysis CCA典型相关分析 (canonical correlation analysis)利用综合变量对之间的相关关系来反映两组指标之间的整体相关性的多元统计分析方法。它的基本原理是...

空空如也

空空如也

1 2 3 4 5 ... 20
收藏数 212,267
精华内容 84,906
关键字:

典型相关分析实例结果分析