精华内容
下载资源
问答
  • 因子分析与对应分析

    2012-08-17 20:29:32
    ppt课件 spss因子分析与对应分析
  • 对应分析

    万次阅读 多人点赞 2018-10-21 17:58:45
    对应分析的提出:因子分析的不足 因子分析法分为R型因子分析和Q型因子分析。R型因子分析研究变量(指标)之间的相关关系,Q型因子分析研究样本之间的相关关系。 有时不仅关心变量之间或样本之间的相关...
    对应分析的提出:因子分析的不足
    • 因子分析法分为R型因子分析和Q型因子分析。R型因子分析研究变量(指标)之间的相关关系,Q型因子分析研究样本之间的相关关系。
    • 有时不仅关心变量之间或样本之间的相关关系,还关心变量和样本之间的对应关系,这是因子分析方法不能解释的。
    对应分析(correspondence analysis)概念
    • 定义:研究样本和变量之间的关系
    • 作用:对应分析是分析两组或多组因素之间关系的有效方法,在离散情况下,建立因素间的列联表来对数据进行分析。
    • 应用条件:在对数据作对应分析之前,需要先了解因素间是否独立。如果因素之间相互独立,则没有必要进行对应分析

                            

                            

     

    对应分析基本原理

                       

     

                      

     

    对应分析计算步骤
    • Q型和R型因子分析分别反映了数据的不同方面,他们之间必然有内在的联系,对应分析通过巧妙的数学转换,将Q型和R型因子分析有机地结合起来
    • 即通过求过渡矩阵Z,从而有变量差矩阵A=Z'Z与样本的协方差矩阵B=ZZ'.而矩阵A和B有相同的非零特征根,记为\lambda _1\geq \lambda _2\geq ...\geq \lambda _p. 记矩阵A的特征根\lambda _i,特征向量为U_i,矩阵B对应的特征向量就是ZU_i=V_i

                  

                   

    对应分析注意问题
    • 不能用于相关关系的假设检验
    • 维度由变量所含的最小类别决定
    • 对极端值敏感性研究
    • 研究对象要有可比性
    • 变量的类别应涵盖所有情况
    • 不同标准化分析的结果不同
    展开全文
  • 多重对应分析spss多重对应分析操作方法.pdf
  • 1 聚类分析 聚类分析这种多元统计分析方法,用于定量分析指标或样品的分类问题。在一个数据样本中,不同的样本具有各方面的差异,如果目标是对其进行分组,可根据一批样品的多个观测指标,找出用于度量变量之间相似...

    1 什么是对应分析?

    在社会科学的数量研究中,人们经常会对品质型(属性)变量(定类尺度或定序尺度)进行分析,研究两个或多个品质型变量之间的相关关系。


    这里有必要说一下,什么是品质变量,这是一个统计术语,《统计学原理》中是这样解释的

    变量是说明现象某种属性和特征的名称。可分为品质变量和数值变量。

    品质变量就是品质标志(品质标志只能用文字进行描述)

    在这里插入图片描述

    而数量变量包括数量标志和指标,数量变量可以分为连续变量和离散变量。

    连续变量的数值通过连续登记取得,数值表现为无穷小数(如身高,体重);
    离散变量的数值通过间断登记取得,数值表现为整数(如学校个数)。


    对于研究两个属性变量之间的各种状态或是相关关系,常常用列联表的形式来呈现。

    例如1:为了解消费者对公司产品的满意度情况,需要针对不同职业的消费者进行调查。(该问题中消费者的满意度与其职业均是定类的品质型变量)

    在这里插入图片描述

    例如2:利用超市销售数据研究其销售水平与超市促销方式之间的关系。(该问题中销售水平和促销方式均是品质型变量,其中销售水平为定序变量,促销方式为定类变量)

    例如3:分析顾客职业与购买汽车品牌之间的关系,研究不同客户群对汽车的喜爱偏好。(该问题中顾客职业和汽车品牌均是定类的品质型变量)

    例如4
    在这里插入图片描述
    上述这些例子,基本都属于对两个分类变量间的关系进行分析,通常采用频数统计、卡方拟合优度检验(判断两个变量是否独立)、二分类logistic模型等进行分析

    但是

    当研究的分类变量类别较多或者分类变量的个数较多时,就很难透过列联表直观地揭示出变量之间的联系以及变量各分类之间的联系。

    例如,这里属性变量A有n个分类值,属性变量B有p个分类值,如果 n 、p 都较大

    这时交叉列联表行列数剧增,列联表频数的形式变得复杂,不易于对列联表进行直观地观察或者建模。(列多行少这种情况也不易于卡方检验)在这里插入图片描述

    此时就可以利用降维的思想来简化列联表的结构

    通常,对于降维方法我们一般会想到主成分分析或者因子分析,这两种方法都是用少数的综合变量提取原始变量大部分信息的有效方法。

    但是因子分析这种方法存在一定的不足,就是

    在因子分析中,Q型、R型分析针对的对象不同,R型因子分析研究变量(指标)之间的相关关系,Q型因子分析研究样本之间的相关关系,这两种分析方法往往是相互对立的,必须分别对样本和变量进行处理。(变量是一列,样本是一行)

    因此,不能同时进行 R型因子分析和 Q型因子分析,这是因子分析的一大局限;

    有时不仅关心变量之间或样本之间的相关关系,还关心变量和样本之间的对应关系,这是因子分析方法不能解释的。https://blog.csdn.net/mengjizhiyou/article/details/83243248

    另一方面,当 n 或者 p 较大时,单独使用因子分析会极大增加计算量。

    这种情况怎么办呢?

    这时就该本文的主角登场啦——对应分析(冲鸭)

    啥是对应分析?

    对应分析也称为关联分析、R-Q型因子分析,它克服了因子分析的缺点,综合R型和Q型因子分析的优点同时对交叉列联表中的行与列进行处理

    利用降维的思想达到简化数据结构的目,寻求以低维图形表示数据表中行与列之间的关系,是特别适合于多分类属性变量研究的一种多元统计分析方法。(广泛应用于市场分析、产品定位、广告研究、社会学等)

    对应分析为我们可以提供三个方面的信息

    • 变量之间的信息
    • 样本之间的信息
    • 变量与样本之间的信息

    上述三方面信息都可以通过二维图呈现出来

    • 当对两个分类变量进行的对应分析称为简单对应分析
    • 对两个以上的分类变量进行的对应分析称为多重对应分析

    2 对应分析的基本思想

    该方法的基本思想就是将一个列联表的行和列中各元素的比例结构以点的形式在较低维的空间中表示出来。(列联表的每一行及每一列均以二维图上的一个点来表示,以直观、简洁的形式描述属性变量各种状态之间的相互关系及不同属性变量之间的相互关系。)

    对应分析将变量及变量之间的联系同时反映在一张二维或三维的散点图上,并使联系密切的类别点较集中联系疏远的类别点较分散;通过观察对应分布图就能直观地把握变量类别之间的联系。


    例子:研究轿车特征与用户特征之间的联系(这里引用自:对应分析

    在这里插入图片描述

    在这里插入图片描述

    从这个例子可以看出,对应分析的一大特点就是它可以在一张二维图上同时表示出属性变量的各种状态,以直观描述原始数据结构。

    对于该方法,在减少维度方面与因子分析相似,在作分布图方面与多维尺度方法相似

    那么现在有一个问题就是,如何将多个类别点表示在低维空间或者说二维图中呢?

    3 对应分析的基本步骤

    对应分析法整个处理过程由两部分组成:列联表和关联图(行列变量分类的对应分布图)。

    因此,对应分析大致有四大步骤,分别为:

    1. 编制交叉列联表
    2. 根据原始矩阵进行对应变换
    3. 行变量和列变量的分类降维处理
    4. 绘制行列变量分类的对应分布图

    3.1 编制 样品-变量 交叉列联表

    首先是编制两个品质变量的交叉列联表,涉及的两个变量分别称为行变量和列变量

    比如,编制 顾客职业与购买汽车的品牌 的列联表,其中 顾客职业A 是行变量( n 个类或者 n 个样品),购买汽车的品牌B 是列变量,( p 个类或者 p个变量)
    在这里插入图片描述

    在上表中,

    < n i . = n i 1 + n i 2 + ⋯ + n i p n . j = n 1 j + n 2 j + ⋯ + n n j \left< \begin{array}{l} n_{i.}=n_{i1}+n_{i2}+\cdots +n_{ip}\\ \\ n_{.j}=n_{1j}+n_{2j}+\cdots +n_{nj}\\ \end{array} \right. ni.=ni1+ni2++nipn.j=n1j+n2j++nnj

    右下角元素 n n n 是所有频数的总和,即

    n = n 1. + n 2. + ⋯ + n n . = n . 1 + n . 2 + ⋯ + n . p n=n_{1.}+n_{2.}+\cdots +n_{n.} =n_{.1}+n_{.2}+\cdots +n_{.p} n=n1.+n2.++nn.=n.1+n.2++n.p

    3.2 根据原始矩阵进行对应变换

    将上述矩进行规格化处理得到新的矩阵,即对应矩阵 P P P ,也称概率矩阵,令
    p i j = n i j n ,   p i . = ∑ j = 1 p p i j ,   p . j = ∑ i = 1 n p i j p_{ij}=\frac{n_{ij}}{n}\text{,\\\\\\ }p_{i.}=\sum_{j=1}^p{p_{ij}}\text{,\\\\\\ }p_{.j}=\sum_{i=1}^n{p_{ij}} pij=nnij pi.=j=1ppij p.j=i=1npij

    在这里插入图片描述

    这里 p i j p_{ij} pij 可以解释为概率

    这里的卡方检验如下,如果 A 与 B 相互独立,满足 p i j = p i . × p . j p_{ij}=p_{i.}\times p_{.j} pij=pi.×p.j,那么可以提出以下假设问题:

    H 0 :   A 与 B 相互独立 ⇔ H 1 :   A 与 B 不独立  H_0:\ A\text{与}B\text{相互独立}\Leftrightarrow H_1:\ A\text{与}B\text{不独立\ } H0: AB相互独立H1: AB不独立 
    此时卡方统计量为

    χ 2 = n ∑ i = 1 n ∑ j = 1 p ( p i j − p i . × p . j ) 2 p i . × p . j ∼ χ 2 ( n − 1 ) ( p − 1 ) \chi ^2=n\sum_{i=1}^n{\sum_{j=1}^p{\frac{\left( p_{ij}-p_{i.}\times p_{.j} \right) ^2}{p_{i.}\times p_{.j}}\sim \chi ^2\left( n-1 \right) \left( p-1 \right)}} χ2=ni=1nj=1ppi.×p.j(pijpi.×p.j)2χ2(n1)(p1)

    这里称
    总惯量 = ∑ i = 1 n ∑ j = 1 p ( p i j − p i . × p . j ) 2 p i . × p . j \text{总惯量}=\sum_{i=1}^n{\sum_{j=1}^p{\frac{\left( p_{ij}-p_{i.}\times p_{.j} \right) ^2}{p_{i.}\times p_{.j}}}} 总惯量=i=1nj=1ppi.×p.j(pijpi.×p.j)2

    对应分析的目的就是在原假设 H 0 H_0 H0 被否定后,也就是已知 A 和 B 不独立,进一步探究其各状态之间的关系。

    所以对应分析是以变量和样本的协方差矩阵或相关系数矩阵为基础来进行分析的,那么接下来可以

    将对应矩阵 P P P 进行标准化变换得到过渡矩阵 Z Z Z

    Z = ( z 11 z 12 ⋯ z 1 z 21 z 22 ⋯ z 2 p ⋮ ⋮ ⋮ z n 1 z n 2 ⋯ z n p ) Z=\left( \begin{matrix}{} z_{11}& z_{12}& \cdots& z_1\\ z_{21}& z_{22}& \cdots& z_{2p}\\ \vdots& \vdots& & \vdots\\ z_{n1}& z_{n2}& \cdots& z_{np}\\ \end{matrix} \right) Z=z11z21zn1z12z22zn2z1z2pznp

    式中
    z i j = p i j − p i . × p . j p i . × p . j  , ( i = 1 , 2 , ⋯   , n ; j = 1 , 2 , ⋯   , p ) z_{ij}=\frac{p_{ij}-p_{i.}\times p_{.j}}{\sqrt{p_{i.}\times p_{.j}}}\ \text{,}\left( i=1,2,\cdots ,n\text{;}j=1,2,\cdots ,p \right) zij=pi.×p.j pijpi.×p.j (i=1,2,,nj=1,2,,p)

    3.3 行变量和列变量的分类降维处理

    3.3.1 对列变量实施分类降维( R R R 型因子分析)

    计算(列)变量的协方差矩阵 A = Z T Z A=Z^TZ A=ZTZ的特征根 λ 1 ≥ λ 2 ≥ ⋯ ≥ λ p \lambda _1\ge \lambda _2\ge \cdots \ge \lambda _p λ1λ2λp,以及特征根对应的特征向量 U i U_i Ui

    根据累计方差贡献率确定最终提取特征根的个数 m,并计算出相应的 R R R 型因子载荷矩阵 F F F,即

    F = ( u 11 λ 1 u 12 λ 2 ⋯ u 1 m λ m u 21 λ 1 u 22 λ 2 ⋯ u 2 m λ m ⋮ ⋮ ⋮ u p 1 λ 1 u p 2 λ 2 ⋯ u p m λ m ) ⇒ 变量之间的关系 F=\left( \begin{matrix} u_{11}\sqrt{\lambda _1}& u_{12}\sqrt{\lambda _2}& \cdots& u_{1m}\sqrt{\lambda _m}\\ u_{21}\sqrt{\lambda _1}& u_{22}\sqrt{\lambda _2}& \cdots& u_{2m}\sqrt{\lambda _m}\\ \vdots& \vdots& & \vdots\\ u_{p1}\sqrt{\lambda _1}& u_{p2}\sqrt{\lambda _2}& \cdots& u_{pm}\sqrt{\lambda _m}\\ \end{matrix} \right) \Rightarrow \text{变量之间的关系} F=u11λ1 u21λ1 up1λ1 u12λ2 u22λ2 up2λ2 u1mλm u2mλm upmλm 变量之间的关系

    通常 m m m 取 2,

    F = ( u 11 λ 1 u 12 λ 2 u 21 λ 1 u 22 λ 2 ⋮ ⋮ u p 1 λ 1 u p 2 λ 2 ) F=\left( \begin{matrix}{} u_{11}\sqrt{\lambda _1}& u_{12}\sqrt{\lambda _2}\\ u_{21}\sqrt{\lambda _1}& u_{22}\sqrt{\lambda _2}\\ \vdots& \vdots\\ u_{p1}\sqrt{\lambda _1}& u_{p2}\sqrt{\lambda _2}\\ \end{matrix} \right) F=u11λ1 u21λ1 up1λ1 u12λ2 u22λ2 up2λ2

    对这里不熟悉的可以在回顾一下:因子分析

    其中,因子载荷是列变量的某分类在某个因子上的载荷,反映了它们之间的相关关系。

    在这里插入图片描述

    与因子分析类似,

    • 可通过变量(列变量某分类)的共同度测度其方差的解释程度和信息的丢失程度;
    • 可通过因子的方差贡献测度因子的重要程度。

    3.3.2 对行样本实施分类降维( Q Q Q 型因子分析)

    对于 变量的协方差矩阵 A = Z T Z A=Z^TZ A=ZTZ与样本的协方差矩阵 B = Z Z T B=ZZ^T B=ZZT

    矩阵 A A A B B B 具有完全相同的非零特征根,即矩阵 B B B 的特征根也为 λ 1 ≥ λ 2 ≥ ⋯ ≥ λ p \lambda _1\ge \lambda _2\ge \cdots \ge \lambda _p λ1λ2λp

    其特征向量为 V i = Z U i V_i=ZU_i Vi=ZUi

    计算出相应的 Q Q Q 型因子载荷矩阵 G G G,即
    G = ( v 11 λ 1 v 12 λ 2 ⋯ v 1 m λ m v 21 λ 1 v 22 λ 2 ⋯ v 2 m λ m ⋮ ⋮ ⋮ v n 1 λ 1 v n 2 λ 2 ⋯ v n m λ m ) ⇒ 样本之间的关系 G=\left( \begin{matrix} v_{11}\sqrt{\lambda _1}& v_{12}\sqrt{\lambda _2}& \cdots& v_{1m}\sqrt{\lambda _m}\\ v_{21}\sqrt{\lambda _1}& v_{22}\sqrt{\lambda _2}& \cdots& v_{2m}\sqrt{\lambda _m}\\ \vdots& \vdots& & \vdots\\ v_{n1}\sqrt{\lambda _1}& v_{n2}\sqrt{\lambda _2}& \cdots& v_{nm}\sqrt{\lambda _m}\\ \end{matrix} \right) \Rightarrow \text{样本之间的关系} G=v11λ1 v21λ1 vn1λ1 v12λ2 v22λ2 vn2λ2 v1mλm v2mλm vnmλm 样本之间的关系

    通常 m m m 取 2,

    G = ( v 11 λ 1 v 12 λ 2 v 21 λ 1 v 22 λ 2 ⋮ ⋮ v n 1 λ 1 v n 2 λ 2 ) G=\left( \begin{matrix}{} v_{11}\sqrt{\lambda _1}& v_{12}\sqrt{\lambda _2}\\ v_{21}\sqrt{\lambda _1}& v_{22}\sqrt{\lambda _2}\\ \vdots& \vdots\\ v_{n1}\sqrt{\lambda _1}& v_{n2}\sqrt{\lambda _2}\\ \end{matrix} \right) G=v11λ1 v21λ1 vn1λ1 v12λ2 v22λ2 vn2λ2

    3.4 绘制行列变量分类的对应分布图

    因为矩阵 A A A B B B 具有完全相同的非零特征根,而这些特征根又正是各公因子的方差,因此,可用同一因子轴同时表示变量点和样本点

    另外

    对于 R R R 型因子载荷 F F F Q Q Q 型因子载荷 G G G 中元素,

    F = ( u 11 λ 1 u 12 λ 2 u 21 λ 1 u 22 λ 2 ⋮ ⋮ u p 1 λ 1 u p 2 λ 2 )        G = ( v 11 λ 1 v 12 λ 2 v 21 λ 1 v 22 λ 2 ⋮ ⋮ v n 1 λ 1 v n 2 λ 2 ) F=\left( \begin{matrix} u_{11}\sqrt{\lambda _1}& u_{12}\sqrt{\lambda _2}\\ u_{21}\sqrt{\lambda _1}& u_{22}\sqrt{\lambda _2}\\ \vdots& \vdots\\ u_{p1}\sqrt{\lambda _1}& u_{p2}\sqrt{\lambda _2}\\ \end{matrix} \right) \ \ \ \ \ \ G=\left( \begin{matrix} v_{11}\sqrt{\lambda _1}& v_{12}\sqrt{\lambda _2}\\ v_{21}\sqrt{\lambda _1}& v_{22}\sqrt{\lambda _2}\\ \vdots& \vdots\\ v_{n1}\sqrt{\lambda _1}& v_{n2}\sqrt{\lambda _2}\\ \end{matrix} \right) F=u11λ1 u21λ1 up1λ1 u12λ2 u22λ2 up2λ2       G=v11λ1 v21λ1 vn1λ1 v12λ2 v22λ2 vn2λ2

    取值范围是相同的,且元素数量大小的含义也类似

    因此

    可将 F F F G G G 分别看成 p p p 个二维点和 n n n 个二维点绘制在一个共同的坐标平面中,形成对应分布图,各点的坐标即为相应的因子载荷

    至此

    通过以上步骤,实现了对行列变量多类别的降维,并以因子载荷为坐标,将行列变量的多个分类点直观地表示在对应分布图中,实现了品质变量各类别间差异的量化。通过观察对应分布图中各数据点的远近就能够判断各类别之间的联系

    3.5 对应分析流程图

    引用参考[2]的流程图,可以把整个过程串起来
    在这里插入图片描述

    4 对应分析的适用条件以及注意事项

    运用对应分析法处理问题有这样的要求:

    • 变量是名义变量或定序变量
    • 行变量的类别取值与列变量相互独立
      在对数据作对应分析之前,需要先了解因素间是否独立。如果因素之间相互独立,则没有必要进行对应分析,当因素间在统计学上具有显著的关联性时,在此基础上使用对应分析方法,其分析结果才具有意义。
    • 行列变量构成的交叉频数表中不能出现小于等于零的情况

    需要注意一下几点:

    • 对应分析不能应用在相关关系的假设检验中,无法解释两个变量间存在的联系显著与否。因此,在应用对应分析时,需要事先做的工作是检验两个变量之间的相关性,能够通过卡方统计量检验进行。

    • 对应分析也是一种降维方法,因此在将行列信息投射到低纬空间时也可能会有信息的损失。

    • 对应分析可以省去因子旋转和因子选择等复杂中间过程,降低数学运算难度,且从因子载荷图上可以直接对行因素和列因素进行分类。

    • 对应分析对异常点或者极端值敏感

    • 研究对象要有可比性

    • 不同标准化分析的结果不同

    • 定性变量划分的类别越多,对应分析方法的优越性越明显


    参考文章:

    [1] 于秀林.多元统计分析与程序[M].北京:中国统计出版社,1993.1-45.
    [2] 刘冬梅. 对应分析在航空安全事件研究中的应用[D].中国民航大学,2016.
    [3] 尚佳. 基于对应分析法的综合保税区与自由贸易园区的差别化研究[D].上海交通大学,2012.
    [4] 百度文库—对应分析
    [5] 百度文库—SPSS数据的对应分析资料
    [6] 对应分析

    展开全文
  • 统计分析--对应分析

    千次阅读 2019-05-19 20:24:19
    统计分析–对应分析sas/r实现 --------仅用于个人学习知识整理和sas/R语言/python代码整理 1.前言 对应分析,主要适用于有多个类别的分类变量,可以揭示同一个变量各个类别之间的差异,以及不同变量各个类别...

    统计分析–对应分析

    --------仅用于个人学习知识整理和sas/R语言/python代码整理


    1.前言

    对应分析,主要适用于有多个类别的分类变量,可以揭示同一个变量各个类别之间的差异,以及不同变量各个类别之间的对应关系(简介摘录自:https://www.jianshu.com/p/77a0d15f0336)

    以下通过实际例子 使用sas及r语言 进行实现,以及附上对应分析图的解读方式(没有找到python的实现方式,如果有,请不吝赐教!)

    2.sas实现

    1.源数据准备

    以下数据全为测试虚构数据,只用来说明数据格式及辅助图的解读
    输入数据集为以下交叉表格式,每一个数据代表该组别该变量的人数,假设这里要看五组人群和变量之间的关系,得到交叉表如下:
    在这里插入图片描述

    2.sas对应分析

    sas对应分析主要使用proc corresp过程步,在进行对应分析是var参数需要输入所有变量名,所以先将所有变量放入宏变量中,实现代码如下:

    /*存放变量*/
    proc contents data=rawdata out=cont noprint;run;
    proc sql  noprint;
    select kcompress("'"||name||"'")||"n " into : name3 separated by ' ' from cont where name^='CLUSTER' and 
    name^='cluster'  and name^='class' and  name^='right';
    quit;
    
    /*打印宏变量*/
    %put &name3.;
    
    /*进行对应分析*/
    proc corresp data=rawdata print=percent observed cellchi2 rp cp
            short outc=data_out plot(flip);
          var &name3;
          id class;
        run;
    %plotit(data=duiying.data_out,datatype=corresp,plotvars=Dim1 Dim2,color=black,href=0,vref=0) 
    /*绘制对应分析图; %plotit中指定的参数分别是输入数据集名称、数据类型、绘图的变量名,坐标轴的颜色和参考线。用前面的输出数据集results中两个变量Dim1 Dim2绘图*/
    run;
    
    3.对应分析图解读

    首先可以看到,第一维度解释了65.41%,第二维度解释了24.92%,说明在两个维度上,能够说明数据的90.33%

    对应分析图有很多种解读的方法,附上一篇很详细的对应分析图详解:
    http://www.botaijixie.cn/shiti/10937.html
    我们一般会使用向量分析,即看和这个人群比较关联的产品是哪些,在下图中,如果要看和a人群比较关联的label,会从原点出发,向a的方向画一个向量(原点到a的方向作为向量正向),然后每个产品点向这条直线做垂线,垂足和a点的正向越近,表示和a越关联
    在这里插入图片描述

    3.r语言实现

    r语言主要使用ca包中的ca函数
    附上一篇写的较为详细的r链接:https://www.douban.com/note/236880884/

    ca_data <- read_excel("Z:/ca.xlsx")
    
    ca_data2<-as.data.frame(ca_data[,-1])
    row.names(ca_data2)<-ca_data$class
    
    library(ca)
    plot(ca(ca_data2),dim = c(1,2),xlim=c(-1,1),ylim=c(-1,1), pch = c(16, 1, 17, 24))
    
    

    在这里插入图片描述

    展开全文
  • SPSS下如何进行对应分析

    千次阅读 2020-12-16 10:16:44
    何为对应分析 定义:对应分析又称关联分析、R-Q型因子分析,主要是揭示变量样品之间的相互关系的多元统计方法 应用场景:主要用于市场细分、产品定位等方面研究 条件:变量是名义变量或定序变量,行变量的类别取值...

    何为对应分析

    1. 定义:对应分析又称关联分析、R-Q型因子分析,主要是揭示变量样品之间的相互关系的多元统计方法
    2. 应用场景:主要用于市场细分、产品定位等方面研究
    3. 条件:变量是名义变量或定序变量,行变量的类别取值与列变量相互独立,行、列变量构成的交叉频数表不能有0值或负数
    4. 优点:
    • 名义变量划分的类别越多,这种分析的优势越明显
    • 可以将名义变量或定序变量转变为间距变量
    • 直观的在图形中展示变量各类别间的联系
    1. 缺点:
    • 不能用于相关关系的假设检验
    • 分析结果受易受到极端值的影响
    • 实质是降维,将原始数据按照一定规则以二维平面图形式展现,在此过程中部分信息会丢失

    一、多元对应分析【SP:降维–最优尺度】

    情景1:单选与单选

    案例背景介绍:

    某次调研中,有这样的一些问题:

    1. QA4_3.综合来讲,您认为一汽马自达品牌怎么样? 10分表示您认为这个品牌非常好,1分表示您认为这个品牌非常不好。打分题
    2. Q2. 您的性别是?【单选】

    在这里插入图片描述
    4. Q3. 您的学历是?【单选】
    在这里插入图片描述

    1. Q4. 您的职业是?【单选】
      在这里插入图片描述
    2. Q5. 您的年龄是?【单选】
      在这里插入图片描述

    需求介绍:

    对于一汽马自达品牌的评价【QA4_3】分成两种情况,“”1-7“【对一马评价低】”与“8-10”【对一马评价高】,对Q2 Q3 Q4 Q5进行多元对应分析

    实际操作:

    具体的操作流程如下:

    1. 针对QA4_3的结果划分成两组,生成新变量NQA4_3
    IF  (QA4_3 >= 1 & QA4_3  <= 7) NQA4_3=1.
    IF  (QA4_3 >= 8 & QA4_3  <= 10) NQA4_3=2.
    VARIABLE LABELS  NQA4_3 '对一马评价'.
    VALUE LABELS   NQA4_3
    1 '对一马评价低'
    2 '对一马评价高'.
    EXECUTE.
    
    1. Q4题的选项15【其他请注明】与实际的需求没有啥用处,需要Missing掉

    2. 进行多元对应分析
      手动操作
      在这里插入图片描述
      在这里插入图片描述
      在这里插入图片描述补充变量:将那些频数结果小的变量但是又不能丢弃的变量可以放到此处
      在这里插入图片描述
      在这里插入图片描述
      在这里插入图片描述
      在这里插入图片描述
      语法批量:
      在这里插入图片描述

    MULTIPLE CORRES VARIABLES=NQA4_3 Q2 Q3 Q4 Q5
    /ANALYSIS=NQA4_3(WEIGHT=1) Q2(WEIGHT=1) Q3(WEIGHT=1) Q4(WEIGHT=1) Q5(WEIGHT=1) 
    /MISSING=NQA4_3(PASSIVE,MODEIMPU) Q2(PASSIVE,MODEIMPU) Q3(PASSIVE,MODEIMPU) Q4(PASSIVE,MODEIMPU) 
    Q5(PASSIVE,MODEIMPU) 
    /DIMENSION=2
    /NORMALIZATION=VPRINCIPAL
    /MAXITER=100
    /CRITITER=.00001
    /PRINT=CORR DISCRIM QUANT(Q2 Q3 Q4 Q5 NQA4_3) 
    /PLOT=OBJECT(20) JOINTCAT(Q2 Q3 Q4 Q5 NQA4_3) (20) 
    DISCRIM (20).
    

    通过修改上述语法中的变量名【NQA4_3 Q2 Q3 Q4 Q5】,可以实现批量快速获得所需的分析。

    情景2:单选与多选

    多选题的处理—数据重组【转置】

    VARSTOCASES
      /ID=id
      /MAKE trans1 FROM QB2_1 QB2_2 QB2_3 QB2_4 QB2_5 QB2_6 QB2_7 QB2_8 QB2_9 QB2_10 QB2_11 QB2_12 
        QB2_13 QB2_14 QB2_15 QB2_16 QB2_17 QB2_18 QB2_19 QB2_20 QB2_21 QB2_22 QB2_23 QB2_24 QB2_25 QB2_26 
        QB2_27 QB2_28 QB2_29 QB2_30 QB2_31 QB2_32 QB2_33 QB2_34 QB2_35 QB2_36
      /MAKE trans2 FROM QB201_1 QB201_2 QB201_3 QB201_4 QB201_5 QB201_6 QB201_7 QB201_8 QB201_9 QB201_10 QB201_11 QB201_12 
        QB201_13 QB201_14 QB201_15 QB201_16 QB201_17 QB201_18 QB201_19 QB201_20 QB201_21 QB201_22 QB201_23 QB201_24 QB201_25 QB201_26 
        QB201_27 QB201_28 QB201_29 QB201_30 QB201_31 QB201_32 QB201_33 QB201_34 QB201_35 QB201_36
      /INDEX=索引1(36)
      /KEEP= Q2 Q4 Q5 Q7
      /NULL=drop.
    
    注释:
    1. QB2、QB2-1是多选题,转置成单选的形式,转置的结果是trans1、trans2
    2. keep的意思是要保留那些变量
    3. null=drop 意思是将空的结果删除

    多选题转置结果

    由于转置【数据重组】操作是在原始数据库上操作的,因此需要将结果另存为一份新的数据库。后续的操作将在此数据库上操作。
    在这里插入图片描述

    二、简单对应分析【SP:降维–对应分析】

    情景1:单选与单选

    案例背景介绍:沿用前面的案例,此处不赘述

    需求介绍:

    以为NQ4_3【低、高】区分,对Q4题职业进行简单对应分析

    实际操作:

    手动操作
    在这里插入图片描述
    在这里插入图片描述
    针对上述的选择变量时有个小技巧,键盘上同时按着Q和4,可快速找到Q4变量。
    在这里插入图片描述
    在这里插入图片描述

    此处是定义一下变量的取值范围,点击‘更新’。
    在这里插入图片描述

    语法批量:

    CORRESPONDENCE TABLE=NQA4_3(1 2) BY Q4(1 14)
      /DIMENSIONS=2
      /MEASURE=CHISQ
      /STANDARDIZE=RCMEAN
      /NORMALIZATION=SYMMETRICAL
      /PRINT=TABLE RPOINTS CPOINTS
      /PLOT=NDIM(1,MAX) BIPLOT(20) RPOINTS(20) CPOINTS(20).
    

    上述操作后没有跑出对应分析。具体的原因应该是只有一个维度,画不出对应分析图来。

    情景2:单选与多选

    将多选题重组成单选的形式,此时变成单选与单选操作,具体参照单选与单选的简单对应分析的操作步骤,此处不再重复介绍。

    需求介绍:

    以Q4题职业为区分,对QB2进行简单对应分析

    实际操作:

    手动操作
    在这里插入图片描述
    语法批量:

    CORRESPONDENCE TABLE=Q4(1 14) BY trans1(1 36)
      /DIMENSIONS=2
      /MEASURE=CHISQ
      /STANDARDIZE=RCMEAN
      /NORMALIZATION=SYMMETRICAL
      /PRINT=TABLE RPOINTS CPOINTS
      /PLOT=NDIM(1,MAX) BIPLOT(20).
    

    三、结果展示【部分展示】

    在这里插入图片描述
    在这里插入图片描述
    在这里插入图片描述

    展开全文
  • SPSS学习笔记——对应分析

    千次阅读 2019-06-09 19:15:59
    这一步是为了先知道行和列的两个变量之间有没有相关性,有相关性才能做对应分析。 【加权个案】 用人数加权 【分析】-【描述统计】-【交叉表格】将【统计】-卡方和相关性,【单元格】中的期望值选中 从卡方检验...
  • SPSS(十三)SPSS之多重对应分析(图文+数据集)

    万次阅读 多人点赞 2019-05-28 21:12:41
    SPSS(十三)SPSS之多重对应分析(图文+数据集) 前一篇SPSS(十二)SPSS对应分析(图文+数据集)讲的只是针对两个变量的,我们看其对话框,行列都只是能放一个变量而已,对应的是简单的对应分析,对应操作如下 ...
  • SPSS(十二)SPSS对应分析(图文+数据集)

    万次阅读 多人点赞 2019-05-28 17:08:47
    SPSS(十二)SPSS对应分析(图文+数据集) 对应分析的介绍 对应分析其实是对分类变量进行信息浓缩的方法,之前的主成分分析/因子分析针对的是连续型的变量 分析分类变量间关系时 卡方检验只能给出总体有无关联的...
  • spss——对应分析

    2010-04-11 13:22:20
    spss——对应分析 spss——对应分析 spss——对应分析
  • 安装R语言 R语言安装和python类似,都是需要安装一个界面的软件,因此需要安装两个程序。...library(ca)加载对应分析包,第一次加载完成后即可 digits=8是不同品牌或不同类的数量 画图,输出
  • 对应分析及R使用

    万次阅读 2018-11-04 19:51:46
    对应分析是在因子分析基础上发展起来的,因子分析分为R型和Q型因子分析,R型是对变量(指标)做因子分析,Q型是对样品做因子分析,研究样品之间的相互关系,对应分析是把R和Q统一起来,通过R型因子分析直接得到Q型...
  • R 对应分析ca

    千次阅读 2020-05-12 18:40:13
    R中自带数据HairEyeColor 用头发颜色和眼睛颜色形成的列联表做二元对应分析
  • 数学建模常用模型16 :对应分析

    万次阅读 2018-08-20 14:44:04
    对应分析( correspondence analysis )是在R型和Q型因子分析基础上发展起来的多元统计分析方法,又称为R-Q型因子分析。 例 试用对应分析研究我国部分省份的农村居民家庭人均消费支出结构。选取7个变量:A为食品...
  • 第10章 对应分析及R使用 ;多元统计分析及R语言建模;内容与要求;内容与要求;10.1 对应分析的提出;10.1 对应分析的提出;10.2 对应分析的基本原理;10.2 对应分析的基本原理;10.2 对应分析的基本原理;10 对应分析及R使用...
  • 分析: 先对变量间的两两关联性进行卡方检验,除了性别和大多变量没有相关性,其他变量间基本都有相关性,尝试保留性别。 【分析】-【降维】-【最优尺度】-【定义】 全部选入“分析变量” 【变量】-把所有变量选入...
  • 七种角度分析对应分析方法

    千次阅读 2014-05-04 21:34:48
    对应分析方法与对应图解读方法——七种分析角度  对应分析是一种多元统计分析技术,主要分析定性数据Category Data方法,也是强有力的数据图示化技术,当然也是强有力的市场研究分析技术。  这里...
  • 如何从列联表获得对应分析的结果

    千次阅读 2018-09-03 20:30:52
    对应分析所针对的原始数据必须有行向量和列向量, 在轻松获得所感兴趣的两个变量组成的列联表之后, 要进行多步转换,才能获取结果. 获取列联表 Sub1 &lt;- data.frame(F$自评成绩, F$可能性) %&gt;% ...
  • 对应分析与典型相关分析笔记_数学建模系列这里的对应分析与典型相关分析仍然用于降维,因子分析的进阶! 对应分析:在同一张图上,直观的展现样本和属性的聚类效果,同时省去因子选择、因子轴旋转等复杂过程。具体...
  • 对应分析之多重多维+偏好选择

    千次阅读 2018-08-12 20:59:07
    当你看到下面这种题 先不着急装逼,看看他的数据: 几.....我已经不自觉开始颤抖了。(作为新手小白在建模... (3)点击分析–&amp;gt;降维–&amp;gt;最优尺度 在”最佳尺度“里,有 a.最佳度量水平...
  • SPSS与对应分析(类别简单型)

    千次阅读 2018-08-12 18:13:22
    对应分析用SPSS做并不难,比较困难的是解读分析出来的东西。本文只是步骤,结果解读后续再写~ 分析变量的方法主要有: 类型一:变量间型-R型(主成分分析) 类型二:样本间型:(转置后再进行因子分析(步骤相同...
  • SPSS对应分析---研究品牌和品牌形象之间的关系 对应分析能够把一个交叉表结果通过图形的方式展现出来,用以表达不同变量之间以及不同类别之间的关系。 对应分析实际上也是“降维”方法的一种,比较适合对分类变量...
  • 1.典型相关分析:两组变量之间的相关问题 cancor() cancor(x, y, xcenter = TRUE, ycenter = TRUE) x,y为两组变量的数据矩阵;xcenter和ycenter是逻辑值,表示是否中心化,实际中一般采用默认值TRUE 注意...
  • 9、spss做交叉表检验和对应分析

    千次阅读 2015-04-15 15:35:34
    回顾一下,主要有相关分析,假设检验,和各种回归。以及因子分析。我们知道,对于两组连续变量,我们可以通过假设检验来判断他们的分布是否相同,差异时候存在。不知道大家想过没有,如果我们想讨论两个分类变量的...
  • SPSS工具:对应分析--品牌形象定位

    千次阅读 2018-09-13 20:43:57
    对应分析是一种多元统计数据分析: 至此,对应分析过程已经讲完。看看分析的结果吧:      
  • 对应分析图解读的七种方法

    千次阅读 2014-05-04 21:44:27
    对应分析图解读的七种方法   转载▼  今天刚听完沈浩老师对对应分析图的讲解,觉得很有必要总结下来与大家分享。本资料重点在数据解读,这点是非常重要的,大部分人会做对应分析,但不一定知道怎么用...
  • 常用的数据分析方法有:聚类分析、因子分析、相关分析、对应分析、回归分析、方差分析。 1、聚类分析(Cluster Analysis) 聚类分析指将物理或抽象对象的集合分组成为由类似的对象组成的多个类的分析过程。聚类是将...
  • arm汇编指令与机器码对应分析

    千次阅读 2019-04-25 11:41:29
    我们编写的汇编程序还是不够底层,CPU都是对机器码进行操作的,...下面举几个例子来说说分析ARM机器码的方法。  对编译连接之后得到的ELF进行反汇编:arm-linux-objdump  查看得到的反汇编代码。这里如果想...
  • 关于聚类分析、判别分析、主成分分析、因子分析 主成分分析与因子分析的区别   1. 目的不同: 因子分析把诸多变量看成由对每一个变量都有作用的一些公共因子和仅对某一个变量有作用的特殊...

空空如也

空空如也

1 2 3 4 5 ... 20
收藏数 1,653,523
精华内容 661,409
关键字:

对应分析