精华内容
下载资源
问答
  • 讲述了统计和数据处理中的因子分析方法的原理、数学模型,并以实际案例为例,介绍了其应用方法和步骤,值得学习。
  • 采用因子分析法处理各评价指标体,采用SPSS软件进行数据分析处理,能够全面反映影响矿井瓦斯爆炸的因素特征,做出科学、客观的评价。实例分析结果表明,评价结果准确,具有良好的实际应用价值。
  • 因子分析: 将除序号外的变量都移入变量框中: 打开“描述”选项卡,勾选原始分析结果,这个结果会给出各因子的特征值、各因子特征值占总方差的百分比以及累计百分比。 选中“抽取”选项卡,方法选择主成分...

    学生成绩因子构成和分科建议

    • 数据概况:

    • 因子分析:

    将除序号外的变量都移入变量框中:

    打开“描述”选项卡,勾选原始分析结果,这个结果会给出各因子的特征值、各因子特征值占总方差的百分比以及累计百分比。

    选中“抽取”选项卡,方法选择主成分法;因子分析输出选择未旋转的因子解,输出因子载荷矩阵;因子抽取原则是基于特征值大于1的因子。

     

    点击“旋转”选项卡,选择“最大方差法”。

    点击“得分”选项卡,勾选“保存为变量”,则因子得分会作为新的变量保存在结果中,勾选“显示因子得分系数矩阵”,则会输出因子得分系数矩阵。

    点击确定,进行因子分析。

    • 提取学生成绩因子
    1. 各因子方法贡献表:

    可以看到只有前两个因子累积方差贡献已经达到75%,而且第三个因子的特征根下降比较快。于是我们使用两个公因子解释学生成绩。

    1. 变量共同度:

    变量共同度是指变量对所有公因子的依赖程度,可以看到依赖程度除物理外都大于三分之二,解释力度良好。

    1. 旋转前的因子载荷矩阵:

    可以看到变量对两个公共因子的相关性区分不是特别明显,为了对公共因子进行命令和解释,我们查看旋转后的因子载荷矩阵。

    1. 因子载荷矩阵:

    可以看到因子1与变量语文、历史、英语相关性比较高,我们把它命名为“文科因子”,因子2与数学、物理、化学相关性比较高,我们把它命名为“理科因子”。

    1. 因子得分系数矩阵:

    这是作为我们为每个学生打分的基础,根据因子得分系数矩阵,我们可以计算因子得分:

    F1=0.064*数学+0.085*物理+0.137*化学+0.332*语文+0.378*历史+0.432*英语

    F2=0.439*数学+0.400*物理+0.484*化学-0.014*语文+0.073*历史+0.169*英语

    • 分科建议:

    由因子得分我们可以知道每个学生在不同因子上面的得分,如果“文科因子”得分较高,那么学生在文科比如语文、历史和英语等科目掌握较好,如果“理科因子”得分高,则理科学得比较好,那么根据因子得分更高的原则可以为学生分科提供意见。

    这体现在我们前一步因子分析中已经导出的因子得分变量,如下图:

    如果因子1得分高于因子2,则选择文科比较合适,反之选择理科。

     

    展开全文
  • 文章目录(1) 因子分析实例(2) 因子分析前的检验(3) 因子分析原理(4) 因子模型的性质(5) 因子载荷矩阵的统计意义(6) 参数估计(7) 确定公共因子的个数(8) 因子旋转(9) 因子得分 (1) 因子分析实例 为了评价高中学生将来...

    因子分析
    在某种程度上可以看成是主成分分析法的推广,优势主要体现在解释选取的综合因子时更加容易

    (1) 因子分析实例

    为了评价高中学生将来进入大学时的学习能力,抽了 200200 名高中生进行问卷调查,共 5050 个问题。所有这些问题可简单的归结为阅读理解、数学水平和艺术修养这三个方面。这就是一个因子分析模型,每一个方面就是一个因子。

    (2) 因子分析前的检验

    • KMO检验
      • KMO 值越接近 11,意味着变量间的相关性越强,KMO 值越接近 00,意味着变量间的相关性越弱。相关性越强越适合进行因子分析。
      • KMO> 0.90.9 非常适合进行因子分析,0.90.9 >KMO> 0.80.8 适合进行因子分析,0.80.8 >KMO> 0.70.7 一般,0.70.7 不太适合。
    • 巴特利特球性检验
      • 原假设为:相关系数矩阵是一个单位矩阵 (不适合做因子分析,指标之间的相关性太差,不适合降维)。
      • 备择假设为:适合做因子分析。
      • 使用 SPSS 可以计算出 pp 值。

    (3) 因子分析原理

    • 大小为 n×pn\times p 的随机向量 x=(x1,x2,,xp)Tx=(x_1,x_2,\dots,x_p)^T,均值为 μ=(μ1,μ2,,μp)T\mu=(\mu_1,\mu_2,\dots,\mu_p)^T,特殊因子向量 ϵ=(ϵ1,ϵ2,,ϵp)T\epsilon=(\epsilon_1,\epsilon_2,\dots,\epsilon_p)^T,公因子向量 f=(f1,f2,,fp)Tf=(f_1,f_2,\dots,f_p)^T,载荷矩阵 Ap×m=(aij)p×mA_{p\times m}=(a_{ij})_{p\times m} ,注意这里 xiμiϵifix_i,\mu_i,\epsilon_i,f_i 都是 n×1n\times1 维的向量。
    • 因子分析的一般模型
      {x1=μ1+a11f1+a12f2++a1mfm+ϵ1x2=μ2+a21f1+a22f2++a2mfm+ϵ2xp=μp+ap1f1+ap2f2++apmfm+ϵp \left\{ \begin{aligned} x_1&=\mu_1+a_{11}f_1+a_{12}f_2+\dots+a_{1m}f_m+\epsilon_1\\ x_2&=\mu_2+a_{21}f_1+a_{22}f_2+\dots+a_{2m}f_m+\epsilon_2\\ &\vdots\\ x_p&=\mu_p+a_{p1}f_1+a_{p2}f_2+\dots+a_{pm}f_m+\epsilon_p\\ \end{aligned} \right.
      表示为矩阵的形式:x=μ+Af+ϵx=\mu+Af+\epsilon
    • 对模型的相关假设
      {E(f)=0E(ϵ)=0Var(f)=IVar(ϵ)=D=diag(σ12,σ22,,σp2)Cov(f,ϵ)=0 \left\{ \begin{aligned} &E(f)=0\\ &E(\epsilon)=0\\ &Var(f)=I\\ &Var(\epsilon)=D=diag(\sigma_1^2,\sigma_2^2,\dots,\sigma_p^2)\\ &Cov(f,\epsilon)=0\\ \end{aligned} \right.
      公因子不相关并且具有单位方差,特殊因子和公因子也不相关。
    • 解释:特殊因子向量其实就像噪声,是一个无关紧要的向量,公因子向量表现的就是提取的各个公因子。

    (4) 因子模型的性质

    xx 的协方差矩阵的分解
    Var(x)=E[(xμ)(xμ)T]=E[(Af+ϵ)(Af+ϵ)T]=AE(ffT)AT+AE(fϵT)+E(ϵfT)AT+E(ϵϵT)=AVar(f)AT+Var(ϵ)=AAT+D= \begin{aligned} Var(x)&=E[(x-\mu)(x-\mu)^T]=E[(Af+\epsilon)(Af+\epsilon)^T]\\ &=AE(ff^T)A^T+AE(f\epsilon^T)+E(\epsilon f^T)A^T+E(\epsilon\epsilon^T)\\ &=AVar(f)A^T+Var(\epsilon)\\ &=AA^T+D=\sum\nolimits \\ \end{aligned}
    ⭐️因子载荷不唯一 (由于载荷的不唯一才可以通过调整载荷矩阵使解释变得更容易)

    • TT 为任意一个 m×mm\times m 的正交矩阵,并取 A=ATA^*=ATf=TTff^*=T^Tf,将 AA^*ff^* 代入相关假设之中,发现还成立,因此可以将 AA 改为 AA^*

    (5) 因子载荷矩阵的统计意义

    • 原始变量 xix_i 与公因子 fjf_j 之间的协方差
      Cov(xi,fj)=k=1maikCov(fk,fj)+Cov(ϵi,fj)=aijCov(x_i,f_j)=\sum_{k=1}^ma_{ik}Cov(f_k,f_j)+Cov(\epsilon_i,f_j)=a_{ij}
      xx 已经经过标准化,则 aij=ρ(xi,fj)a_{ij}=\rho(x_i,f_j) 表示 xix_ifjf_j 之间的相关系数。
    • AA 的行元素平方和 hi2=j=1maij2h_i^2=\displaystyle\sum_{j=1}^ma_{ij}^2 ———原始变量 xix_i 对公因子依赖的程度。
      • xx 没有进行标准化时
        σii=V(xi)=ai12V(f1)+ai22V(f2)++aim2V(fm)+V(ϵi)=ai12+ai22++aim2+σi2=hi2+σi2\begin{aligned} \sigma_{ii}=V(x_i)&=a_{i1}^2V(f_1)+a_{i2}^2V(f_2)+\dots+a_{im}^2V(f_m)+V(\epsilon_i)\\ &=a_{i1}^2+a_{i2}^2+\dots+a_{im}^2+\sigma_i^2\\ &=h_i^2+\sigma_i^2 \end{aligned}
        其中 σii\sigma_{ii} 称为个性方差。
      • xx 进行过标准化之后
        1=hi2+σi21=h_i^2+\sigma_i^2
    • AA 的列元素平方和 gj2=i=1paij2g_j^2=\displaystyle\sum_{i=1}^pa_{ij}^2 ———公因子 fjf_jxx 的贡献。
      • gj2=i=1paij2  (j=1,2,,m)g_j^2=\displaystyle\sum_{i=1}^pa_{ij}^2~~(j=1,2,\dots,m)
        i=1pV(xi)=i=1pai12V(f1)+i=1pai22V(f2)++i=1paim2V(fm)+i=1pV(ϵi)=g12+g22++gm2+i=1pσi2\begin{aligned} \sum_{i=1}^pV(x_i)&=\sum_{i=1}^pa_{i1}^2V(f_1)+\sum_{i=1}^pa_{i2}^2V(f_2)+\dots+\sum_{i=1}^pa_{im}^2V(f_m)+\sum_{i=1}^pV(\epsilon_i)\\ &=g_1^2+g_2^2+\dots+g_m^2+\sum_{i=1}^p\sigma_i^2\\ \end{aligned}
      • gj2g_j^2 是衡量公因子 fjf_j 重要性的一个尺度,可视为公因子 fjf_jxx 的贡献。

    (6) 参数估计

    • x1,x2,,xnx_1,x_2,\dots,x_n 是一组 pp 维的样本。则可以估计 μ\mu\sum 分别为 x=1ni=1nxi\overline{x}=\dfrac{1}{n}\sum_{i=1}^nx_i
      S2=1n1i=1n(xix)(xix)TS^2=\dfrac{1}{n-1}\sum_{i=1}^n(x_i-\overline{x})(x_i-\overline{x})^T
    • 还需要估计因子载荷矩阵 AA 与个性方差矩阵 D=diag(σ12,σ22,,σp2)D=diag(\sigma_1^2,\sigma_2^2,\dots,\sigma_p^2)
      • 主成分法
      • 最大似然法
      • 主因子法

    (7) 确定公共因子的个数

    碎石检验:当某个特征值较前一特征值出现较大的下降,而这个特征值较小,其后面的特征值变化不大,说明添加相应于该特征值的因素只能增加很少的信息,因此只取前几几个特征值。

    (8) 因子旋转

    • 因子旋转的目的,使公共因子的载荷系数的绝对值更可能接近 0011,这样可以使因子更好分析。
    • 使用 SPSS。

    (9) 因子得分

    • 反过来将公共因子表示为原变量的线性组合。
      {f1=b11x1+b12x2++b1mxpf2=b21x1+b22x2++b2mxpfm=bm1x1+bm2x2++bmpxp \left\{ \begin{aligned} f_1&=b_{11}x_1+b_{12}x_2+\dots+b_{1m}x_p\\ f_2&=b_{21}x_1+b_{22}x_2+\dots+b_{2m}x_p\\ &\vdots\\ f_m&=b_{m1}x_1+b_{m2}x_2+\dots+b_{mp}x_p\\ \end{aligned} \right.
      bijb_{ij} 就是第 ii 个因子的得分对应于第 jj 个变量。
    • 常用 Anderson-Rubin 方法和 Bartlett 得分。
    展开全文
  • 因子分析(FA)算法简述

    千次阅读 2020-10-16 15:29:53
    文章目录前言一、什么是因子分析?1.1 因子分析应用背景1.2 因子分析算法的基本步骤1.3 因子分析算法的数学解释1.3.1 因子模型1.3.2 因子载荷矩阵的求解二...因子分析法是指: 研究从变量群中提取共性因子的统计技术,


    前言

    在学习数据降维时,了解到因子分析(FA)算法是其中的一种方式,因此,在这里对因子分析算法做一个简要的归纳、梳理,后续会对数据降维的几种方式做个总结,感兴趣的朋友,可以持续关注。

    一、什么是因子分析?

    因子分析法是指: 研究从变量群中提取共性因子的统计技术,这里的共性因子指的是不同变量之间内在的隐藏因子。例如,一个学生的英语、数据、语文成绩都很好,那么潜在的共性因子可能是智力水平高。因此,因子分析的过程其实是寻找共性因子和个性因子并得到最优解释的过程。
    其基本思想是: 根据相关性大小把变量分组,使得同组内的变量之间相关性较高,但不同组的变量不相关或相关性较低,每组变量代表一个基本结构一即公共因子。
    因子分析有两个核心问题: 一是如何构造因子变量,二是如何对因子变量进行命名解释。
    因子分析类型: R型因子分析与Q型因子分析,就像聚类分析分为R型和Q型一样,R型的因子分析是对变量作因子分析,Q型因子分析是对样品作因子分析,本文是以R型因子分析展开。

    1.1 因子分析应用背景

    因子分析用于处理高斯数据,主要应用于以下两种情形

    1. 假如有 m 个样本,每个样本的维度是 n, 如果 n » m;这时哪怕拟合出一个高斯模型都很困难,更不用说高斯混合, 为什么呢?其实,这和解多元线性方程组是一样的道理,就是自变量的个数多于非线性相关的方程的个数,这必然导致解的不唯一,虽然在解方程的时候可以随便选一个解满足方程组,但是对于某一实际数据集,往往样本对应的概率分布在客观上都是唯一的,只是我们无法简单地用概率论中的几个典型的分布准确表示出来罢了!
    2. m 个样本的维度都较低。用高斯分布对数据建模,用最大似然估计去估计均值(期望)和方差:
      在这里插入图片描述
      我们会发现,协方差矩阵 Σ 是奇异的,即 Σ 不可逆,Σ-1 不存在,且有:
      在这里插入图片描述
      但是这两项在计算多元高斯分布时,又都是必不可少的。所以,除非 m 比 n 大一定较合适的数值,否则对方差和均值的最大似然估计将会很难找到正确的值。

    1.2 因子分析算法的基本步骤

    应用因子分析算法时,常常有如下几个基本步骤:

    1. 确定原有若干变量是否适合于因子分析;因子分析的基本逻辑是从原始变量中构造出少数几个具有代表意义的因子变量,这就要求原有变量之间要具有比较强的相关性,否则,因子分析将无法提取变量间的“共性特征”(变量间没有共性还如何提取共性?)。实际应用时,可以使用相关性矩阵进行验证,如果相关系数小于0.3,那么变量间的共性较小,不适合使用因子分析;也可以用KMO 和 Bartlett 的检验来判断是否适合做因子分析,一般来说KMO的值越接近于1越好,大于zhi0.5的话适合做因dao子分析,你的KMO值是0.674大于0.5。Bartlett 的检验主要看Sig.越小越好,你的接近于0.由此可以得出,你的数据适合做因子分析。
    2. 构造因子变量;因子分析中有多种确定因子变量的方法,如基于主成分模型的主成分分析法和基于因子分析模型的主轴因子法、极大似然法、最小二乘法等。
    3. 利用旋转使得因子变量更具有可解释性 ;在实际分析工作中,主要是因子分析得到因子和原变量的关系,从而对新的因子能够进行命名和解释,否则其不具有可解释性的前提下对比PCA就没有明显的可解释价值。
    4. 计算因子变量的得分 。子变量确定以后,对每一样本数据,希望得到它们在不同因子上的具体数据值,这些数值就是因子得分,它和原变量的得分相对应。

    具体而言:

    • (1) 相关性检验,一般采用KMO检验法和Bartlett球形检验法两种方法来对原始变量进行相关性检验;
    • (2) 输入原始数据Xn*p,计算样本均值和方差,对数据样本进行标准化处理;
    • (3) 计算样本的相关矩阵R;
    • (4) 求相关矩阵R的特征根和特征向量;
    • (5) 根据系统要求的累积贡献率确定公共因子的个数;
    • (6) 计算因子载荷矩阵A;
    • (7) 对载荷矩阵进行旋转,以求能更好地解释公共因子;
    • (8) 确定因子模型;
    • (9) 根据上述计算结果,求因子得分,对系统进行分析

    1.3 因子分析算法的数学解释

    1.3.1 因子模型

    因子分析中的公共因子是不可直接观测但又客观存在的共同影响因素,每个变量都可以表示成公共因子的线性函数与特殊因子之和,即:
    在这里插入图片描述
    式中的F1,F2,…,Fm称为公共因子,εi称为Xi的特殊因子。该模型可用矩阵表示为:
    在这里插入图片描述
    这里:
    在这里插入图片描述
    且满足:
    在这里插入图片描述
    模型中的矩阵A称为因子载荷矩阵,aij称为因子“载荷”,是第i个变量在第j个因子上的负荷,如果把变量Xi看成m维空间中的一个点,则aij表示它在坐标轴Fj上的投影。

    1.3.2 因子载荷矩阵的求解

    因子载荷矩阵的求解方法有很多,主要有以下三种:主成分分析法;主因子法;极大似然估计法。(其中以主成分分析法最为常用)

    • 1.主成分分析法
      原理及主要计算步骤:
      (1)计算原始数据X的协方差阵Σ;
      (2)计算协方差阵Σ的特征根,按数值大小表示为λ_1≥λ_2≥⋯≥λ_p,相应的单位特征向量表示为e_1,e_2,…,e_p,特征向量矩阵表示为U。此时协方差阵Σ有如下表示方式1:
      在这里插入图片描述
      基于公式1和模型假设,我们还可以得到协方差阵Σ有如下式2的表示方法:
      在这里插入图片描述
      结合公式1和2,我们可以得到因子载荷矩阵的估计:
      在这里插入图片描述
      其中:
      在这里插入图片描述
      其中λ_i表示第i个特征值,e_ij表示λ_i相对应的第i个特征向量的第j个分量。
      得到载荷矩阵后,我们可以将因子模型表示为:
      在这里插入图片描述
    • 2.主因子法
      主因子方法是对主成分方法的修正,假定我们首先对变量进行标准化变换。则
      在这里插入图片描述
      称R为约相关矩阵,R对角线上的元素是h_i_2,而不是1。设h^_i_2是h_i_2的初始估计,则:在这里插入图片描述
      在这里插入图片描述
      在这里插入图片描述
      在这里插入图片描述
    • 3.极大似然估计法
      详见极大似然估计法

    1.3.3 因子载荷矩阵的旋转

    设Q为m阶正交矩阵,令B=AQ,则:
    在这里插入图片描述
    由于,上一小节得到的因子载荷矩阵A并不是唯一的,事实上对矩阵A做正交变换后得到的新矩阵都可以看作因子载荷矩阵。
    我们在得到一个因子载荷矩阵的估计时,有可能会出现多个变量均在同一个因子上出现较大因子载荷,或者一个变量在多个因子上具有较大的载荷,此时很难对因子进行解释或命名,此时我们希望通过对因子载荷矩阵进行旋转得到新的简化后的因子载荷矩阵,新的因子载荷之间区分度更高,便于因子分析和命名。
    载荷矩阵的旋转分正交旋转和斜交旋转两类。正交旋转的常用方法有方差最大法、四次方最大法和等量最大法。斜交旋转常用方法有最小斜交旋转法、四次方最小法、斜交旋转等。

    1.3.4 因子得分

    得到因子载荷矩阵之后,有时我们希望利用公共因子进行其他研宄,比如进行聚类分析或回归分析,此时我们希望能通过原始变量对公共因子进行估计,即得到因子得分。
    对于模型X=AF+ε,如果不考虑特殊因子ε的影响,可以得到X=AF,但矩阵A是pXm阶,模型中我们要求m<=p,通常因子个数远小于变量个数,即m<p,因此载荷矩阵不可逆,无法直接得到F的估计。
    公共因子估计的常用方法是回归法和Bartlett法(加权最小二乘法)。

    二、因子分析的应用实例

    假设某一社会经济系统问题,其主要特性可用4个指标表示,它们分别是生产、技术、交通和环境。其相关矩阵为:
    在这里插入图片描述
    相应的特征值、占总体百分比和累计百分比如下表:
    在这里插入图片描述
    对应特征值的特征向量矩阵为:
    在这里插入图片描述
    假如要求所取特征值反映的信息量占总体信息量的90%以上,则从累计特征值所占百分比看,只需取前两项即可。也就是说,只需取两个主要因子。对应于前两列特征值的特征向量,可求的其因子载荷矩阵A为:
    在这里插入图片描述
    于是,该问题的因子模型为:
    在这里插入图片描述
    因子分析:由以上可以看出,两个因子中,f1是全面反映生产、技术、交通和环境的因子,而f2却不同,它反映了对生产和技术这两项增长有利,而对交通和环境增长不利的因子。也就是说,按照原有统计资料得出的相关矩阵分析的结果是如果生产和技术都随f2增长了,将有可能出现交通紧张和环境恶化的问题,f2反映了这两方面的相互制约状况。
    Python编程应用示例见:因子分析(KMO检验和Bartlett’s球形检验)

    三、主成分分析(PCA)与因子分析(FA)的联系与区别

    主成分分析(PCA)是一种数据降维技巧,它能将大量相关变量转化为一组很少的不相关变量,这些无关变量称为主成分。探索性因子分析(EFA)是一系列用来发现一组变量的潜在结构的方法。它通过寻找一组更小的、潜在的或隐藏的结构来解释已观测到的、显式的变量间的关系。
    在这里插入图片描述
    主成分(PC1和PC2)是观测变量(X1到X5)的线性组合。形成线性组合的权重都是通过最大化各主成分所解释的方差来获得,同时还要保证个主成分间不相关。相反,因子(F1和F2)被当做是观测变量的结构基础或“原因”,而不是它们的线性组合。代表观测变量方差的误差(e1到e5)无法用因子来解释。图中的圆圈表示因子和误差无法直接观测,但是可通过变量间的相互关系推导得到。

    两者之间的区别与联系,具体而言有如下几种:

    • 联系:
          1. PCA和因子分析都是数据降维的重要方法,都对原始数据进行标准化处理,都消除了原始指标的相关性对综合评价所造成的信息重复的影响,都属于因素分析法,都基于统计分析方法
          2. 二者均应用于高斯分布的数据,非高斯分布的数据采用ICA算法
          3. 二者构造综合评价时所涉及的权数具有客观性,在原始信息损失不大的前提下,减少了后期数据挖掘和分析的工作量。

    • 区别:
          1. 原理不同; PCA的基本原理是利用降维(线性变换)的思想,在损失很少信息的前提下把多个指标转化为几个不相关的主成分,每个主成分都是原始变量的线性组合
      FA基本原理是从原始变量相关矩阵内部的依赖关系出发,把因子表达成能表示成少数公共因子和仅对某一个变量有作用的特殊因子的线性组合(因子分析是主成分的推广,相对于主成分分析,更倾向于描述原始变量之间的相关关系);
          2.假设条件不同; 主成分分析不需要有假设,而因子分析需要假设各个共同因子之间不相关,特殊因子(specificfactor)之间也不相关,共同因子和特殊因子之间也不相关;
          3. 求解方法不同; 主成分分析的求解方法从协方差阵出发,而因子分析的求解方法包括主成分法、主轴因子法、极大似然法、最小二乘法、a因子提取法等;
          4. 降维后的“维度”数量不同,即因子数量和主成分的数量; 主成分分析的数量最多等于维度数;而因子分析中的因子个数需要分析者指定(SPSS和SAS根据一定的条件自动设定,只要是特征值大于1的因子主可进入分析),指定的因子数量不同而结果也不同。
          5. 线性表示方法不同; 因子分析是把变量表示成各公因子的线性组合;主成分分析中则是把主成分表示成各变量的线性组合。
          6. 主成分和因子的变化不同; 主成分分析:当给定的协方差矩阵或者相关矩阵的特征值唯一时,主成分一般是固定的独特的;因子分析:因子不是固定的,可以旋转得到不同的因子。
          7.解释重点不同; 主成分分析:重点在于解释个变量的总方差;因子分析:则把重点放在解释各变量之间的协方差。
          8.算法上的不同; 主成分分析:协方差矩阵的对角元素是变量的方差;因子分析:所采用的协方差矩阵的对角元素不在是变量的方差,而是和变量对应的共同度(变量方差中被各因子所解释的部分)。
          9.优点不同; 对于因子分析,可以使用旋转技术,使得因子更好的得到解释,因此在解释主成分方面因子分析更占优势;其次因子分析不是对原有变量的取舍,而是根据原始变量的信息进行重新组合,找出影响变量的共同因子,化简数据;如果仅仅想把现有的变量变成少数几个新的变量(新的变量几乎带有原来所有变量的信息)来进入后续的分析,则可以使用主成分分析,不过一般情况下也可以使用因子分析。

            综合来看,因子分析在实现中可以使用旋转技术,因此可以得到更好的因子解释,这一点比主成分占优势;另外,因子分析不需要舍弃原有变量,而是站到原有变量间的共性因子作为下一步应用的前提,其实就是由表及里去发现内在规律。但是,主成分分析由于不需要假设条件,并且可以最大限度的保持原有变量的大多数特征,因此适用范围更广泛,尤其是宏观的未知数据的稳定度更高。

    总结

    • 因子分析跟主成分分析一样,由于侧重点都是进行数据降维,因此很少单独使用,大多数情况下都会有一些模型组合使用。例如:
      (1) 因子分析(主成分分析)+多元回归分析:判断并解决共线性问题之后进行回归预测;
      (2) 因子分析(主成分分析)+聚类分析:通过降维后的数据进行聚类并分析数据特点,但因子分析会更适合,原因是基于因子的聚类结果更容易解释,而基于主成分的聚类结果很难解释;
      (3) 因子分析(主成分分析)+分类:数据降维(或数据压缩)后进行分类预测,这也是常用的组合方法。

    • 因子分析通过寻找公共因子的方式达到数据降维的目的(因子分析还可以用于分析不同变量之间的内在联系),主成分分析则是求特征矩阵,实现数据的降维。

    • 因子分析的主要作用:
      (1) 寻求基本数据结构;
      (2) 用少数因子,描述具有相关性的多个指标;
      (3) 数据简化,即降维。
      1) 强相关问题会对分析带来困难
      2) 通过因子分析可以找出少数的几个因子替代原来的变量做回归分析、聚类分析和判别分析

    参考文献来源:
    https://www.cnblogs.com/wintergrass/archive/2011/10/27/2226454.html     因子分析法(Factor Analysis Method) 【转】
    https://www.cnblogs.com/echo-coding/p/8724373.html     因子分析
    http://www.dataivy.cn/blog/%E5%9B%A0%E5%AD%90%E5%88%86%E6%9E%90factor-analysis/     因子分析(Factor Analysis)
    https://www.cnblogs.com/90zeng/p/Factor_analysis_model.html     因子分析
    https://wenku.baidu.com/view/67fb7a5a3b3567ec102d8abd.html     很好的因子分析法讲义和实例
    https://blog.csdn.net/iceberg7012/article/details/109036194    主成分分析算法简述
    https://www.cnblogs.com/lantingg/p/9293880.html     主成分分析和因子分析区别与联系
    https://www.cnblogs.com/liulunyang/p/3931685.html     主成分分析与因子分析的十大不同
    https://www.cnblogs.com/jpld/p/4483415.html      R in action读书笔记(19)第十四章 主成分和因子分析
    https://www.cnblogs.com/Bfrican/p/4442663.html     Stat3—因子分析(Factor Analysis)
    山东省县域经济发展情况综合分析一基于因子分析和聚类分析(马玉涛-山东大学硕士论文)
    https://www.cnblogs.com/caiyishuai/p/12421034.html     Python——因子分析(KMO检验和Bartlett’s球形检验)
    https://www.cnblogs.com/TreeDream/p/8337765.html     因子分析-应用
    http://www.doc88.com/p-30022239605.html     探索性因子分析与验证性因子分析的比较研究
    https://blog.csdn.net/hfutxiaoguozhi/article/details/78840126     基于R的因子分析(含代码)
    https://blog.csdn.net/sinat_36744986/article/details/86477963    SPSS软件做因子分析

    展开全文
  • 【更新2】因子分析

    2021-01-25 22:16:10
    因子分析法通过研究变量间的相关系数矩阵,把这些变量间错综复杂的关系归结成少数几个综合因子,由于归结出的因子个数少于原始变量的个数,但是它们又包含原始变量的信息,所以,这一分析过程也称为降维。...

    因子分析由斯皮尔曼在1904年首次提出,其在某种程度上可以被看成是主成分分析的推广和扩展。
    因子分析法通过研究变量间的相关系数矩阵,把这些变量间错综复杂的关系归结成少数几个综合因子,由于归结出的因子个数少于原始变量的个数,但是它们又包含原始变量的信息,所以,这一分析过程也称为降维。由于因子往往比主成分更易得到解释,故因子分析比主成分分析更容易成功,从而有更广泛的应用。
    在这里插入图片描述
    在这里插入图片描述
    在这里插入图片描述
    在这里插入图片描述
    在这里插入图片描述

    在这里插入图片描述
    在这里插入图片描述
    在这里插入图片描述
    在这里插入图片描述
    在这里插入图片描述
    因子分析的实例

    例1:在1984年洛杉矶奥运会田径统计手册中,有55个国家和地区的如下八项
    男子径赛运动记录:
    X1: 100米(单位:秒) x5: 1500米(单位:分)
    x2: 200米(单位:秒) x6: 5000米(单位:分)
    x3: 400米(单位:秒) x7: 10000米(单位:分)
    x4: 800米(单位:秒) x8: 马拉松(单位:分)
    在这里插入图片描述
    在这里插入图片描述
    在这里插入图片描述
    在这里插入图片描述
    在这里插入图片描述
    在这里插入图片描述
    在这里插入图片描述
    在这里插入图片描述
    在这里插入图片描述
    在这里插入图片描述

    展开全文
  • 一、层次分析法原理层次分析法(analytic hierarchy process,ahp)由美国运筹学家托马斯·塞蒂(t. l. saaty)于20世纪70年代中期提出,用于确定评价模型中各评价因子/准则的权重,进一步选择最优方案。该方法仍具有较...
  • 文章首先建立了我国煤矿安全的评价指标体系,该指标体系克服了前人所建立指标体系的不足,然后使用因子分析法对一个煤矿实例进行了安全评价。本文为煤矿安全评价提供了另外一个视角,具有一定的理论和现实意义。
  • 一、层次分析法原理 层次分析法(Analytic Hierarchy Process,AHP)由美国运筹学家托马斯·塞蒂(T. L. Saaty)于20世纪70年代中期提出,用于确定评价模型中各评价因子/准则的权重,进一步选择最优方案。该方法仍...
  • 3 因子分析法实例 [1] 4 因子分析与主成分分析的区别 [2] 5 相关条目 6 参考文献 什么是因子分析  因子分析法是指从研究指标相关矩阵内部的依赖关系出发,把一些信息重叠、具有错综复杂关系的变量归结为...
  • 3.因子分析的具体实例 4.本章例子中的样本 5.补充注意事项 6.因子载荷量小的变量的处理方法 7.极大似然 8.旋转与Varimax 9.因子载荷量矩阵和因子结构矩阵 10.Promax 11.能够假定的公共因子个数的上限 12.主...
  • 一、层次分析法原理层次分析法(Analytic Hierarchy Process,AHP)由美国运筹学家托马斯·塞蒂(T. L. Saaty)于20世纪70年代中期提出,用于确定评价模型中各评价因子/准则的权重,进一步选择最优方案。该方法仍具有较...
  • 简介 主成分分析(PCA)是将多个变量通过线性变换,以选出较少个数的重要变量的一种多元统计分析方法。 主成分:由原始指标综合形成的几个新指标。...(2)进行因子分析 (3)计算结果 (4)求指标对应的系...
  • 模型选用影响顶煤可放性的9个指标作为判别因子,将顶煤可放性分为4个等级作为Bayes判别分析的4个正态总体,以工程实例数据作为学习样本进行训练,建立相应的判别函数,并利用回代对判别准则进行评价以验证模型的优良性...
  • 为了获得在煤柱留设研究中相对比较准确的预测公式,基于多元回归分析法,在总结全国各典型煤矿断层防隔水煤柱相关资料的基础上,以水头压力、煤层厚度、安全系数、煤体抗拉强度为主要影响因子,研究了煤矿断层防隔水煤柱...
  • 将建立的判别模型应用于工程实例,预测结果与实际情况吻合良好,与Bayes判别、神经网络模型判别结果一致。研究结果表明,Fisher判别分析用于围岩分类简便可行,正确率高,是解决隧洞围岩分类的一种有效方法。
  • 该模型选用煤层的埋藏深度、裂隙发育程度、孔隙率、湿润边角、饱和水分增值和坚固性系数6个指标作为判别因子,将煤层注水的难易程度分为3个等级作为Bayes判别分析的3个正态总体。以15组煤层注水实测数据作为训练样本,...
  • 建立了煤与瓦斯突出预测的Bayes判别模型,选用5项指标作为判别因子,将突出类型分为4个等级作为Bayes模型的正态总体,利用训练好的模型进行了实例预测。研究表明,Bayes判别模型是预测突出的有效方法。
  • 选用表土层厚度、底含厚度、底含水位速降、井筒外径、井壁厚度和井筒投入使用时间6项指标作为距离判别分析模型的判别因子,以历史上工程实测数据作为学习样本进行训练,建立相应判别函数对工程实例进行预测....
  • 设置实常数:弹簧的刚度K,接触面的向接触刚度因子FKN。 设置材料库:弹性模量,泊松比,密度,屈服强度和切线模量。 创建有限元模型:底板(指定壳单元),石子(指定实体单元),最后弹簧(指定弹簧单元)。在...
  • 首先,从直接反映配电网设备利用率的指标容量因子和负载率展开影响因子分析,对比了有/无源配电网中影响因子的差异,进一步基于设备负载特性、设备运行时间及设备参数3个方面,构建了一套有源配电网设备利用率影响...
  • 实例5 secret2.exe 由分析可知: 程序要求输入的字符串其实是提示正确信息字符串(you are welcome!)中取9位以内个数的字符。取是取第1、3、5、7、9、11、13、15、17位上的字符的ASCII码加一。即zvbfxmpf!。...
  • 摘要:介绍了求解 BWRS状态方程中压缩因子的数值方法 ,在求解方面重点介绍了...并结合计算实例对结果进行了分析 ,得出运用推荐的计算压缩因子的算法具有使用简单快捷、 精度高等特点的结论 ,给工程实际计算带来了方便。
  • 为克服个体决策者知识的不完备性,该文提出利用多领域的专家知识实现决策,并结合Delphi和AHP对半结构化的决策问题进行定量分析.结合农业产业结构调整中影响因子及其权重的确定实例给出了群体决策的实现策略.
  • C语言经典实例100例 【程序16】 题目:输入两个正整数m和n,求其最大公约数和最小公倍数。 1.程序分析:利用辗除。 2.程序源代码: 【程序19】 题目:一个数如果恰好等于它的因子之和,这个数就称为“完数”。...
  • 基于仿真平台PSCAD按照某99 MW风电场参数搭建实例仿真模型,在验证模态分析法可行性的同时,深入研究随着风电场集电线路长度和风机并网台数改变时的并网谐振各节点参与因子与谐振中心的变化规律。
  • 本文应用因子分析法因子载荷阵的简单结构、加权算术平均数的合理性,得出主成分分析综合评价的应用条件是:指标是正向、标准化的,主成分载荷阵达到更好的简单结构,主成分正向,主成分与变量显著相关;并结合2010年广东省...
  • 为了提高矿井涌水量预测的精度,基于多元回归分析法,以可能影响涌水量的累计采空面积、累计煤炭产量、累计采掘进尺、采厚为主要影响因子,对涌水量进行预测研究。利用SPSS软件分析相关程度、Matlab软件绘制散点图,并对...
  • R语言经典实例(中+英)

    热门讨论 2014-12-03 18:46:15
     13.9 因子分析 361  第14章 时间序列分析 366  14.1 表示时间序列 367  14.2 绘制时序图 370  14.3 提取最老的观测值或者最新的观测值 373  14.4 选取时间序列的子集 374  14.5 合并多个时间序列 376  14.6...
  • 《应用多元统计分析》为...第八章 因子分析 §8.1 引言 §8.2 因子模型 …… 第九章 对应分析方法 第十章 典型相关分析 第十一章 偏最小二乘回归分析 附录 矩阵代数 部分习题参考解答或提示 参考文献 主要符号说明 索引

空空如也

空空如也

1 2 3 4 5
收藏数 99
精华内容 39
关键字:

因子分析法实例