精华内容
下载资源
问答
  • 因子分析进行数据预处理,进行因子分析介绍
  • 量化投资中的聚类、贝叶斯判别及因子分析应用研究.pdf
  • R-因子分析应用

    万次阅读 多人点赞 2018-05-24 21:55:43
    摘要了解各个地区的教育水平对提升国民素质及建设美好社会主义中国有着极大的作用。本文对中国各省市就业人员受教育水平...给出了全国各个省份就业人员受教育水平的综合评价,愿为因子分析法在实际生活中的应用提供...

     

    摘要

    了解各个地区的教育水平对提升国民素质及建设美好社会主义中国有着极大的作用。本文对中国各省市就业人员受教育水平进行研究,使用了2015年全国31个省份的就业人员受教育程度的数据,运用因子分析方法对影响其教育水平的因素进行分析,选取了3个主要因子,并合理解释了全国各个地区就业人员受教育水平在各个因子上的得分,给出了全国各个省份就业人员受教育水平的综合评价,愿为因子分析法在实际生活中的应用提供依据。

    关键词:就业人员受教育水平、因子分析法

    Abstract

    Understanding the educationallevel of various regions plays a great role in improving the quality of thepeople and building a better socialist China. This paper studies theeducational level of the employment personnel in various provinces and citiesin China, uses the data of the educational level of the workers in 31 provincesin 2015, analyzes the factors affecting their educational level by means offactor analysis, selects 3 main factors, and understands the education of theemployment personnel in all regions of the country. The score of the level oneach factor gives the comprehensive evaluation of the educational level of theemployment personnel in all provinces of the country, and is willing to providethe basis for the application of factor analysis in the actual life.

    Keywords:Theeducational level and factor analysis method of the employment personnel



    现如今,随着经济多元化的不断发展,各层岗位所需要的人才也不断的多元化,各省份就业人员的文化水平参差不齐。为了更好的了解各省份就业人员整体文化水平,本文以2015年劳动力调查资料中各省份就业人员文化水平所占比例的数据为例,使用因子分析法对各省份从业人员文化水平进行了综合分析,得出了北京、上海、天津、江苏、广东地区的就业人员文化程度普遍高于其他地区。

    二、          因子分析简介

    2.1 基本思想:

    因子分析同主成分分析一样,它也是利用降维的思想,由研究原始变量相关矩阵内部的依赖关系出发,把一些具有错综复杂关系的变量归结为少数几个综合因子的一种多变量统计分析方法。其基本思想是根据相关性大小把原始变量分组,使得同组内的变量之间相关性较高,不同组的变量间相关性则较低。

    因子分析不仅可以帮助我们对复杂的经济问题进行分析和解释,还可用于对变量或样品进行分类处理。本文以R型因子分析(即研究变量间的相关关系)出发,对所给出的问题进行分析、解释及分类。

    2.2 模型理论:

    假设由n个样品,每个样品观测值p个指标,这p个指标之间具有较强的相关性。为了便于研究,对样本观测数据进行标准化处理。使标准化后的变量均值为0,方差为1。为方便,将原始变量及标准化变量均用向量X表示,用表示标准化的公共因子(F为隐变量,不可观测,且均值为0,协方阵为单位阵),此外,还假设是相互独立的。则有以下模型:

     

    矩阵可表示为  

    其中,                 

    2.3因子分析基本步骤

    ⑴根据研究问题选取原始变量;

    ⑵对原变量进行标准化并求其相关阵,分析变量之间的相关性;

    ⑶求解初始公共因子及因子载荷矩阵(如主成分法、主轴因子法、极大似然法等);

    ⑷因子旋转(必要的时候可进行);

    ⑸计算因子得分;

    ⑹根据因子得分值进一步分析。

    三、          案例分析

    下面是全国31个省份的就业人员受教育程度(百分比)统计,即一百个就业人员中,各种学历的人员所占的比例,数据来源于2015年劳动力调查资料,为了操作方便,我们对数据做了一些处理,删除了一些指标。我们的目的是利用因子分析把31个省份归类,看看哪些省份的就业人员有着相似比率的受教育程度。方便我们更好选择就业城市。

     

     

     

    3.1 数据及指标解释

    地区

    x1

    x2

    x3

    x4

    x5

    x6

    x7

    x8

    x9

    北京

    0.2

    3

    21.5

    13.6

    7.3

    1.9

    19.8

    26.8

    6.1

    天津

    0.5

    8.4

    33.5

    12.1

    9.8

    1.3

    14.8

    17.3

    2.3

    河北

    1.3

    13.6

    49.4

    13.6

    5.2

    1.1

    9.2

    6

    0.5

    山西

    1.3

    11.6

    47.5

    13

    4.9

    0.9

    10.9

    9.1

    0.8

    内蒙古

    2.4

    17.7

    45.2

    12.5

    3.4

    0.8

    10.2

    7.6

    0.3

    辽宁

    0.5

    12.7

    50.3

    10.1

    5.1

    1.4

    9.8

    9.3

    0.9

    本文数据来源于《中国统计年鉴2015》,上述只展示了经处理的前几行数据,具体原数据详见附录。其中,

    X1——为上过学;          x2——小学;

    X3——初中;              x4——高中;

    X5——中等职业教育;        x6——高等职业教育;

    X7——大学专科;          x8——大学本科;

    X9——研究生.

    3.2计算运行结果

    3.2.1 读入数据

    > mydata <- read.csv(file.choose('education.csv'))
    > attach(mydata)
    > head(mydata)  

     

     

      地区  x1   x2   x3   x4  x5  x6   x7   x8  x9
    1   北京 0.2  3.0 21.5 13.6 7.3 1.9 19.8 26.8 6.1
    2   天津 0.5  8.4 33.5 12.1 9.8 1.3 14.8 17.3 2.3
    3   河北 1.3 13.6 49.4 13.6 5.2 1.1  9.2  6.0 0.5
    4   山西 1.3 11.6 47.5 13.0 4.9 0.9 10.9  9.1 0.8
    5 内蒙古 2.4 17.7 45.2 12.5 3.4 0.8 10.2  7.6 0.3
    6   辽宁 0.5 12.7 50.3 10.1 5.1 1.4  9.8  9.3 0.9
    #计算相关阵
    >r <- cor(scale(mydata[,-1])); r

     

      x1         x2          x3         x4          x5         x6
    x1  1.0000000  0.7303868 -0.58210264 -0.7266064 -0.53040056 -0.6134866
    x2  0.7303868  1.0000000 -0.25785170 -0.7334589 -0.72672006 -0.6840356
    x3 -0.5821026 -0.2578517  1.00000000  0.3661459 -0.02643989  0.1504135
    x4 -0.7266064 -0.7334589  0.36614590  1.0000000  0.44341872  0.7154409
    x5 -0.5304006 -0.7267201 -0.02643989  0.4434187  1.00000000  0.6063987
    x6 -0.6134866 -0.6840356  0.15041352  0.7154409  0.60639871  1.0000000
    x7 -0.4076279 -0.7499635 -0.36459518  0.4065892  0.63640827  0.4968509
    x8 -0.3320995 -0.6566241 -0.47734047  0.2718571  0.62871207  0.4120036
    x9 -0.2724071 -0.5921219 -0.49823358  0.2173291  0.59530784  0.4256475
               x7         x8         x9
    x1 -0.4076279 -0.3320995 -0.2724071
    x2 -0.7499635 -0.6566241 -0.5921219
    x3 -0.3645952 -0.4773405 -0.4982336
    x4  0.4065892  0.2718571  0.2173291
    x5  0.6364083  0.6287121  0.5953078
    x6  0.4968509  0.4120036  0.4256475
    x7  1.0000000  0.9456458  0.8577081
    x8  0.9456458  1.0000000  0.9487681
    x9  0.8577081  0.9487681  1.0000000

    由相关系数阵可知其大多数简单相关系数是大于0.3的,由此我们可以进行因子分析。

    3.2.2 求解公共因子及载荷矩阵(主成分法)

    1)主成分选取

    > mydata.pr <- princomp(scale(mydata[,-1]))
    > summary(mydata.pr)

     

    Importance of components:
                                Comp.1    Comp.2     Comp.3     Comp.4
    Standard deviation     2.228114 1.5171842 0.70706911 0.64670310
    Proportion of Variance 0.569997 0.2642862 0.05740129 0.04801841
    Cumulative Proportion  0.569997 0.8342833 0.89168458 0.93970299
                               Comp.5     Comp.6     Comp.7      Comp.8
    Standard deviation     0.48607383 0.41181881 0.32048415 0.128706142
    Proportion of Variance 0.02712704 0.01947199 0.01179264 0.001901939
    Cumulative Proportion  0.96683003 0.98630202 0.99809466 0.999996600
                                 Comp.9
    Standard deviation     5.441946e-03
    Proportion of Variance 3.400215e-06
    Cumulative Proportion  1.000000e+00
     
    #勾画碎石图
    > screeplot(mydata.pr, main = '碎石图', type = 'l', lwd = 2)

    由方差贡献表知当选择前三个主成分时,其累积方差贡献率达到 89.2%(>85%)。此外,由碎石图可知从第三个方差变化的趋势已渐平稳,因此,我们选择前三个主成分。

    2)计算因子载荷阵

    >library(psych) 
    > pc <- principal(r, nfactors = 3, rotate = 'none')
    > pc$loadings
    Loadings:
       PC1    PC2    PC3   
    x1 -0.702  0.591  0.234
    x2 -0.918  0.233  0.139
    x3        -0.944 -0.288
    x4  0.686 -0.538  0.298
    x5  0.813              
    x6  0.763 -0.298  0.487
    x7  0.877  0.379       
    x8  0.832  0.517 -0.132
    x9  0.787  0.543       
     
                    PC1   PC2   PC3
    SS loadings    5.13 2.379 0.517
    Proportion Var 0.57 0.264 0.057
    Cumulative Var 0.57 0.834 0.892
    通过因子载荷阵发现,未旋转的公共因子的实际意义并不好解释,其在各成分的载荷系数差别不大,因此,为更好的分析判别,我们有必要对公共因子进行方差最大化旋转。
    3)因子旋转(即方差最大化因子旋转) 
    > pc1 <- principal(r, nfactors = 3, rotate = 'varimax')
    > pc1$loadings
    Loadings:
          RC1    RC3    RC2   
    x1 -0.291 -0.455 -0.778
    x2 -0.630 -0.498 -0.521
    x3 -0.462  0.156  0.859
    x4  0.155  0.813  0.405
    x5  0.661  0.394  0.270
    x6  0.295  0.896  0.134
    x7  0.919  0.271       
    x8  0.975  0.153       
    x9  0.936  0.162 -0.126
     
                     RC1   RC3   RC2
    SS loadings    3.916 2.221 1.888
    Proportion Var 0.435 0.247 0.210
    Cumulative Var 0.435 0.682 0.892
    我们很清楚的看到各主成分因子实行了两极分化,即新的因子载荷系数要么尽可能的接近于0,要么尽可能的接近于1,这样更能便于我们分析问题。

    由旋转后的因子载荷矩阵可看出,公共因子F1在 x5(中等职业教育),x7(大学专科),x8(大学本科),x9(研究生)上载荷值都很大,在一定程度上反应了高等教育;而公共因子F2在x4(高中),x6(高等职业教育)的载荷较大,在此因子上反应了中等教育;对于公共因子F3,其在x1(未上过学), 在x2(小学),x3(初中)的载荷较大,则反应了初等教育(包括未受过教育),在这个方面因子上的得分越高,表明该省市就业人员文化水平较低,一定程度上反应了其教育资源有所匮乏,也在一定程度上反应了该省市比较落后的经济水平。

    4)计算综合因子得分并排序
    > W <- as.matrix(pc1$weights)
    > X <- as.matrix(scale(mydata[,-1]))
    > P <- X%*%W
    > pc.rank <- function(F){
    +   F1 = P[,1]
    +   F2 = P[,2]
    +   F3 = P[,3]
    +   F = (0.57*F1+0.264*F2+0.057*F3)/0.892
    +   F.rank = rank(-F)
    +   result = cbind(F1, F2, F3, -F, F.rank)
    +   return(result)
    + }
    > pc.rank(F)        

       

                F1          F2            F3                      F.rank
     [1,]  3.49966630  0.61640350 -1.06899610 -2.350456883      1
     [2,]  2.10798877 -0.37441302  0.51224932 -1.268953783      3
     [3,] -0.17520540 -0.13803644  1.11990150  0.081249232     15
     [4,]  0.39214784 -0.78261582  1.30315753 -0.102235055      8
     [5,] -0.06679056 -0.80629340  0.82216454  0.228776567     21
     [6,]  0.24573412 -0.46700613  1.17065646 -0.093616867      9
     [7,] -0.64077476  0.73374032 -0.05071280  0.195543496     19
     [8,] -0.27684834 -0.01526615  0.87632180  0.125429903     16
     [9,]  2.70399200  0.05535172 -0.33408426 -1.722920956      2
    [10,] -0.01944532  1.82624933 -0.57546749 -0.491305315      4
    [11,]  0.22346389  0.38317856 -0.28247917 -0.238152742      6
    [12,] -0.28500693 -1.21172171  0.43524582  0.512936624     27
    [13,]  0.06395090 -0.35571897  0.26810817  0.047282095     14
    [14,] -0.75156486  0.48514478  0.15405846  0.326830059     24
    [15,] -0.36256328  0.64888330  0.52426580  0.006135346     12
    [16,] -0.70144561  0.37720770  0.77624523  0.286990123     22
    [17,] -0.30790151  0.92240564 -0.16307277 -0.065825199     10
    [18,] -0.56653155  0.40763466  0.34155270  0.219550368     20
    [19,] -0.68887713  3.05256165 -0.67564016 -0.420072673      5
    [20,] -0.32297963 -0.48522098  0.91669665  0.291418180     23
    [21,] -0.39404141  0.01123883  0.95981877  0.187137759     18
    [22,] -0.17324784  0.43999563 -0.65313455  0.022220951     13
    [23,] -0.74539468 -0.01588454 -0.56882973  0.517367470     28
    [24,] -0.64733525 -1.65458547 -0.28132063  0.921330643     30
    [25,] -0.59336609 -1.51451586 -0.23491061  0.842422377     29
    [26,] -0.73664299 -1.46254300 -4.13638864  1.167905838     31
    [27,] -0.52390478  1.35845021 -0.19757762 -0.054644854     11
    [28,] -0.63545478 -0.01725606 -0.64977938  0.452693108     26
    [29,] -0.09094485 -1.18370509 -0.48647443  0.439535598     25
    [30,]  0.02176722 -0.54644248 -0.09943017  0.154171547     17
    [31,]  0.44755649 -0.28722068  0.27785577 -0.218742957      7
     

    由综合因子得分排序(F.rank),我们可看出排名前五的省份依次是北京、上海、天津、江苏、广东;排名末尾的五位分别为西藏、贵州、云南、四川、安徽。这表明对于受过高等教育的人员来说,他们更倾向于选择经济发达省市就业(例如北上广)以增加自己的就业实力,同时可看出这些省市就业压力之大;然而,对于较不发达的省市(如云、贵、藏等),它们就业人员中,其受教育程度相对北上广等省市就低得多,这也表明其经济水平相对落后状况,同时反应了一个省市经济实力是否发达,可在一定程度上由其受教育程度直接反应出。

    5)总结

    ⑴  省份的经济实力作用于教育,而教育在一定程度上反作用于经济。拿北京和西藏两个省份来说,对于北京,其就业人员受教育程度明显比西藏要高,相比西藏,其经济实力明显雄厚,更能吸引更多的知识分子前去就业。对于西藏,无论是从经济方面还是从教育方面考虑,都相对落后,因此有待加强。

    ⑵  选择地方就业应结合自身实力。例如,选择在发达的省份就业的人除了要考虑自身技能以外,还需考虑自己的受教育水平。以北京为例,北京是一座动感城市,其各种竞争压力都很大。如果你想去北京工作,教育是衡量一个人是否优秀的硬指标。刚才前面提到,经济的发达程度与教育是相关联的。对于北京来说,其教育资源丰富,市民所受教育程度比较高。因此,如果你想去北京就业,拥有一个良好的教育背景是非常有必要的,它不仅能够增加你的就业竞争实力,更能够为你以后幸福生活奠定了基础。

    ⑶ 中国教育发展不平衡,国家应重视西部教育。由综合因子得分排名可知排名偏末的大都是西部地区,其中就有西藏、甘肃、贵州、云南、青海等省份。这些省份的就业人员中,其接受教育程度相对较低,有的甚至并没有接受过教育。而相比那些比较发达的省份,例如北京、上海、天津、广州等等,其就业人士所接受的教育程度至少为小学教育,有的甚至是研究生教育。由此可看出,仅在教育程度上,我国东西部差距之大(其他方面本文现不考虑)。因此,为了让每一个人享受知识,进而共同实现中国梦,民族梦,富强梦,那么国家重视西部教育就很有必要。

    四、          结论

    本文简单介绍了因子分析法的基本思想及实现步骤,以全国各省份就业人员的文化水平数据为例,运用了因子分析法对原始9个变量求解公共因子,合理地选取了3个公共因子,即高等教育、中等教育、初等教育,并计算了各省份就业人员整体文化水平的因子得分,合理的评价了各地区就业人员的文化水平,并提出了一些建议与看法。

    附录

    全国各省份就业人员受教育水平

    单位: %

    地区

    未上过学

    小学

    初中

    高中

    中等职业教育

    高等职业教育

    大学专科

    大学本科

    研究生

    北京1

    0.2

    3

    21.5

    13.6

    7.3

    1.9

    19.8

    26.8

    6.1

    天津2

    0.5

    8.4

    33.5

    12.1

    9.8

    1.3

    14.8

    17.3

    2.3

    河北3

    1.3

    13.6

    49.4

    13.6

    5.2

    1.1

    9.2

    6

    0.5

    山西4

    1.3

    11.6

    47.5

    13

    4.9

    0.9

    10.9

    9.1

    0.8

    内蒙古5

    2.4

    17.7

    45.2

    12.5

    3.4

    0.8

    10.2

    7.6

    0.3

    辽宁6

    0.5

    12.7

    50.3

    10.1

    5.1

    1.4

    9.8

    9.3

    0.9

    吉林7

    1.2

    20.9

    43.1

    13.9

    3.7

    1.4

    7.6

    7.8

    0.4

    黑龙江8

    0.9

    14

    49.8

    12.7

    3.3

    1.3

    9.4

    8.1

    0.5

    上海9

    0.8

    4.9

    29.3

    12.9

    6.6

    1.6

    17.1

    22

    4.8

    江苏10

    2

    13.1

    40.6

    13.6

    5.6

    2.1

    12

    10

    0.9

    浙江11

    2.7

    16.5

    37.6

    13.7

    3.5

    1.3

    12.4

    11.5

    0.8

    安徽12

    7.4

    20.6

    45.2

    8.9

    3.9

    0.8

    7.3

    5.6

    0.4

    福建13

    3

    20.3

    41

    11.2

    5.6

    1.1

    8.8

    8.5

    0.6

    江西14

    2.7

    20.6

    44.8

    14.1

    4.1

    1.2

    7.2

    5

    0.4

    山东15

    2.7

    14

    47.9

    13.1

    6.1

    1.5

    8.3

    5.9

    0.5

    河南16

    2.4

    14.6

    51.2

    13.8

    4

    1.3

    7.6

    4.8

    0.4

    湖北17

    3.4

    17.4

    41.9

    13.7

    5.8

    1.5

    8.7

    6.8

    0.8

    湖南18

    2.2

    17.9

    44.7

    15.2

    3.9

    1.1

    8.2

    6.2

    0.4

    广东19

    0.9

    12.8

    42.7

    17.4

    6.6

    2.3

    9.8

    6.9

    0.6

    广西20

    1.7

    19.2

    50

    9.3

    5.1

    1.3

    8.1

    5

    0.4

    海南21

    2.5

    14.1

    50.8

    12.1

    5.3

    1.3

    7.7

    5.9

    0.3

    重庆22

    2.9

    24.7

    35.7

    12.4

    4.4

    1.3

    10.1

    7.5

    0.9

    四川23

    4.2

    29.8

    39

    10

    3.7

    1.2

    7

    4.6

    0.4

    贵州24

    8.7

    32.2

    40.3

    5.6

    3

    0.7

    5.3

    4

    0.2

    云南25

    6.1

    34.3

    39.7

    5.7

    3.5

    0.8

    4.9

    4.6

    0.4

    西藏26

    30.5

    40.7

    13.6

    3

    1.8

    0.3

    5.9

    4

    0.1

    陕西27

    2.7

    14.7

    45.5

    13.8

    3.9

    1.8

    10

    6.8

    0.8

    甘肃28

    5.6

    27.7

    36.9

    11.8

    3.7

    1

    6.8

    6.2

    0.4

    青海29

    7.2

    27.5

    35

    8.9

    2.8

    0.7

    9.9

    7.8

    0.2

    宁夏30

    6.1

    19.8

    38.8

    11.5

    3.7

    0.9

    10.7

    8.3

    0.4

    新疆31

    2.2

    16.9

    41

    10.6

    5.1

    1.3

    12.3

    9.9

    0.8

     

    ——数据来源于2015年劳动力市场调查资料                                                        

    展开全文
  • 主成分分析、因子分析、聚类分析是三种比较有价值的多元统计方法, 但同时也是在使用过程中容易误用或混淆的几种方法。 本文从基本思想、数据的标准化、应用上的优缺点等方面, 详细地探讨了三者的异同, 并且举例说明...
  • SPSS因子分析案例

    万次阅读 多人点赞 2018-01-14 20:43:40
    一、SPSS中的因子分析。 具体操作步骤: (1)定义变量:x1-财政用于农业的支出的比重,x2-第二、三产业从业人数占全社会从业人数的比重,x3-非农村人口比重,x4-乡村从业人员占农村人口的比重,x5-农业总产值占农林牧...

    PS:请见文末的打赏选项

    一、SPSS中的因子分析。

    具体操作步骤:

    (1)定义变量:x1-财政用于农业的支出的比重,x2-第二、三产业从业人数占全社会从业人数的比重,x3-非农村人口比重,x4-乡村从业人员占农村人口的比重,x5-农业总产值占农林牧总产值的比重,x6-农作物播种面积,x7—农村用电量。

     

    (2)导入数据:file-open-data

     

     

     

    (3)变量标准化Analyze-Descriptive Statistics-Descriptives

     

    展开全文
  • 建模方法(四)-因子分析定义和应用

    万次阅读 多人点赞 2018-08-20 20:58:05
    因子分析(factor analysis)也是一种降维、简化数据的技术。 它通过研究众多变量之间的内部依赖关系,使用少数几个“抽象”的变量来表示其基本的 数据结构。这几个抽象的变量被称作“因子”,能反映原来 众多变量的...

    因子分析(factor analysis)也是一种降维、简化数据的技术。 它通过研究众多变量之间的内部依赖关系,使用少数几个“抽象”的变量来表示其基本的 数据结构。这几个抽象的变量被称作“因子”,能反映原来 众多变量的主要信息。原始的变量是可观测的显在变量,而 因子一般是不可观测的潜在变量。 例如:商店的环境、商店 的服务和商品的价格作为因子,这三个方面除了价格外,商店的环境 和服务质量,都是客观存在的、抽象的影响因素,都不便于 直接测量,只能通过其它具体指标进行间接反映。因子分析 就是一种通过显在变量测评潜在变量,通过具体指标测评抽 象因子的统计分析方法。

    因子分析类型分为R型因子分析和Q型因子分析。就像聚类分析分为R型和Q型一样,R型的因子分析是对变量作因子分析, Q型因子分析是对样品作因子分析。

    下面我们以R型为例,介绍因子分析。

    R型因子分析的模型如下所示:

    R因子分析中的公共因子是不可直接观测但又客观存在的共 同影响因素,每一个变量都可以表示成公共因子的线性函数 与特殊因子之和,即 

    式中的F1 ,F2,...Fm称为公共因子,εi称为 Xi的特殊因子,Xi为可测变量。

    模型的矩阵形式如下:

    (7.2)

    以上式子满足:

    (1)式很好理解,因为我们目的是降维所以因子的数量一般都小于变量数量,不然没有任何意义。

    (2)式需要概率论基础,Cov表示协方差,相关系数的分子为协方差,而相关系数描述变量间的线性相关性,如果相关系数为0,表示变量线性无关,因为特殊因子如果与公共因子有线性关系,则特殊因子可以合并到公共因子里面。

    (3)与(2)类似,从这里可以看出为什么要用因子分析,各个变量相互相关,因子分析就是找出互不相关因子,揭示这些变量数据背后的结构,找出各个变量表达的主要信息。

    (4)可以这样理解因为ε是变量的特殊因子,所以只与变量有关。

    如果想要理解上诉的公式,可以参考概率论相关章节,如果只想知道如何应用因子分析,不知道概率论公式不影响。

    模型中的aij称为因子“载荷”,是第i个变量在第j个因子上 的负荷,因此矩阵 A 称为因子载荷矩阵。注意因子载荷矩阵A不是唯一的,在实际的应用中常常利 用这一点,通过因子的变换,使得新的因子有更好的实际意 义。 实 际上因子载荷矩阵存在明显的统计意义。

    aij是 变量Xi和因子Fj的相关系数(需要标准化Xi和Fj得出),它一方面表示Xi对Fj的依赖程度,绝对值 越大,密切程度越高;另一方面也反映了变量Xi对公共因子Fj 的相对重要性。

    下面介绍变量的共同度。

    设因子载荷矩阵为A,称第i行元素的平方和,即 

    为变量Xi的共同度。 
     由因子模型,知 

    对Xi做标准化处理后,得:

    (7.8)式说明变量Xi的方差由两部分组成: 第一部分为变量Xi的共同度,它描述了全部公共因子对变量Xi 的总方差所作的贡献,反映了公共因子对变量Xi的影响 程度。第二部分为特殊因子εi 对变量Xi的方差的贡献, 通常称为个性方差。

    上面是对载荷矩阵A的一行的计算,下面对列计算,即公因子Fj对全部变量的贡献。

    设因子载荷矩阵为A,称第j列元素的平方和,即 

    为公共因子Fj对所有变量的贡献,即上述结果表示同一公共因子Fj对 各变量所提供的方差贡献之总和,它是衡量每一个公共因子 相对重要性的一个尺度。他对于选择公因子的数量有很大的作用。

     

    求解因子载荷矩阵方法有主成分分析法、主因子法、大似然估计法,下面介绍主成分分析法:

    因为因子数<变量数,所以m+1~p是没有任何意义的,即图中红色标记,分解中将红色部分作为特殊因子的方差忽略。在式(7.5)中因随机向量X的协方差矩阵在X标准化以后就是相关矩阵,有如下式子

     

    上述绿色部分的p*m矩阵就是因子载荷矩阵A。

    因子旋转用于给各个公因子取一个描述性名字,像之前提到的使用商店的环境、商店 的服务和商品的价格作为描述商品的因子。因为我们得到的载荷矩阵中的因子的系数载荷在各个变量上的值很难看出差异,也就很难看出因子对于哪些变量很重要,也就难以得出因子的含义。而因子旋转使同一列上的载荷尽可能地向靠近 1和靠近0两极分离。这时就突出了每个公共因子和其载荷较 大的那些变量的联系,矛盾的主要方面显现出来了,该公共 因子的含义也就能通过这些载荷较大变量做出合理的说明, 这样也显示了该公共因子的主要性质。 它的原理这里就不给出了,matlab中仅需一行代码就可以得到因子旋转的结果。

    matlab命令:rotatefactors(A, 'method', 'varimax')

    给出一个例子:

    按上述求解因子载荷矩阵的方法确定矩阵,如下

    因子载荷矩阵可以看出,除第一因子中所有的变量在公共因子 上有较大的正载荷,可以称为一般运动因子。其他的3个因子不太 容易解释。似乎是跑和投掷的能力对比,似乎是长跑耐力和短跑速 度的对比。于是考虑旋转因子,得下表 

    因子得分:根据变量X反过来推出因子的值,因为X的值可观测,最后就得出以因子为指标的结果,可以对结果进行聚类分析等,下面给一个因子分析的完整例子。

    因子分析法在环境质量评价中的应用实例
            环境作为人类赖以生存的基础对经济社会的发展起 着巨大的作用。基于国家统计局统计数据库2008年的数 据,采用因子分析法对中国31个省市的环境质量进行了排 序。        分析结果显示,环保建设和环境污染在环境质量评价 中起主要作用,地区在注重保护基础环境的同时更要加强 对环境的补偿。

    1 环境质量评价指标体系构建
    依据国家统计局统计数据库2008年统计数据,选取 14项具体指标,作为中国区域环境质量评价指标体系。 这些指标分别为:        X1(生活污水排放量)、X2(废水治理设施数)、X3(工 业废气排放量)、X4(工业烟尘排放量)、X5(工业粉尘排 放量)、X6(生活烟尘排放量)、X7(工业废气治理设施数)、 X8(工业固体废弃物排放量)、X9(林业用地面积)、X10(森 林覆盖率)、X11(林业重点工程造林面积)、X12(森林病虫 鼠害防治率)、X13(工业污染治理项目本年投资完成额)、 X14(林业系统营林固定资产投资完成额)。

    2 因子分析
        因子分析首先将原始数据标准化处理,建立相关系数矩 阵并计算其特征值和特征向量,接着从中选择特征值大于等 于1的特征值个数为公共因子数,或者根据因子对X的累计贡献 率大于80%来确定公共因子,求得因子载荷矩阵, 后计算公因子得分和综合得分。

    这里注意相关系数矩阵为非单位阵,故可实施因子分析,因为因子分析的前提是变量Xi之间存在内部关系,这样才能分解为各因子。

    由于初始因子载荷阵结构不够简明,各因子的含义不突出。为此采用方差大正 交旋转变化,使各变量在某个因子上产生较高载荷,而在其余因子上载荷较小, 得到旋转后因子载荷矩阵,如表3所示。

    (注:F的表达式里面的-是+,图片有误)

     

     

    总结:

    因子分析通常包括以下五个步骤:

    1.选择分析的变量     用定性分析和定量分析的方法选择变量,因子分析的前提条件 是观测变量间有较强的相关性,因为如果变量之间无相关性或相 关性较小的话,他们不会有共享因子,所以原始变量间应该有较强 的相关性。

    2.计算所选原始变量的相关系数矩阵   相关系数矩阵描述了原始变量之间的相关关系。可以帮助判 断原始变量之间是否存在相关关系,这对因子分析是非常重要 的,因为如果所选变量之间无关系,做因子分析是不恰当的 并且相关系数矩阵是估计因子结构的基础。 

    3.提取公共因子     这一步要确定因子求解的方法和因子的个数,根据相关系数矩阵(协方差矩阵的标准化)来做。需要根据研 究者的设计方案或有关的经验或知识事先确定。因子个数的 确定可以根据因子方差的大小。只取方差大于1(或特征值大 于1)的那些因子,因为方差小于1的因子其贡献可能很小;按 照因子的累计方差贡献率来确定,一般认为要达到70%才能 符合要求; 

    4.因子旋转     通过坐标变换使每个原始变量在尽可能少的因子之间有密 切的关系,这样因子解的实际意义更容易解释,并为每个潜在 因子赋予有实际意义的名字。

     5.计算因子得分    求出各样本的因子得分,有了因子得分值,则可以在许多 分析中使用这些因子,例如以因子的得分做聚类分析的变量, 做回归分析中的回归因子。 在数学建模中可以直接使用因子得分公式。

    ==打赏博主==

    展开全文
  • 因子分析(FA)算法简述

    千次阅读 多人点赞 2020-10-16 15:29:53
    1.1 因子分析应用背景1.2 因子分析算法的基本步骤1.3 因子分析算法的数学解释1.3.1 因子模型1.3.2 因子载荷矩阵的求解二、因子分析的应用实例三、主成分分析(PCA)与因子分析(FA)的联系与区别总结 前言 在学习...


    前言

    在学习数据降维时,了解到因子分析(FA)算法是其中的一种方式,因此,在这里对因子分析算法做一个简要的归纳、梳理,后续会对数据降维的几种方式做个总结,感兴趣的朋友,可以持续关注。

    一、什么是因子分析?

    因子分析法是指: 研究从变量群中提取共性因子的统计技术,这里的共性因子指的是不同变量之间内在的隐藏因子。例如,一个学生的英语、数据、语文成绩都很好,那么潜在的共性因子可能是智力水平高。因此,因子分析的过程其实是寻找共性因子和个性因子并得到最优解释的过程。
    其基本思想是: 根据相关性大小把变量分组,使得同组内的变量之间相关性较高,但不同组的变量不相关或相关性较低,每组变量代表一个基本结构一即公共因子。
    因子分析有两个核心问题: 一是如何构造因子变量,二是如何对因子变量进行命名解释。
    因子分析类型: R型因子分析与Q型因子分析,就像聚类分析分为R型和Q型一样,R型的因子分析是对变量作因子分析,Q型因子分析是对样品作因子分析,本文是以R型因子分析展开。

    1.1 因子分析应用背景

    因子分析用于处理高斯数据,主要应用于以下两种情形

    1. 假如有 m 个样本,每个样本的维度是 n, 如果 n » m;这时哪怕拟合出一个高斯模型都很困难,更不用说高斯混合, 为什么呢?其实,这和解多元线性方程组是一样的道理,就是自变量的个数多于非线性相关的方程的个数,这必然导致解的不唯一,虽然在解方程的时候可以随便选一个解满足方程组,但是对于某一实际数据集,往往样本对应的概率分布在客观上都是唯一的,只是我们无法简单地用概率论中的几个典型的分布准确表示出来罢了!
    2. m 个样本的维度都较低。用高斯分布对数据建模,用最大似然估计去估计均值(期望)和方差:
      在这里插入图片描述
      我们会发现,协方差矩阵 Σ 是奇异的,即 Σ 不可逆,Σ-1 不存在,且有:
      在这里插入图片描述
      但是这两项在计算多元高斯分布时,又都是必不可少的。所以,除非 m 比 n 大一定较合适的数值,否则对方差和均值的最大似然估计将会很难找到正确的值。

    1.2 因子分析算法的基本步骤

    应用因子分析算法时,常常有如下几个基本步骤:

    1. 确定原有若干变量是否适合于因子分析;因子分析的基本逻辑是从原始变量中构造出少数几个具有代表意义的因子变量,这就要求原有变量之间要具有比较强的相关性,否则,因子分析将无法提取变量间的“共性特征”(变量间没有共性还如何提取共性?)。实际应用时,可以使用相关性矩阵进行验证,如果相关系数小于0.3,那么变量间的共性较小,不适合使用因子分析;也可以用KMO 和 Bartlett 的检验来判断是否适合做因子分析,一般来说KMO的值越接近于1越好,大于zhi0.5的话适合做因dao子分析,你的KMO值是0.674大于0.5。Bartlett 的检验主要看Sig.越小越好,你的接近于0.由此可以得出,你的数据适合做因子分析。
    2. 构造因子变量;因子分析中有多种确定因子变量的方法,如基于主成分模型的主成分分析法和基于因子分析模型的主轴因子法、极大似然法、最小二乘法等。
    3. 利用旋转使得因子变量更具有可解释性 ;在实际分析工作中,主要是因子分析得到因子和原变量的关系,从而对新的因子能够进行命名和解释,否则其不具有可解释性的前提下对比PCA就没有明显的可解释价值。
    4. 计算因子变量的得分 。子变量确定以后,对每一样本数据,希望得到它们在不同因子上的具体数据值,这些数值就是因子得分,它和原变量的得分相对应。

    具体而言:

    • (1) 相关性检验,一般采用KMO检验法和Bartlett球形检验法两种方法来对原始变量进行相关性检验;
    • (2) 输入原始数据Xn*p,计算样本均值和方差,对数据样本进行标准化处理;
    • (3) 计算样本的相关矩阵R;
    • (4) 求相关矩阵R的特征根和特征向量;
    • (5) 根据系统要求的累积贡献率确定公共因子的个数;
    • (6) 计算因子载荷矩阵A;
    • (7) 对载荷矩阵进行旋转,以求能更好地解释公共因子;
    • (8) 确定因子模型;
    • (9) 根据上述计算结果,求因子得分,对系统进行分析

    1.3 因子分析算法的数学解释

    1.3.1 因子模型

    因子分析中的公共因子是不可直接观测但又客观存在的共同影响因素,每个变量都可以表示成公共因子的线性函数与特殊因子之和,即:
    在这里插入图片描述
    式中的F1,F2,…,Fm称为公共因子,εi称为Xi的特殊因子。该模型可用矩阵表示为:
    在这里插入图片描述
    这里:
    在这里插入图片描述
    且满足:
    在这里插入图片描述
    模型中的矩阵A称为因子载荷矩阵,aij称为因子“载荷”,是第i个变量在第j个因子上的负荷,如果把变量Xi看成m维空间中的一个点,则aij表示它在坐标轴Fj上的投影。

    1.3.2 因子载荷矩阵的求解

    因子载荷矩阵的求解方法有很多,主要有以下三种:主成分分析法;主因子法;极大似然估计法。(其中以主成分分析法最为常用)

    • 1.主成分分析法
      原理及主要计算步骤:
      (1)计算原始数据X的协方差阵Σ;
      (2)计算协方差阵Σ的特征根,按数值大小表示为λ_1≥λ_2≥⋯≥λ_p,相应的单位特征向量表示为e_1,e_2,…,e_p,特征向量矩阵表示为U。此时协方差阵Σ有如下表示方式1:
      在这里插入图片描述
      基于公式1和模型假设,我们还可以得到协方差阵Σ有如下式2的表示方法:
      在这里插入图片描述
      结合公式1和2,我们可以得到因子载荷矩阵的估计:
      在这里插入图片描述
      其中:
      在这里插入图片描述
      其中λ_i表示第i个特征值,e_ij表示λ_i相对应的第i个特征向量的第j个分量。
      得到载荷矩阵后,我们可以将因子模型表示为:
      在这里插入图片描述
    • 2.主因子法
      主因子方法是对主成分方法的修正,假定我们首先对变量进行标准化变换。则
      在这里插入图片描述
      称R为约相关矩阵,R对角线上的元素是h_i_2,而不是1。设h^_i_2是h_i_2的初始估计,则:在这里插入图片描述
      在这里插入图片描述
      在这里插入图片描述
      在这里插入图片描述
    • 3.极大似然估计法
      详见极大似然估计法

    1.3.3 因子载荷矩阵的旋转

    设Q为m阶正交矩阵,令B=AQ,则:
    在这里插入图片描述
    由于,上一小节得到的因子载荷矩阵A并不是唯一的,事实上对矩阵A做正交变换后得到的新矩阵都可以看作因子载荷矩阵。
    我们在得到一个因子载荷矩阵的估计时,有可能会出现多个变量均在同一个因子上出现较大因子载荷,或者一个变量在多个因子上具有较大的载荷,此时很难对因子进行解释或命名,此时我们希望通过对因子载荷矩阵进行旋转得到新的简化后的因子载荷矩阵,新的因子载荷之间区分度更高,便于因子分析和命名。
    载荷矩阵的旋转分正交旋转和斜交旋转两类。正交旋转的常用方法有方差最大法、四次方最大法和等量最大法。斜交旋转常用方法有最小斜交旋转法、四次方最小法、斜交旋转等。

    1.3.4 因子得分

    得到因子载荷矩阵之后,有时我们希望利用公共因子进行其他研宄,比如进行聚类分析或回归分析,此时我们希望能通过原始变量对公共因子进行估计,即得到因子得分。
    对于模型X=AF+ε,如果不考虑特殊因子ε的影响,可以得到X=AF,但矩阵A是pXm阶,模型中我们要求m<=p,通常因子个数远小于变量个数,即m<p,因此载荷矩阵不可逆,无法直接得到F的估计。
    公共因子估计的常用方法是回归法和Bartlett法(加权最小二乘法)。

    二、因子分析的应用实例

    假设某一社会经济系统问题,其主要特性可用4个指标表示,它们分别是生产、技术、交通和环境。其相关矩阵为:
    在这里插入图片描述
    相应的特征值、占总体百分比和累计百分比如下表:
    在这里插入图片描述
    对应特征值的特征向量矩阵为:
    在这里插入图片描述
    假如要求所取特征值反映的信息量占总体信息量的90%以上,则从累计特征值所占百分比看,只需取前两项即可。也就是说,只需取两个主要因子。对应于前两列特征值的特征向量,可求的其因子载荷矩阵A为:
    在这里插入图片描述
    于是,该问题的因子模型为:
    在这里插入图片描述
    因子分析:由以上可以看出,两个因子中,f1是全面反映生产、技术、交通和环境的因子,而f2却不同,它反映了对生产和技术这两项增长有利,而对交通和环境增长不利的因子。也就是说,按照原有统计资料得出的相关矩阵分析的结果是如果生产和技术都随f2增长了,将有可能出现交通紧张和环境恶化的问题,f2反映了这两方面的相互制约状况。
    Python编程应用示例见:因子分析(KMO检验和Bartlett’s球形检验)

    三、主成分分析(PCA)与因子分析(FA)的联系与区别

    主成分分析(PCA)是一种数据降维技巧,它能将大量相关变量转化为一组很少的不相关变量,这些无关变量称为主成分。探索性因子分析(EFA)是一系列用来发现一组变量的潜在结构的方法。它通过寻找一组更小的、潜在的或隐藏的结构来解释已观测到的、显式的变量间的关系。
    在这里插入图片描述
    主成分(PC1和PC2)是观测变量(X1到X5)的线性组合。形成线性组合的权重都是通过最大化各主成分所解释的方差来获得,同时还要保证个主成分间不相关。相反,因子(F1和F2)被当做是观测变量的结构基础或“原因”,而不是它们的线性组合。代表观测变量方差的误差(e1到e5)无法用因子来解释。图中的圆圈表示因子和误差无法直接观测,但是可通过变量间的相互关系推导得到。

    两者之间的区别与联系,具体而言有如下几种:

    • 联系:
          1. PCA和因子分析都是数据降维的重要方法,都对原始数据进行标准化处理,都消除了原始指标的相关性对综合评价所造成的信息重复的影响,都属于因素分析法,都基于统计分析方法
          2. 二者均应用于高斯分布的数据,非高斯分布的数据采用ICA算法
          3. 二者构造综合评价时所涉及的权数具有客观性,在原始信息损失不大的前提下,减少了后期数据挖掘和分析的工作量。

    • 区别:
          1. 原理不同; PCA的基本原理是利用降维(线性变换)的思想,在损失很少信息的前提下把多个指标转化为几个不相关的主成分,每个主成分都是原始变量的线性组合
      FA基本原理是从原始变量相关矩阵内部的依赖关系出发,把因子表达成能表示成少数公共因子和仅对某一个变量有作用的特殊因子的线性组合(因子分析是主成分的推广,相对于主成分分析,更倾向于描述原始变量之间的相关关系);
          2.假设条件不同; 主成分分析不需要有假设,而因子分析需要假设各个共同因子之间不相关,特殊因子(specificfactor)之间也不相关,共同因子和特殊因子之间也不相关;
          3. 求解方法不同; 主成分分析的求解方法从协方差阵出发,而因子分析的求解方法包括主成分法、主轴因子法、极大似然法、最小二乘法、a因子提取法等;
          4. 降维后的“维度”数量不同,即因子数量和主成分的数量; 主成分分析的数量最多等于维度数;而因子分析中的因子个数需要分析者指定(SPSS和SAS根据一定的条件自动设定,只要是特征值大于1的因子主可进入分析),指定的因子数量不同而结果也不同。
          5. 线性表示方法不同; 因子分析是把变量表示成各公因子的线性组合;主成分分析中则是把主成分表示成各变量的线性组合。
          6. 主成分和因子的变化不同; 主成分分析:当给定的协方差矩阵或者相关矩阵的特征值唯一时,主成分一般是固定的独特的;因子分析:因子不是固定的,可以旋转得到不同的因子。
          7.解释重点不同; 主成分分析:重点在于解释个变量的总方差;因子分析:则把重点放在解释各变量之间的协方差。
          8.算法上的不同; 主成分分析:协方差矩阵的对角元素是变量的方差;因子分析:所采用的协方差矩阵的对角元素不在是变量的方差,而是和变量对应的共同度(变量方差中被各因子所解释的部分)。
          9.优点不同; 对于因子分析,可以使用旋转技术,使得因子更好的得到解释,因此在解释主成分方面因子分析更占优势;其次因子分析不是对原有变量的取舍,而是根据原始变量的信息进行重新组合,找出影响变量的共同因子,化简数据;如果仅仅想把现有的变量变成少数几个新的变量(新的变量几乎带有原来所有变量的信息)来进入后续的分析,则可以使用主成分分析,不过一般情况下也可以使用因子分析。

            综合来看,因子分析在实现中可以使用旋转技术,因此可以得到更好的因子解释,这一点比主成分占优势;另外,因子分析不需要舍弃原有变量,而是站到原有变量间的共性因子作为下一步应用的前提,其实就是由表及里去发现内在规律。但是,主成分分析由于不需要假设条件,并且可以最大限度的保持原有变量的大多数特征,因此适用范围更广泛,尤其是宏观的未知数据的稳定度更高。

    总结

    • 因子分析跟主成分分析一样,由于侧重点都是进行数据降维,因此很少单独使用,大多数情况下都会有一些模型组合使用。例如:
      (1) 因子分析(主成分分析)+多元回归分析:判断并解决共线性问题之后进行回归预测;
      (2) 因子分析(主成分分析)+聚类分析:通过降维后的数据进行聚类并分析数据特点,但因子分析会更适合,原因是基于因子的聚类结果更容易解释,而基于主成分的聚类结果很难解释;
      (3) 因子分析(主成分分析)+分类:数据降维(或数据压缩)后进行分类预测,这也是常用的组合方法。

    • 因子分析通过寻找公共因子的方式达到数据降维的目的(因子分析还可以用于分析不同变量之间的内在联系),主成分分析则是求特征矩阵,实现数据的降维。

    • 因子分析的主要作用:
      (1) 寻求基本数据结构;
      (2) 用少数因子,描述具有相关性的多个指标;
      (3) 数据简化,即降维。
      1) 强相关问题会对分析带来困难
      2) 通过因子分析可以找出少数的几个因子替代原来的变量做回归分析、聚类分析和判别分析

    参考文献来源:
    https://www.cnblogs.com/wintergrass/archive/2011/10/27/2226454.html     因子分析法(Factor Analysis Method) 【转】
    https://www.cnblogs.com/echo-coding/p/8724373.html     因子分析
    http://www.dataivy.cn/blog/%E5%9B%A0%E5%AD%90%E5%88%86%E6%9E%90factor-analysis/     因子分析(Factor Analysis)
    https://www.cnblogs.com/90zeng/p/Factor_analysis_model.html     因子分析
    https://wenku.baidu.com/view/67fb7a5a3b3567ec102d8abd.html     很好的因子分析法讲义和实例
    https://blog.csdn.net/iceberg7012/article/details/109036194    主成分分析算法简述
    https://www.cnblogs.com/lantingg/p/9293880.html     主成分分析和因子分析区别与联系
    https://www.cnblogs.com/liulunyang/p/3931685.html     主成分分析与因子分析的十大不同
    https://www.cnblogs.com/jpld/p/4483415.html      R in action读书笔记(19)第十四章 主成分和因子分析
    https://www.cnblogs.com/Bfrican/p/4442663.html     Stat3—因子分析(Factor Analysis)
    山东省县域经济发展情况综合分析一基于因子分析和聚类分析(马玉涛-山东大学硕士论文)
    https://www.cnblogs.com/caiyishuai/p/12421034.html     Python——因子分析(KMO检验和Bartlett’s球形检验)
    https://www.cnblogs.com/TreeDream/p/8337765.html     因子分析-应用
    http://www.doc88.com/p-30022239605.html     探索性因子分析与验证性因子分析的比较研究
    https://blog.csdn.net/hfutxiaoguozhi/article/details/78840126     基于R的因子分析(含代码)
    https://blog.csdn.net/sinat_36744986/article/details/86477963    SPSS软件做因子分析

    展开全文
  • 讲解了主成分分析和因子分析的概念和区别,并带有SPSS分析的示例,简单易懂!
  • 以大同煤矿集团某矿煤质化验数据为基础,运用因子分析方法进行变量降维处理,在原有的8项煤质分析指标中提取出热值因子、进化因子和破坏因子3个因子并得出各因子的得分及权重,基于此进一步进行煤质样本聚类分析,并对...
  • 结合灰色系统与经典因子分析的优点,提出一种新的模型,即灰因子分析,并利用面向对象程序设计的方法进行了系统实现,对结果所做的分析对比表明效果显著。最后将该方法应用到实例中,实验结果显示,该方法对具有时间...
  • 聚类因子分析法在巢湖水质痕量金属参数分析中的应用.pdf
  • 将平行因子模型应用于植物油光谱数据矩阵的分析,确定了平行因子分析模型的因子数及其因子的物质基础(维生素ë及其衍生物,亚油酸和亚麻酸,脂肪酸氧化产物,植物油氧化产物)建立植物油的4因子激发- 。发射光谱...
  • 因子分析就是在尽可能不损失信息或者少损失信息的情况下,将多个变量减少为少数几个因子的方法。这几个因子可以高度概括大量数据中的信息,这样,既减少了变量个数,又同样能再现变量之间的内在联系。
  • 因子分析在SPSS中的操作过程及结果解读

    万次阅读 多人点赞 2019-01-14 16:28:27
    因子分析在SPSS中的操作过程及结果解读 笔者在做该项研究时在网络上查阅了大量资料,都写得不够十分完整,所以该篇文章将因子分析从前到后做一个通俗易懂的解释,全文并不涉及非常晦涩的公式原理。 一.因子分析是...
  • 使用SPSS的方法是,首先应用因子分析功能定义因子分析的变量,进行适切性量数(KMO)取样与巴特莱(Bartett)球形检验,通过后绘制碎石图,形成主成分列表,作方差最大化旋转,最后形成因子得分表。接着根据聚类分析...
  • 这里写自定义目录标题 感觉自己几天 不说话了,头大,很想明白呢,哈哈在明天周会 上嘚瑟嘚瑟。...赶紧问问 因子正交化、主成分,特征值、特征向量 嘛意思,谁让老人家在数学-线性变化上是一绝呢。 哈哈。...
  • 因子分析与聚类分析在消费者生活形态研究中的应用 数学建模好好学习
  • 采用因子分析法处理各评价指标体,采用SPSS软件进行数据分析处理,能够全面反映影响矿井瓦斯爆炸的因素特征,做出科学、客观的评价。实例分析结果表明,评价结果准确,具有良好的实际应用价值。
  • 多元统计分析课程中因子分析讲解,多元统计分析在众多课程门类中都有较大的应用,可用于机器学习,统计学习基础。因子分析是指研究从变量群中提取共性因子的统计技术。
  • 基于MATLAB的因子分析与聚类分析在学生成绩评价中的应用.pdf
  • 基于因子分析的小微企业应用跨境电商影响因素研究.pdf
  • 利用因子分析方法研究六种化学元素(即六个变量)之间的相关性,得到因子得分,将因子得分作为新变量。用聚类分析方法对六块火山岩标本分类,进而对六种区域火山岩的元素含量情况作出较好的判断.
  • 采用因子分析法对上证180指数31只样本股进行分析,通过统计软件spas的计算,提取3个公共区子来反映影响个股的主要N素,并采取计算因子得分的方式给出衡量这些股票财务状况的方法.
  • 基于此方法分析运营绩效实战论文
  • 数据挖掘中基于因子分析的聚类方法及其应用.pdf
  • 基于探索性因子分析的中国房地产企业BIM应用障碍因素分析,左心月,张金月,建筑信息模型(BIM)已经在国外得到了全流程和全利益相关方的应用,但是在国内却并未普及,特别是应做到上游技术牵头的大部分房地
  • 聚类因子分析在太湖水质参数评价中的应用.pdf
  • 基于2005—2008年度的财报信息,利用因子分析方法对我国煤炭上市公司经营业绩进行实证分析,结果表明企业的经营业绩主要取决于成长能力、盈利能力,部分取决于收益质量以及营运能力,结合煤炭企业的经营特点,得出了企业...
  • 滴滴打车应用频率与时段及其影响因子分析——以淮安市为例.pdf
  • 基于因子分析和改进DBSCAN算法的电子商务站点评估应用

空空如也

空空如也

1 2 3 4 5 ... 20
收藏数 72,897
精华内容 29,158
关键字:

因子分析的应用