精华内容
下载资源
问答
  • R语言 主成分分析

    千次阅读 2020-01-03 20:56:12
    (1)主成分分析的基本思想和性质: ···主成分分析(Principal Component Analysis,PCA), 是一种统计方法。通过正交变换将一组可能存在相关性的变量转换为一组线性不相关的变量,转换后的这组变量叫主成分。在...

    (1)主成分分析的基本思想和性质:

    ···主成分分析(Principal Component Analysis,PCA), 是一种统计方法。通过正交变换将一组可能存在相关性的变量转换为一组线性不相关的变量,转换后的这组变量叫主成分。在保留原始变量尽可能多的信息的前提下达到降维的目的,从而简化问题的复杂性并抓住问题的主要矛盾。

    一般来说,利用主成分分析得到的主成分与原始变量之间有如下基本关系
    ①每一个主成分都是各原始变量的线性组合
    ②主成分的数目大大少于原始变量的数目
    ③主成分保留了原始变量的绝大多数信息
    ④各主成分之间互不相关

    ···主成分贡献率(contributing rate of principalcomponent),主成分的方差在所考察的随机变量的总方差中所占的比例,主要用以度量主成分对于原变量变异性的解释能力。第一主成分的贡献率越大,该值用来解释其他变量的能力就越强。主成分累积贡献率是选择有效主成分的重要依据,一般使得累积贡献率在85%以上为宜。

    ···因子负荷量 是指第k个主成分Y与原始变量X之间的相关系数ρ,因子负荷量的绝对值大小刻画了该主成分的主要意义和成因。

    (2)案例分析1

    搜集各国运动员如下八项男子径赛运动记录:
    x1:100米(秒) x5:1500米(分)
    x2:200米(秒) x6:5000米(分)
    x3:400米(秒) x7:10000米(分)
    x4:800米(秒) x8:马拉松(分)
    在这里插入图片描述
    数据:
    在这里插入图片描述
    ………………

    library(psych)
    data=read.table(“clipboard”,header=T)
    head(data)
    #提取主成分的书面
    fa.parallel(data,fa=“pc”,n.iter=100,show.legend=FALSE) #碎石图

    在这里插入图片描述

    #主成分分析
    pc=principal(data,nfactors=2,rotate=“none”,score=TRUE)
    pc$weights #求主成分系数

    在这里插入图片描述
    可得主成分系数表达式
    在这里插入图片描述
    将标准化的x代入以上式子,可得每个个案的主成分得分。

    pc$scores #求主成分得分

    在这里插入图片描述

    #判断提取公因子数目
    fa.parallel(data,fa=“fa”,n.iter=100,main=“Scree plots with parallel analysis”)
    #提供主成分和因子分析的碎石图

    在这里插入图片描述

    #提取公因子
    fa=fa(data,nfactors=2,rotate=“none”,fm=“pa”)
    #因子旋转
    fa.varimax=fa(data,nfactors=2,rotate=“varimax”,fm=“pa”) #正交旋转:方差最大化
    fa.promax=fa(data,nfactors=2,rotate=“promax”,fm=“pa”) #斜交旋转
    #斜交旋转计算因子载荷矩阵
    fsm=function(oblique){
    if(class(oblique)[2]==“fa”&is.null(oblique$Phi)){

    warning(“object doesn’t look like EFA”)
    }else{
    P=unclass(obliqueloading)F=Ploading) F=P%*%obliquePhi
    colnames(F)=c(“PA1”,“PA2”)
    return(F)
    }
    }
    fa.varimax #因子模型
    fsm(fa.promax)

    在这里插入图片描述
    在这里插入图片描述
    综合碎石图、特征值、平行分析图,可提取2个公因子。
    采用主轴因子法获得初始解,第一、二公因子的方差贡献率分别为82%、10%,累计贡献达到92%,xi的共同度均在86%以上,绝大部分在90%以上,提取两个公因子恰当。
    采用方差最大法对因子载荷矩阵进行正交旋转,得到因子模型
    在这里插入图片描述

    #画图
    factor.plot(fa.varimax,labels=rownames(fa.varimax$loadings))
    fa.diagram(fa.varimax,simple=FALSE)

    在这里插入图片描述
    在这里插入图片描述

    #因子得分
    fa.varimax$weights

    在这里插入图片描述

    根据旋转后的载荷矩阵,给公因子一命名耐力因子,公因子二命名速度因子。
    计算因子得分
    在这里插入图片描述

    plot(fa.varimax$weights)
    在这里插入图片描述

    (3)案例分析2

    “基本建设投资.xlsx”数据搜集了各地区投资基本建设的资金来源。进行因子分析。要求:
    (1)利用主成分法,提取合适的因子个数,对提取效果进行分析;
    (2)采用方差最大法进行因子旋转,根据因子载荷矩阵写出因子分析模型,并根据旋转后的因子载荷矩阵为各因子命名;
    (3)保存因子得分,据此画散点图,分析各地区投资资金来源特点。
    在这里插入图片描述

    data=read.table(“clipboard”,header=T)
    library(psych)
    #提取主成分的书面
    fa.parallel(data,fa=“pc”,n.iter=100,show.legend=FALSE)

    #主成分分析
    pc=principal(data,nfactors=2,rotate=“none”,score=TRUE)
    pc$weights #求主成分系数

    pc$scores #求主成分得分

    #判断提取公因子数目
    fa.parallel(data,fa=“fa”,n.iter=100,main=“Scree plots with parallel analysis”)
    #提供主成分和因子分析的碎石图
    #提取公因子
    fa=fa(data,nfactors=2,rotate=“none”,fm=“pa”)
    在这里插入图片描述

    #因子旋转
    fa.varimax=fa(data,nfactors=2,rotate=“varimax”,fm=“pa”) #正交旋转:方差最大化
    fa.promax=fa(data,nfactors=2,rotate=“promax”,fm=“pa”) #斜交旋转
    #斜交旋转计算因子载荷矩阵
    fsm=function(oblique){
    if(class(oblique)[2]==“fa”&is.null(oblique$Phi)){
    warning(“object doesn’t look like EFA”)
    }else{

    P=unclass(obliqueloading)F=Ploading) F=P%*%obliquePhi
    colnames(F)=c(“PA1”,“PA2”)
    return(F)
    }
    }
    fa.varimax
    fsm(fa.promax)

    在这里插入图片描述
    在这里插入图片描述
    观察碎石图,提取两个公因子,方差累计贡献率89%,两个公因子能解释原始变量89%的方差,变量共同度除了国内贷款为79%,其余均在85%以上,大部分变量信息留存较好,整体提取效果较好。

    因子模型:
    国家预算内基金:x1=0.12f1+0.62f2
    国内贷款:X2=0.64f1+0.62f2
    利用外款:X3=0.83f1+0.27f2
    自筹资金:X4=0.94f1+0.3f2
    其他投资:X5=0.91f1+0.17f2

    #画图
    factor.plot(fa.varimax,labels=rownames(fa.varimax$loadings))
    fa.diagram(fa.varimax,simple=FALSE)

    在这里插入图片描述
    在这里插入图片描述

    #因子得分
    fa.varimax$weights

    在这里插入图片描述

    展开全文
  • R语言主成分分析

    2021-04-12 17:17:48
    主成分分析(Principal Component Analysis,PCA), 是一种统计方法。通过正交变换将一组可能存在相关性的变量转换为一组线性不相关的变量,转换后的这组变量叫主成分。 是一种降维技术,把多个变量化为能够反映...

    主成分分析(Principal Component Analysis,PCA), 是一种统计方法。通过正交变换将一组可能存在相关性的变量转换为一组线性不相关的变量,转换后的这组变量叫主成分。
    是一种降维技术,把多个变量化为能够反映原始变量大部分信息的少数几个主成分。
    设X有p个变量,为n*p阶矩阵,即n个样本的p维向量。首先对X的p个变量寻找正规化线性组合,使它的方差达到最大,这个新的变量称为第一主成分,抽取第一主成分后,第二主成分的抽取方法与第一主成分一样,依次类推,直到各主成分累积方差达到总方差的一定比例。

    #原理: 在用统计分析方法研究多变量的课题时,变量个数太多就会增加课题的复杂性。人们自然希望变量个数较少而得到的信息较多。在很多情形,变量之间是有一定的相关关系的,当两个变量之间有一定相关关系时,可以解释为这两个变量反映此课题的信息有一定的重叠。主成分分析是对于原先提出的所有变量,将重复的变量(关系紧密的变量)删去多余,建立尽可能少的新变量,使得这些新变量是两两不相关的,而且这些新变量在反映课题的信息方面尽可能保持原有的信息。

    #pca计算过程

    整个过程,就是将原始样例的n维特征变成了k维,这k维就是原始特征在k维上的投影。
    1.对数据中心化:分别求特征的平均值,然后对于所有的样例,都减去对应的均值

    2.求特征的协方差矩阵

    3.求协方差矩阵的特征值和特征向量

    4.取最大的k个特征值所对应的特征向量:将特征值按照从大到小的顺序排序,选择其中最大的k个,然后将其对应的k个特征向量分别作为列向量组成特征向量矩阵

    5.将样本点投影到选取的特征向量上:将样本点投影到选取的特征向量上。假设样例数为m,特征数为n,减去均值后的样本矩阵为DataAdjust(mn),协方差矩阵是nn,选取的k个特征向量组成的矩阵为EigenVectors(n*k)。那么投影后的数据为FinalData

    # 用数据框形式输入数据
    student<-data.frame(
       X1=c(148, 139, 160, 149, 159, 142, 153, 150, 151, 139, 
            140, 161, 158, 140, 137, 152, 149, 145, 160, 156, 
            151, 147, 157, 147, 157, 151, 144, 141, 139, 148), 
       X2=c(41, 34, 49, 36, 45, 31, 43, 43, 42, 31, 
            29, 47, 49, 33, 31, 35, 47, 35, 47, 44,
            42, 38, 39, 30, 48, 36, 36, 30, 32, 38),
       X3=c(72, 71, 77, 67, 80, 66, 76, 77, 77, 68, 
            64, 78, 78, 67, 66, 73, 82, 70, 74, 78, 
            73, 73, 68, 65, 80, 74, 68, 67, 68, 70),
       X4=c(78, 76, 86, 79, 86, 76, 83, 79, 80, 74, 
            74, 84, 83, 77, 73, 79, 79, 77, 87, 85, 
            82, 78, 80, 75, 88, 80, 76, 76, 73, 78)
    )
    #Standard deviation标准差   
    #Proportion of Variance方差比例  
    #Cumulative Proportion累积概率
    # 作主成分分析
    student.pr<-princomp(student, cor=TRUE)
    
    # 并显示分析结果
    summary(student.pr, loadings=TRUE)
    
    # 作预测
    predict(student.pr)
    
    # 画碎石图
    screeplot(student.pr)
    screeplot(student.pr,type="lines")
    
    biplot(student.pr)
    
    princomp(~X1+X2+X3+X4,data=student, cor=T)
    
    展开全文
  • R语言主成分分析练习

    2018-01-18 20:07:17
    R语言主成分分析练习
  • R 语言 主成分分析

    千次阅读 2018-04-03 16:05:32
    1.R中的主成分和因子分析R的基础安装包中提供了PCA和EFA的函数,分别为princomp ()和factanal()psych包中有用的因子分析函数函数描述 principal()含多种可选的方差放置方法的主成分分析fa()可用主轴、最小...

    1.R中的主成分和因子分析

    R的基础安装包中提供了PCAEFA的函数,分别为princomp ()和factanal()

    psych包中有用的因子分析函数

    函数描述 
    principal()含多种可选的方差放置方法的主成分分析
    fa()可用主轴、最小残差、加权最小平方或最大似然法估计的因子分析
    fa.parallel()含平等分析的碎石图
    factor.plot()绘制因子分析或主成分分析的结果
    fa.diagram()绘制因子分析或主成分分析的载荷矩阵
    scree()因子分析和主成分分析的碎石图

    PCA/EFA 分析流程:

    1)数据预处理;PCAEFA都是根据观测变量间的相关性来推导结果。用户可以输入原始数据矩阵或相关系数矩阵列到principal()fa()函数中,若输出初始结果,相关系数矩阵将会被自动计算,在计算前请确保数据中没有缺失值;

    2)选择因子分析模型。判断是PCA(数据降维)还是EFA(发现潜在结构)更符合你的分析目标。若选择EFA方法时,还需要选择一种估计因子模型的方法(如最大似然估计)。

    3)判断要选择的主成分/因子数目;

    4)选择主成分/因子;

    5)旋转主成分/因子;

    6)解释结果;

    7)计算主成分或因子得分。

    #主成分分析:psych包的:princomp()#因子分析:factanal()
    library(psych)
    #例1(根据原始变量做主成分分析)
    View(USJudgeRatings)
    #主成分个数选择(图形方法选择主成分个数)
    fa.parallel(USJudgeRatings[,-1], fa="pc", n.iter=100,
                show.legend=FALSE, main="Scree plot with parallel analysis")
    #主成分结果
    pc <- principal(USJudgeRatings[,-1], nfactors=1,scores=T)
    #每个调查对象在该主成分上的得分
    head(pc$scores)
    #律师与法官的接触频数与法官评分间的相关系数
    cor(USJudgeRatings$CONT, pc$score)
    cor(USJudgeRatings)
    
    
    #例2(根据相关关系图做主成分分析)
    View(Harman23.cor)
    #主成分个数选择
    fa.parallel(Harman23.cor$cov, n.obs=302, fa="pc", n.iter=100,
                show.legend=FALSE, main="Scree plot with parallel analysis")
    #主成分结果
    principal(Harman23.cor$cov, nfactors=2, rotate="none")
    #主成分旋转(方差极大旋转)
    principal(Harman23.cor$cov, nfactors=2, rotate="varimax")
    #获取主成分得分系数
    rc <- principal(Harman23.cor$cov, nfactors=2, rotate="varimax")
    round(unclass(rc$weights), 2)
    PC1 = 0.28*height + 0.30*arm.span + 0.30*forearm + 0.29*lower.leg -
          0.06*weight - 0.08*bitro.diameter - 0.10*chest.girth -
          0.04*chest.width
    PC2 = -0.05*height - 0.08*arm.span - 0.09*forearm - 0.06*lower.leg +
           0.33*weight + 0.32*bitro.diameter + 0.34*chest.girth +
           0.27*chest.width
    
    #例3
    #默认生成所有主成分查看主成分的贡献率,然后选择
    pr <- princomp(USJudgeRatings[,-1],cor = T)
    options(digits = 4)
    summary(pr,loadings = T)#列出主成分对应原始变量的系数
    #简单画碎石图的函数
    screeplot(pr,type = "line",main = "碎石图")
    #用biplot绘制主成分的散点图
    pr <- princomp(USJudgeRatings[,-1],cor = T)
    biplot(pr,choices = 1:2)
    
    #R 中labdsv包
    library(labdsv)
    #
    pac <- pca(USJudgeRatings[,-1],dim = 4,cor = T)
    summary(pac)
    #查看载荷系数
    loadings.pca(pac)
    #绘制碎石图以及累计方差图
    #分割图形区域
    op <- par(mfrow= c(1,2))
    varplot.pca(pac)
    Hit Return to Continue
    
    


    展开全文
  • R语言主成分分析法笔记

    万次阅读 多人点赞 2019-05-27 09:33:38
    01、什么是主成分分析法 简要概括主成分分析法的作用:把能反映某种特征的很多指标汇总成一个指标。 举例而言,一家银行的流动性可以体现在它的现金资产占比和定期存款占比上—— 银行A的现金资产占比是0.12,定期...

    01、什么是主成分分析法

    简要概括主成分分析法的作用:把能反映某种特征的很多指标汇总成一个指标。

    举例而言,一家银行的流动性可以体现在它的现金资产占比和定期存款占比上——
    银行A的现金资产占比是0.12,定期存款占比是0.37;
    银行B现金资产占比是0.09,定期存款占比是0.5。
    哪一家流动性更好呢?

    如果我们能确定存在一个公式比如: 流动性指标 = 30%现金资产占比 + 70%定期存款占比 ,就可以衡量它们的流动性差异了。
    银行A=(0.30.12+0.70.37)
    银行B=(0.30.09+0.70.5)

    决定各个变量应该以什么比例组合成一个新的综合指标,就是“主成分分析法”。
    它的原理和推导过程并不难,有线性代数的基础是很容易看懂的。有兴趣的可以去百度一下,有很多详尽教学的。无名在这里不做赘述。

    02、R语言进行数据读取

    首先,因为一般需要处理的数据量巨大,手动输入程序中是不现实的。我们需要一条语句从csv文件中读取数据。

    首先打开一个excel,在其中输入你的数据。第一行是表头,列一下你用了哪些变量。为了结果看的方便,无名把每个变量都命名为I1、I2以此类推。每一列对应一个变量的数据。
    数据复制粘贴填好以后,左上角菜单里,点“另存为”,在另存为的“其它格式”中,选择另存为成“CSV(逗号分隔)”。另存为的路径最好不要是桌面,直接放在D盘E盘中,因为R语言对中文的支持不算好,路径中最好能不出现中文。
    数据格式截图如下:

    另存为成CSV文件后,在R语言中运行语句:
    x <- data.frame(read.csv(“D:/PCA.csv”, head = T, sep = “,”))
    “D:/PCA.csv”这个就是我放在D盘下的CSV数据文件,你们自行改成自己的文件路径就行。
    用x作为存储数据的变量我就是图方便,随手打的,你们可以把变量叫别的名字。

    注意点:

    1. 指标反映的内容需要一致。

    I1是银行贷存比,I2是中国棒棒糖年产量——这是不行的!当然这个错误是不会有人犯的吧。
    比较要注意的在于,比如银行贷存比,越高,银行流动性越低,而其它的指标如定期存款占比、拆出拆入资金比、现金资产占比,都是数值越高,银行流动性越高。那么,银行贷存比那一个变量列的所有数值,最好全部取倒数。保证所有变量,都是同向的,数值越高,反映的内容变化趋势也相同。

    1. 不可以有空值!

    无名在这里被坑得很惨。因为查数据的时候总归会有一两年或者一两家机构的数据是缺失的,无名在做表格时,缺失的地方都是空着的,然后R语言分析的时候报了好多次错。检查了好久。
    处理缺失值的方法,很复杂,如果是写硕博士论文一类的很有必要认真做的,可以去查查R语言“mice”包处理缺失值相关的内容。这里不做赘述。
    如果你只是随便水一篇论文,可以把缺失值用平均值填写。比如A银行2003年到2018年所有的数据都有,中间就缺了一年2005年的数据,那么你就可以用其它年份的平均值先填一下。(但注意,这是不对的!对结果有影响,绝不可以写在你的论文里,也最好不要用!)
    如果你既学不会处理缺失值,也不想填数据,那么唯一的处理方法就是删除,把缺失数值的那一行整体删除。如果某个变量缺失了太多数值,建议直接删除这个变量。如果你所有变量都缺失了大量数值,建议直接放弃吧,主成分分析法不适合你(这篇论文都不适合)。

    03、确定数据适合主成分分析(数据检验)

    啥叫检验呢,就是怕你放的几个变量是一个是关于流动性的,一个是关于棒棒糖的,完全不相关,根本不应该用主成分分析法合成一个指标。
    做检验,就是你要去证明一下,我的数据做主成分分析,没问题!

    检验用的R语言包叫psych。电脑里没有的话,运行如下语句安装:

    install.packages("psych")
    

    只要装一次,未来永久可用。

    进行检验前,运行语句调用一下这个包:

    library(psych)
    

    开始检验。有两种检验方法。

    • 第一种是bartlett球形检验。

    运行语句:

    cortest.bartlett(cor(x))
    

    输出结果:

    > corest.bartlett(cor(x))
    $chisq
    [1] 36.55689
    
    $p.value
    [1] 6.750071e-05
    
    $df 
    [1] 10
    

    看p.value,这是p值,它越小越好。只要小于0.05,说明你的数据做主成分分析法没有问题。
    bartlett球形检验一般来说,只要你的数据是正正常常有关联的,都能通过,不用担心。

    • 第二种是KMO检验。

    输入语句:

    KMO(cor(x))
    

    结果如下:

    在这里插入图片描述

    MSA就是这个检验的统计量,overall是针对主成分分析法总体的,底下的是分别对用每个变量的数值。
    越大越好。大于0.7,说明数据完美,超适合主成分分析;大于0.5,说明数据可以做主成分,但是不完美;小于0.5,说明数据不合适,别用主成分分析法了。

    注:KMO检验无名觉得较难通过,它对数据的要求确实比较高。无名本来有6个变量,因为其中1个缺失值较多,本来抱着侥幸的心理觉得说不定能过,结果被拦下来了。最后不得不删除了一整个变量。缺失值对KMO的影响真的大呢。

    最后随手贴个论文中怎么表明已经做过这两个检验了的写法。无名初稿的内容还没有修改。你们可以作为“如何在论文里写明这两种检验”的一个参考。
    一、bartlett球形检验写法
    在这里插入图片描述

    二、KMO检验写法
    在这里插入图片描述

    04\用R语言进行主成分分析

    无名觉得这反而是最简单的一块了。运行语句:

    x.pr <- princomp(x, cor = TRUE)
    summary(x.pr, loadings = TRUE)
    

    输出结果如下:
    在这里插入图片描述
    解释一下。
    Comp.1是第一个主成分,向下看它这一列,1.5337893是它的标准差,没什么用;0.4705019是它本身对原本所有数据的方差的解释程度,你可以理解为,这个成分包含了原始数据中47.05019%的信息;最后一个数字还是0.4705019,因为这是累积解释度,其它成分还没和它加在一起。
    Comp.2是第二个主成分,标准差不用看;0.2848944是它本身对原始数据的解释程度;0.7553963是累积解释度,就是从Comp.1到它这里所有的主成分加起来能解释原始数据的75.53963%。
    以此类推。

    累积解释度达到85%即为最适宜。因此,这个例子中,从Comp.1到Comp.3的累积解释度,已经达到了92.11666%,Comp.4和Comp.5可以直接扔掉,不管。

    Loadings那一栏什么意思呢?
    Comp.1 = -0.608 * I1 - 0.112 * I2 + 0.572 * I3 - 0.396 * I4 + 0.365 * I5
    Comp.2 = -0.655 * I2 - 0.129 * I3 + 0.569 * I4 + 0.471 * I5
    以此类推。

    那么最终的指标,就应该是:
    a * Comp.1 + b * Comp.2 + c * Comp.3
    所以a、b、c的系数如何确定呢?
    答案是根据方差解释度加权计算。每个主成分的方差解释度就是权重。
    Comp.1对方差的解释度是0.4705019,
    Comp.2对方差的解释度是0.2848944,
    Comp.3对方差的解释度是0.1657703,
    它们加总的累积方差解释度是,0.9211666 (0.4705019 + 0.2848944 + 0.1657703)。

    因此
    a = 0.4705019/0.9211666 = 0.5107674
    b = 0.2848944/0.9211666 = 0.3092757
    c = 0.1657703/0.9211666 = 0.1799569
    系数a、b、c的值加起来应该正好是1。

    最终确定的指标就应该是:
    0.51 * Comp.1 + 0.31 * Comp.2 + 0.18 * Comp.3

    在excel表中,用原始数据进行计算,就可以得到最终数值了。

    最后再贴一下论文里的写法(再次声明这就是个初稿,数据什么的都不太对的,就是让你们参考一下,如何在论文里写明白主成分分析法)。

    05、结语

    全部代码如下:

    x <- data.frame(read.csv("D:/***.csv", head = T, sep = ",")) #读取数据,***处填写路径
    x #查看数据
    
    install.packages("psych") #安装psych包
    library(psych) #调用psych包
    cortest.bartlett(cor(x)) #bartlett球形检验
    KMO(cor(x)) #KMO检验
    
    x.pr <- princomp(x, cor = TRUE) #主成分分析
    summary(x.pr, loadings = TRUE) #查看主成分分析结果
    
    eigen(cor(x)) #查看主成分分析的特征值与特征向量
    

    其中,特征值和特征向量对于写论文来说可有可无,列在论文里也可以,本文就没有专门提出来了。
    会线性代数的,去看一下原理,很容易理解特征值、特征向量的作用以及含义。

    转载自微信公众号 :无名氏如是说 《R语言主成分分析法笔记》

    展开全文
  • R语言主成分分析总结

    万次阅读 多人点赞 2017-07-10 16:56:28
    简单总结R语言PCA相关函数 这里是数据集 year X1 X2 X3 1951 1 -2.7 -4.3 1952 -5.3 -5.9 -3.5 1953 -2 -3.4 -0.8 1954 -5.7 -4.7 -1.1 1955 -0.9 -3.8 -3.1 1956 -5.7 -5.3
  • R语言主成分分析——prcomp VS princomp

    千次阅读 2019-06-01 14:50:56
    最简单的主成分分析函数,prcomp 和 princomp 都是自带的函数,不需要额外的包 http://strata.uga.edu/software/pdf/pcaTutorial.pdf很好的一个介绍 ...
  • 某市13个工业部门8个指标的案例; # Title : TODO # Objective : TODO # Created by: fuguowen # Created on: 2018/12/4 #读取数据 ...#### 作主成分分析,并显示结果 hangye.pr&lt;-princomp(ha...
  • 非常简单而又非常完整的R语言主成分分析实例

    万次阅读 多人点赞 2016-12-21 15:25:35
    本篇文章不讲有关主成分分析的理论知识,只讲实际操作。实例:(中学生身体四项指标的主成分分析)在某中学随机抽取某年级30名学生,测量其身高(X1)、体重(X2)、胸围(X3)和坐高(X4),数据如下。试对这30名中学生身体...
  • data=read.csv('F:/R语言工作空间/pca/data.csv') #数据的导入> > ls(data) #ls()函数列出所有变量 [1] "X" "不良贷款率" "存贷款比率" "存款增长率" "贷款增长率" "流动比率" "收入利润率" [8] "资本充足率...
  • R语言主成分分析之SVD

    千次阅读 2014-11-18 19:55:39
    #全数据集PCA all_col_mean = colMeans(data.learn.x) #计算训练集每一列的均值 data.learn.PCAx = data.learn.x cols = ncol(data.learn.x) #获取列数 all_col_sd = apply(data.learn.x,2,sd) ...
  • 我们将使用葡萄酒数据集进行主成分分析。 数据 数据包含177个样本和13个变量的数据框;vintages包含类标签。这些数据是对生长在意大利同一地区但来自三个不同栽培品种的葡萄酒进行化学分析的结果:内比奥罗、...

空空如也

空空如也

1 2 3 4 5 ... 16
收藏数 318
精华内容 127
关键字:

r语言主成分分析