精华内容
下载资源
问答
  • R语言典型相关分析

    万次阅读 多人点赞 2017-02-27 16:40:46
    部分参考薛毅的《统计建模与R软件》和《R语言实战》1 关键点:典型相关分析典型相关分析是用于分析两组随机变量之间的相关程度的一种统计方法,它能够有效地揭示两组随机变量之间的相互(线性依赖)关系例如 研究生...

    自己整理编写的R语言常用数据分析模型的模板,原文件为Rmd格式,直接复制粘贴过来,作为个人学习笔记保存和分享。部分参考薛毅的《统计建模与R软件》和《R语言实战》

    1 关键点:典型相关分析

    典型相关分析是用于分析两组随机变量之间的相关程度的一种统计方法,它能够有效地揭示两组随机变量之间的相互(线性依赖)关系

    例如 研究生入学考试成绩与本科阶段一些主要课程成绩的相关性

    将研究两组变量的相关性问题转化为研究两个变量的相关性问题 此类相关为典型相关#

    2 分类:

    总体典型相关

    样本典型相关

    3 R语言提供的计算函数:

    典型相关计算 cancor(x,y,xcenter=TRUE,ycenter=TRUE)

    x,y是相应的数据矩阵 xcenter,ycenter是逻辑变量 TRUE是将数据中心化 FALSE是不中心化

    4 分析结果含义

    cor是典型相关系数

    xcoef是对应于数据x的系数 又称关于数据x的典型载荷即样本典型变量U系数矩阵A的转置

    xcenter是数据X的中心 即数据X的样本均值

    y是对应于数据x的系数 又称关于数据y的典型载荷即样本典型变量V系数矩阵B的转置

    ycenter是数据Y的中心 即数据Y的样本均值

    5 分析步骤

    (1.)载入原始数据 data.frame

    (2.)原始数据标准化 scale

    (3.)典型相关分析 cancor

    (4.)相关系数显著性检验 corcoef.test.R


    I.典型相关分析的计算

    现对20名中年人测得三个生理指标:体重(X1) 腰围(X2) 脉搏(X3);三个训练指标:引体向上(Y1) 起座次数(Y2) 跳跃次数(Y3) 试分析这组数据的相关性

    #用数据框的形式输入数据矩阵
    test<-data.frame(
      X1=c(191, 193, 189, 211, 176, 169, 154, 193, 176, 156, 
           189, 162, 182, 167, 154, 166, 247, 202, 157, 138), 
      X2=c(36, 38, 35, 38, 31, 34, 34, 36, 37, 33, 
           37, 35, 36, 34, 33, 33, 46, 37, 32, 33),
      X3=c(50, 58, 46, 56, 74, 50, 64, 46, 54, 54,
           52, 62, 56, 60, 56, 52, 50, 62, 52, 68), 
      Y1=c( 5, 12, 13,  8, 15, 17, 14,  6,  4, 15, 
            2, 12,  4,  6, 17, 13,  1, 12, 11,  2), 
      Y2=c(162, 101, 155, 101, 200, 120, 215,  70,  60, 225, 
           110, 105, 101, 125, 251, 210,  50, 210, 230, 110), 
      Y3=c(60, 101, 58, 38, 40, 38, 105, 31, 25, 73, 
           60, 37, 42, 40, 250, 115, 50, 120, 80, 43)
    )
    #为了消除数量级的影响 将数据标准化处理 调用scale函数
    test<-scale(test)
    #对标准化的数据做典型相关分析
    ca<-cancor(test[,1:3],test[,4:6])
    #查看分析结果
    ca

    结果说明:
    1) cor; xcoef是对应于数据X的系数, 即为关于数据X的典型载荷; ycoefY; xcenter与$ycenter是数据X与Y的中心, 即样本均值;

    2) 对于该问题, 第一对典型变量的表达式为

    U1 = -0.17788841x1 + 0.36232695x2 - 0.01356309x3

    U2 = -0.43230348x1 + 0.27085764x2 - 0.05301954x3

    U3 = -0.04381432x1 + 0.11608883x2 + 0.24106633x3

    V1 = -0.08018009y1 - 0.24180670y2 + 0.16435956y3

    V2 = -0.08615561y1 + 0.02833066y2 + 0.24367781y3

    V3 = -0.29745900y1 + 0.28373986y2 - 0.09608099y3

    相应的相关系数为:p(U1,V1)=0.79560815 ,p(U2,V2)=0.20055604 ,p(U3,V3)=0.07257029

    可以进行典型相关系数的显著性检验, 经检验也只有第一组典型变量.

    下面计算样本数据在典型变量下的得分:

    #计算数据在典型变量下的得分 U=AX  V=BY
    U<-as.matrix(test[, 1:3])%*% ca$xcoef ; U
    V<-as.matrix(test[, 4:6])%*% ca$ycoef ; V
    #调整图形
    opar <- par(mfrow = c(1, 1),mar = c(5,4,1,1))
    #画出以相关变量U1、V1和U3、V3为坐标的数据散点图
    plot(U[,1], V[,1], xlab="U1", ylab="V1")
    plot(U[,3], V[,3], xlab="U3", ylab="V3")
    #调整图形
    par(opar)

    由散点图可知 第一典型相关变量分布在一条直线附近;第三典型相关变量数据很分散。因为第一典型变量其相关系数为0.79560815,接近1,所以在一直线附近;第三典型变量的相关系数是0.07257029,接近于0,所以很分散。


    II.典型相关系数的显著性检验

    作为相关分析的目的 就是选择多少对典型变量?因此需要做典型相关系数的显著性检验。若认为相关系数k为0 就没有必要考虑第k对典型变量了

    #相关系数检验R程序
    corcoef.test<-function(r, n, p, q, alpha=0.1){
       #r为相关系数 n为样本个数 且n>p+q
       m<-length(r); Q<-rep(0, m); lambda <- 1
       for (k in m:1){
         #检验统计量 
         lambda<-lambda*(1-r[k]^2); 
          #检验统计量取对数
         Q[k]<- -log(lambda)  
       }
       s<-0; i<-m 
       for (k in 1:m){
         #统计量  
         Q[k]<- (n-k+1-1/2*(p+q+3)+s)*Q[k]
          chi<-1-pchisq(Q[k], (p-k+1)*(q-k+1))
          if (chi>alpha){
             i<-k-1; break
          }
          s<-s+1/r[k]^2
       }
      #显示输出结果 选用第几对典型变量
        i
    }
    source("corcoef.test.R")
    #输入相关系数r,样本个数n,两个随机向量的维数p和q,置信水平a(缺省值为0.1)
    corcoef.test(r=ca$cor,n=20,p=3,q=3)
    #程序输出值为典型变量的对数

    最终程序运行结果显示选择第一对典型相关变量。我们只利用第一典型变量分析问题,达到降维的目的。

    write.csv(test,"test_test.csv") 
    展开全文
  • R语言 典型相关分析

    千次阅读 2016-05-05 14:50:25
    1 关键点:#典型相关分析# #典型相关分析是用于分析两组随机变量之间的相关程度的一种统计方法,它能够有效地揭示两组随机变量之间的相互(线性依赖)关系 #例如 研究生入学考试成绩与本科阶段...3 R语言提供的计算...

    1 关键点:#典型相关分析#
    #典型相关分析是用于分析两组随机变量之间的相关程度的一种统计方法,它能够有效地揭示两组随机变量之间的相互(线性依赖)关系
    #例如 研究生入学考试成绩与本科阶段一些主要课程成绩的相关性
    #将研究两组变量的相关性问题转化为研究两个变量的相关性问题 此类相关为典型相关#

    2 分类:#总体典型相关#样本典型相关

    3 R语言提供的计算函数:

    #典型相关计算 cancor(x,y,xcenter=TRUE,ycenter=TRUE)
    #x,y是相应的数据矩阵 xcenter,ycenter是逻辑变量 TRUE是将数据中心化 FALSE是不中心化

    4 分析结果含义

    #cor是典型相关系数

    #xcoef是对应于数据x的系数 又称关于数据x的典型载荷即样本典型变量U系数矩阵A的转置
    #xcenter是数据X的中心 即数据X的样本均值

    #y是对应于数据x的系数 又称关于数据y的典型载荷即样本典型变量V系数矩阵B的转置
    #ycenter是数据Y的中心 即数据Y的样本均值

    4 分析步骤

    #1.载入原始数据 data.frame
    #2.原始数据标准化 scale
    #3.典型相关分析 cancor

    #4.相关系数显著性检验 corcoef.test.R

    5 案例

    #现对20名中年人测得三个生理指标:体重(X1) 腰围(X2) 脉搏(X3)
    #三个训练指标:引体向上(Y1) 起座次数(Y2) 跳跃次数(Y3) 试分析这组数据的相关性

    #用数据框的形式输入数据
    test<-data.frame(
    X1=c(191, 193, 189, 211, 176, 169, 154, 193, 176, 156,
    189, 162, 182, 167, 154, 166, 247, 202, 157, 138),
    X2=c(36, 38, 35, 38, 31, 34, 34, 36, 37, 33,
    37, 35, 36, 34, 33, 33, 46, 37, 32, 33),
    X3=c(50, 58, 46, 56, 74, 50, 64, 46, 54, 54,
    52, 62, 56, 60, 56, 52, 50, 62, 52, 68),
    Y1=c( 5, 12, 13, 8, 15, 17, 14, 6, 4, 15,
    2, 12, 4, 6, 17, 13, 1, 12, 11, 2),
    Y2=c(162, 101, 155, 101, 200, 120, 215, 70, 60, 225,
    110, 105, 101, 125, 251, 210, 50, 210, 230, 110),
    Y3=c(60, 101, 58, 38, 40, 38, 105, 31, 25, 73,
    60, 37, 42, 40, 250, 115, 50, 120, 80, 43)
    )

    #为了消除数量级的影响 将数据标准化处理 调用scale函数
    test<-scale(test)
    #对标准化的数据做典型相关分析
    ca<-cancor(test[,1:3],test[,4:6])
    #查看分析结果
    ca

    R语言 <wbr>典型相关分析

    #计算数据在典型变量下的得分 U=AX V=BY
    U<-as.matrix(test[, 1:3])%*% ca$xcoef
    V<-as.matrix(test[, 4:6])%*% ca$ycoef
    #画出U1、V1和U3、V3为组表的数据散点图
    plot(U[,1], V[,1], xlab=”U1″, ylab=”V1″)
    plot(U[,3], V[,3], xlab=”U3″, ylab=”V3″)

    R语言 <wbr>典型相关分析

    由散点图可知 第一典型相关变量分布在一条直线附近 ;第三典型相关变量数据很分散。
    #典型相关系数的显著性检验
    #作为相关分析的目的 就是选择多少对典型变量?因此需要做典型相关系数的显著性检验
    #若认为相关系数k为0 就没有必要考虑第k对典型变量了

    #相关系数检验R程序
    source(“E:/R/corcoef.test.R”)
    corcoef.test(r=ca$cor,n=20,p=3,q=3)

    最终程序运行结果显示选择第一对典型相关变量。

    典型相关系数检验 R语言程序 corcoef.test.R 将其保存在计算机的E盘的R文件夹下

    corcoef.test<-function(r, n, p, q, alpha=0.1){
    #r为相关系数 n为样本个数 且n>p+q
    m<-length(r); Q<-rep(0, m); lambda <- 1
    for (k in m:1){
    lambda<-lambda*(1-r[k]^2); #检验统计量
    Q[k]<- -log(lambda) #检验统计量取对数
    }
    s<-0; i<-m
    for (k in 1:m){
    Q[k]<- (n-k+1-1/2*(p+q+3)+s)*Q[k] #统计量
    chi<-1-pchisq(Q[k], (p-k+1)*(q-k+1))
    if (chi>alpha){
    i<-k-1; break
    }
    s<-s+1/r[k]^2
    }
    i #显示输出结果 选用第几对典型变量
    }

    展开全文
  • 典型相关分析中,当一组变量仅有两个时,可用简单相关系数衡量;当考察一组时,可用复相关进行衡量。大量的实际问题需要我们把指标之间的联系扩展到两组随机变量之间的相互依赖关系。典型相关关系就是为了解决此类...

    一.基本概念和原理

    典型相关分析中,当一组变量仅有两个时,可用简单相关系数衡量;当考察一组时,可用复相关进行衡量。大量的实际问题需要我们把指标之间的联系扩展到两组随机变量之间的相互依赖关系。典型相关关系就是为了解决此类问题而提出的多变量统计分析方法。它实际上是利用主成分的思想来讨论两组随机变量的相关性问题,把两组变量间的相关性研究化为少数几对变量间的相关性研究,而且这少数几对变量之间又是不相关的,以此来达到化解复杂相关关系的目的。

    以下是我为大家准备的几个精品专栏,喜欢的小伙伴可自行订阅,你的支持就是我不断更新的动力哟!

    MATLAB-30天带你从入门到精通

    MATLAB深入理解高级教程(附源码)

    tableau可视化数据分析高级教程

    二.分析原理

    典型相关分析是研究两组变量之间的相关关系的一种多变量统计分析方法,它可以真正反映两组变量之间的相互依赖的线性关系。设两组变量   用x1,x2....xp及y1,y2...yp表示,采用类似主成分分析的方法,在每组变量中选择若干个有代表性的综合指标(变量的线性组合),通过研究两组综合指标之间的关系来反映两组变量之间的关系。

    展开全文
  • 1.典型相关分析:两组变量之间的相关问题 cancor() cancor(x, y, xcenter = TRUE, ycenter = TRUE) x,y为两组变量的数据矩阵;xcenter和ycenter是逻辑值,表示是否中心化,实际中一般采用默认值TRUE 注意...

    1.典型相关分析:两组变量之间的相关问题

    cancor()

     

    cancor(x, y, xcenter = TRUE, ycenter = TRUE)

    x,y为两组变量的数据矩阵;xcenter和ycenter是逻辑值,表示是否中心化,实际中一般采用默认值TRUE

     

    注意分析前要对数据进行标准化

    scale():对数据进行标准化和中心化

     

    scale(x, center = TRUE, scale = TRUE)

    x是矩阵,提供数据;若center为数字或与x等长的向量,中心化时用x减去center对应的数值; center=TRUE则减去x的平均值,默认为TRUE;scale为数字或与x等长的向量,则标准化用x除以scale,默认为TRUE,即除以标准差。

     

    2.对应分析:行变量和列变量之间的关系

    corresp();MASS包,简单对应分析

     

    corresp(x, nf = 1,...)

    x是数据矩阵;nf表示因子分析中计算因子的个数,通常取2

     

    可以使用biplot()提取因子分析的散点图

    ca():专门计算对应分析的ca包

     

    ca(data)

     

     

     

     

     

     

     

     

     

    展开全文
  • R语言实用案例分析-1

    万次阅读 2017-01-23 09:40:14
    R语言是一门统计学语言,他可以方便的完成统计相关的计算,下面我们就来看一个相关案例。 1. 背景 最近西安交大大数据专业二班,开设了Java和大数据技术课程,班级人数共100人。 2. 需求 通过R语言完成该100位...
  • R语言数据分析案例(1)

    千次阅读 2021-06-26 17:58:37
    (1)学生在如下类别内任选其一,结合项目的行业特点,自拟题目和功能需求,利用R语言完成相关数据统计分析和绘图工作。要求:学生选题要“一人一题”,不得重复,个人项目需征得教师同意方可开展后续研究。 互联网...
  • 典型相关分析R(搜的搜的)

    千次阅读 2018-08-13 00:23:49
    1 关键点:#典型相关分析# 典型相关分析是用于分析两组随机变量之间的相关程度的一种统计方法,它能够有效地揭示两组随机变量之间的相互(线性依赖)关系 ...3 R语言提供的计算函数: 典型相关计...
  • R语言用户自定义编写函数实例分析

    千次阅读 2020-09-02 17:25:29
    实例一:构造计算描述统计量的函数 ##自定义函数 mystats() mystats <- function(x, parametric=TRUE, print=FALSE) { if (parametric) { center <- mean(x); spread <- sd(x) } else ...
  • R语言判别分析

    万次阅读 多人点赞 2017-02-27 17:07:54
    自己整理编写的R语言常用数据分析模型的模板,原文件为Rmd格式,直接复制粘贴过来,作为个人学习笔记保存和分享。部分参考薛毅的《统计建模与R软件》和《R语言实战》本文中分三个方法介绍判别分析,Bayes判别,距离...
  • R语言igraph包编写网络分析代码原理和代码例子,怎么在中国知网上搜索相关的论文呢。表示自己查不到,有详细的技术路线更好
  • 介绍 ...其中包括图像和语音识别,无人驾驶汽车,自然语言处理等等。 今天,深度学习对于几乎所有需要机器学习的任务都是非常有效的。但是,它特别适合复杂的分层数据。其潜在的人工神经网...
  • 案例1主题: 主成分分析及学生成绩神秘联系分析 案例2主题: 因子分析及学生成绩神秘联系分析 案例一:目的与内容 学生的考试是评估学生的学习程度及能力,当我们只想知道学生的学习程度如何时,可借由一份良好的...
  • 拓端tecdat|R语言生存分析可视化分析

    千次阅读 2019-08-08 23:51:16
    生存分析对应于一组统计方法,用于调查感兴趣事件发生所花费的时间。...在癌症研究中,典型的研究问题如下: 某些临床特征对患者的生存有何影响? 个人三年存活的概率是多少? 各组患者的生存率有差异吗? ...
  • r语言实现关联分析–关联规则挖掘 关联分析: 引子: 我们一般把一件事情发生,对另一间事情也会产生影响的关系叫做关联。而关联分析就是在大量数据中发现项集之间有趣的关联和相关联系(形如“由于某些事件的发生而...
  • 数据分析学习总结笔记08:数据分类典型方法及其R语言操作1 判别分析1.1 判别分析简介1.1.1 判别分析概念1.1.2 判别分析的种类1.2 距离判别法1.2.1 两总体距离判别1.2.2 多总体距离判别1.3 Fisher 判别法1.3.1 Fisher...
  • 本次培训采取深入浅出的方法,先以简单的案例引入R数据分析的基本原理,随后重点讲解多种常用单元的功能和特性,以及有R数据分析与数据的实用技术和处理方法,紧密结合应用实例,针对工作中存在的疑难问题进行分析...
  • 典型相关分析(CCA)

    万次阅读 多人点赞 2018-07-30 23:14:03
    CCA是数据挖掘中重要的算法...我们有相关系数,如下所示: ρ(X,Y)=cov(X,Y)DX√DY√ρ(X,Y)=cov(X,Y)DXDY \rho(X, Y) = \frac{cov(X,Y)}{\sqrt{DX}\sqrt{DY}} 值ρ(X,Y)ρ(X,Y) \rho(X, Y)的绝对值越接近1,说明X...
  • R语言 PCA 主成分分析

    2020-08-07 17:56:13
    综述:主成分分析 因子分析 典型相关分析,三种方法的共同点主要是用来对数据降维处理的从数据中提取某些公共部分,然后对这些公共部分进行分析和处理。 #主成分分析 是将多指标化为少数几个综合指标的一种统计...
  • R语言经典实例中文版》

    热门讨论 2014-11-05 19:58:33
    此为完整版中文版,希望对大家有所帮助。《R语言经典实例》涵盖200多个R语言实用方法,可以帮助读者快速而有效地使用R进行数据分析
  • R语言语言学与R语言的碰撞Xu & YangPhoneticSan学习参考Discovering Statistics Using RStatistics for Linguistics with RHow to Do Linguistics with RR in ActionAnalyzing Linguistic DataR Graphics ...
  • 其中包括图像和语音识别,无人驾驶汽车,自然语言处理等等。有趣的是,数十年来,大多数深度学习的数学概念都已为人所知。然而,只有通过最近的几项发展才能释放深度学习的全部潜力 。 以前,由于消失的梯度和过度...
  • R语言——方差分析

    万次阅读 多人点赞 2017-05-22 15:58:00
    一、方差分析的基本概念 方差分析是在20世纪20年代发展起来的一种统计方法,它是由英国统计学家费希尔在进行实验设计时为解释实验数据而首先引入的。 从形式上看,方差分析是比较多个总体的均值是否相等;但是其...
  • R语言 主成分分析

    2016-04-09 12:48:00
    综述:主成分分析 因子分析 典型相关分析,三种方法的共同点主要是用来对数据降维处理的 从数据中提取某些公共部分,然后对这些公共部分进行分析和处理。 #主成分分析 是将多指标化为少数几个综合指标的一种统计...
  • R语言与统计分析

    万次阅读 2015-12-16 11:20:29
    R语言与统计分析 汤银才 主编 高等教育出版社 二○○八年五月 内容介绍 本书以数据的常用统计分析方法为基础,在简明扼要地阐述统计学基本概 念、基本思想与基本方法的基础上,讲述与之相对应的R函数的实现,...
  • R语言实战之基本统计分析

    千次阅读 2018-06-02 23:48:18
    第7章 基本统计分析 在数据被组织成合适的形式后,...本章将评述用于生成基本的描述性统计量和推断统计量的R函数。 7.1 描述性统计分析 本节介绍分析连续型变量中心趋势、变化性和分布性的方法。 使用第1章中Mo...
  • R语言 PCA(主成分分析

    万次阅读 2016-11-30 16:16:49
    R语言 PCA 转自:http://www.cnblogs.com/longzhongren/p/4300593.html 1、关键点 综述:主成分分析 因子分析 典型相关分析,三种方法的共同点主要是用来对数据降维处理的从数据中提取某些公共部分,然后对...
  • R语言之主成分分析-PCA 贡献率

    千次阅读 2016-12-27 10:48:26
    综述:主成分分析 因子分析典型相关分析,三种方法的共同点主要是用来对数据降维处理的 从数据中提取某些公共部分,然后对这些公共部分进行分析和处理。 #主成分分析 是将多指标化为少数几个综合指标的一种统计分析...

空空如也

空空如也

1 2 3 4 5 ... 20
收藏数 44,478
精华内容 17,791
关键字:

r语言典型相关分析案例