精华内容
下载资源
问答
  • 阶段线性判别分析的改进方法
  • 为了解决模拟电路软故障诊断中特征提取不全面准确的问题,提出了一基于综合时频域及核判别分析的两级特征提取新方法。首先,对采集到的故障响应信号分别提取均值、方差等时域统计特征和小波包分解后不同频带的能量...
  • 在分析经典聚类判别分析方法实质的基础上,提出了一新的聚类判别分析框架,改进了一基于样本指标值频度计算的两总体判别分析算法,提高了在对所有参与建立判别模型的样本进行判别时的计算速度;给出了建立在此...
  • matlab距离判别分析的应用

    千次阅读 2019-07-25 19:25:50
    matlab距离判别分析的应用 一、定义 距离判别法:距离判别分析方法是判别样品所属类别的一应用性很强的多因素决方法,其中包括个样本总体距离判别法,多个样本距离判别法。 多个总体距离判别法:多个总体距离判别法...

    matlab距离判别分析的应用

    一、定义

    距离判别法:距离判别分析方法是判别样品所属类别的一应用性很强的多因素决方法,其中包括两个样本总体距离判别法,多个样本距离判别法。
    多个总体距离判别法:多个总体距离判别法是距离判别法的一种,是两个总体距离判别法的推广,具有多个总体,将待测样本归为多个样本中的一类。

    1.1两个总体的距离判别法

    设有两个总体(或称两类)G1、G2,从第一个总体中抽取n1个样品,从第二个总体中抽取n2个样品,每个样品测量p个指标如下页表。
    今任取一个样品,实测指标值为,问X应判归为哪一类?
    在这里插入图片描述

    在这里插入图片描述

    如果距离定义采用欧氏距离,则可计算出
    在这里插入图片描述
    然后比较和大小,按距离最近准则判别归类。
    在这里插入图片描述

    1.2

    在这里插入图片描述

    在这里插入图片描述

    在这里插入图片描述

    二、多个总体的距离判别法

    设有k个总体G1, …, Gk,它们的均值和协方差阵分别为,从每个总体Gi中抽取ni个样品,i =1,…,k,每个样品测p个指标。今任取一个样品,实测指标值为,问X应判归为哪一类?
    在这里插入图片描述
    在这里插入图片描述

    三、实际问题

    3.1城市分类

    例 对全国30个省市自治区1994年影响各地区经济增长差异的制度变量:x1—经济增长率(%)、x2—非国有化水平(%)、x3—开放度(%)、x4—市场化程度(%)作判别分析。

    在这里插入图片描述
    我们首先判断两组协方差是否相等,相等用一种算法,不相等用另外一种算法。

    a=xlsread('keshe','sheet1','D2:G12');%第一类
    b=xlsread('keshe','Sheet1','D13:G28');%第二类
    x=xlsread('keshe','Sheet1','D29:G31');%待测数据
    n1=length(a(:,1));n2=length(b(:,1));  %样本容量
    n=n1+n2;s1=cov(a);s2=cov(b); %样本协方差
    p=3;s=((n1-1)*s1+(n2-1)*s2)/(n1+n2-2);
    q1=(n1-1)*(log(det(s))-log(det(s1))-p+trace(inv(s)*s1));
    q2=(n2-1)*(log(det(s))-log(det(s2))-p+trace(inv(s)*s2));%检验统计量
    if (q1<chi2inv(0.95,p*(p+1)/2))&(q2<chi2inv(0.95,p*(p+1)/2));
    disp('协方差矩阵相同,判别函数值为:')
    for i=1:3
    D(i)=(x(i,:)-mean(a))*inv(s)*(x(i,:)-mean(a))'-(x(i,:)-mean(b))*inv(s)*(x(i,:)-mean(b))';
    end
    D
    else  
    disp('协方差矩阵不相同')   
    end 
    

    在这里插入图片描述
    chi2inv(0.95,10)=18.3070,q1< 18.3070 q2>18.3070
    所以协方差不相等

    然后通过协方差不相同来调用函数进行判别:

    q2=(n2-1)*(log(det(s))-log(det(s2))-p+trace(inv(s)*s2)); %检验统计量
    chi2inv(0.95,10); %验证两总体的协方差矩阵相同
    W=mahal(x,a)-mahal(x,b)    %协方差不相等时,计算二次判别函数
    

    在这里插入图片描述

    得到以上结果,x1小于0,x2大于0。再根据判别准则可得 x1,属于第一类,x2,x3属于第二类,即待判样品中江苏被判属第一组,陕西和安徽被判属第二组
    第二种方法 用classify进行判别,此时协方差不相同,选用二次判别函数。

    n1=size(a,1);n2=size(b,1);
    group=[ones(n1,1);2*ones(n2,1)];
    training=[a;b];
    [class2,err,POSTERIOR,logp,coeff]=classify(x,training,group,'mahalanobis');
    class2  
    

    在这里插入图片描述
    得到以上结果,x1小于0,x2大于0。再根据判别准则可得 x1,属于第一类,x2,x3属于第二类,即待判样品中江苏被判属第一组,陕西和安徽被判属第二组

    对于判别结果的分析

    %回代误判率
    a=xlsread('keshe','sheet1','D2:G12');%第一类
    b=xlsread('keshe','Sheet1','D13:G28');%第二类
    x=xlsread('keshe','Sheet1','D29:G31');%待测数据
    for i=1:n1
    d11(i)=(a(i,:)-mean(a))*inv(s)*(a(i,:)-mean(a))'-(a(i,:)-mean(b))*inv(s)*(a(i,:)-mean(b))';end
    for i=1:n2
    d22(i)=(b(i,:)-mean(b))*inv(s)*(b(i,:)-mean(b))'-(b(i,:)-mean(a))*inv(s)*(b(i,:)-mean(a))';end
    n12=length(find(d11>0));n21=length(find(d22>0));p0=(n12+n21)/(n1+n2)  
    
     %计算交叉误判率
    for i=1:n1
     A=a([1:i-1,i+1:n1],:);
     n1=length(A(:,1));n2=length(b(:,1));
    s1=cov(a);s2=cov(b);P=3;
    s=((n1-1)*s1+(n2-1)*s2)/(n1+n2-2);
    D11(i)=(a(i,:)-mean(A))*inv(s)*(a(i,:)-mean(A))'-(a(i,:)-mean(b))*inv(s)*(a(i,:)-mean(b))';end  
    for i=1:n2 B=b([1:i-1,i+1:n2],:);
    n1=length(a(:,1));n2=length(B(:,1));
    s1=cov(A);s2=cov(B);P=3;
    s=((n1-1)*s1+(n2-1)*s2)/(n1+n2-2);
    D22(i)=(b(i,:)-mean(B))*inv(s)*(b(i,:)-mean(B))'-(b(i,:)-mean(a))*inv(s)*(b(i,:)-mean(a))';
    end
    N11=length(find(D11>0));
    N22=length(find(D22>0));
    p1=(N11+N22)/(n1+n2) 
    

    两个总体协方差相等判别

    n1=length(a(:,1));n2=length(b(:,1));s1=cov(a);s2=cov(b);
    p=3;s=((n1-1)*s1+(n2-1)*s2)/(n1+n2-2);q1=(n1-1)*(log(det(s))-log(det(s1))-p+trace(inv(s)*s1)) q2=(n2-1)*(log(det(s))-log(det(s2))-p+trace(inv(s)*s2))
    chi2inv(0.95,3)    %根据q1 q2与临界值的大小关系判断协方差是否相等
    

    在这里插入图片描述
    回归误判率是0.0370,交叉误判率是0.07690,两个误判率都比较小,因此可见这个判别是有效的

    那么再来一题多个总体的吧。

    3.2医疗应用

    为了研究某地区人口死亡状况,已按某种方法将15个已知样品分为三类(如下表所示),指标及原始数据见下表,试建立判别函数并判定另外4个待判样品分别属于哪类。
    在这里插入图片描述
    (1)判别协方差是否相等
    判别多个样本协方差是否相等

    a=xlsread('ks','sheet1','B1:G5');%第一组
    b=xlsread('ks','sheet1','B6:G10');%第二组
    c=xlsread('ks','sheet1','B11:G15');%第三组
    x=xlsread('ks','sheet1','B16:G19');%待测样本
     
    
    
    n=size(a,1)+ size(b,1)+ size(c,1);        %计算总的样本容量
    [n1,p]= size(a);
    k=3;
    f=p*(p+1)*(k-1)/2;                        %统计量自由度
    d=(2*p^2+3*p-1)*(k+1)/(6*(p+1)*(n-k));      %由(2.2.18)式计算
    s1=cov(a);                             %协方差矩阵
    s2=cov(b);                             %协方差矩阵
    s3=cov(c);                             %协方差矩阵
    s=(n1-1)*(s1+s2+s3)/(n-k);                 %总体协方差估计
    M=(n-k)*log(det(s))-19*(log(det(s1))+log(det(s2))+log(det(s3)));    %(2.2.17)中的M值
    T=(1-d)*M;                              % 统计量(2.2.17)
    P0=1-chi2cdf(T,f);                      % 卡方分布概率 
    if P0>0.1
    disp('协方差相同');
    else
        disp('协方差不相同');
    end
    

    结果是不相等蛤
    (2)调用classify判别
    在这里插入图片描述
    所以第一三个样本是属于第二类,第二四个样本属于第一类误差为0.1333%,这个误差很小,说明该判定是有效的。

    调用classify进行判别多个总体
    x=xlsread('ks_2','sheet1','C17:H20');%待测样本
    group=[ones(n1,1);2*ones(n2,1);3*ones(n3,1)];
    training=[a;b;c];
    [class2,err2,POSTERIOR2,logp2,coeff2]=classify(x,training,group,'diagquadratic');
    class2
    
    展开全文
  • CAA智慧起航,共创未来局部线性指数判别分析(LLEDA):结合指数判别分析方法(EDA) 的全局映射与局部线性嵌入方法(LLE)的局部保持两种优势.在进行全局判别分析的同时能够保持非线性数据间的局部几何结构, 能够克服故障...

    2e035ebf89e23f838b7e3dd60eeb5a2a.gif

    CAA

    智慧起航,共创未来

    局部线性指数判别分析(LLEDA):结合指数判别分析方法(EDA) 的全局映射与局部线性嵌入方法(LLE)的局部保持两种优势.在进行全局判别分析的同时能够保持非线性数据间的局部几何结构, 能够克服故障样本数据量少的限制.对工业过程的强非线性系统有较好的处理效果。

    工业过程数据具有规模性大, 复杂性高, 变量多, 关联性强等特点. 如何从数据出发准确并快速地发现故障并处理, 保证过程高效运行意义重大。目前已有学者将一些数据驱动的故障诊断方法结合起来,使其能够处理更多特性(如动态, 非线性等) 的工业过程, 进而提高诊断的准确性. 然而, 这些方法多针对特定的问题, 如只是进行故障检测或者故障诊断等. 因此, 本文提出了一种集成数据分类, 故障模型库建立, 故障诊断及可视化于一体的方法, 完成数据分类, 构建故障模型库, 故障在线诊断及可视化相关处理.(1)常规主成分分析(PCA) 方法对历史数据进行初筛, 区分出正常和故障信息;(2)聚类方法对故障数据集进行分类;(3)局部线性指数判别分析方法(LLEDA) 建立故障模型库进而进行故障诊断.面对这些任务,混合型过程监控和故障诊断方法的实现过程如下图。6d7f9a4dfdac389d5a1d4ea8c278b1f8.png混合型故障检测和诊断信息流程 

    采用田纳西伊士曼(TE) 过程来评估所提混合型故障监控与诊断方法的有效性, 基于PCA 的故障检测方法对数据集进行粗分, 检测出显著故障,再使用层次聚类方法展示出部分故障数据的层次聚类树形图,利用平行坐标可视化方法展示每类故障数据集, 通过比较各故障数据集与正常数据集各变量, 判别故障类型。

    b53ff3e3b83f41c14ffb3ca516dc9e0d.png

    层次聚类分析

    a5063bd63f6dbce4c6a1b68a025b0f50.png

    故障数据的平行坐标可视化图

    LLEDA 故障诊断:采用LLEDA方法进行故障诊断, 在进行判别分析的时候将类间离散矩阵和类内离散矩阵指数化, 即使数据集中存在难诊断的微小故障, 也能增大不同类别间的距离, 提高分类能力.此方法的故障检测能力与其他方法的对比结果更说明了其有效性。

    8cb756701ba82d3c6c50a6a9c0aff8c3.pngd8ec2a6816cf72d79e9beede359557e5.png63f940225c623af521e9f5d977fe69cd.png

    FDA、LLE + FDA 和LLEDA 方法下不同特征矢量对应的故障4, 8 和13 的识别率

    故障诊断结果可视化:从三个特征向量的角度建立三维数据分类图, 实现故障数据分类可视化的直接展示.

    a50a51eec5d419fff8e423ec2881b61a.pngc8d60c3618a3f556ea17bff6c862ca89.png

    在LLEDA 方法下故障数据的投影

    850a1bd0628fd3a7a3ca4333ff1469bc.png

    图3  TDAA语音分离模型框架[5]LLEDA 方法下故障4, 8 和13 的诊断结果

    混合型过程监控与故障诊断的结论:有效结合了PCA 的检测能力, 层次聚类的分类能力以及LLEDA 的判别分析能力. 首先利用PCA 检测是否发生故障, 利用正常工况数据建立统计模型,计算监控统计量和置信限, 然后利用层次聚类方法对故障数据集进行聚类分析, 分成不同的故障类别.最后基于聚类分析的结果再进行LLEDA 判别分析.与其他方法相比, LLEDA 在降维过程中保留了局部几何结构, 克服了类内离散矩阵奇异值的问题, 可以避免小样本问题, 提高对微小故障的诊断率. 此外,基于此混合型故障诊断方法, 可以保证在工业过程中直接采集数据进行监控诊断而无需知道先验知识,良好的仿真结果表明了所提方法的有效性.

    作者简介

    bec35b715033aef4cfc6a0f38671cc6c.png

    陈晓露

    北京化工大学信息科学与技术学院博士研究生. 主要研究方向为复杂工业过程的建模与故障诊断,数据因果关系分析和智能学习算法.  

    E-mail: 18810493810@163.com

    c1cd9153b41843191b675f7fcfe4635c.png

    王瑞璇

    北京化工大学信息科学与技术学院硕士研究生.主要研究方向为复杂工业过程的过程监控和故障诊断.

    E-mail: wangruixuan11@126.com

    355011d9e8a2a420928d3b9beaaef079.png

    王  晶

    1998年获得了东北大学控制理论与控制工程专业博士学位.北京化工大学信息科学与技术学院的教授.2014年在美国特拉华大学担任访问教授.研究方向包括非线性、多变量、受约束的工业过程的先进控制方法的应用;复杂的工业过程的建模,优化和控制;过程监控和复杂工业过程的故障诊断.

    E-mail: jwang@mail.buct.edu.cn

    bee592b97217ff4edf45efa7684a2b63.png

    周靖林

    2005 年获得了中国科学院自动化研究所的博士学位.他是英国谢菲尔德大学自动控制与系统工程系的学者,现任北京化工大学信息科学与技术学院教授.研究内容包括随机分布控制,故障检测与诊断,变结构控制及其应用. 

    E-mail: jinglinzhou@mail.buct.

    edu.cn

    来源:AAS自动化学报

    7c5c8b9394069f9f71ed550f1bd2a1b2.png

     往期文章    

    三千名学者专家共话“自主智能 创享未来”,2020中国自动化大会在沪隆重召开

    【CAC2020】曲终人未散,未来尤可期!2021,北京见!

    【重要通知】关于继续征集中国自动化学会专家库成员的通知

    【喜报】自动化学报排名第一,被评定为中国中文权威期刊!

    【喜报】中国自动化学会多名会员入选2020年度国家杰出青年科学基金建议资助项目申请人名单!

       联系我们      

    地址:北京市海淀区中关村东路95号

    邮编:100190

    电话:010-82544542(综合)

              010-62522472(会员)

              010-62522248(学术活动)

              010-62624980(财务)

    传真:010-62522248

    邮箱:caa@ia.ac.cn

     更多精彩   

    官方微信公众号(英文)

    名称:CAA OFFICIAL

    微信号:caaofficial

    7a98718a4d35d76039b07881efb16a42.png

    会员微信公众号 

    名称:CAA会员服务 

    微信号:caa-member

    3bb3f28e37c1ba0442929ed9510a6274.png

    99c64d4abbc68ab58e73cee15f21abb8.gif

    e9b8f67dd250f404dc1e781ead5058f0.gif

    点击  查看详情

    展开全文
  • R语言 判别分析

    千次阅读 2016-12-27 10:48:29
    #判别分析 用以判别个体所属群体统计方法 判别分析重点是类群体的判别方法 #主要判别分析方法 有距离判别 贝叶斯判别 费歇判别法 1、关键点: #贝叶斯判别 贝叶斯判别式假定对研究对象已有一定认识...

    #判别分析 用以判别个体所属群体的一种统计方法 判别分析重点是两类群体的判别方法

    #主要判别分析方法 有距离判别 贝叶斯判别 费歇判别法

    1、关键点:

    #贝叶斯判别 贝叶斯判别式假定对研究对象已有一定的认识 这种认识常用先验概率来描述

    #当取得样本后 就可以用样本来修正已经有的先验概率分布 得出后验概率分布

    #然后通过后验概率分布 进行各种统计推断

    #实际上就是使平均误判损失(误判概率与误判损失的结合)ECM达到极小的过程

    2、案例分析

    (一)两个总体的贝叶斯判别分析

    #1.载入数据
    TrnX1<-matrix(
      c(24.8, 24.1, 26.6, 23.5, 25.5, 27.4,-2.0, -2.4, -3.0, -1.9, -2.1, -3.1),ncol=2)
    TrnX2<-matrix(
      c(22.1, 21.6, 22.0, 22.8, 22.7, 21.5, 22.1, 21.4,
      -0.7, -1.4, -0.8, -1.6, -1.5, -1.0, -1.2, -1.3),
      ncol=2)
    #2、载入两总体的贝叶斯判别函数  注 把贝叶斯判别函数存在了计算机的E盘R文件夹中
    source("E:/R/discriminiant.bayes.R")
    #3、协方差相同时的判别
    discriminiant.bayes(TrnX1, TrnX2, rate=8/6,var.equal=TRUE)
    #协方差不同时的判别
    discriminiant.bayes(TrnX1, TrnX2, rate=8/6)

    PS============================discriminiant.bayes.R========================

    #两个总体判别的贝叶斯判别程序

    #输入 TrnX1 TrnX2表示X1类 X2类训练样本 样本输入格式为数据框

    #rate=p2/p1缺省时为1

    #Tst为待测样本 其输入格式是数据框 为两个训练样本之和

    #var.equal是逻辑变量 当其值为TRUE是表示认为两个总体的协方差相同 否则不同

    #输出 函数的输出时1和2构成的一维矩阵 1表示待测样本属于X1类

    discriminiant.bayes <- function
    (TrnX1, TrnX2, rate = 1, TstX = NULL, var.equal = FALSE){
      if (is.null(TstX) == TRUE) TstX<-rbind(TrnX1,TrnX2)
      if (is.vector(TstX) == TRUE) TstX <- t(as.matrix(TstX))
      else if (is.matrix(TstX) != TRUE)
      TstX <- as.matrix(TstX)
      if (is.matrix(TrnX1) != TRUE) TrnX1 <- as.matrix(TrnX1)
      if (is.matrix(TrnX2) != TRUE) TrnX2 <- as.matrix(TrnX2)
      nx <- nrow(TstX)
      blong <- matrix(rep(0, nx), nrow=1, byrow=TRUE,
      dimnames=list("blong", 1:nx))
      mu1 <- colMeans(TrnX1); mu2 <- colMeans(TrnX2)
      if (var.equal == TRUE || var.equal == T){
      S <- var(rbind(TrnX1,TrnX2)); beta <- 2*log(rate)
      w <- mahalanobis(TstX, mu2, S)
      - mahalanobis(TstX, mu1, S)
      }
      else{
      S1 <- var(TrnX1); S2 <- var(TrnX2)
      beta <- 2*log(rate) + log(det(S1)/det(S2))
      w <- mahalanobis(TstX, mu2, S2)
      - mahalanobis(TstX, mu1, S1)
      }
      for (i in 1:nx){
      if (w[i] > beta)
      blong[i] <- 1
      else
      blong[i] <- 2
      }
      blong
    }

    (二)多个总体贝叶斯判别

    X<-iris[,1:4]
    G<-gl(3,50)
    source("E:/R/distinguish.bayes.R")
    distinguish.bayes(X,G)

    PS:=============distinguish.bayes.R====================

    #多个总体判别的贝叶斯判别程序

    #输入 TrnX 表示训练样本 样本输入格式为数据框

    #TrnG是因子变量 表示训练样本的分类情况

    #输入变量p是先验概率 缺省值为1

    #Tst为待测样本 其输入格式是数据框

    #var.equal是逻辑变量 当其值为TRUE是表示认为两个总体的协方差相同 否则不同

    #输出 函数的输出是数字构成的一维矩阵 1表示待测样本属于X1类

    distinguish.bayes <- function
    (TrnX, TrnG, p = rep(1, length(levels(TrnG))),
     TstX = NULL, var.equal = FALSE){
      if ( is.factor(TrnG) == FALSE){
      mx <- nrow(TrnX); mg <- nrow(TrnG)
      TrnX <- rbind(TrnX, TrnG)
      TrnG <- factor(rep(1:2, c(mx, mg)))
      }
      if (is.null(TstX) == TRUE) TstX <- TrnX
      if (is.vector(TstX) == TRUE) TstX <- t(as.matrix(TstX))
      else if (is.matrix(TstX) != TRUE)
      TstX <- as.matrix(TstX)
      if (is.matrix(TrnX) != TRUE) TrnX <- as.matrix(TrnX)
      nx <- nrow(TstX)
      blong <- matrix(rep(0, nx), nrow=1,
      dimnames=list("blong", 1:nx))
      g <- length(levels(TrnG))
      mu <- matrix(0, nrow=g, ncol=ncol(TrnX))
      for (i in 1:g)
      mu[i,] <- colMeans(TrnX[TrnG==i,])
      D <- matrix(0, nrow=g, ncol=nx)
      if (var.equal == TRUE || var.equal == T){
      for (i in 1:g){
      d2 <- mahalanobis(TstX, mu[i,], var(TrnX))
      D[i,] <- d2 - 2*log(p[i])
      }
      }
      else{
      for (i in 1:g){
      S <- var(TrnX[TrnG==i,])
      d2 <- mahalanobis(TstX, mu[i,], S)
      D[i,] <- d2 - 2*log(p[i])-log(det(S))
      }
      }
      for (j in 1:nx){
      dmin <- Inf
      for (i in 1:g)
      if (D[i,j] < dmin){
      dmin <- D[i,j]; blong[j] <- i
      }
      }
      blong
    }
    展开全文
  • 我们接着说数据分析的十六种方法中的回归分析法、聚类分析法和判别分析法:七、回归分析 回归分析在统计学中是指确定两种或者两种以上变量之间相互依赖的定量的一种统计分析的方法,在数据分析中运营广泛,回归分析...

      我们接着说数据分析的十六种方法中的回归分析法、聚类分析法和判别分析法:

    七、回归分析

      回归分析在统计学中是指确定两种或者两种以上变量之间相互依赖的定量的一种统计分析的方法,在数据分析中运营广泛,回归分析按照涉及其中的变量多少可以分为一元回归和多元回归分析,按照自变量和因变量之间的关系类型,可以分为线性回归分析和非线性回归分析,按照因变量的数量多少,可以分为简单回归分析和多重回归分析。其他还有Logistic回归分析、有序回归、Probit回归、加权回归等分析方法。

      回归分析在数据分析中研究的主要问题:

      1、 确定Y与X间的定量关系表达式,此表达式成为回归方程;

      2、 对求得的回归方程的可信度进行检验;

      3、 判断自变量X对因变量Y有无影响;

      4、 利用所求得的回归方程进行预测和控制。

      我们举个例子,如果要研究质量和用户满意度之间的因果关系,从实践意义上讲,产品

      质量会影响用户的满意情况,因此设用户满意度为因变量,记为Y;质量为自变量,记为X。通常可以建立下面的线性关系:Y=A+BX+ξ

    八、聚类分析

      数据分析中的聚类分析方法主要是指将物理或抽象对象的集合分组为由类似的对象组成的多个类的分析过程,是在相似的基础上把收集起来的数据进行分类,这也是聚类分析方法的目标。

      数据分析中需要用到很多统计学的观点,那聚类分析是通过数据建模简化数据的一种方法。传统的统计聚类分析方法包括系统聚类法、加入法、动态聚类法、有重叠聚类、分解法和模糊聚类法等。

      例如,学校里面会有一些同学玩在一起,学在一起,关系很好,但是他们与另外一些同学的来往就比较少,关系也比较疏远。我们从数据分析的角度去进行深层次的分析,我们就会发现,经常在一起的同学的家庭情况、学习成绩、课余爱好、性格等等方面都会有更多的的共同点,那么关系没那么好的、比较疏远的同学在这些方面就会有比较大的差异。数据分析师为了研究家庭情况这些因素是不是会成为区分中小学生群体的主要因素,可以从上面这些相关的数据来入手,从而进行客观的分组,再进一步比较所得的分组是不是和实际相符合,那么这个过程中对学生的客观分组就可以采用聚类分析的方法了。

    e5b72994df66796af323e12c1f0224dc.png

    九、判别分析

      判别分析作为一种多元分析技术应用相当广泛,和其他的分析技术不太一样,判别分析在数据分析的应用过程中并没有将降维作为主要的任务,而是通过建立判别函数来概括每个不同的维度之间在数据分析应用过程中的差异之处。从而,通过该函数,把新的不知道类别的新元素、新样本进行数据分析角度的归纳分类,那从这个角度来讲的话,判别分析是从另一个角度对数据的分类归纳。

    b75778ad2fdd1280b245f1ef8d3f1ad1.png
    展开全文
  • 判别分析中,至少有一个已经明确知道类别“训练样本”,利用这个数据,就可以建立判别准则,并通过预测变量来为未知类别观测值进行判别了。 所谓Fisher判别法,就是一先投影的方法。 考虑只有个(预测)...
  • 基于R_判别分析

    2018-10-28 11:05:52
    判别分析的概念 用途 种类 Fisher判别法 提出 Fisher线性判别函数 举例判别法 总体 多总体 Bayes判别法 Bayes判别准则 正态总体的Bayes判别 要求: 理解判别分析...
  • 降维与分类是多元统计分析的两个主题,在这里,我浅谈一下的聚类分析和判别分析主要用于分类。聚类分析按分析对象可分为两种:Q型聚类(对样本的聚类),R型聚类(对变量的聚类)按具体方法可分为两种:一般小样本数据...
  • R语言判别分析

    万次阅读 多人点赞 2017-02-27 17:07:54
    自己整理编写R语言常用数据分析模型模板,原...前两种判别方法都要考虑两个、或多个总体协方差(这里是算方差,方差是协方差一种)相等或不等情况,由var.equal=逻辑参数表示,默认是FALSE,表示认为两总体
  • 针对山区公路泥石流易发性评价问题,基于Fisher判别分析理论,在分析影响泥石流易发程度...研究结果表明:Fisher判别分析法用于山区公路泥石流易发性判别效果良好,是解决评价山区公路两侧沟谷泥石流易发性有效方法.
  • R语言3.5 判别分析

    2020-03-05 20:34:51
    判别分析的种类:确定性判别(Fisher型判别)、概率性判别(Bayes型判别) 确定性 1.线性判别分析 eg 今天和昨天湿温差x1及气温差x2是预报明天是否下雨的两个重要因子,试建立Fisher线性判别函数,如测得今天x1=...
  • 通过虚拟仪器同时采集桡侧腕屈肌和肱桡肌路表面肌电信号,取其平均绝对值(MAV)和均方根(RMS)作为特征参数,并应用线性判别分析(LDA)方法对采集样本进行模式识别。与其它特征识别方式实验对比表明,所提识别方法...
  • 为了解决这些问题,提出一基于非参数判别分析(NDA)维数约减方法,称作动态加权非参数判别分析(DWNDA).DWNDA采用动态加权距离来计算类间散布度和类内散布度,不仅能够保留多模态数据集本质结构特征,还能有效地...
  • Fisher线性判别分析(Linear Discriminant Analysis)是一应用较为广泛线性分类方法,该方法于1936年由Fisher提出。Fisher线性判别分析又简称Fisher FDA。 Fisher准则基本原理是,对于d维空间样本,投影到一维...
  • 机器学习——线性判别分析

    千次阅读 多人点赞 2018-11-21 20:56:28
    文章目录什么是线性判别分析线性判别分析的作用基本思想如何将点投影到直线上二分类线性判别分析如何刻画类别的中心点之间的距离如何刻画投影后相同类别的散乱程度如何用式1.9与式1.6刻画LDA的两个关键点 ...
  • 同样作为线性降维算法,PAC是非监督降维方法,而LDA线性判别分析是有监督降维算法。 问题解答: 首先将线性判别分析LDA扩展到高维情况。假设有n个类别,并需要将特征降维至d维,因此我们需要找到以恶搞d维...
  • 基于图正则化稀疏判别分析的人脸识别   摘要 流形学习和稀疏表示的分类技术是人脸识别的两种流行的技术。因为流形学习能用低维表示高维数据,广泛应用于计算机视觉和模式识别。大多数流形学习算法可以嵌入框架,...
  • 线性判别分析(LDA)

    2019-07-08 20:25:00
    线性判别分析(linear discriminant analysis,LDA)是对费舍尔线性鉴别方法的归纳,这种方法使用统计学,模式识别和机器学习方法,试图找到类物体或事件特征一个线性组合,以能够特征化或区分它们。所得...
  • R语言中Fisher判别的使用方法

    千次阅读 2019-09-27 14:20:32
    最近编写了Fisher判别相关代码...不严谨但是通俗说法,判别分析(Discriminant Analysis)是一多元(多个变量)统计分析方法,它根据样本多个已知变量值对样本进行分类的方法。一般来说,判别分析个阶...
  • 提出了一改进的线性判别分析(LDA)算法,能有效地解决传统LDA算法的两个局限,即小样本问题及在多类情况下传统的Fisher准则非最优.该算法还能提高某一(几)个指定类别的分类率.这种算法的关键在于使用不损失“有判别力...
  • 高斯判别分析也是一用于分类的方法,在样本数据服从多元高斯分布以及类别标签\(y\)服从伯努利分布假设条件下,然后再由贝叶斯公式求出一个新样本分别属于类别概率。 对于给定数据集\(D=\{(x_1,y_1),\cdots...
  • 线性判别分析法(discriminant_analysis.LinearDiscriminantAnalysis) 和二次判别分析法(discriminant_analysis.QuadraticDiscriminantAnalysis) 是两种经典分类器。正如他们名字所示,分别为线性与二次决策面...
  • 针对此问题,文中提出一自适应正则化核二维判别分析算法.首先每个图像矩阵经奇异值分解为个正交矩阵与一个对角矩阵乘积,通过个核函数将个正交矩阵列向量从原始非线性空间映射到一个高维特征空间.然后在低维...
  • 两种判别方法都要考虑两个、或多个总体协方差(这里是算方差,方差是协方差一种)相等或不等情况,由var.equal=逻辑参数表示,默认是FALSE,表示认为两总体协方差不等。用样本协方差可以估计总体协方差。...
  • 判别方法{距离判别(适用于连续性随机变量判别类)Bayes判别(适用于假定对研究对象已经有一定认识,这种认识常用先验概率来描述)Fisher判别(适用于总体均值向量必须有显著差异) 判别方法\begin{...
  • 针对跨语言情感倾向分类任务,提出两种跨语言情感倾向分析策略: 半监督框架跨言情感倾向判别方法(双语协同文本情感倾向判别框架) 关键:跨语言一致文本 材料:源语言数据集和目标语言数据集 目标.....

空空如也

空空如也

1 2 3 4 5 ... 17
收藏数 333
精华内容 133
关键字:

判别分析的两种判别方法