精华内容
下载资源
问答
  • 灰色关联度分析

    千次阅读 多人点赞 2019-11-13 14:46:07
    灰色关联度分析 灰色关联度分析方法步骤及原理; 另附例题及代码。

    灰色关联度分析

    引言

    大家好,这是我的第一篇博客,我是一名通信工程专业的大二学生,在过了1年的学习后我才发现自己并不是很喜欢这个专业,因为在学校加入了数学建模工作室,也大大小小做过几次比赛,对于Matlab软件有一些基础的了解,慢慢的竟然感觉自己有点喜欢这个软件来敲代码了,因此我决定慢慢开始尽量系统的学习一下Matlab,同时因为要做建模比赛,所以会学习一些建模用的相关算法等等,因此我开了这一个大模块,用来记录我每一个学习的和Matlab相关的知识点,我本是一个萌新,学的东西可能很基础,不过如果看到本文的你觉得内容对你有所帮助,还是请帮我点个赞,谢谢啦。

    灰色关联度分析

    在我看来,灰色关联度分析即是一种对影响目标序列的相关因素进行定量分析的模型,他的基本原理就是将已知的目标序列数据和比较序列(即影响目标序列的因素所构成的序列)数据进行无量纲化处理之后,通过对比各个序列对目标序列的数据增长或减少的相似或相异程度来判断各个因素对目标序列的影响结果(权重)。
    如下图,即是某一无量纲化之后各因素的数据与目标序列数据变化趋势图,对灰色关联度分析而言,图形几何形状越是接近,关联程度也就越大。当然,如果要对更多更复杂的数据进行关联分析,肯定是无法用肉眼得到分析结果的,因此,我们肯定需要一种计算方法来得到我们想要的结果,这种计算方法即为灰色关联分析方法。
    无量纲化之后各因素的数据与目标序列数据变化趋势图

    原理和方法

    1.计算比较序列与目标序列之间的关联系数

    公式

    关联系数公式

    2.计算比较序列与目标序列之间的关联度

    在这里插入图片描述

    求解步骤

    Step1.数据无量纲化处理

    由于各指标的单位不同,需要对原始数据进行无量纲化处理,数据无量纲化处理的方法有均值化、初值化、区间值化、导数化、零化等。后面我给出的代码采用均值化法。

    Step2.求差序列

    即计算参考数列与比较序列的相应指标的绝对差值。

    Step3.求两级差

    即计算两级最大差值。

    Step4.计算关联系数

    将计算得到的两级差值代入关联系数公式求关联系数的值。

    Step5.计算灰色关联度及权重

    将求得的关联系数的值代入关联度公式中得到各指标与目标序列的关联度,最终利用得到的值归一化处理得到各指标的权重。

    例题数据

    要求计算各参考序列对目标序列的影响(权重)
    年份目标序列参考序列1参考序列2参考序列3参考序列4参考序列5参考序列6
    20095.1874.617.2701.2621.62.2685223.3
    20107.3399.3310.04614.9516.81.5876197.6
    20115.30124.2711.5528.6613.71.2158154.5
    20124.45137.3111.98014.1512.30.9839107.7
    20134.05150.1113.6888.5117.31.0903149.9
    20146.35160.5214.6742.5427.81.5359245.9
    20158.27163.3414.9094.6116.83.2937245.3
    201611.7172.7715.2037.8829.32.3942326.5
    20177.58203.5217.9824.1528.83.0424334.9
    20184.46216.1018.5713.3224.63.578265.5
    平均值6.467150.1913.5887.020.92.1225.1

    代码

    clc;clear;close all;
    %输入原始已知数据
    A=[5.18 74.61   7.27    1.26    21.6    2.2685  223.3;
    7.33    99.33   10.046  14.95   16.8    1.5876  197.6;
    5.3     124.27  11.552  8.66    13.7    1.2158  154.5;
    4.45    137.31  11.98   14.15   12.3    -0.0161  107.7;
    4.05    150.11  13.688  8.51    17.3    1.0903  149.9;
    6.35    160.52  14.674  2.54    27.8    1.5359  245.9;
    8.27    163.34  14.909  4.61    16.8    3.2937  245.3;
    11.7    172.77  15.203  7.88    29.3    2.3942  326.5;
    7.58    203.52  17.982  4.15    28.8    3.0424  334.9;
    4.46    216.1   18.571  3.32    24.6    3.578   265.5];
    y=[6.467 150.19 13.588 7 20.9 2.1 225.1];
    %数据无量纲化处理
    x1=A(1:10,1)./y(1);x2=A(1:10,2)./y(2);x3=A(1:10,3)./y(3);
    x4=A(1:10,4)./y(4);x5=A(1:10,5)./y(5);x6=A(1:10,6)./y(6);
    x7=A(1:10,7)./y(7);
    B=[x1,x2,x3,x4,x5,x6,x7]; 
    %求差序列
    y1=abs(x1-x2);y2=abs(x1-x3);
    y3=abs(x1-x4);y4=abs(x1-x5);
    y5=abs(x1-x6);y6=abs(x1-x7);
    C=[y1,y2,y3,y4,y5,y6];
    %求两级差
    xmax=max(max(C)); 
    xmin=min(min(C)); 
    %计算目标和各指标的关联系数
    z=(xmin+0.5*xmax)./(C+0.5*xmax); 
    e=[];
    [t,n]=size(C);
    %计算目标与各指标的关联度
    for i=1:n
    z1=sum(z(1:10,i))/10;
    e=[e,z1];
    end
    %各指标的权重
    f=e./sum(e) 
    

    The end

    整篇文章的内容到这里也就结束了,因为是第一次写博客,很多功能都不会用所以做的不太好,希望大家多多包容,如果谁有什么问题欢迎来咨询我,我会在有时间的时候尽自己最大的能力帮助你,感谢大家的观看。

    展开全文
  • SPU(Standard Product Unit):标准化产品单元。 是商品信息聚合的最小单位,是一组可复用、易检索的标准化信息的集合,该集合描述了一个产品的特性。通俗点讲,属性值、特性相同的商品就可以称为一个SPU。...

    SPU(Standard Product Unit):标准化产品单元。

    是商品信息聚合的最小单位,是一组可复用、易检索的标准化信息的集合,该集合描述了一个产品的特性。通俗点讲,属性值、特性相同的商品就可以称为一个SPU。

     

    通俗解释:就比如:一个苹果X手机,就是一个SPU。商品的特性可以由多个“属性及对应的属性值对”进行描述。“属性及对应的属性值对”完全相同的商品,可以抽象成为一个SPU。属性及对应的属性值对就类似,都是苹果公司生产的手机,机型为苹果X

     

    SKU = Stock Keeping Unit :库存量单位

    即库存进出计量的单位,可以是以件,盒,托盘等为单位。SKU这是对于大型连锁超市DC(配送中心)物流管理的一个必要的方法。当下已经被我们引申为产品统一编号的简称,每种产品均对应有唯一的SKU号。

    通俗解释:就比如:一个苹果X手机,红色,高配置256G,就是一个SKU。

    SKU从属于SPU。

    展开全文
  • R包vegan的普鲁克分析(Procrustes Analysis)示例几天前,同学咨询这篇文献中的分析方法,先来看一下(部分截图)。(Zhao et al, 2019)大体意思是,作者...

    R包vegan的普鲁克分析(Procrustes Analysis)示例

    几天前,同学咨询这篇文献中的分析方法,先来看一下(部分截图)。


    (Zhao et al, 2019)

    大体意思是,作者测量了活性污泥(AS)中的细菌群落(16S)组成和抗生素抗性基因(ARGs)丰度,然后分别执行了OTUs和ARGs 亚型的非度量多维标度(NMDS)分析,基于获得的两组NMDS坐标执行Procrustes分析以表征各样本的细菌物种丰度组成和抗生素抗性基因丰度组成的潜在一致性。

    作者通过Procrustes分析的M2个统计量以及基于999次置换检验获得的显著性p值,指出各样本的细菌物种丰度组成和抗生素抗性基因丰度组成存在很强的关联。

     

    大致搞懂了什么是Procrustes分析之后,本篇作个简介。包括其原理,M2统计量的意义,以及怎样计算(在R里可以使用那个函数执行)。

       

    Procrustes分析简介

      

    Procrustes分析(Procrustes Analysis,普鲁克分析)是一种通过分析形状分布,比较两组数据一致性的方法。数学上来讲,就是不断迭代,寻找标准形状(canonical shape),并利用最小二乘法寻找每个对象形状到这个标准形状的仿射变化方式(Gower, 1975)。该过程也称为最小二乘正交映射(least-squares orthogonal mapping)。

    Procrustes分析的过程

    简单地说,Procrustes分析基于匹配两个数据集中的对应点(坐标),通过平移、旋转和缩放其中一个数据集中点的坐标以匹配另一数据集中对应点的坐标,并最小化点坐标之间的偏差平方和(表示为M2)。对应点坐标之间的偏差称为矢量残差(vector residuals),小的矢量残差代表了两数据集具有更高的一致性。


    A,显示了投影至二维空间中的两数据集,两数据集中样本对应(A-a,B-b,C-c);

    B,平移坐标使质心对齐,此时两数据集具有一个公共质心;

    C-D,通过不断迭代旋转并缩放调整数据,使M2最小化。

    注:坐标平移、旋转和缩放过程中,对所有的样本点执行统一的操作,因此尽管点的位置发生改变,但不会改变数据集的投影“形状”。

    Procrustes分析M2统计量的显著性检验(PROTEST)

    Procrustes分析对两个数据集中点的坐标进行描述性总结和图形化比较,尽管M2统计量提供了对一致性的度量(M2越小表示两数据集关联度越高),但是并未评估M2是否比预期的要好(M2是否显著,而不是由偶然所致)。

    可通过置换检验的原理实现对M2显著性的检验,称为PROTEST或PROcrustean randomization test。通过在其中一个数据集中随机地对观测值进行置换,同时保持数据集的共变结构,之后使用Procrustes分析计算随机置换后数据集与另一数据集的M2值(称为Mp2)。如此随机置换共N次,并记录原始观测值的M2 < Mp2的次数,由此获得p值:

    如果p达到显著性水平(如p<0.05),则可以认为原始观测值的M2并非由偶然因素所致,M2显著小于随机数据集的Mp2,两个数据集的期望值比在随机情况下表现出更大的一致性。

    Procrustes分析在生物学数据分析中的应用

    这是一个在面部几何中广泛应用的算法,例如用于人脸识别。同学们有兴趣的话搜一下了解就可以了,本篇扯人脸识别就偏题了(况且白鱼同学自己就是出了名的脸盲,莫要跟我提人脸识别……)。

    生物学数据分析中,Procrustes分析也经常出现。

    例如在组学分析中,经常需要分析来自相同样本不同组学数据集之间是否存在相似性关系,就微生物组而言,例如开篇时提到的那个示例,物种组成丰度和ARGs丰度是否存在潜在一致性。当然分析潜在关系的方法有很多,Procrustes分析就是一种很好的选择。

    再如群落分析中,常见通过Procrustes分析物种组成与环境的关系,以及物种形态、遗传组成、空间结构、行为特征等更多类型的数据集类似的案例。

    考虑到白鱼同学的所学专业,所以下文多以“群落分析”举例描述。

    Procrustes分析与Mantel Test的比较

    提到群落分析,Procrustes分析与Mantel test都是用于分析物种组成和环境属性关系的常见方法,当然二者的具体关注点还是有区别的,方法各有自身的优点。但如果只聚焦在评估两数据集一致性上,似乎Procrustes分析更直观一些。

    M2统计量及其显著性检验p值提供了两个数据集之间一致性的总体度量,同时数据集的图形匹配和相关残差提供了比Mantel test更丰富的信息源。在对应点的坐标匹配度较好时,两个数据集表现出良好的一致性。坐标匹配度越差表明这些点与整体趋势不匹配,这类似于回归分析中残差较大的点,这些点不符合样本的总体趋势。此外,PROTEST的统计功效也被证明优于Mantel test的统计功效(Peres-Neto and Jackson, 2001)。因此,如果两组数据之间存在潜在关系,则Procrustes分析更有能力检测到,并且鉴于结果的图形性质,它还提供了出色的解释性准则。

    R包vegan的Procrustes分析示例

      

    Procrustes分析在群落分析中得到广泛应用,因此vegan包(这是一个在群落分析中非常知名的R包)中就提供了Procrustes分析的方法,下文就以vegan包的Procrustes分析为例展示。

    其它可用于Procrustes分析的R包,请自行了解。

    下文示例数据、R代码等的获取链接(提取码,ij18):

    https://pan.baidu.com/s/1VXqsxicZE4a2VdY6bnuJLQ

    示例数据

    举一个非常常见的例子,在A、B、C三个环境中(每个地点观测了4个样地)测量了物种组成和当地的环境指标,并期望通过Procrustes分析建立环境和物种的关联。

    网盘附件示例数据集,一个物种丰度矩阵(spe_table.txt),一个环境变量矩阵(env_table.txt)。


    PCA降维及探索性分析

    由于两个数据集的属性不同,直接比较并不合适。因此,分别对两个数据集执行主成分分析(PCA)降维,并提取特征轴的坐标(代表了变量集的线性组合)用于比较。

    使用vegan的rda()执行PCA。过程中,将环境变量标准化为均值为0和标准差为1,以消除不同环境测度的量纲差异;对物种变量执行Hellinger转化,避免直接应用欧几里得距离时产生的“马蹄形效应”。(为什么这样做,参考前文主成分分析;当然,对于物种数据的降维,基于Bray-curtis距离的主坐标分析(PCoA)也是一个好的选择,本篇未用它举例,大家可以自行尝试下)

    library(vegan)
     
    ##样方-环境属性矩阵
    env <- read.delim('env_table.txt', row.names = 1, sep = '\t', stringsAsFactors = FALSE, check.names = FALSE)
     
    #环境变量的 PCA 需要标准化,详情 ?rda
    env_pca <- rda(env, scale = TRUE)
     
    ##样方-物种丰度矩阵
    otu <- read.delim('spe_table.txt', row.names = 1, sep = '\t', stringsAsFactors = FALSE, check.names = FALSE)
     
    #物种数据 Hellinger 预转化,详情 ?decostand
    otu_hel <- decostand(otu, method = 'hellinger')
     
    #对转化后的物种数据执行 PCA,无需标准化,详情 ?rda
    otu_pca <- rda(otu_hel, scale = FALSE)
     
    ##排序图比较,以 PCA 的 I 型标尺为例
    par(mfrow = c(1, 2))
    biplot(env_pca, choices = c(1, 2), scaling = 1, 
        main = '环境组成的PCA', col = c('red', 'blue'))
    biplot(otu_pca, choices = c(1, 2), scaling = 1, 
        main = '物种组成的PCA', col = c('red', 'blue'))
    


    同时也可借助PCA作为探索性分析,看两个数据集中样方的排序坐标是否具有一致性。比如说,在排序图中不同分组都区分的很明显,表明环境与物种存在协同性;如果PCA结果中两个数据集比较后找不到规律,可能表明它们之间的关联度较低。

    在示例的两个数据集各自的PCA排序图中,样方的排布还是非常明显的,A、B、C三组的样本都能够分开。尽管具体的坐标有区别,但这无妨,因为Procrustes分析可以通过平移、旋转和缩放坐标,最小化最组坐标之间的偏差平方和(M2),描述二者的关联程度。

    Procrustes分析度量两数据集一致性

    接下来,将上述两个PCA结果中的样方坐标提取出来,作为Procrustes分析的输入。vegan中,procrustes()执行Procrustes分析。

    关于procrustes()中参数X和Y的指定,环境数据的PCA坐标指定于X,物种组成的PCA坐标指定于Y,因为后续Procrustes分析中旋转和缩放操作是对Y而言的,将Y匹配于X。这种顺序可以表示物种依赖于环境的逻辑,代表了将物种匹配于环境,最好不要反过来。

    注:procrustes()参数中,当symmetric=FALSE时,将旋转并按比例缩放Y以匹配X,可知这种模式是“非对称”的,X和Y的分配值调换后,Procrustes分析的偏差平方和(M2)也会随之改变。而当symmetric=TRUE时,首先将两组坐标都按比例缩放为单位方差,从而给出更独立于比例的对称统计。这种“对称”模式下,X和Y的分配值调换后,Procrustes分析的偏差平方和(M2)不会发生改变,但注意旋转仍将是非对称的(旋转的仍然是Y)。

    #Procrustes 分析
    #提取两个 PCA 中的样方排序坐标,均以 I 型标尺为例
    site_env <- summary(otu_pca, scaling = 1)$site
    site_otu <- summary(otu_pca, scaling = 1)$site
     
    #执行 Procrustes 分析,详情 ?procrustes
    #以对称分析为例(symmetric = TRUE)
    proc <- procrustes(X = env_pca, Y = otu_pca, symmetric = TRUE)
    summary(proc)
     
    #旋转图
    plot(proc, kind = 1, type = 'text')
     
    #一些重要的结果提取
    names(proc)
     
    head(proc$Yrot)  #Procrustes 分析后 Y 的坐标
    head(proc$X)  #Procrustes 分析后 X 的坐标
    proc$ss  #偏差平方和 M2 统计量
    proc$rotation  #通过该值可获得旋转轴的坐标位置
    


    通过平移、旋转和缩放坐标,图中映射在主正交轴中的点是来自环境变量PCA的样方点,映射在斜向正交轴中的点是来自物种组成PCA的样方点,箭头指示了二者中配对的样方。从图形结果中可以看出,环境和物种的潜在关系表现出较好的一致性。

    最小化最组坐标之间的平方差之和(M2)为0.2178。

    #残差图
    plot(proc, kind = 2)
    residuals(proc)  #残差值
    


    该图显示了每个配对样方的残差,从底部到顶部的水平线是残差的25%(虚线),50%(实线)和75%(虚线)分位数。如果样方中环境和物种组成更为一致,则旋转图中两个匹配的点距离越近,残差较小,反之环境和物种更无规律,则残差更大。

     

    M2统计量的显著性检验(PROTEST)

    上述图形结果显示,环境和物种的潜在关系表现出较好的一致性,同时获得了指示这种一致性的M2统计量。

    但是这种一致性是否是显著的,procrustes()没有为我们提供出来。因此,通过另一函数protest()执行置换检验评估Procrustes分析结果的显著性(即PROTEST,见上文概述部分)。

    #PROTEST 检验,详情 ?protest
    #以 999 次置换为例
    #注:protest() 中执行的是对称 Procrustes 分析,X 和 Y 的分配调换不影响 M2 统计量的计算
    set.seed(123)
    prot <- protest(X = env_pca, Y = otu_pca, permutations = how(nperm = 999))
    prot
     
    #重要统计量的提取
    names(prot)
    prot$signif  #p 值
    prot$ss  #偏差平方和 M2 统计量
    


    999次置换检验后显示p<0.001,结果是非常显著的。

    备注:我尝试在procrustes()中添加参数symmetric = TRUE/FALSE,但都返回了对称Procrustes分析的M2统计量,该函数只能执行对称模式的Procrustes分析?不过倒是不影响结果判断,因为对称Procrustes分析显著的话,非对称Procrustes分析肯定也是显著的,因此p值怎样都适用。

    ggplot2的一个作图示例

    Procrustes分析到这里就大致演示完了。

    如果觉得vegan默认的图不方便调整,不妨将上述计算好的坐标导出,通过ggplot2作图,如下展示一个示例。

    library(ggplot2)
     
    #提取 Procrustes 分析的坐标
    Y <- cbind(data.frame(proc$Yrot), data.frame(proc$X))
    X <- data.frame(proc$rotation)
     
    #添加分组信息
    group <- read.delim('group.txt', sep = '\t', stringsAsFactors = FALSE, check.names = FALSE)
    Y$samples <- rownames(Y)
    Y <- merge(Y, group, by = 'samples')
     
    #ggplot2 作图
    p <- ggplot(Y) +
    geom_point(aes(X1, X2, color = groups), size = 1.5, shape = 16) +
    geom_point(aes(PC1, PC2, color = groups), size = 1.5, shape = 1) +
    scale_color_manual(values = c('red2', 'purple2', 'green3'), limits = c('A', 'B', 'C')) +
    geom_segment(aes(x = X1, y = X2, xend = PC1, yend = PC2), arrow = arrow(length = unit(0.1, 'cm')),
        color = 'blue', size = 0.3) +
    theme(panel.grid = element_blank(), panel.background = element_rect(color = 'black', fill = 'transparent'),
        legend.key = element_rect(fill = 'transparent')) +
    labs(x = 'Dimension 1', y = 'Dimension 2', color = '') +
    geom_vline(xintercept = 0, color = 'gray', linetype = 2, size = 0.3) +
    geom_hline(yintercept = 0, color = 'gray', linetype = 2, size = 0.3) +
    geom_abline(intercept = 0, slope = X[1,2]/X[1,1], size = 0.3) +
    geom_abline(intercept = 0, slope = X[2,2]/X[2,1], size = 0.3) +
    annotate('text', label = sprintf('M^2 == 0.2178'),
        x = -0.21, y = 0.42, size = 3, parse = TRUE) +
    annotate('text', label = 'P < 0.001',
        x = -0.21, y = 0.38, size = 3, parse = TRUE)
     
    p
     
    #输出图片
    ggsave('procrustes.pdf', p, width = 6, height = 5)
    ggsave('procrustes.png', p, width = 6, height = 5)
    


    该图和上文中vegan包的默认出图结构是一致的,解读方式参考上文即可。额外添加了样方分组、统计量标识等信息。

       

    参考资料

      

    概念:http://jackson.eeb.utoronto.ca/procrustes-analysis/

    R操作:http://john-quensen.com/tutorials/procrustes-analysis/

    Gower J C. Generalized procrustes analysis. Psychometrika, 1975, 40, 33-51.

    Peres-Neto P R, Jackson D A. How well do multivariate data sets match? The advantages of a Procrustean superimposition approach over the Mantel test. Oecologia, 2001, 129(2):169-178.

    Zhao R, Feng J, Liu J, et al. Deciphering of microbial community and antibiotic resistance genes in activated sludge reactors under high selective pressure of different antibiotics. Water Research, 2019, 388-402.

    猜你喜欢

    10000+:菌群分析 宝宝与猫狗 梅毒狂想曲 提DNA发Nature Cell专刊 肠道指挥大脑

    系列教程:微生物组入门 Biostar 微生物组  宏基因组

    专业技能:学术图表 高分文章 生信宝典 不可或缺的人

    一文读懂:宏基因组 寄生虫益处 进化树

    必备技能:提问 搜索  Endnote

    文献阅读 热心肠 SemanticScholar Geenmedical

    扩增子分析:图表解读 分析流程 统计绘图

    16S功能预测   PICRUSt  FAPROTAX  Bugbase Tax4Fun

    在线工具:16S预测培养基 生信绘图

    科研经验:云笔记  云协作 公众号

    编程模板: Shell  R Perl

    生物科普:  肠道细菌 人体上的生命 生命大跃进  细胞暗战 人体奥秘  

    写在后面

    为鼓励读者交流、快速解决科研困难,我们建立了“宏基因组”专业讨论群,目前己有国内外5000+ 一线科研人员加入。参与讨论,获得专业解答,欢迎分享此文至朋友圈,并扫码加主编好友带你入群,务必备注“姓名-单位-研究方向-职称/年级”。PI请明示身份,另有海内外微生物相关PI群供大佬合作交流。技术问题寻求帮助,首先阅读《如何优雅的提问》学习解决问题思路,仍未解决群内讨论,问题不私聊,帮助同行。

    学习16S扩增子、宏基因组科研思路和分析实战,关注“宏基因组”

    点击阅读原文,跳转最新文章目录阅读

    展开全文
  • 关联规则 置信定义

    2016-11-07 17:39:43
    关联规则中相关定义在附件中有定义  
    关联规则中相关定义在附件中有定义

     

    展开全文
  • 区块链是什么意思

    千次阅读 2018-05-31 10:52:02
    区块链是分布式数据存储、点对点传输、共识机制、加密算法等计算机技术的新型...区块链是一串使用密码学方法相关联产生的数据块,每一个数据块中包含了一次比特币网络交易的信息,用于验证其信息的有效性(防伪)和...
  • 对于新注册使用LinkedIn领英的人来说,LinkedIn领英人脉的规则一定是最让人头痛的问题之一,因为我刚开始用LinkedIn领英的时候,就是被这个折磨到差点放弃。 但LinkedIn领英又是全球最大的职场社交平台,... 什么是L
  • CMM是指“能力成熟模型”,其英文全称为CapabilityMaturityModelforSoftware,英文缩写为SW-CMM,简称CMM。它是对于软件组织在定义、实施、度量、控制和改善其软件过程的实践中各个发展阶段的描述。CMM的核心是把...
  • NP是什么意思

    千次阅读 2018-09-27 21:37:00
     设V=V1∪V2,V1∩V2=Ø,G去掉V1中所有顶点(及其关联边)得到图  G2=(V2,E2)。则可以证明G2的顶点色数比G的顶点色数小1;且G2去掉  小于2的顶点(若这样的顶点存在)后,任意两个顶点的距离也是不大于2的。 ...
  • kino是什么意思什么要KINO

    万次阅读 2017-02-14 22:20:07
    第二贴定义什么是一个好的KINO 第三贴专门来谈怎么做一个好的KINO 第四贴给大家一个KINO的快速流程以便大家练习 首先第一部分:为什么KINO是非常必要的 现在社区里没有太多的专门讲KINO的帖子。...
  • 商品关联分析

    千次阅读 2016-07-12 17:21:45
    association: 用在实际的事物之上,比如电子商务网站上的商品之间的关联度。支持度(support):数据集中包含某几个特定项的概率。 比如在1000次的商品交易中同时出现了啤酒和尿布的次数是50次,那么此关联的支持度...
  • 怎么理解关联规则中最小支持和最小置信?一、支持二、置信 原作者@吴健,转自知乎 Apriori算法有支持和置信两个概念,都是在执行算法之前自己设定的,在每一次迭代过程后,大于支持的项集被保留为频繁项...
  • 手机端meta分别是什么意思

    千次阅读 2016-08-18 16:00:08
    文档相关联的名称/值对。 手机端特有的有哪些? 第一个meta标签表示:强制让文档的宽度与设备的宽度保持1:1,并且文档最大的宽度比例是1.0,且不允许用户点击屏幕放大浏览;
  • Apriori算法有支持和置信两个概念,都是在执行算法之前自己设定的,在每一次迭代过程后,大于支持的项集被保留为频繁项集,最后生成的规则由最终的频繁项集组成。 一、支持 支持就是所有我们分析的交易...
  • 关联规则挖掘与算法 一、事务数据库: 二、支持与频繁项目集: 如表所示交易数据库,其项集 I={a,b,c,d,e}, T 购买的商品 t1 a,b,c,d t2 b,c,e t3 a,b,c,e t4 b,d,e t5 a,b,c,d 1、支持: ...
  • 原因就是,这一集成能够将重要的上游和下游流程以及数据关联起来,而这些流程和数据分散在传统上使用不同企业系统的不同用户组之间。 理想的集成环境提供双向框架和可靠的闭环事务管理,并且允许将所有相关的业务...
  • java程序的耦合什么

    千次阅读 2016-07-12 16:21:02
    程序的耦合是 你的子程序之间的相关联性,也就是说你的多个类的联系 是否太紧密,打个比方,你房子里边有窗子 ,那房子 和窗子 就有了关联 耦合 是松还是紧 就看你的 关联 是强还是弱,也就是修改的代价,比如 ...
  • 降低耦合的建议: 模块只对外暴露最小限度的接口,形成最低的依赖关系。 只要对外接口不变,模块内部的修改,就不得影响其他模块。 删除一个模块,应当只影响有依赖关系的其他模块,而不是影响其他无关部分。
  • 一般我们使用三个指标来度量一个关联规则,这三个指标分别是:支持、置信和提升。 Support(支持):表示同时包含A和B的事务占所有事务的比例。如果用P(A)表示使用A事务的比例,那么Support= Confidence...
  • 关联规则

    千次阅读 2014-05-14 19:32:14
    在数据挖掘的知识模式中,关联规则模式是比较重要的一种。关联规则的概念由Agrawal、Imielinski、Swami 提出,是数据中一种简单但很实用的规则。关联规则模式属于描述型模式,发现关联规则的算法属于无监督学习的...
  • 至于是流式布局还是固定布局,是否能适应不同的分辨率,那是另一个话题,与是否使用px作为单位并没有直接关联。 Em  CSS提供的测量类型尺寸  源自印刷界,一个em表示一种特殊字体的大写字母M的高度。...
  • 关联规则介绍

    千次阅读 2015-06-16 15:01:16
    关联规则是形如X→Y的蕴涵式,其中, X和Y分别...其中,关联规则XY,存在支持和信任。 定义:  假设 是项的集合。给定一个交易数据库D,其中每个事务(Transaction)t是I的非空子集,即,每一个事务都与一个
  • 服务器结构中的1U 2U 3U是什么意思?

    千次阅读 2006-10-10 16:26:00
    U是服务器机箱的高度 1U等于4.45厘米 随着企业信息化的快速发展,对服务器的需求量也越来越大,在有限的机房的空间里,如何合理的规划与实施,对与我们来说,就不能... 那么什么是1U服务器呢?所谓的1U服务器就是一种高
  • 什么是耦合

    万次阅读 2014-05-25 21:25:07
    简单地说,软件工程中对象之间的耦合就是对象之间的依赖性。指导使用和维护对象的主要问题是对象之间的多重依赖性。对象之间的耦合越高,维护成本越高。因此对象的设计应使类和构件之间的耦合最小。 有软硬件...
  • SLAM数据关联

    千次阅读 2017-06-05 09:35:26
    马氏距离与数据关联在SLAM的数据关联中,马氏距离是一种常见的方法。本文使用简单的数据进行说明,同时对必要的公式进行推导。本文使用的数据来源于[1]. 。 在这里我们重点使用two dimension的数据进行示例。以x1x_...
  • 例子: 总共有10000个消费者购买了商品, 其中购买尿布的有1000人, 购买啤酒的有2000人, 购买面包的有500人, 同时购买尿布和啤酒的有800人, ...关联规则:用于表示数据内隐含的关联性,例如...
  • 关联规则挖掘算法

    千次阅读 2018-08-31 20:06:08
    关联规则挖掘是一种基于规则的机器学习算法,该算法可以在大数据库中发现感兴趣的关系。它的目的是利用一些度量指标来分辨数据库中存在的强规则。也即是说关联规则挖掘是用于知识发现,而非预测,所以是属于无监督的...

空空如也

空空如也

1 2 3 4 5 ... 20
收藏数 66,583
精华内容 26,633
关键字:

关联度是什么意思