精华内容
下载资源
问答
  • 灰色关联度分析excel实现,使用excel实现灰色关联度分析
  • 灰色关联分析——Excel实现

    千次阅读 多人点赞 2020-08-01 18:43:46
    灰色关联分析概述 一般的抽象系统,如社会系统、经济系统、农业系统等都包含多种因素,多种因素共同决定了该系统的发展态势。而人们通常希望知道在众多的因素中,哪些因素是主要因素,哪些因素是次要因素,哪些因素...

    灰色关联分析概述

    一般的抽象系统,如社会系统、经济系统、农业系统等都包含多种因素,多种因素共同决定了该系统的发展态势。而人们通常希望知道在众多的因素中,哪些因素是主要因素,哪些因素是次要因素,哪些因素对发展影响大,哪些因素对发展影响小等,这都是系统分析中人们普遍关心的问题。

    数理统计中的回归分析、方差分析、主成分分析等都是用来进行系统分析的方法,但是存在局限性:

    1. 要求有大量数据
    2. 要求样本服从某个典型的概率分布,要求各因素数据与系统特征数据之间呈线性关系且各因素之间彼此无关

    灰色关联分析就可以弥补这些缺点,而且不仅可以用于系统分析,还可以进行综合分析。

    灰色关联分析的基本思想:

    根据序列曲线几何形状的相似程度来判断其联系是否紧密。曲线越接近,相应序列之间的关联度就越大,反之就越小。

    在这里插入图片描述
    在这里插入图片描述

    在这里插入图片描述
    在这里插入图片描述
    灰色关联度系数
    在这里插入图片描述
    在这里插入图片描述
    在这里插入图片描述
    在这里插入图片描述

    我一般是用python和excel的,如果有需要MATLAB代码,可到公众号【茶谈大数据】获取。

    展开全文
  • 灰色关联度分析就是通过研究每个因子与参考因子的关联系数大小来分析泥石流灾害的危险性。若以x(i,j)为灰色关联因子的原始数据矩阵,x′(i,j)为x(i,j)无量纲化矩阵,x(a,j)为参考序列,则灰色关联度的计算如下式(1)...

    泥石流危险性是指在人类及所在环境中一切事物遭受泥石流损害的可能性大小。作为防灾减灾中泥石流灾害管理的重要一环,泥石流的危险性评估是泥石流灾害防治决策的前提。学者们普遍认为通过泥石流风险评估和风险管理,可以大大减弱其带来的风险,通常从泥石流的发育规律、孕灾环境、成灾方式和驱动因子等多方面来科学评价其发生的可能性、危险性、危害范围和程度等。

    21世纪以来,灾害风险评估和管理的研究成为新的热点。国内外学者对泥石流危险性评估进行了大量的研究,其中澳大利亚FELL将危险度描述为规模与概率(频率)的乘积,并得到大多认同,而我国学者将泥石流灾害系统中孕灾环境、致灾因子的自然属性特征用灾害过程强度或规模、频率、灾害影响区域及其影响程度、危害程度等指标进行刻画,由此,多因子综合评价成为泥石流危险性研究所采取的主要模式。在泥石流灾害研究中,致灾因子的识别和风险评估分析方法的选取一直是泥石流危险性研究的关键。泥石流灾害的形成与其所处的地貌形态、物质、构造、水文、气象和植被条件等多种因素密切相关,因此,探究已发生泥石流灾害与这些因素间的关系,可揭示泥石流发生的重要条件和有利于制定防灾减灾措施。例如,MOORE和MCINNES基于地貌方法,研究了山坡系统与冲积海岸沉积系统间的关系,对制定研究区安全保护措施奠定基础;牛全福等基于多种方法探讨了地形因子在地质灾害研究中的适宜性,并探讨了因子分级的方法对评估精度的影响。孟凡奇等基于逐步判别分析法对泥石流危险性的评价因子按贡献大小进行筛选,使得危险度评价结果更符合实际泥石流危险发育情况。泥石流灾害的评估方法通常基于泥石流灾害预测理论的原理,已形成参数合成法、数理多元统计、层次分析法、信息模型法等多种评估预测模型。这些评估模型大多基于统计方法,其优点为指标体系的建立简单易行、可操作性较强、便于计算机编程处理等,缺点为对样本要求高、预测结果精度不够。因此,探索泥石流形成的致灾因子和适宜的评估方法有利于进一步提高泥石流危险性评估的可靠性。

    随着计算机以及地理信息系统技术的发展,泥石流评价也向着精度更高、速度更快,集成性能更高、更加便捷的方向发展。泥石流是由多种致灾因素共同作用形成的一种地质灾害,其中多数致灾因素较难确定或者模糊不清,形成了一个灰色系统。由于泥石流灾害特性的这种不确定性和灾害系统的复杂性,用绝对的“非此即彼”存在难以描述泥石流灾害系统的客观实际问题,即存在“亦此亦彼”的模糊现象。因此,其评估方法宜采用灰色关联模型、粗糙度和模糊数学理论等非确定性分析方法进行模拟。基于上述讨论,本研究以泥石流频发的兰州市为例,从泥石流灾害预测理论出发,结合3S技术和地形、地貌、岩性、降雨和植被覆盖等影响指标,应用灰色关联度、粗糙依赖度以及融合前两种方法的模糊定权方法进行泥石流危险性评价,为该区域泥石流危险性评价理论研究和防灾减灾等提供技术支持。

    兰州市地处黄河上游的黄土高原西部,黄河自西向东穿城而过,城区坐落在两岸河流阶地上,是典型的山间河谷型城市(图1)。市区南北两侧为绵延起伏的高山和纵横沟壑的黄土峁梁,海拔为1 417~2 918 m,地形起伏较大。受其特殊的地理位置和河流的分割影响,其地域空间狭窄、岩土体完整性差、风化严重。由于半干旱的气候环境,植被覆盖较为稀少,降水主要集中在6~9月,小范围短时暴雨往往强度大,因而滑坡泥石流等地质灾害频发,严重威胁人们的生命和财产安全。

    adf17370dcc04d88e15cab1c9d2f5810.png

    兰州为我国泥石流发育最密集的城市之一。自建国以来,兰州市己发生滑坡、泥石流等地质灾害超342起,造成约687人死亡,累计直接经济损失超过7.95×108元,其中泥石流灾害最为严重,其危害程度居全国各省会城市之首。据调查,兰州已发生泥石流多沿黄河干流和支流呈带状分布,其中有30多条分布在黄河以南部的阳洼沟、大金沟以及元托峁沟等,有50多条沿北部分布,以雷坛河上游两岸最为集中。近年来,随着西部大开发和城市化的步伐加快,人口和建筑物密集、土地资源稀缺,人类工程活动等不断加剧,潜在地质灾害危险性不断增大、隐患也不断增多。

    利用ArcGIS10.2平台,基于Aster GDEM进行孕灾环境因子的提取,基于地貌数据和地质数据提取地貌类型和地质岩性并转换成栅格图层,将最大月降雨数据经插值处理生成研究区的降雨因子图层;其次,在ENVI支持下,将3景landsat8遥感数据进行辐射校正、几何纠正、NDVI和植被覆盖度计算,拼接和裁减、生成植被覆盖图层;第三,应用复相关系数法对地形因子去相关,获得综合所有地形因子的地形易发性图层;最后,建立危险性评价指标体系,应用灰色关联度、粗糙依赖度以及融合灰色关联度和粗糙依赖度的模糊综合定权法进行兰州泥石流危险性评价,并分析评价结果。

    (1)灰色关联度

    泥石流是由多种致灾因素共同作用形成的一种地质灾害,其中多数致灾因素较难确定或者模糊不清,形成了一个灰色系统。灰色关联度分析就是通过研究每个因子与参考因子的关联系数大小来分析泥石流灾害的危险性。若以x(i,j)为灰色关联因子的原始数据矩阵,x′(i,j)为x(i,j)无量纲化矩阵,x(a,j)为参考序列,则灰色关联度的计算如下式(1):

    51a0c1efea192d8cc2d0fdabb2e6ef7d.png

    其中,r(i)——灰色关联度;

    i——样本;

    j——关联因子;

    n——总样本;

    m——关联因子总数(i=1,2,…,n; j=1,2,…,m);

    ρ——分辨系数,取值区间为[0,1],其值越小分辨率越大,通常取0.5。

    (2)粗糙依赖度

    粗糙依赖度也可以处理不确定性和不完整性的问题,它是间接对数据进行分析和推理的方法,通过对已知数据分析处理发现隐含的知识,在泥石流评价指标体系中,去除某一指标会对评估结果产生一定的影响,该指标的重要程度可用相互依赖度来计算,具体公式如下式(2):

    af16a08b3420068a41d72720ae0bd7c0.png

    其中,ai——第i类致灾因子的权重;

    NC(D)——系统D中由指标序列C构建的子集数;

    NC-C′(D)——系统D中去掉某一个指标C′的指标序列C-C′构建的子集,与子集NC(D)具有相同的子集数。其中NC-C′(D)/NC(D)表示致灾因子的依赖度,而1-NC-C′(D)/NC(D)表示致灾因子的重要度。

    (3)融合灰色关联度和粗糙依赖度的模糊综合法

    灰色关联度算法是通过关联系数分析泥石流致灾因子的不确定性,由于算法中关联度与比较数列、参考数列以及其长度有关,而且无量纲处理和分辨系数的选取也会对关联度产生影响。粗糙依赖度作为一种刻画不确定性问题的较为客观方法,可以结合灰色关联度和模糊集理论,在泥石流危险性评估中发挥各自的优势。本算法融合灰色关联度和粗糙依赖度的模糊定权方法如下:

    wi=uai+(1-u)βi

    (3)

    式中:wi——融合灰色关联度和粗糙依赖度的模糊法的权重;

    u——系数,本研究取值为0.4;

    ai——粗糙依赖度确定的各致灾因子权重;

    βi——灰色关联度确定的各致灾因子权重。

    利用ArcGIS10.2平台和Aster GDEM分别提取6个微观地形因子(坡度、坡向、坡长、坡度变率、坡向变率和曲率)和4个宏观地形因子(地表粗糙度、地形起伏度、高程变异系数和地表切割深度),并与研究区已调查的泥石流位置点数据进行叠加运算,提取泥石流点的各地形因子属性值并做标准化处理;其次,将标准化结果导入SPSS软件,计算各地形因子与已发生泥石流点密度间的相关性,选择相关性最强的地形起伏度作为主要因子,其余地形因子为次要因子;第三,计算主要因子与次要因子之间的复相关系数,获取各地形因子的权重(表1),并对各地形因子图层做加权叠加运算,得地形易发性图层。然后,基于ENVI和Landsat8 OLI数据计算NDVI及植被覆盖度,基于ArcGIS10.2平台,利用地貌和地质数据分别提取地貌类型和地质岩性图层,利用雨季(6月~9月)的月降雨均值经空间插值计算获得月降雨图层(图2)。

    461dadf3af9d97facd9e6413ae4ecb61.png

    a16155914655dba07cf55948c7ec761c.png

    dd70b6fcce1829731f6be1a2a5bcae15.png

    本次泥石流危险性研究,分别采用了灰色关联度、粗糙依赖度以及融合灰色关联度和粗糙依赖度的模糊法来分析。并且,为了对本次泥石流危险性评估结果进行评价,将收集的已发生泥石流数据(共145个)进行随机分组,第一组(75个泥石流点)引入上述三种模型中进行泥石流的危险性模拟,第二组(70个泥石流点)用来做精度评价。

    应用灰色关联度进行泥石流危险性模拟步骤:首先,对地形易发性、植被覆盖度、地貌类型、岩性和月降雨五个因子做无量纲处理,消除单位差异;其次,将泥石流灾害点密度作为参考序列,与比较序列(五个致灾因子)进行求差的绝对值;计算其与五个比较序列的关联系数,进而计算灰色关联度;将灰色关联序做归一化处理,得到各致灾因子的权重(表2);然后基于ArcGIS10.2平台加权叠加各致灾因子,获得研究区泥石流危险性分级图(图3)。

    应用粗糙依赖度进行泥石流危险性模拟步骤:首先,对地形易发性因子、地质岩性、降雨、植被覆盖度和地貌类型五个因子重分类(分别分四级),其中,地形易发性、植被覆盖度和降雨采用自然断点法进行分级,地质岩性参考岩层的坚硬程度进行分级;其次,进行致灾因子与泥石流发生的必要性分析;接下来,应用粗糙依赖度计算五个致灾因子的依赖度和重要度,并计算每个因子的权重(表3);最后,基于ArcGIS10.2平台将各致灾因子进行加权叠加运算并分级,获得研究区泥石流危险性分级图(图4)。

    基于灰色关联度方法和粗糙依赖度方法分别获得的各致灾因子的权重,应用融合灰色关联度和粗糙依赖度的模糊综合法,获得各致灾因子的模糊综合权重(表4)。然后,基于ArcGIS10.2平台加权叠加各致灾因子,获得研究区泥石流危险性分级图(图5)。

    d283de9641cc87779803fa3ab1ecf625.png

    b1eaa41faf6f1545346ad7ce4ba69f93.png

    88a1664cfe884129e1e5952f61f0a44c.png

    本研究结果的精度分析采用验证组数据进行统计分析,主要采用两种方法进行评价:将评估结果与验证组数据进行空间叠加统计分析和基于ROC曲线的精度评定。首先,将验证组泥石流灾害点与三种方法获得的评估结果进行叠加统计,对比分析已发生泥石流点在泥石流危险性等级中的分布关系(图3,表5)。从图3可以看出,验证组泥石流点绝大多数分布在危险性的中、高危险等级区域,仅有少量落到较低危险区域。由表5可知,研究区大多数泥石流点分布在0.4~0.6和0.6~0.8区间,且三种方法获得结果的趋势一致。表明本研究基于三种不确定方法获得的泥石流危险性评估结果与已发生泥石流分布具有很好的对应关系,即泥石流高发区对应着危险性评估的高等级区,本次评估的结果较客观反映了研究区泥石流灾害的空间分布,也说明了评估结果具有较高的可信度。

    ROC曲线又称为感受性曲线,已广泛应用于地质灾害危险性评估结果精度分析中。基于ROC曲线的模型精度评判标准为:曲线下面积越接近于1(总面积值位于0~1),说明模型的判别结果较好。因此,本研究采用ROC曲线评价泥石流危险性评估三种结果的精度。首先,将灰色关联度、粗糙依赖度和综合前两种方法的模糊综合法的评估结果以及研究区内泥石流的发生与否情况,通过采样(共290个点)制作成Excel表格,样点中,将已发生泥石流点的属性置为1,未发生为0,并导入SPSS软件统计分析,获得三种评价模型的ROC曲线(图6)和精度计算结果(表6)。

    由图6和表6可知,融合灰色关联和粗糙依赖度的模糊综合法所获得的结果精度最好,其ROC曲线下的面积为0.789;灰色关联度和粗糙依赖度的评估结果精度比较接近,其ROC曲线下的面积分别为0.658和0.660。同时,依据ROC曲线的评判标准,灰色关联度和粗糙依赖度的ROC曲线下面积接近于0.7,表明其结果具有低的准确性,而融合灰色关联和粗糙依赖度的模糊综合法的ROC曲线下面积大于0.7,说明该模型评估的结果具有较高的可信度,很好地反映了泥石流危险性分布。

    b23d28dcc2758cf16afc9dfbf4642a76.png

    本研究基于泥石流发生的不确定性、复杂性和模糊性的特点,以泥石流频发地兰州地区为例,从已发生的泥石流灾害点调查数据出发,选取适合描述泥石流灾害系统不确定性的数学模型:灰色关联度、粗糙依赖度、融合灰色关联度和粗糙依赖度的模糊综合法进行泥石流危险性评估,所得结论如下:

    (1)由复相关系数得到的地形因子权重来看,地形起伏度>坡向变率>地表粗糙度>坡长>坡度变率>坡向>坡度>高程变异系数>地表切割深度>曲率,且地形起伏度、坡向变率、地表粗糙度、坡长和坡度变率的权重均大于0.1,说明这五个因子对该区域泥石流的发生,在地形参数上具有一定的控制作用。由灰色关联度计算的权重排序为:降雨>地貌类型>地形易发性>植被覆盖度>地质岩性;利用粗糙依赖度获得泥石流影响因子的权重排序为:植被覆盖度>地形易发性>降雨>地貌类型>地质岩性;而融合灰色关联度和粗糙依赖度的模糊综合法获得的影响因子权重顺序与粗糙依赖度所获结果序列一致。

    (2)从泥石流影响因子来分析,基于三种方法获得的主要致灾因子依次为:植被覆盖度、降雨和地形易发性,其中,地形易发性主要受地形起伏度、坡向变率、地表粗糙度、坡长和坡度变率的控制,经调查发现这些影响因子与实际地形地貌和生态环境具有很好的吻合性。由于兰州河谷盆地为一双侧不对称的压扭性断陷谷地,其南北两山起伏度较大、主体属于松散岩土,结构疏松, 植被覆盖稀少,河谷阶地及被沟谷切割的黄土梁峁等为主要地貌形态,高陡的斜坡、高阶地前缘形成多个临空面,许多冲沟顺断裂面发育。此外,驱动因素(如:地震和暴雨)也是研究区泥石流发生的直接诱发因素,据统计,研究区年均降水量约为327.7 mm,多集中在6~9月。短时集中强降雨驱动下极易引发泥石流灾害,该区域也是泥石流灾害的多发区。

    (3)由三种方法进行泥石流的危险性评估的结果来分析,从定性角度来看,将验证组的泥石流点与灰色关联度、粗糙依赖度、以及融合灰色关联度和粗糙依赖度的模糊综合法评估结果进行叠加分析可知,绝大多数泥石流点分布在评估结果的中和高等级区域,表明三种方法评估的结果均较客观地反映了研究区泥石流危险性的空间分布,也说明其评估结果均具有一定的可信度。但是,基于ROC曲线的精度分析来看,灰色关联度和粗糙依赖度的评估结果精度比较接近,其ROC曲线下面积均接近0.7;融合灰色关联和粗糙依赖法的模糊综合法所获得的结果精度最好,其 ROC曲线下面积大于0.7,说明该模型评估的结果具有较高的可信度,较好地反映泥石流危险性分布。

    (4)本研究针对泥石流频发的兰州地区,基于泥石流灾害的模糊不确定性特点,利用不确定性算法进行泥石流的危险性评估,其结果与泥石流调查数据具有很好的吻合性,表明该研究方法可行,可为该区域及其它地区泥石流的危险性研究提供借鉴。

    来源:地质环境学术交流

    f7de9359b2fb20b4a430ec24f5063909.gif

    展开全文
  • 灰色关联度分析

    千次阅读 2018-03-30 18:51:10
    7.2.2 灰色关联度分析需求:按照灰色关联度的分析方法,对数据指标进行分析解决方法:通过Python的pandas以及内置的函数完成该需求。import numpy as np import pandas as pd import os def readData(filename): ...

    7.2.2 灰色关联度分析

    需求:按照灰色关联度的分析方法,对数据指标进行分析

    解决方法:通过Python的pandas以及内置的函数完成该需求。

    import numpy as np
    import pandas as pd
    import os
    
    def readData(filename):
        if(os.path.isfile(filename)):
            if(not os.access(filename,os.R_OK)):
                raise Exception('文件不可读')
            else:
                return pd.read_excel(filename)
        else:
            raise Exception('文件不存在')
    
    def overall(filename):
        try:
            dframe = readData(filename)
        except Exception as err:
            print(err)
    
        if(dframe.columns.size>0):
            totaltarget = dframe.columns.size -1
            rowsize=dframe.iloc[:,0].size
    
    
            ## 1 读取原始数据,该数据通过ETL加工而来
            ## 2 异常数据检测
            ## 3 按照指标的情况,计算参考序列:即每个指标的最大/小值,注意这里避开了首列SKUID
            dframe1 =dframe.iloc[:,1:dframe.columns.size]
            a = dframe1.apply(lambda x: (x-x.min())/(x.max() - x.min())*(1-0)+0)
            ## 4 参考序列差额绝对值, ABS(V1-RefV).
            a= a.apply(lambda x: abs(x - x.max()))
            ## 5 指定全局最小、最大值、分辨率 这里默认取的是0、1(计算而来)、0.5(经验值)
            globalMax=a.values.max()
            globalMin=a.values.min()
            resolution=0.5
            ## 6 计算关联系数:(全局最小值+全局最大值*分辨率)/(V1+全局最大值*分辨率)
            a= a.apply(lambda x:(globalMin + globalMax *resolution)/(x+globalMax *resolution) )
            ## 7 计算权重系数和关联度(新增一行一列,其中关联度的每个V是该行的AVG,权重系数是每列的AVG)
            a.loc['Row_avg']=a.apply(lambda x: x.mean())
            ## 8 加权关联度: 通过SUMPRODUCT,每个SKU的指标和权重系数一维数组的对应索引元素相乘在求和,除以总指标数得到关联系数
            d= a.iloc[:,0:totaltarget]
            reftab=pd.DataFrame((d.dot(np.array(d.loc['Row_avg'].values[0:]))/totaltarget),columns=['refid'])
            skuidtab=pd.DataFrame(dframe.iloc[0:rowsize,0:1].values[0:],columns=['skuid'])
            fintab=pd.concat([skuidtab.astype('str'),reftab.astype('float')],axis=1)
            #fintab.reindex(columns=cols)
            ## 9 对关联系数进行正排序得到上架数N,逆排序得到
            print(fintab.iloc[0:-1, 0:totaltarget].sort_values(by='refid', ascending=False)) 
        else:
            print('DataFrame初始化失败')
    
    if __name__ == '__main__':
        overall("G:\Works\BIPreJ\ModelData.xlsx")
        
    
    

    原始文件:

    执行结果:

    待补充

     

    展开全文
  • 本文旨在能快速地用Excel实现灰色关联分析,并简单地了解其原理。该系列文章是个人在参加2021年暑假国赛数模的培训,自己记录的心得与体会,意在总结归纳自己的学习成果,也希望能帮助想在数模比赛中施展身手的...


    我将会尽量用很通俗的语言来描述。


    一、灰色关联分析是什么?

      灰色关联度分析(Grey Relation Analysis,GRA),是一种多因素统计分析的方法。简单来讲,就是在一个灰色系统中,我们想要了解其中某个我们所关注的某个项目受 其他的因素 影响的相对强弱
      再直白一点,就是说:我们假设已经知道某一个指标可能是与其他的某几个因素相关的。那么我们想知道这个指标与其他哪个因素,相对来说更有关系,而与哪个因素相对关系弱一点。依次类推,把这些因素排个序,得到一个分析结果,我们就可以知道我们关注的这个指标,与因素中的哪些更相关。

      补充 : 灰色系统这个概念的提出是相对于白色系统和黑色系统而言的。按照控制论的惯例,颜色一般代表的是对于一个系统我们已知的信息的多少,白色就代表信息充足,比如一个力学系统,因素之间的关系都是能够确定的,这就是一个白色系统;而黑色系统代表我们对于其中的结构并不清楚的系统,通常叫做黑箱或黑盒的就是这类系统。灰色介于两者之间,表示我们只对该系统有部分了解。


    二、灰色关联分析有什么用?

    	举一个简单的栗子,在某一个城市里有个网吧,它的总收入和其他数据如下。
    	然后问你一个问题,你觉得 这个网吧的总收入 和 那些数据 更具有相关性。(不妨花费5秒看一看)
    

    在这里插入图片描述
      显然,我们单靠眼睛看还是很难看出。接下来我们可以用灰色关联分析,就能挖掘其主要因素。
      注:知道有什么用、怎么用即可。如要了解详细的原理,可以看看文章最后的 参考附录
      在下面的用法中,我也将会简单地、通俗地穿插其原理。




    三、灰色关联分析的适用范围?

    样本数量较少时,使用关联分析最佳。
    而当样本数量较多时,一般使用标准化回归。



    四、灰色关联分析怎么用?


      不管是用matlab,还是Excel,都是可以的,鉴于方便起见,我用Excel吧,后面有文章更新时,我在加上matlab的方法吧。

      先上方法~


    ①第一步:求平均值

    作用:去量纲的前一步操作

    在这里插入图片描述
    即求每一列数据的平均值。(输入公式,拖入数据)

    在这里插入图片描述


    ②第二步:均值化(也可以用初值化)

    作用:去量纲
    补充:那为什么要去量纲呢?
    因为在这几列数据中,有些列的单位是不同的(比如 D列 和 E列 )。我们为了消除单位所带来的差异,去掉数据的“外壳”。就将每一列的每个数据除以 该列数据的平均值 ,之后,即可得到一个“相对值”(好好体会吧),一个可以认为是没有了单位的 “相对数值”
    在这里插入图片描述
    注:“$”是锁定 编号为 ‘17’ 这一行的意思。 然后拖动数据框,得到如下结果。

    在这里插入图片描述


    ③第三步:取绝对值

    为什么要取绝对值?
    因为要让 子序列(即 D列、E列、F列、G列) 和 母序列(即C列的 “网吧总收入” ) 进行比较,就要使双方产生 关系 ,只不过在灰色关联分析的方法中,是通过 “取绝对值” 产生的关系。

    灰色关联度的公式详见“⑤”。

    在这里插入图片描述
    注:“$”是锁定 编号为 ‘C’ 这一列的意思。ABS()函数是用来取绝对值的。 然后拖动数据框,即可得到结果。


    ④第四步:计算出 最最大值 和 最最小值

    在这里插入图片描述

    注:为什么我叫它最最小值呢?就是在所有 “行+列” 中的最小值。最最大值同理。


    ⑤第五步:使用灰色关联度公式

    这个是计算灰色关联度的公式:

    <1> ρ是分辨系数,一般取0.5。我用 Excel 计算时也用的 0.5。
    <2> “ min min | x0(k) - xi(k) | ” 就是 “最最小值” 的意思
    <3> “ max max | x0(k) - xi(k) | ” 就是 “最最大值” 的意思
    在这里插入图片描述

    在这里插入图片描述

    注:“$B$45”中的两个 $ 的意思是,锁定“B”这一列和“45”这一列,也就是锁定“B45”这一个单元格。


    ⑥第六步:求灰色关联度

    在这里插入图片描述

    注:求关联度也就是,求每一列的平均值。


    ⑦第七步:最终结果

    在这里插入图片描述

    注:灰色关联度的取值范围为 [0, 1],而值越大的说明灰色关联度越大。比如,从表格中,我们可以看见,“附近居民数量”的灰色关联度为0.862…,值最大,说明它和“网吧总收入”的相关性最强,而与“网吧的环境资金投入”的相对关系最弱


    参考附录:

    [1] 《灰色关联度分析(GRA)原理详解》,通过这篇文章,你可以比较系统地学习到:灰色关联分析原理
    链接: 灰色关联度分析(Grey Relation Analysis,GRA)原理详解.

    [2] 《灰色关联分析法》:来自百度百科
    链接: 灰色关联分析法.


    🍋

    展开全文
  • Python 灰色关联度分析

    2021-09-11 15:48:24
    灰色关联度分析(Grey Relation Analysis,GRA),是一种多因素统计分析的方法,是一种对影响目标序列的相关因素进行定量分析的模型。 本文采用一个示例,简单分析一下。 数据集 链接: ...
  • 灰色关联分析,从其思想方法上来看,属于...用于度量因素之间关联程度的灰色关联度,就是通过对因素之间的关联曲线的比较而得的。除了传统的Excel可以进行关联分析外,还可以用现有的软件进行分析 实现界面 ...
  • excel做数据分析

    千次阅读 2019-04-05 11:00:55
    我们先来看看某公司全国产品销售的报表(截取了部分) 某公司全国产品销售的报表 ...我们使用 excel 进行数据分析,一般有以下步骤 需求收集 数据整理 数据简单统计 图表展示 分析结果撰写报告 第一...
  • 灰色关联分析(GRA)的理论及应用(matlab和python)

    万次阅读 多人点赞 2018-08-26 21:48:11
    什么是灰色关联分析 灰色关联分析是指对一个系统发展变化态势的定量描述和比较的方法,其基本思想是通过确定参考数据列和若干个比较数据列的几何形状相似程度来判断其联系是否紧密,它反映了曲线间的关联程度。 ...
  • 最容易掌握灰色关联分析法的教程,具体的例子帮助理解灰色关联分析法及其计算方法
  • (本文专注于商品间的关联度分析,商品&价格/天气/商圈/顾客 之类的广义上的关联先不探究)   读者萝卜: ok,我觉得不用继续下去了, Person 和 Spearman 系数我已经很熟了,公式原理倒背入流,Python 实现也非常...
  • 1、Python 灰色关联度分析 采用一个示例,简单分析一下。 灰色关联度分析是 度量两条曲线的形态和走势是否相近 本文是在前文的基础上,进行结果可视化展示。 程序 读数据 import pandas as p import numpy as np ...
  • 本篇文章介绍的是基于Excel和SPSS的数据分析和数据可视化操作.大数据时代,我们每天接受的数据量是巨大的,只有分析数据之间的联系进而才可能得到商机和"钱"途,本篇文章将从最基础的概念入手到实际的对数据的分析实战,...
  • 灰色关联分析步骤

    千次阅读 2021-03-09 18:19:22
    什么是灰色关联分析 灰色关联分析是指对一个系统发展变化态势的定量描述和比较的方法,其基本思想是通过确定参考数据列和若干个比较数据列的几何形状相似程度来判断其联系是否紧密,它反映了曲线间的关联程度。 ...
  • 灰色关联度

    2014-06-04 16:35:38
    灰色关联度是根据诸因素间动态过程的相似性或相异程度来衡量因素间发展态势的一种方法.通过定义加权灰色关联系数分布密度值,构建了灰内涵序列,建立了关联系数权重的优化 模型
  • 灰色关联分析

    2021-01-30 17:07:05
    定义灰色关联度总结 前言 系统分析时,常使用数理统计:回归分析(标准化回归)、方差分析(使用较少)、主成分分析(用于降维),但总有不足: 1.需要有大量数据;数据个数大于条件个数 2.样本需要服从典型概率...
  • python从excel中读取数据并进行相关度分析 # -*- coding: utf-8 -*- """ Created on Fri Nov 27 19:41:32 2020 @author: asus """ import numpy as np import pandas as pd from pandas import read_excel from ...
  • python计算灰色关联度

    千次阅读 2020-04-12 17:04:06
    1. 初值法 import pandas as pd import os os.chdir(r"E:\...x=pd.read_excel("灰色关联度1.xlsx", encoding='utf8') x=x.T # 1、数据初值化处理 x_mean=x.mean(axis=1) for i in range(x.index.s...
  • 商品关联分析

    千次阅读 2016-07-12 17:21:45
    association: 用在实际的事物之上,比如电子商务网站上的商品之间的关联度。支持度(support):数据集中包含某几个特定项的概率。 比如在1000次的商品交易中同时出现了啤酒和尿布的次数是50次,那么此关联的支持度...
  • 商品关联度分析的时候,我们可能会遇到各种各样格式的数据,而对数据的格式往往会影响关联度分析,一般来说,数据源大多有三种格式: 第一种是事务型交易数据,典型的数据格式是每个数据行以订单ID或以客户ID...
  • [数学建模]灰色关联分析--系统分析

    千次阅读 多人点赞 2021-02-01 11:19:10
    建模算法整理,文章主要介绍了 灰色关联分析 参考学习资料:清风数学建模 其他资源:2016到2020美赛o奖论文=== 姜启源 司守奎电子书===论文模板 ====算法代码 如果需要可私信或者评论
  • 使用python实现灰色关联分析及其可视化...灰色系统理论提出了对各子系统进行灰色关联度分析的概念,意图透过一定的方法,去寻求系统中各子系统(或因素)之间的数值关系。因此,灰色关联度分析对于一个系统发展变化态势
  • EXCEL中的数据分析—描述统计

    千次阅读 2019-09-11 10:07:18
    今天给大家分享的是在数据分析中很重要的一环,也就是描述统计。在百科的解释中,描述统计是通过图表或数学方法,对数据资料进行整理、分析,并对数据的分布状态、数字特征和随机变量之间关系进行估计和描述的方法。...
  • 回归分析中,只包括一个自变量和一个因变量,且二者的关系可用一条直线近似表示,这种回归分析称为一元线性回归分析。如果回归分析中包括两个或两个以上的自变量,且因变量和自变量之间是线性关系,则称为多元线性.....
  • 数学建模之灰色关联分析

    千次阅读 2020-03-09 17:30:51
    什么是灰色关联分析 对于两个系统之间的因素,其随时间或不同对象而变化的关联性...因此,灰色关联分析方法,是根据因素之间发展趋势的相似或相异程度,亦即“灰色关联度”,作为衡量因素间关联程度的一种方法。 ...
  • VLOOKUP函数 功能:按列查找 语法格式:=VLOOKUP(查找目标,查找范围,返回值的列数,精确or 模糊查找) 查找方式有2种: 精确查找:0或FALSE 模糊查找:1或TRUE 查询方式 (1) 单条件查询(使用单个...
  • 淘宝用户行为分析——通过excel分析

    千次阅读 2019-10-04 13:04:14
    数据清洗四、数据分析1.每日的浏览量2.时间的变化与购买之间的关系3.一周内用户行为分析4.描述统计五、总结 一、需要解决的问题 每日的浏览量,访客量以及时间维度的用户行为分析 二、理解数据 阿里云天池数据:...
  • 数据分析入门(一)

    千次阅读 多人点赞 2020-02-29 11:17:19
    1.数据分析概念 1.1数据分析 是指用适当的统计分析方法对收集来的大量数据进行分析,将他们加以汇总和理解并消化,以求最大化地开发数据的...Excel可以实现。 探索性数据分析(高级数据分析):EDA指对已有数据在...

空空如也

空空如也

1 2 3 4 5 ... 20
收藏数 8,742
精华内容 3,496
关键字:

excel做关联度分析