精华内容
下载资源
问答
  • 因此,灰色关联分析是指对一个系统发展变化态势的定量描述和比较的方法,其基本思想是通过确定参考数据列和若干个比较数据列的几何形状相似程度来判断其联系是否紧密,它反映了曲线间的关联程度。 2、输入输出描述 ...

    1、作用

    对于两个系统之间的因素,其随时间或不同对象而变化的关联性大小的量度,称为关联度。在系统发展过程中,若两个因素变化的趋势具有一致性,即同步变化程度较高,即可谓二者关联程度较高;反之,则较低。因此,灰色关联分析是指对一个系统发展变化态势的定量描述和比较的方法,其基本思想是通过确定参考数据列和若干个比较数据列的几何形状相似程度来判断其联系是否紧密,它反映了曲线间的关联程度。

    2、输入输出描述

    输入:特征序列为至少两项或以上的定量变量,母序列(关联对象)为1项定量变量。
    输出:反应考核指标与母序列的关联程度。

    3、学习网站

    SPSSPRO-免费专业的在线数据分析平台

    4、案例示例

    案例:分析09-18年内,影院数量,观影人数,票价、电影上线数量这些因素对全年电影票房的影响。其中电影票房是母序列,影院数量,观影人数,票价、电影上线数量是特征序列。

    5、案例数据

    灰色关联分析案例数据

    6、案例操作

    Step1:新建分析;
    Step2:上传数据;
    Step3:选择对应数据打开后进行预览,确认无误后点击开始分析;

    step4:选择【灰色关联分析】;
    step5:查看对应的数据数据格式,【灰色关联分析】要求特征序列为定量变量,且至少有一项;要求母序列为定量变量,且只有一项。
    step6:设置量纲处理方式(包括初值化、均值化、无处理)、分辨系数(ρ越小,分辨力越大,一般ρ的取值区间为 ( 0 ,1 ),具体取值可视情况而定。当 ρ ≤ 0.5463时,分辨力最好,通常取 ρ = 0.5 )
    step7:点击【开始分析】,完成全部操作。

    7、输出结果分析

    输出结果1:灰色关联系数

    图表说明:关联系数代表着该子序列与母序列对应维度上的关联程度值(数字越大,代表关联性越强)。

    输出结果2:关联系数图


    分析:输出结果1和输出结果2是一样的,输出结果1用了表格形式来呈现关联系数,输出结果2用了图表形式来呈现关联系数。图表很直观地展现了,大多数年份的银幕数量和电影上线数量对票房影响更大。

    输出结果3:关联系数图


    分析:针对本次4个评价项,银幕数量评价最高(关联度为:0.882),其次是电影上线数量(关联度为:0.873)。这说明对票房影响最大的是银幕数量,其次是电影上线数量、票价,观影人数对电影票房的影响程度较小。

    8、注意事项

    • 在选择量纲处理方式时,一般地,初值化方法适用于稳定递增或递减的数据,而均值化适合没有明显升降趋势现象的数据;
    • 灰色关联分析时,数据一定需要大于0,原因在于如果小于0进行计算时会出现‘抵消’现象,并不符合灰色关联分析的计算原理。如果出现小于0数据,建议作为空值处理或者填补;
    • 母序列是指标的参照对比项,比如研究5个指标与母序列的关联程度,通常研究者需要自己提供母序列数据。

    9、模型理论

    灰色关联分析基于灰色关联度,它通过对数据 序列几何关系和曲线几何形状的相似程度进行比较,来分析系统各因素之间的关联程度 。它的步骤如下:

    步骤1 : 确定特征数列和母数列。
    比较序列为

    母序列(即评价标准)为

    步骤2: 对指标数据进行量纲一化 。为了真实地反映实际情况 ,排除由于各个指标单位的不同及其数值数量级间 的悬殊差别带来的影 响 ,避免不合理现象的发生 ,需要对指标进行 量纲一化处理。 spsspro提供初值化、均值化两种处理来进行量纲统一化。

    步骤3: 计算关联系数 。由下式分别计算每个比较序列与 参考序列对 应元素的关联系数 :

    ρ为分辨系数 ,在 (0,1)内取值 ,分辨系数越小,关联系数间差异越大 ,区分能力越强,通常取0.5。

    步骤4: 计算关联序度。
    分别计算其各个指标与参考序列对应元素的关联系数的加权平均值 ,以反映各操纵装置对象与参考序列间的关联关系 ,并称其为关联度 ,记为

    步骤5: 分析计算结果。根据灰色加权关联度的大小,建立各评价对象的关联序。关联度越大,表明评价对象对评价标准的重要程度越大。

    10、参考文献

    [1] ohamInadA,Daniel N,PeterI C.Fu2zy grey relational analvsis for software effort estimation[J].Empircal Sotware Engineering,2010,15(1):60—90.
    [2] 付雅芳,杨任农,刘晓东,等. 基于灰色关联分析的软件工作量估算方法[J]. 系统工程与电子技术,2012,34(11):2384-2389. DOI:10.3969/j.issn.1001-506X.2012.11.34

    展开全文
  • 灰色系统理论提出了对各子系统进行灰色关联度分析的概念,意图透过一定的方法,去寻求系统中各子系统(或因素)之间的数值关系。因此,灰色关联度分析对于一个系统发展变化态势提供了量化的度量,非常适合动态历程...
  • 灰色关联分析计算的实例演示 快速学习灰关联计算套路
  • 灰色关联度、粗糙依赖度和综合前两种方法的模糊综合法的评估结果以及研究区内泥石流的发生与否情况,通过采样(共290个点)制作成Excel表格,样点中,将已发生泥石流点的属性置为1,未发生为0,并导入SPSS软件统计...

    泥石流危险性是指在人类及所在环境中一切事物遭受泥石流损害的可能性大小。作为防灾减灾中泥石流灾害管理的重要一环,泥石流的危险性评估是泥石流灾害防治决策的前提。学者们普遍认为通过泥石流风险评估和风险管理,可以大大减弱其带来的风险,通常从泥石流的发育规律、孕灾环境、成灾方式和驱动因子等多方面来科学评价其发生的可能性、危险性、危害范围和程度等。

    21世纪以来,灾害风险评估和管理的研究成为新的热点。国内外学者对泥石流危险性评估进行了大量的研究,其中澳大利亚FELL将危险度描述为规模与概率(频率)的乘积,并得到大多认同,而我国学者将泥石流灾害系统中孕灾环境、致灾因子的自然属性特征用灾害过程强度或规模、频率、灾害影响区域及其影响程度、危害程度等指标进行刻画,由此,多因子综合评价成为泥石流危险性研究所采取的主要模式。在泥石流灾害研究中,致灾因子的识别和风险评估分析方法的选取一直是泥石流危险性研究的关键。泥石流灾害的形成与其所处的地貌形态、物质、构造、水文、气象和植被条件等多种因素密切相关,因此,探究已发生泥石流灾害与这些因素间的关系,可揭示泥石流发生的重要条件和有利于制定防灾减灾措施。例如,MOORE和MCINNES基于地貌方法,研究了山坡系统与冲积海岸沉积系统间的关系,对制定研究区安全保护措施奠定基础;牛全福等基于多种方法探讨了地形因子在地质灾害研究中的适宜性,并探讨了因子分级的方法对评估精度的影响。孟凡奇等基于逐步判别分析法对泥石流危险性的评价因子按贡献大小进行筛选,使得危险度评价结果更符合实际泥石流危险发育情况。泥石流灾害的评估方法通常基于泥石流灾害预测理论的原理,已形成参数合成法、数理多元统计、层次分析法、信息模型法等多种评估预测模型。这些评估模型大多基于统计方法,其优点为指标体系的建立简单易行、可操作性较强、便于计算机编程处理等,缺点为对样本要求高、预测结果精度不够。因此,探索泥石流形成的致灾因子和适宜的评估方法有利于进一步提高泥石流危险性评估的可靠性。

    随着计算机以及地理信息系统技术的发展,泥石流评价也向着精度更高、速度更快,集成性能更高、更加便捷的方向发展。泥石流是由多种致灾因素共同作用形成的一种地质灾害,其中多数致灾因素较难确定或者模糊不清,形成了一个灰色系统。由于泥石流灾害特性的这种不确定性和灾害系统的复杂性,用绝对的“非此即彼”存在难以描述泥石流灾害系统的客观实际问题,即存在“亦此亦彼”的模糊现象。因此,其评估方法宜采用灰色关联模型、粗糙度和模糊数学理论等非确定性分析方法进行模拟。基于上述讨论,本研究以泥石流频发的兰州市为例,从泥石流灾害预测理论出发,结合3S技术和地形、地貌、岩性、降雨和植被覆盖等影响指标,应用灰色关联度、粗糙依赖度以及融合前两种方法的模糊定权方法进行泥石流危险性评价,为该区域泥石流危险性评价理论研究和防灾减灾等提供技术支持。

    兰州市地处黄河上游的黄土高原西部,黄河自西向东穿城而过,城区坐落在两岸河流阶地上,是典型的山间河谷型城市(图1)。市区南北两侧为绵延起伏的高山和纵横沟壑的黄土峁梁,海拔为1 417~2 918 m,地形起伏较大。受其特殊的地理位置和河流的分割影响,其地域空间狭窄、岩土体完整性差、风化严重。由于半干旱的气候环境,植被覆盖较为稀少,降水主要集中在6~9月,小范围短时暴雨往往强度大,因而滑坡泥石流等地质灾害频发,严重威胁人们的生命和财产安全。

    adf17370dcc04d88e15cab1c9d2f5810.png

    兰州为我国泥石流发育最密集的城市之一。自建国以来,兰州市己发生滑坡、泥石流等地质灾害超342起,造成约687人死亡,累计直接经济损失超过7.95×108元,其中泥石流灾害最为严重,其危害程度居全国各省会城市之首。据调查,兰州已发生泥石流多沿黄河干流和支流呈带状分布,其中有30多条分布在黄河以南部的阳洼沟、大金沟以及元托峁沟等,有50多条沿北部分布,以雷坛河上游两岸最为集中。近年来,随着西部大开发和城市化的步伐加快,人口和建筑物密集、土地资源稀缺,人类工程活动等不断加剧,潜在地质灾害危险性不断增大、隐患也不断增多。

    利用ArcGIS10.2平台,基于Aster GDEM进行孕灾环境因子的提取,基于地貌数据和地质数据提取地貌类型和地质岩性并转换成栅格图层,将最大月降雨数据经插值处理生成研究区的降雨因子图层;其次,在ENVI支持下,将3景landsat8遥感数据进行辐射校正、几何纠正、NDVI和植被覆盖度计算,拼接和裁减、生成植被覆盖图层;第三,应用复相关系数法对地形因子去相关,获得综合所有地形因子的地形易发性图层;最后,建立危险性评价指标体系,应用灰色关联度、粗糙依赖度以及融合灰色关联度和粗糙依赖度的模糊综合定权法进行兰州泥石流危险性评价,并分析评价结果。

    (1)灰色关联度

    泥石流是由多种致灾因素共同作用形成的一种地质灾害,其中多数致灾因素较难确定或者模糊不清,形成了一个灰色系统。灰色关联度分析就是通过研究每个因子与参考因子的关联系数大小来分析泥石流灾害的危险性。若以x(i,j)为灰色关联因子的原始数据矩阵,x′(i,j)为x(i,j)无量纲化矩阵,x(a,j)为参考序列,则灰色关联度的计算如下式(1):

    51a0c1efea192d8cc2d0fdabb2e6ef7d.png

    其中,r(i)——灰色关联度;

    i——样本;

    j——关联因子;

    n——总样本;

    m——关联因子总数(i=1,2,…,n; j=1,2,…,m);

    ρ——分辨系数,取值区间为[0,1],其值越小分辨率越大,通常取0.5。

    (2)粗糙依赖度

    粗糙依赖度也可以处理不确定性和不完整性的问题,它是间接对数据进行分析和推理的方法,通过对已知数据分析处理发现隐含的知识,在泥石流评价指标体系中,去除某一指标会对评估结果产生一定的影响,该指标的重要程度可用相互依赖度来计算,具体公式如下式(2):

    af16a08b3420068a41d72720ae0bd7c0.png

    其中,ai——第i类致灾因子的权重;

    NC(D)——系统D中由指标序列C构建的子集数;

    NC-C′(D)——系统D中去掉某一个指标C′的指标序列C-C′构建的子集,与子集NC(D)具有相同的子集数。其中NC-C′(D)/NC(D)表示致灾因子的依赖度,而1-NC-C′(D)/NC(D)表示致灾因子的重要度。

    (3)融合灰色关联度和粗糙依赖度的模糊综合法

    灰色关联度算法是通过关联系数分析泥石流致灾因子的不确定性,由于算法中关联度与比较数列、参考数列以及其长度有关,而且无量纲处理和分辨系数的选取也会对关联度产生影响。粗糙依赖度作为一种刻画不确定性问题的较为客观方法,可以结合灰色关联度和模糊集理论,在泥石流危险性评估中发挥各自的优势。本算法融合灰色关联度和粗糙依赖度的模糊定权方法如下:

    wi=uai+(1-u)βi

    (3)

    式中:wi——融合灰色关联度和粗糙依赖度的模糊法的权重;

    u——系数,本研究取值为0.4;

    ai——粗糙依赖度确定的各致灾因子权重;

    βi——灰色关联度确定的各致灾因子权重。

    利用ArcGIS10.2平台和Aster GDEM分别提取6个微观地形因子(坡度、坡向、坡长、坡度变率、坡向变率和曲率)和4个宏观地形因子(地表粗糙度、地形起伏度、高程变异系数和地表切割深度),并与研究区已调查的泥石流位置点数据进行叠加运算,提取泥石流点的各地形因子属性值并做标准化处理;其次,将标准化结果导入SPSS软件,计算各地形因子与已发生泥石流点密度间的相关性,选择相关性最强的地形起伏度作为主要因子,其余地形因子为次要因子;第三,计算主要因子与次要因子之间的复相关系数,获取各地形因子的权重(表1),并对各地形因子图层做加权叠加运算,得地形易发性图层。然后,基于ENVI和Landsat8 OLI数据计算NDVI及植被覆盖度,基于ArcGIS10.2平台,利用地貌和地质数据分别提取地貌类型和地质岩性图层,利用雨季(6月~9月)的月降雨均值经空间插值计算获得月降雨图层(图2)。

    461dadf3af9d97facd9e6413ae4ecb61.png

    a16155914655dba07cf55948c7ec761c.png

    dd70b6fcce1829731f6be1a2a5bcae15.png

    本次泥石流危险性研究,分别采用了灰色关联度、粗糙依赖度以及融合灰色关联度和粗糙依赖度的模糊法来分析。并且,为了对本次泥石流危险性评估结果进行评价,将收集的已发生泥石流数据(共145个)进行随机分组,第一组(75个泥石流点)引入上述三种模型中进行泥石流的危险性模拟,第二组(70个泥石流点)用来做精度评价。

    应用灰色关联度进行泥石流危险性模拟步骤:首先,对地形易发性、植被覆盖度、地貌类型、岩性和月降雨五个因子做无量纲处理,消除单位差异;其次,将泥石流灾害点密度作为参考序列,与比较序列(五个致灾因子)进行求差的绝对值;计算其与五个比较序列的关联系数,进而计算灰色关联度;将灰色关联序做归一化处理,得到各致灾因子的权重(表2);然后基于ArcGIS10.2平台加权叠加各致灾因子,获得研究区泥石流危险性分级图(图3)。

    应用粗糙依赖度进行泥石流危险性模拟步骤:首先,对地形易发性因子、地质岩性、降雨、植被覆盖度和地貌类型五个因子重分类(分别分四级),其中,地形易发性、植被覆盖度和降雨采用自然断点法进行分级,地质岩性参考岩层的坚硬程度进行分级;其次,进行致灾因子与泥石流发生的必要性分析;接下来,应用粗糙依赖度计算五个致灾因子的依赖度和重要度,并计算每个因子的权重(表3);最后,基于ArcGIS10.2平台将各致灾因子进行加权叠加运算并分级,获得研究区泥石流危险性分级图(图4)。

    基于灰色关联度方法和粗糙依赖度方法分别获得的各致灾因子的权重,应用融合灰色关联度和粗糙依赖度的模糊综合法,获得各致灾因子的模糊综合权重(表4)。然后,基于ArcGIS10.2平台加权叠加各致灾因子,获得研究区泥石流危险性分级图(图5)。

    d283de9641cc87779803fa3ab1ecf625.png

    b1eaa41faf6f1545346ad7ce4ba69f93.png

    88a1664cfe884129e1e5952f61f0a44c.png

    本研究结果的精度分析采用验证组数据进行统计分析,主要采用两种方法进行评价:将评估结果与验证组数据进行空间叠加统计分析和基于ROC曲线的精度评定。首先,将验证组泥石流灾害点与三种方法获得的评估结果进行叠加统计,对比分析已发生泥石流点在泥石流危险性等级中的分布关系(图3,表5)。从图3可以看出,验证组泥石流点绝大多数分布在危险性的中、高危险等级区域,仅有少量落到较低危险区域。由表5可知,研究区大多数泥石流点分布在0.4~0.6和0.6~0.8区间,且三种方法获得结果的趋势一致。表明本研究基于三种不确定方法获得的泥石流危险性评估结果与已发生泥石流分布具有很好的对应关系,即泥石流高发区对应着危险性评估的高等级区,本次评估的结果较客观反映了研究区泥石流灾害的空间分布,也说明了评估结果具有较高的可信度。

    ROC曲线又称为感受性曲线,已广泛应用于地质灾害危险性评估结果精度分析中。基于ROC曲线的模型精度评判标准为:曲线下面积越接近于1(总面积值位于0~1),说明模型的判别结果较好。因此,本研究采用ROC曲线评价泥石流危险性评估三种结果的精度。首先,将灰色关联度、粗糙依赖度和综合前两种方法的模糊综合法的评估结果以及研究区内泥石流的发生与否情况,通过采样(共290个点)制作成Excel表格,样点中,将已发生泥石流点的属性置为1,未发生为0,并导入SPSS软件统计分析,获得三种评价模型的ROC曲线(图6)和精度计算结果(表6)。

    由图6和表6可知,融合灰色关联和粗糙依赖度的模糊综合法所获得的结果精度最好,其ROC曲线下的面积为0.789;灰色关联度和粗糙依赖度的评估结果精度比较接近,其ROC曲线下的面积分别为0.658和0.660。同时,依据ROC曲线的评判标准,灰色关联度和粗糙依赖度的ROC曲线下面积接近于0.7,表明其结果具有低的准确性,而融合灰色关联和粗糙依赖度的模糊综合法的ROC曲线下面积大于0.7,说明该模型评估的结果具有较高的可信度,很好地反映了泥石流危险性分布。

    b23d28dcc2758cf16afc9dfbf4642a76.png

    本研究基于泥石流发生的不确定性、复杂性和模糊性的特点,以泥石流频发地兰州地区为例,从已发生的泥石流灾害点调查数据出发,选取适合描述泥石流灾害系统不确定性的数学模型:灰色关联度、粗糙依赖度、融合灰色关联度和粗糙依赖度的模糊综合法进行泥石流危险性评估,所得结论如下:

    (1)由复相关系数得到的地形因子权重来看,地形起伏度>坡向变率>地表粗糙度>坡长>坡度变率>坡向>坡度>高程变异系数>地表切割深度>曲率,且地形起伏度、坡向变率、地表粗糙度、坡长和坡度变率的权重均大于0.1,说明这五个因子对该区域泥石流的发生,在地形参数上具有一定的控制作用。由灰色关联度计算的权重排序为:降雨>地貌类型>地形易发性>植被覆盖度>地质岩性;利用粗糙依赖度获得泥石流影响因子的权重排序为:植被覆盖度>地形易发性>降雨>地貌类型>地质岩性;而融合灰色关联度和粗糙依赖度的模糊综合法获得的影响因子权重顺序与粗糙依赖度所获结果序列一致。

    (2)从泥石流影响因子来分析,基于三种方法获得的主要致灾因子依次为:植被覆盖度、降雨和地形易发性,其中,地形易发性主要受地形起伏度、坡向变率、地表粗糙度、坡长和坡度变率的控制,经调查发现这些影响因子与实际地形地貌和生态环境具有很好的吻合性。由于兰州河谷盆地为一双侧不对称的压扭性断陷谷地,其南北两山起伏度较大、主体属于松散岩土,结构疏松, 植被覆盖稀少,河谷阶地及被沟谷切割的黄土梁峁等为主要地貌形态,高陡的斜坡、高阶地前缘形成多个临空面,许多冲沟顺断裂面发育。此外,驱动因素(如:地震和暴雨)也是研究区泥石流发生的直接诱发因素,据统计,研究区年均降水量约为327.7 mm,多集中在6~9月。短时集中强降雨驱动下极易引发泥石流灾害,该区域也是泥石流灾害的多发区。

    (3)由三种方法进行泥石流的危险性评估的结果来分析,从定性角度来看,将验证组的泥石流点与灰色关联度、粗糙依赖度、以及融合灰色关联度和粗糙依赖度的模糊综合法评估结果进行叠加分析可知,绝大多数泥石流点分布在评估结果的中和高等级区域,表明三种方法评估的结果均较客观地反映了研究区泥石流危险性的空间分布,也说明其评估结果均具有一定的可信度。但是,基于ROC曲线的精度分析来看,灰色关联度和粗糙依赖度的评估结果精度比较接近,其ROC曲线下面积均接近0.7;融合灰色关联和粗糙依赖法的模糊综合法所获得的结果精度最好,其 ROC曲线下面积大于0.7,说明该模型评估的结果具有较高的可信度,较好地反映泥石流危险性分布。

    (4)本研究针对泥石流频发的兰州地区,基于泥石流灾害的模糊不确定性特点,利用不确定性算法进行泥石流的危险性评估,其结果与泥石流调查数据具有很好的吻合性,表明该研究方法可行,可为该区域及其它地区泥石流的危险性研究提供借鉴。

    来源:地质环境学术交流

    f7de9359b2fb20b4a430ec24f5063909.gif

    展开全文
  • spss 关联分析

    2013-09-05 16:42:23
    啤酒尿布案例的数据推导,SPSS中的实际演练
  • 灰色关联分析

    万次阅读 多人点赞 2018-01-27 21:18:52
    与灰色预测模型一样,比赛不能优先使用,灰色关联往往可以与层次分析结合使用。层次分析用在确定权重上面 【1】确定比较对象(评价对象)(就是数据,并且需要进行规范化处理,就是标准化处理,见下面例题的表格...
    与灰色预测模型一样,比赛不能优先使用,灰色关联往往可以与层次分析结合使用。层次分析用在确定权重上面
    

    【1】确定比较对象(评价对象)(就是数据,并且需要进行规范化处理,就是标准化处理,见下面例题的表格数据)和参考数列(评价标准,一般该列数列都是1,就是最优的的情况) 
    【2】确定各个指标权重,可用层次分析确定 
    【3】计算灰色关联系数 
    这里写图片描述 
    这是一个比较复杂的公式,给出的代码可以直接运行出来,可以先不管这个公式。 
    【4】计算灰色加权关联度,计算公式为: 
    这里写图片描述 
    其中Ri就是第i个指标对理想对象(参考数列,一般该数列都是1,就是最有情况)的加权关联度。就可以认为是评价的结果。 
    其中Ri就是第i个指标对理想对象(参考数列,一般该数列都是1,就是最有情况)的加权关联度。就可以认为是评价的结果。 
    【5】评价分析。 
    例 1 通过对某健将级女子铅球运动员的跟踪调查,获得其 1982 年至 1986 年每年最好成绩及 16 项专项素质和身体素质的时间序列资料,见下表,试对此铅球运动员的专项成绩进行因素分析。

                                 表 各项成绩数据
    

    这里写图片描述 
    这里写图片描述 

    这里写图片描述

    源代码:基于MATLAB2014a编程
    clc,clear
    load x.txt %把原始数据存放在纯文本文件 x.txt 中,其中把数据的"替换替换成.
    for i=1:15
        x(i,:)=x(i,:)/x(i,1); %标准化数据
    end
    for i=16:17
        x(i,:)=x(i,1)./x(i,:); %标准化数据
    end
    
    data=x;
    n=size(data,2); %求矩阵的列数,即观测时刻的个数
    ck=data(1,:); %提出参考数列
    bj=data(2:end,:); %提出比较数列
    m2=size(bj,1); %求比较数列的个数
    for j=1:m2
        t(j,:)=bj(j,:)-ck;
    end
    mn=min(min(abs(t'))); %求最小差
    mx=max(max(abs(t'))); %求最大差
    rho=0.5; %分辨系数设置
    ksi=(mn+rho*mx)./(abs(t)+rho*mx); %求关联系数
    r=sum(ksi')/n %求关联度
    [rs,rind]=sort(r,'descend') %对关联度进行排序
    运行结果的r为各指标和成绩的关联度,rind即为各指标和成绩的关联度大小排序的结果。在使用本程序的时候,只需要把数据换成自己自己的数据,以及把循环次数改一下即可。


    展开全文
  • SPSS Modeler关联分析(第十八章)

    千次阅读 2021-02-22 17:56:18
    常利用关联规则技术对超市购物篮进行分析,随着数据挖掘技术的不断成熟,关联分析也逐渐被应用于网站分析、气象分析、社交媒体分析等方面。 1. 关联分析基本概念 将上表的每一行记录称为一个事务。每个事务由事务...

    在这里插入图片描述

    通过关联分析,我们将从庞杂的数据中发现事物间潜藏的关联关系。常利用关联规则技术对超市购物篮进行分析,随着数据挖掘技术的不断成熟,关联分析也逐渐被应用于网站分析、气象分析、社交媒体分析等方面。

    1. 关联分析基本概念

    在这里插入图片描述
    将上表的每一行记录称为一个事务。每个事务由事务标识(TID)以及对应的项目组成。
    如果项集X中包含可k个项目,就称X为k-项集。例如,TID为01的事务,就是一个2-项集,其中包含了啤酒和冻肉两个项目。

    为了进一步进行关联分析,我们要将数据转换为表格格式或事物格式。
    在这里插入图片描述
    在这里插入图片描述
    一个关联规则通常可以表示为:X→Y
    X是关联规则的前项,Y是关联规则的后项,前后项目并不相关。
    规则的前项可以包含一个或多个项目,而规则的后项一般只有一个项目。

    2. 关联规则的有效性指标

    2.1 基础性评价指标

    2.11 支持度

    在这里插入图片描述
    分子:同时包含了前项X和后项Y的事务数量。
    分母:数据集中事务总数量。
    通常用于反映项集或规则的普遍程度

    2.22 置信度

    在这里插入图片描述
    分子:同时包含了前项X和后项Y的事务数量。
    分母:前项X的事务数量。
    实际上是给定前项X的前提下后项Y的条件概率。通常用于反映规则的可靠性

    一个合适的关联规则应该同时由较高的支持度和置信度。
    如果关联规则有较高支持度而置信度较低,说明关联规则较弱。如果关联规则有较高置信度而支持度较低,说明规则普遍性较低,可能只是偶然事件,不具备应用推广的意义。
    因此,为了生成合适的关联规则,通常需要分别设置最小支持度及最小置信度阈值。
    有效的规则
    在这里插入图片描述

    2.2 实用性指标

    规则的有效并不代表真的具备实用性,为了能够进一步评估规则的效果,还需要结合其他实用性指标。

    2.21 提升度

    在这里插入图片描述
    实际上是规则置信度和后项支持度的比值,反映了相比总体,后项Y受到前项X的影响程度。
    当提升度>1时,认为前项对后项具有正向影响;值越大,正向影响程度越高。
    当提升度<1时,认为前项对后项具有负向影响。

    2.22 部署能力

    在这里插入图片描述
    部署能力是前项支持度和后项支持度的差值。它反映了有多少已经购买条件但是还没买购买结果的客户比例。

    2.3 其他评估指标

    2.31 置信度差

    在这里插入图片描述
    是规则置信度和后项支持度的绝对差值,与提升度一样,反映后项Y受到前项X的影响程度。值越大,说明后项和前项的关联越大。
    选择该指标作为评估指标,将能够去除负关联规则。

    2.32 置信度比率

    在这里插入图片描述
    是1减去提升度(若提升度>1,则减去其倒数)的差值。
    该指标更多地考虑不均匀分布的情况,将更容易保留负关联规则及稀有数据规则。

    2.33 信息差

    基于信息增量的测量,信息差越大,说明后项与前项的关联越大。

    2.34 标准化卡方

    用于检验前后项是否独立的统计量,该值在0-1之间。
    值越大,前项和后项的关联性越大。

    3. Apriori算法

    数据挖掘中关联分析的核心算法。
    Apriori算法的过程,一共可以分为3步:
    (1)指定最小支持度及最小置信度;
    (2)根据最小支持度生成频繁项集;
    (3)基于频繁项集,根据最小置信度生成关联规则。

    3.1 生成频繁项集

    在这里插入图片描述
    在这里插入图片描述
    在这里插入图片描述
    在这里插入图片描述

    3.2 生成关联规则

    当生成所有频繁项集后,就能够从中抽取规则。

    展开全文
  • 数学建模常用模型04 :灰色关联分析

    万次阅读 多人点赞 2018-08-03 13:15:52
    与灰色预测模型一样,比赛不能优先使用,灰色关联往往可以与层次分析结合使用。层次分析用在确定权重上面 【1】确定比较对象(评价对象)(就是数据,并且需要进行规范化处理,就是标准化处理,见下面例题的表格数据...
  • 1.1 运用SPSS数据预处理结果 对于中国A股市场与美国NASDAQ市场缺失的数据[1],使用一个全局常量或属性的平均值填充空缺值。通过SPSS得到填充后的数据集。 运用平均值法统计出2009-2018年中的平均估值水平、平均...
  • SPSS:数据分析

    千次阅读 多人点赞 2021-03-09 16:06:16
    6、灰色关联度分析(Grey Relation Analysis,GRA) 7、弗里德曼检验(Friedman Test) 8、箱图(Box) 1、数据采集 1、数据分类 定性 观察、访谈、调查 定量 手动测量、自动测量、问卷打分 主观...
  • 关注SPSS相关性分析及相关系数计算方法(点二列相关系数)关键词:SPSS 相关性分析 点二系列相关分析即是指研究连续变量与二分类变量的关联关系。医学数据统计分析中,常常会遇到探讨性别变量与另一个连续变量间是否...
  • 管理类文科类的综合评价模型都可以,一般都是层次分析法ahp,主成分pca /因子分析灰色关联度,熵权法,topsis求指标权重,然后一个排序。如果结合2种或者3种模型,,结合的方法分内在和外在结合, 1 外在的...
  • 导读:本文介绍了关联规则原理及Apriori算法实现购物篮分析,以一个真实案例辅助理解关联分析。背景与需求客户A企业是一家全球知名家具和家居零售商,销售主要包括座椅/沙发系列、办公用品、卧...
  • apriori:‘先验’算法(无监督学习) ...[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-BnjUNLOJ-1606633912505)(F:\资料\py\py资料\知识点\数据分析\关联规则—apriori\support.png)]
  • 关注运用SPSS进行医学诊断数据的Kappa一致性检验关键词:SPSS、 Kappa导读在医学诊断试验中,经常会遇到将待评价的诊断实验方法的诊断结果与金标准的诊断结果进行比较的情况,或者是将两种不同的诊断方法用于同一...
  • 【抢先看】《浙江电力》2020年第1期目录及重点关注文章【抢先看】《浙江电力》2020年第...认准唯一官方投稿网站:http://www.zjdl.cbpt.cnki.net/电力变压器故障类型与关键状态量关联规则分析董 翔1,赵 璧1,戴瑞成...
  • 耦合的计算

    千次阅读 2021-04-17 21:57:09
    耦合计算原理 耦合指标意义与原理 耦合:物理学上指两个或两个以上的体系或两种运动形式间通过相互作用而彼此影响以至联合起来的现象。 耦合是测量两个或多个以上的物体或系统的运动协调程度。 量表: 其中...
  • 指标赋权与评价类方法总结

    千次阅读 2021-08-18 22:23:47
    AHP层次分析、主成分分析、熵权法、组合赋权、Topsis、数据包络法、GRA灰色关联度分析
  • 利用灰色关联分析方法和SPSS 22.0软件构建了北京市PM2.5浓度与能源消费结构之间的多元线性回归方程。结果表明:北京市1998—2016年PM2.5年平均浓度呈现波动上升趋势,空间上表现出南高北低,南北差距逐渐减小的特征...
  • 超级干货:一文读懂灰色预测模型

    千次阅读 2020-08-13 10:42:43
    灰色预测模型可针对数量非常少(比如仅4个),数据完整性和可靠性较低的数据序列进行...灰色关联预测分析GM(1,1)通常可分为以下四个步骤: (1)级比值检验 此步骤目的在于数据序列是否有着适合的规律性,是否可.
  • 建模方法(十)-灰色预测模型GM(1,1)

    万次阅读 多人点赞 2018-08-27 23:02:23
    灰色生成:将原始数据列中的数据,按照某种要求作数据处理称为灰色生成。对原始数据的生成就是企图从杂乱无章的现象中去发现内在规律。常用的生成方式有累加生成,累减生成,均值生成,级比生成等。 这里举个例子...
  • 将该模型的预测性能与多元线性回归预测、灰色关联度分析预测、BP神经网络预测结果进行对比分析。结果表明:该模型选取了三个主成分变量,有效地减少了计算量,具有较高的预测精度,可以对矿井工作面瓦斯涌出量进行...
  • spss做柯尔莫哥洛夫斯米尔诺夫检验,p都大于0.05,所以接受原假设,在95%置信水平上认为数据是正太的。但是可以看到p不是远大于0.05。 大样本还可以用QQ图检验法 下面是是spss导出的QQ图,画法在下面的小样本...
  • 灰色系统预测

    2020-08-28 21:13:00
    通过计算各因素之间的关联度,鉴别系统各因素之间发展趋势的相异程度。其核心体系是灰色模型(Grey Model,GM),即对原始数据累加生成(或者累减、均值等方法)生成近似的指数规律在进行建模的方法。 类型 ...
  • 灰色分析和典型相关分析
  • 当然例如皮尔逊相关系数、灰色关联矩阵,也可以从一定程度上挑选出与某个变量相关性较强的变量,以减少计算量。 六、SPSS主成分分析(简易版) 考虑到本专业对于代码能力的局限性,且难以处理大批量数据(本次数据...
  • 数学建模心得

    千次阅读 2019-03-31 09:37:57
    当需要从定量的角度分析和研究一个实际问题时,人们就要在深入调查研究、了解对象信息、作出简化假设、分析内在规律等工作的基础上,用数学的符号和语言作表述来建立数学模型。举个最简单的例子,初中我们就过关于...
  • ucinet网络分析使用总结

    万次阅读 多人点赞 2019-08-20 17:10:32
    UCINET为菜单驱动的Windows程序,可能是最知名和最经常被使用的处理社会网络数据和其他相似性数据的综合性分析程序。与UCINET捆绑在一 起的还有Pajek、Mage和NetDraw等三个软件。UCINET能够处理的原始数据为矩阵格式...
  • 数据分析思维扫盲

    千次阅读 2021-01-14 09:26:44
    知识来源:接地气学堂1 前言 行文之初衷,建立知识树,因而不易速读,请君悉知。宜为工具书,按索引取之。独学而无友,必孤陋寡闻,请君赐教,不吝感激。...属于“怎么”的方法总结三.数据分析思路如何
  • 根据所得到的数据建立分类与预测、聚类分析关联规则、时序模式、和偏差检测等模型,提取数据中蕴含的有价值的信息。下面就将对这部分知识大致的介绍。 1、分类与预测 1.1 回归分析 本小节只对二分类Logistic...

空空如也

空空如也

1 2 3 4 5 6
收藏数 101
精华内容 40
关键字:

spss做灰色关联度分析