层次聚类 订阅
层次聚类试图在不同层次对数据集进行划分,从而形成树形的聚类结构。数据集划分可采用“自底向上”的聚合策略,也可采用“自顶向下”的分拆策略。 [1]  树的最底层有5个聚类,在上一层中,聚类6包含数据点1和数据点2,聚类7包含数据点4和数据点5。随着我们自下而上遍历树,聚类的数目越来越少。由于整个聚类树都保存了,用户可以选择查看在树的任意层次上的聚类。 展开全文
层次聚类试图在不同层次对数据集进行划分,从而形成树形的聚类结构。数据集划分可采用“自底向上”的聚合策略,也可采用“自顶向下”的分拆策略。 [1]  树的最底层有5个聚类,在上一层中,聚类6包含数据点1和数据点2,聚类7包含数据点4和数据点5。随着我们自下而上遍历树,聚类的数目越来越少。由于整个聚类树都保存了,用户可以选择查看在树的任意层次上的聚类。
信息
外文名
hierarchical clustering [1]
中文名
层次聚类
层次聚类层次聚类
层次聚类是另一种主要的聚类方法,它具有一些十分必要的特性使得它成为广泛应用的聚类方法。它生成一系列嵌套的聚类树来完成聚类。单点聚类处在树的最底层,在树的顶层有一个根节点聚类。根节点聚类覆盖了全部的所有数据点。
收起全文
精华内容
参与话题
问答
  • 层次聚类

    2020-04-12 10:59:30
    一、层次聚类   层次聚类(Hierarchical Clustering)通过计算不同类别数据点间的相似度来创建一棵有层次的嵌套聚类树。在聚类树中,不同类别的原始数据点是树的最低层,树的顶层是一个聚类的根节点。创建聚类树有...

    一、层次聚类

      层次聚类(Hierarchical Clustering)通过计算不同类别数据点间的相似度来创建一棵有层次的嵌套聚类树。在聚类树中,不同类别的原始数据点是树的最低层,树的顶层是一个聚类的根节点。创建聚类树有自下而上合并自上而下分裂两种方法

    二、合并算法

    2.1、算法流程

    • (1) 将每个对象看作一类,计算两两之间的距离;
      • MIN度量
      • MAX度量
      • Group Average(平均距离度量)
        在这里插入图片描述
      • Distance Between Centroids(质心度量)
      • Other methods driven by an objective function
        • Ward’s Method uses squared error
    • (2) 将距离最相近的两个类合并成一个新类;
    • (3) 重新计算新类与所有类之间的距离;
    • (4) 重复(2)、(3),直到所有类最后合并成一类。

    不同的度量方式,层次的划分也不一样

    在这里插入图片描述

    2.2、优缺点

    2.2.1、优点:

    • 1,距离和规则的相似度容易定义,限制少
    • 2,不需要预先制定聚类数
    • 3,可以发现类的层次关系
    • 4,可以聚类成其它形状

    2.2.2、缺点:

    • 1,计算复杂度太高
    • 2,奇异值也能产生很大影响
    • 3,算法很可能聚类成链状
    • 3,合并策略是最终的,一旦合并不可撤销

    Reference

    展开全文

空空如也

1 2 3 4 5 ... 20
收藏数 2,386
精华内容 954
关键字:

层次聚类