精华内容
参与话题
问答
  • 稀疏子空间聚类

    2015-11-10 11:01:13
    SSC聚类代码,里面包含有用SSC算法处理2a.mat数据的实例,可以快速学会怎么使用这个工具包
  • 低秩表示是一类重要的子空间聚类方法,该资源属于鲁棒稀疏子空间聚类,对包含outliers的数据样本具有鲁棒性,子空间聚类可用于前景背景分割,特征提取,异常点检测,目标识别等多个领域
  • CVPR2009的稀疏子空间聚类代码,亲测可用,以帮助需要的人
  • 现有子空间聚类算法不能很好地平衡子空间数据的稠密性和不同子空间数据稀疏性的关系,且无法处理数据的重叠问题。针对上述问题,提出一种稀疏条件下的重叠子空间聚类(OSCSC)算法。算法利用l1范数和Frobenius范数的...
  • 通过定义子空间结构化低秩正则项,将其与子空间结构化稀疏子空间聚类模型相结合,给出一个新的统一优化模型。新模型利用数据的类别属性和相似度互相引导,使得相似度具有判别性和一致性,类别属性具有一致性。相似度...
  • 为了缓解这些问题,我们研究了两种基于稀疏和协同表示的子空间聚类方法,以检测和定位森林火灾。 首先,子空间聚类从整个图像中分割出火焰。 之后,采用稀疏或协作表示法在具有l1正规化或l2正规化术语的词典中表示...
  • 稀疏子空间聚类、谱聚类的一些个人看法

    万次阅读 热门讨论 2013-10-10 22:17:47
    最近在阅读Ehsan的sparse subspace clustering这篇paper,后来看到这篇paper又完善了一下发了13...实在是佩服,我在这里首先说下这篇paper的main idea,然后再阐述下算法思想,顺便再稍微详细的解释下谱聚类。 1:本文

    最近在阅读Ehsan的sparse subspace clustering这篇paper,后来看到这篇paper又完善了一下发了13年的PAMI,去作者主页看了下,作者也就3篇paper,没想到靠这一篇paper就搞出来名气了,真的是不容易,不知道那几年是怎么坚持过来的,实在是佩服,我在这里首先说下这篇paper的main idea,然后再阐述下算法思想,顺便再稍微详细的解释下谱聚类。

    1:本文的main idea

    A:如果一组点来自一组独立的子空间,让,并且,他们分别对应每个子空间的维度以及每个子空间的基。让代表属于第i个子空间的个点,因为我们 知道原始数据中的每个点属于哪个子空间,所以我们的矩阵形式用下面这个来表示:,其中是一个置换变量,来把Y中的属于不同子空间的点给挪到了一起中。其实此时已经有了一些子空间分割的含义了,就是通过一些操作,让属于一组子空间的点,分别对应到自己所属于的那个子空间中去。

    B:若y是子空间中的一个新点,那么就可以用中的点来线性标示y了,我们用下面这个公式来表达我们的含义:,当时候,并且,那么可以直接得到,由于这个时候和y对应的基的维度是,而它远远小于每个点的维度,所以这个时候s就是上式的稀疏解,用数学符号来表达就是:

    试想:如果对每个点都来求这样的s的话,组成一个矩阵,然后再把这个矩阵转换成图分割的问题,那么就解决了我们的这个子空间分割的问题了。可惜的是上面这个优化问题是NP的,无法求解

    C:通过证明知道,如果把0范的约束换成1范的约束,那么对y的表达和0范下的效果是一样的

    D:C步骤正是本文的main idea,这个地方就省略掉证明过程了。

    2:使用的算法

    待补充

    3:谱聚类

    待补充

    展开全文
  • 针对稀疏子空间聚类(sparse subspace clustering,SSC)和低秩子空间聚类(low rank subspace clustering,LRSC)这两种子空间聚类方法的聚类准确率和稳定性不够高,提出一种基于重建系数的子空间聚类融合算法...
  • matlab子空间聚类

    2016-01-30 09:34:16
    可以用于数学建模 其中还会有关于稀疏子空间的相关英文论文 有兴趣的可以看一看
  • 总结了近年来基于子空间聚类的高维数据可视分析方法研究进展,从基于特征选择、基于子空间探索、基于子空间聚类的3种不同方法进行阐述,并对其交互分析方法和应用进行分析,同时对高维数据可视分析方法的未来发展...
  • 针对结构稀疏子空间聚类中不能很好地保证相似度矩阵连接性的问题,给出了一个新的统一优化模型。首先,引入了表示系数矩阵的子空间结构范数,增加了低秩表示来揭示高维数据的全局结构。其次,为了使相似度矩阵具有类...
  • 基于k最相似聚类的子空间聚类算法,闫妍,,子空间聚类是聚类研究领域的重要分支和研究热点,用于解决高维聚类分析面临的数据稀疏问题。提出一种基于k最相似聚类的子空间聚��
  • 多视图聚类与子空间聚类

    千次阅读 2019-06-16 21:57:45
    1、多视图聚类 从对事物的不同角度的理解生成多个特征描述视图,而非单个视图,就是多视图。 若对事物作单视图特征表示,则意味着,增加了特征空间的维度,且不同角度的特征合成同一视图,其特征可能失去原有的意义...

    1、多视图聚类

    从对事物的不同角度的理解生成多个特征描述视图,而非单个视图,就是多视图。

    若对事物作单视图特征表示,则意味着,增加了特征空间的维度,且不同角度的特征合成同一视图,其特征可能失去原有的意义。
    而多视图,则能够发挥各个视图的优势,把同一数据表示成多个特征集,然后在每个特征集上可以用不同的方法进行学习,达到协同学习的目的,改善学习性能。

    半监督多视图学习
    找到将将标记数据较好分类的视图,然后将该视图训练出的分类器对未标记的数据进行分类,并将分类结果给到其他视图,帮助其他视图训练分类器。

    2、子空间聚类

    1. 为什么
      1)高维数据使可视化和理解输入变得困难,通常需要预先应用降维技术。它导致了“维度诅咒”,即随着维度增加,所有子空间的完整枚举变得难以处理;
      2)大多数底层聚类技术依赖于结果和降维技术的选择;
      3)数据的许多维度彼此之间可能是不相关的,并且可以在有噪声的数据中屏蔽现有的聚类;
      4)一种常见的技术是执行特征选择,但是在某些情况下,识别冗余维度是不容易的。

    2. 是什么
      子空间聚类是一种在不同子空间发现聚类的技术。
      基本的假设是,我们可以找到只由维度子集定义的有效聚类。
      子空间聚类算法拓展了特征选择的任务,尝试对相同数据的不同子空间上发现聚类;比如对于n个三维的数据,维度分别为abc,当在三维空间中无法区分数据时,可以找到其子空间,假如是ac将其分开,则能够在此子空间下容易地识别类。

    展开全文
  • 高维数据下的子空间聚类算法研究,博士论文 博士论文
  • 针对传统距离度量在高维数据上效果不明显问题,提出一种共享最近邻子空间聚类算法(SNN_SC),按照维把数据集转变为多个最近邻事务数据库,挖掘事务数据库中最大共现对象集,即一维上聚类。在一维聚类集上进一步挖掘...
  • SUBCLU高维子空间聚类算法在自底向上搜索最大兴趣子空间类的过程中不断迭代产生中间类,这些中间类的产生消耗了大量时间,针对这一问题,提出改进算法BDFS-SUBCLU,采用一种带回溯的深度优先搜索策略来挖掘最大兴趣...
  • 该算法首先利用抗原软子空间聚类计算出不同种类抗原的各个关键特征及其权值,然后通过这些关键特征引导检测器生成以有效地减少冗余特征的影响,从而提高算法检测性能。实验结果表明,在BCW与KDDCup数据集上,相对于...
  • 子空间聚类能在高维空间挖掘隐藏在不同低维子空间中的簇类,能在分类的基础上有效降维。针对目前入侵检测实时性和准确性的要求,提出子空间聚类ASCOD算法,该算法内嵌离群点扫描处理,能动态计算最优的算法参数,将...
  • 针对不确定数据流上的聚类问题提出一种不确定数据流子空间聚类算法UDSSC。该算法使用滑动窗口机制接收新到达的数据,剔除陈旧的数据;还引入子空间簇生成策略和新型离群点机制;系统建立了三个缓冲区分别存储新到来...
  • 约束的子空间聚类

    2017-12-19 11:31:27
    零散的记录一些相关知识

    零散的记录一些相关知识


    漫谈 Clustering (4): Spectral Clustering,谱聚类
    http://blog.pluskid.org/?p=287

    邻接矩阵
    https://zh.wikipedia.org/wiki/%E9%82%BB%E6%8E%A5%E7%9F%A9%E9%98%B5


    展开全文
  • 在低秩表示算法的基础上,提出了一个新模型。新模型构建了揭示数据内在特征联系的亲和度图以实现聚类任务。首先,根据矩阵分解原理对...与现存的子空间算法相比,非负局部约束低秩子空间算法在聚类效果上有明显的提升。
  • 针对特征权重自调节软子空间聚类(soft subspace clustering with feature weight self-adjustment mechanism,SC-FWSA)算法使用欧氏距离,存在对数据适应性较差的问题,将SC-FWSA算法中的欧氏距离拓展为闵科夫斯基...
  • 结合传统的Parzen窗方法并引入一种更加合理的历史数据丢弃策略,在此基础上,通过计算可以得到整个数据集在低维空间投影的信息熵,利用信息熵实现了一种适用于高维数据流的子空间聚类算法(PStream)。理论及实验均...
  • 子空间聚类算法之PROCLUS

    千次阅读 2019-08-29 10:50:23
    PROCLUS算法简介算法来源新的改变功能快捷键合理的创建标题,有助于目录的生成如何改变文本的样式插入链接与图片如何插入一段漂亮的代码片生成一个适合你的列表创建一个表格设定内容居中、居左、居右SmartyPants创建...

    PROCLUS算法

    PROCLUS是由Aggarwal等人在1999年提出的一种子空间聚类算法。原文是《Fast Algorithms for Projected Clustering》,在ACM数据库可以进行下载。

    算法总体介绍

    PROCLUS是基于投影的子空间聚类算法,搜索策略为自顶向下。算法基于中心点思想,适合球形簇数据集,采用曼哈顿距离度量对象的相似性。

    算法一共分为以下三个阶段:

    1. 初始阶段 ,选择中心点超集;
    2. 迭代阶段,确定每一个中心点的特征维度,通过对聚类结果进行分析,并不断迭代替换差的中心点,得到最优中心点集;
    3. 优化阶段,对中心点维度进行优化,改善聚类质量;

    初始阶段

    输入:数据集合DD,簇个数KK,常数AA,常数BB
    输出:中心点集MCMC

    1. 从数据集中随机选择AKA*KAA是常数)个数据构成初始中心点超集MCMC'
    2. 使用贪心算法从MCMC'中选择大小为BKB*KBB为常数,且B<AB<A)的中心点集MCMC
      2.1 初始化MCMC为空集
      2.2 从MCMC'中随机选择一个样本mm加入MCMC(同时将mmMCMC’中移除)
      2.3 计算MCMC'中每个点与MCMC中离该点最近的点的距离disdis,选择disdis最大的点nn,将nn加入MCMC中(同时将nnMCMC’中移除)
      2.4 重复2.3直到MCMC中样本点数为BKB*K

    迭代阶段

    输入:数据集DD(大小为NN),中心点集MCMC,簇平均维度LL,簇个数KK
    输出:最终的中心点集MMMCMC中每个中心点对应的维度

    1. MCMC中选择一个样本ii
    2. 计算MCMC中其他样本点与m的最小距离imindisti_{mindist}(曼哈顿距离)
    3. 计算数据集中i局部近邻点集合ineighbori_{neighbor}(数据集DD中离ii的曼哈顿距离小于imindisti_{mindist}的样本点即为i的局部近邻点)
    4. 计算ineighbori_{neighbor}ii在每个特征维度的平均距离XijX_{ij}(i表示中心点,jj表示对应维度),计算所有维度维度均值YiY_i
    5. 计算Xij的标准差σi=j=1d(XijYi)2d1σ_i=\sqrt {\frac{\sum_{j=1}^{d} {(X_{ij}-Y_i)}^2}{d-1}}
    6. 对于每个特征维度计算Zij=XijYiσiZ_{ij}=\frac{X_{ij}-Y_i}{σ_i},对ZijZ_{ij}进行排序,选取ZijZ_{ij}最小的KLK*L(最小有两维特征)个特征对应的维度,作为候选中心点mm的子空间
    7. 重复1~6,为MCMC中所有中心点找到对应子空间
    8. MCMC中选择KK个中心点,通过计算数据集中其他样本点与中心点在中心点对应的子空间的曼哈顿截断距离(Manhattan segmental distance),进行样本点的分配,使用MC中其他中心点替换掉MbadM_{bad}(在聚类过长中分配到的数据点个数小于NKC\frac{N}{K}*C,C是一个常数,一般设为0.1)中心点

    曼哈顿截断距离:
    dD(x1,x2)=iDX1,iX2,iDd_D(x_1,x_2)=\frac{\sum_{i\in{D}}|X_{1,i}-X_{2,i}|}{|D|}(DD表示中心点对应的子空间)

    优化阶段

    输入:最优的中心点集M,迭代阶段最后得到的簇分配结果{Ci,C2....Ck}\lbrace C_i,C_2....C_k\rbrace
    输出:聚类结果

    1. 丢弃MM中每个中心点都包含的维度
    2. 使用迭代阶段的方法进行子空间选择,但是与迭代阶段不同的是,使用的不是局部近邻点而是迭代阶段输出的每个中心点的聚类结果
    3. M中的中心点会得到新子空间,基于新的子空间进行数据的重新分配

    参考文献

    [1]Aggarwal C C , Wolf J L , Yu P S , et al. Fast Algorithms for Projected Clustering[J]. Sigmod, 1999, 28(2):61-72.

    展开全文
  • 高维分类属性的子空间聚类算法,王新艳,,高维分类数据的处理一直是数据挖掘研究所面临的巨大挑战。传统聚类算法主要针对低维连续性数据的聚类,难以处理高维分类属性数据
  • 针对二元数据空间高维稀疏性的特点而提出的有限混合伯努利模型,能够快速寻找映射簇的模型框架;EM算法是数学模型进行参数迭代的重要方法,其算法的优劣很大程度上取决于其初始参数。对于运用EM算法来实现有限混合...
  • 基于网络的方法:这类方法的原理就是将数据空间划分为网格单元,将数据对象集映射到网格单元中,并计算每个单元的密度。根据预设的 密度阈值 判断每个网格单元是否为 高密度单元,由邻近的稠密单元组形成 “类”(簇...
  • 高位数据聚类存在两个问题: 高纬数据在距离计算上,任意两点的距离都可能极为相近,导致难以将相似点和不相似点区分出来; 高纬数据集的簇可能存在于不同的维度集合里。 二、 文章的灵感 维数约减现状:PCA、...

空空如也

1 2 3 4 5 ... 10
收藏数 183
精华内容 73
关键字:

子空间聚类