精华内容
下载资源
问答
  • 该mfeat数据集主要用于多视图聚类算法研究,其中已经有标签,可以用于对最终聚类算法分出来的类簇进行评估。
  • 在某些实际应用中,经常采用多种测量方法来提取数据的个特征组,从而产生多视图数据。... 使用六个真实世界的多视图数据集来评估该方法,实验结果表明,根据三个性能评估指标,SPEA2明显优于其他MOEA。
  • 最新技术(SOTA)的集合,新颖的多视图聚类方法(论文,代码和数据集) 我们期待其他参与者分享他们的论文和代码。 如果有兴趣,请联系 。 目录 重要调查文件 视角学习论文调查 基于图的多视图聚类系统研究纸代码...
  • 多视图聚类综述

    2021-11-22 20:53:05
    1.Consensus One-step Multi-view Subspace Clustering(2020) 解决问题:虽然上述子空间方法已经...它们很少充分利用信息量更大的多视图划分信息来改进聚类结果。ii)以前的方法通常以两步方式进行,这意味着学习到

    多视图聚类方法分类:

    区分方法(基于相似性)的方法: 

    MVC的目的是将N个主体分成K个类别,最终我们会得到一个成员矩阵H∈(N×K),它会指示哪一个主题是在同一个簇而其他主体是在其他簇。H的每一行的元素之和应该是1,这样可以确保每一行的等可能性。

    A.公共向量矩阵(多视图谱聚类)

           谱聚类的关键在于图的拉普拉斯构造,得到的特征向量反映了数据的分组结构,这组MVC方法通过假设所有视图共享相同或相似的特征向量矩阵来保证得到共同的聚类结果。有两种代表性的方法:联合训练谱聚类(co-training approach for multi-view spectral clustering)和联合正则化谱聚类(“Co-regularized multi-view spectral clustering)。

    1)谱聚类:利用图的拉普拉斯性质,其中图的边表示数据点之间的相似性,并解决图上归一化最小割的松弛问题。与其他广泛使用的方法(如仅适用于球形聚类的kmeans)相比,谱聚类可以应用于任意形状的聚类,并表现出良好的性能。目标函数如下:

    矩阵U的行是数据点的嵌入,可以被用来当作kmeans的输入。 

    关于谱聚类的具体操作可以去搜其他博客,这里只做简要介绍。

    2)协同训练多视图谱聚类:对于半监督学习,当标记和未标记的数据都可用时,两个视图的联合训练是一种广泛认可的想法。它假设在两个视图中构建的预测模型将很可能导致同一样本的相同标签。有两个主要假设可以保证共同训练的成功:(1)充分性:每个视图本身足以进行样本分类,(2)条件独立性:给定类标签,视图是条件独立的。在原始联合训练算法(Combining labeled and unlabeled data with co-training)中,使用标记数据在每个视图中训练两个初始预测函数F1和F2,然后重复执行以下步骤:将F1预测的最有把握的示例添加到标记集TrainF2,反之亦然,然后在放大的标记数据集上重新训练F1和F2。可以看出,经过多次迭代后,F1和F2将在标签上彼此一致。

    3)共正则化多视角谱聚类:共正则化是半监督多视图学习中的一种有效技术。协同正则化的核心思想是最小化作为目标函数一部分的两个视图的预测函数之间的差异。然而,在无监督学习类聚类中不存在预测函数,那么如何在聚类问题中实现协同正则化思想呢?联合正则化多视图谱聚类(Co-regularized multi-view spectral clustering)采用了图拉普拉斯算子的特征向量,在半监督模式下扮演类似于预测函数的角色。

         第一种共正则化方法:

    这个方法在不完整多视图聚类中有用到,这篇论文:《 Incomplete Multiview Spectral Clustering With Adaptive Graph Learning》

            第二种称为基于质心的联合正则化,通过将每个视图的特征向量矩阵正则化为一个共同一致的特征向量矩阵,从而使每个视图的特征向量相似。提出了相应的优化问题:

    与两两正则化算法相比,基于质心的多视图聚类算法不需要将得到的所有视图的特征向量矩阵进行组合,就可以运行kmeans算法,然而,基于质心的方法有一个潜在的缺点:噪声视图可能会影响最佳特征向量,因为它取决于所有视图。 

    Cai等人(Heterogeneous image feature integration via multi-modal spectral clustering)在视图中使用公共指示矩阵来执行多视图谱聚类,并推导出类似于基于质心的共正则化方法的公式。在每一个视图的特征向量矩阵和公共特征向量矩阵之间的不一致性判别为:

    优化问题定义如下:

    与一般的谱聚类不同,一般谱聚类先得到特征向量矩阵,然后再运行聚类(如对初始化条件敏感的k均值)来分配聚类,cai等人直接求解最终的聚类指示矩阵,因此对初始条件更具有鲁棒性。 

    4)其他: 除了上述两种具有代表性的多视图谱聚类方法外,wang等人(Multi-objective multi-view spectral clustering via pareto optimization)在视图间强制执行一个公共特征向量矩阵,并制定一个multi-objective问题,然后使用Pareto优化。


    B.公共系数矩阵(主要是多视图子空间聚类)

    在许多实际应用中,即使给定的数据是高维的,问题的内在维数往往很低。例如,给定图像中的像素数可能很大,但仅使用少数参数来描述场景的外观、几何体和动力学。这推动了寻找底层低维子空间的发展。实际上,数据可以从多个子空间中采样。子空间聚类(A tutorial on subspace clustering)是找到底层子空间,然后根据已识别的子空间正确聚类数据点的技术。

    1)子空间聚类:子空间聚类使用数据样本的自表达特性[Sparse subspace clustering: Algorithm, theory, and applications,],即,每个样本都可以由少数其他数据样本的线性组合表示。经典的子空间聚类公式如下所示:

          Z即是子空间系数矩阵(表示矩阵),可以写作以下优化问题:

    在得到子空间表示Z后,可以构造出相似矩阵W,然后进一步构造出拉普拉斯矩阵,接着执行谱聚类得到最终的聚类结果。

    2)多视图子空间聚类: 当有多视图信息的时候,每个视图的子空间表示Z(v)可以从每个视图中获得,Yin等人(Multi-view clustering via pairwise sparse subspace representation)通过强制每对视图的系数矩阵尽可能相似来共享公共系数矩阵,优化问题如下:

     其中是基于成对共正则化约束的l1范数,能够减轻噪声影响。


    C.公共指示矩阵(主要是多视图非负矩阵分解) 

    1)非负矩阵分解(NMF):目的是找到两个非负的矩阵U和V,它们的积能很好地近似于X,由于非负约束,NMF的一个特性是可以学习part-based的表示。

    2)基于NMF的多视图聚类:为了在NMF框架中组合多视图信息,Akata等人(Non-negative matrix factorization in multimodality data for segmentation and label prediction)在不同视图之间的NMF中强制执行一个公共指示矩阵,以执行多视图聚类。然而,指示矩阵V(v)在相同规模上可能没有可比性。为了使不同视图中的聚类解决方案保持有意义和可比性,Liu等人(Multi-view clustering via joint nonnegative matrix factorization)实施了一个约束,将每个视图相关的指示矩阵推向一个共同的指示矩阵,这导致了另一个受NMF和概率潜在语义分析之间联系启发的规范化约束,最终优化问题的公式为:

     即是保证比较的合理性约束,在获得了共识矩阵V*之后,每一个数据点的簇标签都可以通过计算出来。

    3)多视图k-means:通过引入指示矩阵H,可以使用NMF来制定k-均值聚类方法。k-means聚类的NMF公式是:

     其中G∈R(d×K)的列给出簇的质心。为了处理大规模多视图数据,Cai等人(Multi-view k-means clustering on big data)提出了一种多视图kmeans聚类方法,通过在不同视图之间采用公共指示矩阵,优化问题如下:

    通过学习不同视图的权重α,在多视图聚类过程中,重要视图将获得较大的权重

    4)其他 :如前所述,在子空间聚类中通常有两个步骤:找到子空间表示,然后在根据子空间表示计算出的图Laplacian上运行谱聚类。为了从不同的视图中识别一致的聚类,Gao等人[Multi-view subspace clustering]将这两个步骤合并到子空间聚类中,并在不同的视图中实施了一个通用的指标矩阵。公式如下所示:

     H是公共指示矩阵,该矩阵指示所有视图的唯一群集分配。尽管这种多视图子空间聚类方法基于子空间聚类,但它不强制使用公共系数矩阵Z,而是为不同的视图使用公共指示矩阵。因此,我们将其归类为这一类。

     Wang等人[Multi-view clustering and feature learning via structured sparsity]通过一个公共指标矩阵集成多视图信息,并通过以下公式为不同的数据集群同时选择特征:

     在[Double constrained nmf for partial multi-view clustering]中,采用了矩阵分解方法来协调各个视图产生的聚类。具体地说,创建一个包含每个单独视图的分区指示的矩阵,然后将其分解为两个矩阵:一个显示单个groupings对最终多视图集群的贡献,称为元集群,另一个显示实例对元集群的分配。Tang等人[Clustering with multiple graphs]将多视图聚类视为具有多个图的聚类,每个图通过两个因子的矩阵分解进行近似:一个特定于图的因子和一个所有图共有的因子。Qian等人[Double constrained nmf for partial multi-view clustering]要求每个视图的指示矩阵尽可能接近公共指示矩阵,并采用拉普拉斯正则化来同时保持视图的潜在几何结构。

    除了使用通用指示矩阵外,[Multiple incomplete views clustering via weighted nonnegative matrix factorization with l21 regularization]、[Weighted multi-view clustering with feature selection]、[Online multi-view clustering with incomplete views]还引入了一个权重矩阵来指示是否存在缺失条目,以便它能够解决缺失值问题。多视图自定步长聚类方法[Multi-view self-paced learning for clustering]考虑了样本和视图的复杂性,以缓解局部极小值问题。Tao等人[From ensemble clustering to multi-view clustering]实施了一个公共指标矩阵,并以集成的方式在所有视图中寻求共识聚类。另一种利用公共指标矩阵组合多个视图的方法[Discriminatively embedded k-means for multi-view clustering]采用了线性判别分析思想,并自动对不同视图进行加权。对于基于图形的聚类方法,首先获得每个视图的相似性矩阵,Nie等人[Self-weighted multiview clustering with multiple graphs]假设一个公共指标矩阵,然后通过最小化公共指标矩阵和每个相似性矩阵之间的差异来解决问题。

    D.直接组合(主要是基于多内核的多视图聚类):除了在不同视图之间共享某些结构的方法外,通过内核进行直接视图组合是执行多视图聚类的另一种常见方法。一种自然的方法是为每个视图定义一个内核,然后将这些内核组合成凸组合[Composite kernels for hypertext categorisation][Linear prediction models with graph regularization for web-page categorization][Multi-kernel maximum entropy discrimination for multi-view learning]

    因为我对这块不是很感兴趣,所以只做列举

    1)核函数和核组合方法:

    组合多个内核的方法:

    2)核kmeans和谱聚类: 

     3)基于多核的多视图聚类

    4)其他:除了基于多内核的多视图聚类外,还有一些其他方法使用特征的直接组合来执行多视图聚类,如[Discriminatively embedded k-means for multi-view clustering],[Fusion of similarity data in clustering]。在[Tw-k-means: Automated two-level variable weighting clustering algorithm for multiview data]中,为多视图数据的聚类算法分配了两级权重:视图权重和变量权重,以确定相应视图和变量的重要性。为了将模糊聚类方法扩展到多视图聚类,在[Cofkm: a centralized method for multiple-view clustering]和[Optimized data fusion for kernel k-means clustering]中分别对每个视图进行加权,并获得模糊c-均值和模糊k-均值的多视图版本。


     E.投影后的组合(主要是基于CCA的多视图聚类):

     对于所有视图都具有相同数据类型(如“分类”或“连续”)的多视图数据,直接将它们组合在一起是合理的。然而,在实际应用中,多个表示可能具有不同的数据类型,很难直接比较它们。例如,在生物信息学中,基因信息可以是一个视图,而临床症状可以是患者聚类分析的另一个视图[Multi-view sparse co-clustering via proximal alternating linearized minimization]。显然,这些信息不能直接组合。此外,高维度和噪声也很难处理。为了解决上述问题,介绍了最后一种重要的组合方式:投影后组合。最常用的技术是典型相关分析(CCA)和核心版本的CCA(KCCA)。

    1)CCA和KCCA

    2)基于CCA的多视图聚类

     对于至少有一个完整视图的多视图数据(该视图的特征可用于所有数据点),Anusua等人[Muliview clusterting with incomplete views]借用了拉普拉斯正则化的思想来完成不完整的核矩阵,然后应用KCCA进行多视图聚类。在多视图聚类的另一种方法中,多模式矩阵A(v)∈R(N×Kv),v=1,2,···,其中每一个K对应于一个视图,然后应学习一致模式矩阵以尽可能逼近每个视图的模式矩阵。然而,由于无监督的特性,模式矩阵通常不能直接进行比较。使用CCA公式(29),Long等人[A general model for multiple view unsupervised learning]首先投影一个视图的模式矩阵,然后再与另一个视图的模式矩阵进行比较。

     同样的想法也可以用来解决不完整视图问题(即,没有完整视图)。例如,如果只有两个视图,[Partial multi-view clustering]、[Incomplete multi-view clustering via subspace learning]中的方法将数据分成两个视图的数据部分和只有一个视图的数据部分,然后投影每个视图的数据矩阵,使其接近最终指示矩阵。多视图信息由公共指示矩阵连接,该矩阵对应于两个视图的投影数据。Wang等人[Multi-view clustering with extreme learning machine]提供了一种使用极限学习机的多视图聚类方法,该方法将归一化特征空间映射到更高维的特征空间。

    展开全文
  • 多视图聚类总结

    千次阅读 2021-04-08 17:15:17
    多视图数据的上下文,每个视图都足以完成特定的知识发现任务。然而,不同的视图通常包含相互补充的信息。例如,在图像处理领域,每幅图像都由不同类型的特征来描述,如lbp、sift和hog,其中lbp是一种强大的纹理...

    原文地址:https://www.cnblogs.com/infinite-h/p/13401550.html

    作者:infinite_h

     

    MVC的两个重要原则,即互补原则和共识原则。

    互补原则:该原则规定,为了更全面、更准确地描述数据对象,应该使用多个视图。在多视图数据的上下文,每个视图都足以完成特定的知识发现任务。然而,不同的视图通常包含相互补充的信息。例如,在图像处理领域,每幅图像都由不同类型的特征来描述,如lbp、sift和hog,其中lbp是一种强大的纹理特征,sift对图像的光照、噪声和旋转具有鲁棒性,而hog对边缘信息敏感。因此,有必要利用这些相互补充的信息来描述这些数据对象,并对内部集群提供更深入的见解。

    共识原则:这一原则旨在最大限度地保持多个不同观点的一致性。

     

    Co-training style algorithms

    在多视角共识的基础上,产生了协同训练式算法。这类方法旨在最大限度地在所有观点上达成共识,并达成最广泛的共识。使用交替训练算法,通过使用先验信息或相互学习知识,最大限度地提高不同视图的一致性。

    注意,协同训练的成功主要取决于三个假设:

    (1)充分性:每个视图本身就足以完成学习任务;

    (2)兼容性:目标函数导出对两个视图中同时出现的高概率特征的相同预测;

    (3)条件独立性:所有视图都提供学习标签:有条件独立。

    然而,在实践中,通常很难满足条件独立性假设。

     

     

     协同训练的一般过程

    Multi-kernel learning

    为了提高线性核、多项式核和高斯核等可能的核函数的搜索空间容量,最初开发了多核学习,以实现良好的泛化。由于多核学习的内核自然对应不同的视图,因此多核学习在处理多视图数据方面得到了广泛的应用。多核学习方法的一般过程如图4所示,其中不同的预定义内核用于处理不同的视图。然后将这些核线性地或非线性地组合在一起,得到一个统一的核。在MVC环境下,基于多核学习的MVC为了提高聚类性能,打算对一组预先定义的内核进行优化组合。在这种方法中,一个重要的问题是找到一种选择合适的内核函数的方法,并将这些内核进行优化组合。

     

     

     多核学习的一般过程

    Graph-based MvC

     

     

     基于图聚类的一般过程

    Network-based MvC

    大多数基于图的MVC方法通常都假定同一组数据对象可用于不同的视图。因此,不同视图中数据对象之间的关系是一对一的关系。然而,在许多现实生活应用中,如社会网络、文献引用网络和生物交互网络,数据是从不同的领域收集的,一个领域中的一个对象可能对应于另一个领域中的多个对象,从而导致许多映射关系。用网络而不是图来表示这些关系可能更合适。这是区分基于网络的MVC和基于图形的MVC的主要原因。

    Spectral-based MvC

    谱聚类是一种典型的数据聚类模型。其基本思想是在任意一对对象之间形成一个成对的亲和矩阵,将该亲和矩阵归一化,并计算该归一化亲和矩阵(即图拉普拉斯)的特征向量。结果表明,归一化图拉普拉斯的第二特征向量是二元向量解的松弛。

     

     

     多视图子空间聚类的一般过程

    Multi-task multi-view clustering

    MVC利用不同视图之间的一致性和互补性来实现更好的集群质量,如上所述。另一个概念,即多任务聚类(属于多任务学习领域),共同执行多个相关任务,并利用这些任务之间的关系来增强单视图数据的聚类性能。通过继承MVC和多任务集群的特性,多任务多视图聚类将每个视图数据处理为一个或多个任务,如下图所示。近年来,这一点受到了一些关注。 其主要挑战包括找到一种方法来对每个视图上的任务内(在任务内)集群进行建模,以及一种利用多任务和多视图关系的方法,同时将任务间(在任务之间)的知识相互转移。

     

     

     多任务聚类模型的图形表示

     

    Publically Available Datasets

    3Sources Dataset:一个多视图文本语料库,由三个在线新闻服务的新闻文章构成。该存储库还包含多视图Twitter数据集、用于社交网络发现的Twitter数据集以及BBC和BBCSport数据集,这两个数据集是源自BBC新闻的合成文本数据集。

    WebKb Datasets:这些数据集包含从四所大学的计算机科学系收集的网页数据,即四个多视图数据集。

    Newsgroup Datasets:数据集有3个不同的预处理子集。此外,该存储库还具有Reuters多语言数据集、CORA数据集、Citeseer数据集、Movies617数据集和Mini WEKB数据集。

    Wikipedia Article Dataset:收集的数据集是从维基百科的特色文章集中选择的部分。它们有完整的或小的版本。

    Handwritten Digit Dataset:它包括来自UCI存储库的手写数字(0-9)的特征。

    100leaves Dataset:包含16种不同的植物叶片,每种都有100个样本。对于每个样本,给出了形状描述符、细比例边界和纹理直方图。

    Corel Images Dataset:此数据集由从COREL图像集合中提取的图像功能组成。它提供四组特征,即颜色直方图、颜色直方图布局、颜色矩和共现纹理。

    NUS-WIDE Dataset:从这些图像中提取的具有六种低级特征的Web图像数据集。

    YouTube Video Dataset:此数据集包含大约1.2105个实例,其中每个实例由13种类型的功能描述,并且还具有类信息。

    展开全文
  • 多视图聚类(Multi-View Clustering,MVC)由于对实词数据视图探索的效率而受到了学者和基于此的研究的广泛关注,并取得了重大进展。 但是,具有大量补充信息的视图数据容易受到各种因素(例如噪声)的影响。 ...
  • 1.《基于稀疏表示和自适应加权合作学习》 paper:Multi-view subspace clustering with intactness-aware similarity (Junpeng Tan a , Zhijing Yang a , ∗, ...CL动机:对每个视图进行协作训练,以获得包含.

    1.《基于稀疏表示和自适应加权合作学习》

    paper:Multi-view subspace clustering with intactness-aware similarity

    (Junpeng Tan a , Zhijing Yang a , ∗, Yongqiang Cheng b , Jielin Ye a , Bing Wang b , Qingyun Dai c )2021

     引言:

    非负矩阵存在局限:丢弃一些有用的negative信息。

    CL动机:对每个视图进行协作训练,以获得包含每个视图的多样性信息的全局矩阵,可以充分利用视图之间的多样性信息,还有实现视图之间的互补性。

    现存方法问题:1.在原始数据的SR中,NMF需要非负输入数据和基矩阵上的非负约束,这导致在分解过程中过滤掉负输入数据中包含的一些有用信息;2.它缺乏提取视图特定信息的有效方法。现有的方法很难获得最优的内部结构特征,因为数据往往包含一些冗余噪声;3.独立使用SR、自适应图学习(AGL)或CL不能充分考虑视图的多样性和视图之间的全局性。

    本文贡献:1.提出了一种独特的稀疏矩阵分解方法,放松了NMF基矩阵的非负约束,使矩阵分解得到的稀疏矩阵包含更多有用信息;2.采用直接导数法对基矩阵和稀疏矩阵进行有效优化。因此,它增加了样本之间的相似性鉴别,同时,对SR的系数矩阵提出了二次处理;3.提出了一种新的两步算法来同时解决视图特定信息的学习和融合问题。首先,我们应用AGL优化相似矩阵,并通过组合流形学习对每个视图的内部结构特征进行预处理。AGL和SR的集成可以提取每个视图的特定信息。在此基础上,提出了一种AWCL融合方法来有效融合视图的分集信息。通过自适应加权方法学习全局矩阵进行融合,获得不同视图的特定信息。为了形成完整的全局矩阵数据结构,对全局矩阵进一步应用流形学习。

     方法

    第一项是稀疏的模型表示,可以移除多余的信息,第二项是流形表示,保存内部结构信息

     连续优化过程获得最佳稀疏矩阵和最优相似度矩阵

     其中,fi(v)是拉普拉斯矩阵L(v)的第i个特征向量,第三和第四项是相似度矩阵的自适应学习

     自适应加权协作学习

    其中,Y'是拉普拉斯矩阵Lstar为了全局矩阵)的特征向量矩阵 ,加入矩阵正则化约束:

    算法: 

      


     2.《潜在嵌入空间》

    解决问题:1.以前方法通常依赖于每个视图中的原始特征,但仍然缺乏发现多视图数据的统一表征表示的能力。2.在谱聚类阶段,它们大多倾向于考虑谱聚类的两个分量。(即,亲和矩阵构造和聚类指标矩阵计算)分别进行,但通常缺乏在优化框架中同时表述这两个组件的能力。

    针对上述局限性,本文提出了一种统一的潜在嵌入空间多视图聚类框架(MCLES)。该方法在统一的模型中联合学习潜在嵌入表示、相似信息和聚类指标矩阵。从多视图特征中学习到的潜在嵌入空间能够探索这些关系在不同的样本之间,避免可能的损坏以及维度限制。利用自表达的思想,基于学习到的潜在嵌入表示而非数据的原始特征构造相似矩阵。此外,聚类指标矩阵直接学习,无需额外的谱聚类过程。

    全局相似度学习

    与LLE相似,根据自表达特性,每个数据点都可以由其他数据点的线性组合表示

    其中,S是相似度矩阵(权重) 

    方法

    启发:假设多个视图来自一个潜在表示,该潜在表示从本质上描述了数据,并发现了不同视图之间共享的潜在结构,我们的方法旨在为每个数据点发现一个共享的潜在嵌入表示hi,这样所有这些不同的视图都是从潜在嵌入空间H中提取的。

    求解以下问题得到H:

    其中W是映射模型, 在W上的约束是为了避免H在缩放时过小。

    与以往方法从原始数据中学习相似度矩阵相比,该方法从潜在嵌入空间学习相似矩阵,有效提高了学习相似矩阵的鲁棒性和准确性,根据全局亲和性学习:

     理想情况下,S是一个准确的具有c个连通特性的块对角矩阵。然而4的求解可能并不尽如人意,因此我们需要加入秩约束:

    整体目标函数:

    为了便于求解,将秩约束变成正则化因子放入函数中:

    最终: 

     实验

    数据集:MSRCv1:210样本,7类,4个视图

    结果:0.8810   0.7943  0.8810

    展开全文
  • https://github.com/yeqinglee/mvdata/blob/master/README.md ps:感动,找了一下午,都要找吐了,终于找到了想要的数据集,开心,结合论文一起使用效果更佳,嘻嘻嘻

    https://github.com/yeqinglee/mvdata/blob/master/README.md

    ps:感动,找了一下午,都要找吐了,终于找到了想要的数据集,开心,结合论文一起使用效果更佳,嘻嘻嘻

    展开全文
  • 这里面是机器学习里面聚类所需的数据集,分为人工的二维数据集,如月牙形,双螺旋型等,和UCI真实数据集,是我搜集好久才弄出来的,有一些二维数据集是自己生成的,提供给大家做算法实验。
  • 论文作者:邓强,杨燕,王浩 ...基于视图K-means算法和聚类集成技术,提出了一种改进的多视图聚类集成算法,其提高了聚类的准确性、鲁棒性和稳定性。 结合分布式处理技术,实现了一种分布式的视图并行聚类算法...
  • 我们提供了视图Caltech101数据集,可以从下载。 引文: 如果您发现我们的方法对您的研究有用,请考虑引用: 张铮,刘力,沉富民,沉恒涛和邵玲,``二进制多视图聚类'',《 IEEE模式分析和机器智能交易》(T-PAMI)...
  • 1.摘要关键词:寻求恢复缺失视图,并探索这种恢复的视图和可用视图的全部信息用于数据聚类。将基于特征空间的缺失视图推断和基于流形空间的相似图学习结合到一个统一的框架中。引入了低秩张量约束来捕获多视图的高阶...
  • 主题建模是用于发现文档和图像中基础结构或隐藏结构的强大工具。 用于主题建模的典型算法... 在现实世界中的多视图数据集上的实验结果证明了我们方法的有效性。 :copyright:瑞士施普林格国际出版社(2015)(14参考)
  • 本文方法的目标是通过限制标签空间的多样性和一致性来学习多视图聚类的最优标签矩阵。首先将聚类标签松弛为一致性和多样性部分,然后将其集成到基于视图k-means矩阵分解的模型中,数学公式为 本文方法约束了...
  • 为了完整性,学习潜在的多视图表示的任务通过模拟数据传输被具体地转化为退化过程,从而可以隐含地实现不同视图之间的一致性和互补性之间的最佳折衷。我们的模型配备了对抗策略,可以稳定地估算缺失视图,将每个样本...
  • 多视图聚类与子空间聚类

    千次阅读 2019-06-16 21:57:45
    1、多视图聚类 从对事物的不同角度的理解生成个特征描述视图,而非单个视图,就是视图。 若对事物作单视图特征表示,则意味着,增加了特征空间的维度,且不同角度的特征合成同一视图,其特征可能失去原有的意义...
  • 第一项是用来捕获关于目标图g的结构信息通过挖掘数据的潜在流形结构(对于给定的一组图) 第二项是融合关于G的先验信息并且防止过拟合,D是一个约束项 改进difusion-fusion: k是最近邻的数量 添加L=n-c的...
  • 与现有的一些数据聚类或多视图聚类算法相比,提出的MRMF算法不易受到原始数据中噪声的影响,而且能够充分考虑到不同视图在聚类中所具有不同权重的问题,能够对视图数据进行较为准确的聚类。MRMF算法的有效性在一些...
  • 多视图聚类旨在综合利用视图数据中的一致信息和互补信息实现对数据的划分, 但各视图表征数据的能力参差不齐, 甚至有的视图可能含有大量的冗余和噪声信息, 不仅不能带来多样的信息, 反而影响聚类性能. 本文提出了...
  • matlab求倒数代码多视图聚类的互易多层子空间学习 这是 的 Matlab 实现。 联系人:李瑞煌() 纸 我们提出了一种通过构建互易多层子空间表示来分层识别高维数据的底层集群结构的方法。 基于重建,我们通过强制它接近...
  • 3.广义的局部多视图聚类 X = ?X(1), X(2),··· ,X(V)?, w h e r e X(v)= ? x(v) 1, x(v) 2,··· ,x(v) N ? ∈ RN×dv(v = 1,2,··· ,V), V is the number of views, N is the number of samples, and dvis ...
  • UCI数据集有好多种类,不知道选什么好,貌似Clustering和Classfication类别下的都可以?这两个类别有什么区别啊,感觉都是分类呀? 不是UCI上的也可以给我推荐一下,比较迷茫,最好是二维的数据。
  • l2范数matlab源码TETCI_UIMC ...在这个存储库中,我们实现了一种新方法不平衡不完全多视图聚类(UIMC)。 我们对四个真实世界的数据集进行了大量实验,实验结果表明 UIMC 优于其他最先进的聚类算法。 比较方法的代码
  • MVCSC 论文“自动加权多视图约束谱聚类”的源代码和综合数据集。 资料集 数据:合成; 约束:constraintssyn 跑 演示
  • 针对现有的单视图数据竞争聚类算法无法高效处理多视图数据的问题,提出了基于视图相关因子的多视图数据竞争聚类算法。...在人工和真实数据集上的仿真实验结果表明,新算法比现有的数据竞争聚类算法具有更高的聚类性能。
  • scene15数据集.zip

    2020-07-28 22:42:13
    进行图像场景识别是15类开源数据集,基于该数据集进行场景图像的分类和识别,里面包括MITcoast,MITforest,kitchen,bedroom,store等15种场景的图片,可以用来进行分类。
  • arnumber=8587123&tag=1 ...MVSC将图构造和低维表示学习集成到一个联合学习框架中,使其能够找到全局最优的聚类指标矩阵。通过交替求解所有变量,MVSC可以找到一致性表示F的局部最优值。然后,MV..
  • matlab代码FMR(用于子空间聚类的灵活多视图表示学习) 这是 的 Matlab 实现,发表于 IJCAI 2019。 联系人:李瑞煌() 纸 主要贡献包括: 我们建议通过鼓励它以加权的方式与不同的视图相似来构建一个潜在的表示,这...
  • 为了提升传统视图K-means算法在高维数据中的聚类性能,提出了一种鲁棒性大规模视图数据的自降维K...实验结果表明,在大规模视图数据集上,该算法比其他多视图聚类算法资源消耗更小,并且能够进行更为准确的聚类。
  • 本篇论文是一篇关于二进制的聚类文章,用于处理大规模的数据集。 1、首先对视数据进行哈希编码 本论文在第v个视图的数据中随机选取m个样本或者通过k-mean算法直接生成m个子簇中心amva_m^{v}amv​来表达这...

空空如也

空空如也

1 2 3 4 5 ... 20
收藏数 5,484
精华内容 2,193
关键字:

多视图聚类数据集