精华内容
下载资源
问答
  • k-means 算法是一种基于划分的聚类算法,它以 k 为参数,把 n 个数据对象分成 k 个簇,使簇内具有较高的相似度,而簇间的相似度较低。 1. 基本思想 k-means 算法是根据给定的 n 个数据对象的数据集,构建 k 个划分...
  • k-means聚类算法 k-means是发现给定数据集k个簇的算法,也就是将数据集聚合为k类的算法。 算法过程如下: 1)从N个文档随机选取K个文档作为质心 2)对剩余的每个文档测量其到每个质心的距离,并把它归到最近的质心...
  • K-means聚类算法 简介 聚类是一个将数据集中在某些方面相似的数据成员进行分类组织的过程,聚类就是一种发现这种内在结构的技术,聚类技术经常被称为无监督学习。 K均值聚类是最著名的划分聚类算法,由于简洁和效率...
  • 针对多聚类中心大数据集的加速K-means聚类算法.pdf
  • 随着数据量、数据维度呈指数发展以及实际应用中聚类中心个数的增多,传统的K-means聚类算法已经不能满足实际应用中的时间和内存要求。针对该问题提出了一种基于动态类中心调整和Elkan三角判定思想的加速K-means聚类...
  • k-means聚类算法及matlab代码 数据挖掘实验 实验一:相似度、距离、最近邻分类器 1、实验目的 (1)理解相似度、距离的度量方式。 (2)理解最近邻分类器的工作原理。 2、实验内容 (1)、实现任意给定两个相同维度...
  • K-means聚类算法

    2019-04-20 10:47:44
    它不仅是最简单的聚类算法,也是最普及且最常用的。k-means算法是一种基于形心的划分数据的方法。我们给定一个数据集DD,以及要划分的簇数kk,就能通过该算法将数据集划分为kk个簇。一般来说,每个数据项只能属于...
  • 本文为大家分享了Python机器学习之K-...算法大致流程为:(1)随机选取k个点作为种子点(这k个点不一定属于数据集);(2)分别计算每个数据点到k个种子点的距离,离哪个种子点最近,就属于哪类;(3)重新计算k个种子
  • 聚类 鸢尾花数据K-means 聚类和葡萄酒数据K-Medoids 聚类
  • 一、背景 1.项目描述 你拥有一个超市(Supermarket Mall)。通过会员卡,你用有一些关于你的客户的基本数据,如客户ID,年龄,性别,年收入和消费...Annual Income (k$) 年收入,单位为千美元 Spending Score (1-100)
  • k-means算法python3 聚类算法k-means的简单实现 文件使用介绍: 1.下载后缀为py的文件; 2.下载后缀为txt的数据集; 3.将数据集与代码放在同一目录中,便可运行。
  • 针对高维数据聚类中K-means算法无法有效抑制噪声特征、实现不规则形状聚类的缺点,提出一种基于目标点特征选择和去除的改进K-均值聚类算法.该算法使用闵可夫斯基规度作为评价距离进行目标点的分类,增设权重调节参数...
  • K-均值聚类算法研究

    2020-07-04 16:06:50
    K-均值聚类算法,是一种通过不断迭代调整聚类质心的算法,其特点是精度高,主要用于中小数据集的分类,但是聚类速度比较慢。因此,本文在分析了基于自组织特征映射网络聚类的学习过程,权系数自组织过程中邻域函数,以及...
  • 一种基于粗糙K-Means聚类算法.pdf
  • k-means聚类分析西瓜的密度与含糖率 第一部分:数据集 X表示二维矩阵数据,表示西瓜密度和含糖率 总共30行,每行两列数据 第一列表示西瓜密度:x1 第二列表示西瓜含糖率:x2 from sklearn.cluster import Birch # 从...
  • 将流形距离引入K-means聚类算法中,对于具有流形结构的数据集有很好的聚类效果,流形距离计算参数的设定充分考虑了全局和局部一致性。
  • 针对初始聚类中心对传统K-means算法聚类结果有较大影响的问题,提出一种依据样本点类内距离动态调整中心点类间距离的初始聚类中心选取方法,由此得到的初始聚类中心点尽可能分散且具代表性,能有效避免K-means算法...
  • k-means聚类算法及matlab代码用于单细胞RNA测序数据聚类的机器学习和统计方法 在两个数据集下几种scRNA-Seq聚类算法之间的比较: PBMC数据集 从[1]下载数据集,其中包含来自新鲜供体(捐献者A)的10个富集珠子的...
  • 缺点:可能收敛到局部最小值,在大规模数据集上收敛较慢 使用数据类型:数值型数据 算法思想 k-means算法实际上就是通过计算不同样本间的距离来判断他们的相近关系的,相近的就会放到同一个类别中去。 1.首先我们...
  • 数据集:Iris数据集 ...数据描述:Iris数据集包含150个鸢尾花模式样 本,其中 每个模式样本采用5维的特征描述 利用所学K-means聚类分析方法,对 Iris数据集进行聚类分析,并利用已知的样本类别标 签进行聚类分析评价
  • 这个资源是一个拥有完整代码与测试数据k-means算法文件,原始算法与改进算法于一个程序,通过选择不同的标签号来使用算法,能完整运行,效果很好,希望对大家有帮助!
  • 提出了一种新的多维序列模式挖掘算法,首先在序列信息中挖掘序列模式,然后针对每个序列模式,在包含此模式的所有元组中的多维信息中挖掘频繁1-项,由得到的频繁1-项开始,循环的由频繁(k-1)-项k>1)连接...
  • k - means聚类分析算法

    2018-06-21 10:41:41
    k - means聚类分析算法Python实现,并以鸢尾花数据集为例进行聚类演示
  • 机器学习算法示例 从零开始使用scikit-learn进行K-Means聚类 技术: Python 3; Jupyter笔记本。 执照 该项目根据MIT许可条款获得许可。
  • -means 聚类算法是一种有效的处理聚类边界模糊问题的算法, 但大多数算法对簇的下近似和边界 中的对象使用统一的权值, 忽略了簇内对象之间的差异性. 针对这一问题提出一种新的改进算法, 通过对簇内的每个 ...
  • k-means聚类

    2018-06-06 09:49:36
    K-means算法是硬聚类算法,是典型的基于原型的目标函数聚类方法的代表,它是数据点到原型的某种距离作为优化的目标函数,利用函数求极值的方法得到迭代运算的调整规则。K-means算法以欧式距离作为相似度测度,它是求...
  • 上述代码是利用python内置的k-means聚类算法对鸢尾花数据的聚类效果展示,注意在运行该代码时需要采用pip或者其他方式为自己的python安装sklearn以及iris扩展包,其中X = iris.data[:]表示我们采用了鸢尾花数据的四...
  • Fuzzy-means聚类算法

    2017-11-10 16:15:45
    基于鸢尾花数据集的Fuzzy-means聚类算法基于java的源代码(带可视化)。
  • 虽然数百聚类算法存在,非常简单的 K-means 及其变体仍然是最广泛的生物学家和从业者使用的基因聚类算法。 这个令人惊讶的事实可能归因于其特别易于实施和使用。 当微阵列数据归一化为零均值和单位范数时,使用归一...

空空如也

空空如也

1 2 3 4 5 ... 20
收藏数 25,549
精华内容 10,219
关键字:

k-means聚类算法数据集