精华内容
下载资源
问答
  • 最近邻差值法最近邻差值法最近邻差值法最近邻差值法最近邻差值法最近邻差值法最近邻差值法最近邻差值法最近邻差值法最近邻差值法最近邻差值法最近邻差值法最近邻差值法最近邻差值法最近邻差值法最近邻差值法最近邻...
  • 时空数据库查询与推理,本PPT介绍了空间数据库最近邻查询与反向最近邻查询
  • 近似最近邻搜索是一个基本问题,并且已经研究了几十年。 最近基于图的索引方法已经证明了它们的高效率,其主要思想是离线构造邻域图并从在线图的一些采样点开始执行贪婪搜索。 现有的大多数基于图的方法都集中于具有...
  • KNN即K最近邻,相关的知识内容可以参考 http://blog.csdn.net/luanpeng825485697/article/details/78796773 这里只讲述sklearn中如何使用KNN算法。 无监督最近邻 NearestNeighbors (最近邻)实现了 unsuperv....
       
    

    全栈工程师开发手册 (作者:栾鹏)

    python数据挖掘系列教程

    KNN即K最近邻,相关的知识内容可以参考
    http://blog.csdn.net/luanpeng825485697/article/details/78796773

    这里只讲述sklearn中如何使用KNN算法。

    无监督最近邻

    NearestNeighbors (最近邻)实现了 unsupervised nearest neighbors learning(无监督的最近邻学习)。 它为三种不同的最近邻算法提供统一的接口:BallTree, KDTree, 还有基于 sklearn.metrics.pairwise 的 brute-force 算法。算法的选择可通过关键字 ‘algorithm’ 来控制, 并必须是 [‘auto’, ‘ball_tree’, ‘kd_tree’, ‘brute’] 其中的一个。当默认值设置为 ‘auto’ 时,算法会尝试从训练数据中确定最佳方法。

    # ========无监督查找最近邻(常在聚类中使用
    展开全文
  • 自然最近邻

    2020-12-16 11:30:46
    自然最近邻

    在计算 k 最近邻的过程需要指定参数 k 的值,k 的取值对最近邻的计算结果有很大的影响,最近邻的个数和具体对象都有不确定性,这在实际应用当中效果也有很大的差别。与 k 最近邻和 ε-邻域最近邻不同的是,计算自然最近邻不需要指定参数,相对于计算 k 最近邻的每个对象都至少有 k 个最近邻,自然最近邻是一种无尺度的最近邻概念。求解自然最近邻是一个对数据集自适应的过程,当计算迭代收敛时,得到数据中每个对象的自然最近邻,自然最近邻能够反映数据集密集、稀疏等分布情况。

    一、自然最近邻概念

    给定包含 n 个对象的集合在这里插入图片描述,对于对象在这里插入图片描述,若有对象 在这里插入图片描述的最近邻路径经历在这里插入图片描述且当 S 中最离群的对象都有最近邻路径到达时,则称 在这里插入图片描述在这里插入图片描述的自然最近邻。

    二、自然最近邻形式化定义

    在 k 最近邻算法中, k 是需要设定的一个参数,往往对每个数据对象都设定为相同的 k 值。在自然最近邻中可以给出参数 k 值的一个自适应值。定义可能 k 值的上确界值为在这里插入图片描述在这里插入图片描述在这里插入图片描述,其中在这里插入图片描述表示数据点 y 的第 r 最近邻域。通过分析自然最近邻的形式化定义,求解自然最近邻本质上由两个过程组成,先选择每个数据对象的 k 个最近邻居,然后计算每个数据对象在其它对象的 k 最近邻域中出现的次数,按照这种出现次数可以得到每个数据对象的自然最近邻域。
    在这里插入图片描述
    根据自然最近邻的概念,要保证数据集中最离群的对象都有一条最近邻路径到达,此时形成的邻居关系为自然最近邻。在图 3.5 中,最离群的对象为 t,在求解自然最近邻的过程中,就要保证 t 有一条最近邻路径到达,而 t 是对象 r 的第 5个最近邻,所以当在这里插入图片描述
    时,图 3.5 中每个对象都有自然最近邻。自然最近邻强调的是一种稳定状态,保证数据集中最离群的对象都能成为其他对象的邻居,求解自然最近邻的形式可以有多种,表现为迭代终止条件有多种方式。

    来源文章:基于邻域的离群检测与聚类算法研究
    https://kns.cnki.net/kcms/detail/detail.aspx?dbcode=CDFD&dbname=CDFDLAST2018&filename=1018702049.nh&v=YNKl1u0HnMFO9liNJMnWmSxcBUWNAEn%25mmd2BVmEyxiCffRPBaaRYRR26V9LnJ9A8iIaV

    展开全文
  • 能够实现对一幅图像的最近邻、双线性、双三次三种插值
  • NEARESTNEIGHBORLINKER 根据最近邻点链接两个点列表。 target_indices = NEARESTNEIGHBORLINKER(source, target) 找到每个在“源”中指向“目标”中最近的点。 这 2 个输入必须是每行一个点的数组,并将它们的笛卡尔...
  • python实现K最近邻算法

    2020-09-20 20:16:58
    主要为大家详细介绍了python实现K最近邻算法,具有一定的参考价值,感兴趣的小伙伴们可以参考一下
  • 自然最近邻是一种新颖的最近邻概念,可以有效地避免K最近邻以及ε-最近邻方法需要人为设置参数的缺点。该算法构造相似度矩阵时依靠数据集自身的特性进行搜索,避免了参数选取不当以及离散点所带来的影响,更加真实地...
  • 最近邻检索(Nearest Neighbor Search)1.1 概述1.2 应用领域2. 最近邻检索的发展2.1 精确检索2.2 近似检索参考文献 1. 最近邻检索(Nearest Neighbor Search) 1.1 概述 最近邻检索就是根据数据的相似性,从...

    1. 最近邻检索(Nearest Neighbor Search)

    1.1 概述

    最近邻检索就是根据数据的相似性,从数据库中寻找与目标数据最相似的项目。这种相似性通常会被量化到空间上数据之间的距离,可以认为数据在空间中的距离越近,则数据之间的相似性越高。

    k最近邻(K-Nearest Neighbor,K-NN)检索:当需要查找离目标数据最近的前k个数据项时。

    最近邻检索是线性复杂度的,不能满足对于大规模数据检索的时间性能要求。

    1.2 应用领域

    1. 起初应用于文档检索系统,最近邻检索作为具有查找相似性文档信息的方法;
    2. 随后在地理信息系统中,最近邻检索也被广泛应用于位置信息,空间数据关系的查询、分析与统计;
    3. 如今在图像检索、数据压缩、模式识别以及机器学习等领域都有非常重要的作用。
    4. 在图像处理与检索的研究中,基于内容的图像检索方法(CBIR)是目前的主流。

    这里的“内容”是指:图像中包含的主要对象的几何形状、颜色强度、表面纹理等外在特性,以及前景与后景的对比程度等整体特征。这里的“内容”是指图像中包含的主要对象的几何形状、颜色强度、表面纹理等外在特性,以及前景与后景的对比程度等整体特征。

    图像的描述方式:局部特征描述子(SIFT、SURF、BRIEF) ,全局特征描述子(GIST),特征频率直方图,纹理信息,显著性区域等。

    最近邻检索的引入将图像检索转化到特征向量空间,通过查找与目标特征向量距离最近的向量来获得相应图像之间的关系。 这种特征向量之间的距离通常被定义为欧几里得距离(Euclidean distance),即是空间中两点之间的直线距离。

    2. 最近邻检索的发展

    最近邻检索作为数据检索中使用最为广泛的技术一直以来都是国内外学者研究的热点。近些年,涌现出大量以最近邻检索或近似最近邻检索为基本思想的两类方法。一类是基于提升检索结构性能的方法,主要方法大多基于树形结构;另一类主要基于对数据本身的处理,包括哈希算法、矢量量化方法等。

    2.1 精确检索

    1. 背景:精确检索中数据维度一般较低,所以会采用穷举搜索,即在数据库中依次计算其中样本与所查询数据之间的距离,抽取出所计算出来的距离最小的样本即为所要查找的最近邻。当数据量非常大的时候,搜索效率急剧下降。

    2. 基于树结构的最近邻检索方法

      概述:由于实际数据会呈现出簇状的聚类形态,因此可以考虑对数据库中的样本数据构建数据索引,索引树就是最常见的方法。其基本思想是对搜索空间进行层次划分,再进行快速匹配。

      结论:当数据维度不太高(如d< 20),通常采用树型索引结构对数据进行分区以实现高效索引,如最经典的KD树算法 、R树、M树等等,它们的时间和空间复杂度都是以d为指数的指数级别的,在实际搜索时也取得了良好的效果。

    当d=1时,只要采用传统的二分查找法或者各类平衡树就能找到最近邻;
    当d=2时,将最近邻检索问题转化为求解查询点究竟落在哪个区域的Voronoi图问题,再通过二分查找树就能很好的解决。

    2.2 近似检索

    1. 背景:面对庞大的数据量以及数据库中高维的数据信息,现有的基于 NN 的检索方法无法获得理想的检索效果与可接受的检索时间。因此,研究人员开始关注近似最近邻检索(Approximate Nearest Neighbor,ANN)。

    2. 概述

      近似最近邻检索利用数据量增大后数据之间会形成簇状聚集分布的特性,通过对数据分析聚类的方法对数据库中的数据进行分类或编码,对于目标数据根据其数据特征预测其所属的数据类别,返回类别中的部分或全部作为检索结果。

      近似最近邻检索的核心思想:搜索可能是近邻的数据项而不再只局限于返回最可能的项目,在牺牲可接受范围内的精度的情况下提高检索效率。

    3. 分类
      一种是采用哈希散列的办法,另一种则是矢量量化。

      3.1 局部敏感哈希(LSH)
      核心思想:在高维空间相邻的数据经过哈希函数的映射投影转化到低维空间后,他们落入同一个吊桶的概率很大而不相邻的数据映射到同一个吊桶的概率则很小。在检索时将欧式空间的距离计算转化到汉明(Hamming)空间,并将全局检索转化为对映射到同一个吊桶中的数据进行检索,从而提高了检索速度。这种方法的主要难点在于如何寻找适合的哈希函数。

      3.2 矢量量化
      其代表是乘积量化(PQ)。它的主要思想是将特征向量进行正交分解,在分解后的低维正交子空间上进行量化,由于低维空间可以采用较小的码本进行编码,因此可以降低数据存储空间 。

      PQ方法采用基于查找表的非对称距离计算(Asymmetric Distance Computation,ADC)快速求取特征向量之间的距离,在压缩比相同的情况下,与采用汉明距离的二值编码方法,采用ADC的PQ方法的检索精度更高。

    参考文献

    最近邻检索的简单综述

    展开全文
  • 最近邻方法

    千次阅读 2018-08-23 10:25:08
    最近邻法 1-NN 待识模式离得最近的训练样本是哪类就归为哪类。 K-NN 待识模式离得最近的k个训练样本哪类的多就归为哪类。 剪辑最近邻法 清理两类见的边界,去掉类别混杂的样本,使两类边界更清晰,此即剪辑...

    这种方法它需要训练样本,但不用进行训练。总体比较好理解,不作详述

    最近邻法

    1-NN

    待识模式离得最近的训练样本是哪类就归为哪类。

    K-NN

    待识模式离得最近的k个训练样本哪类的多就归为哪类。

    剪辑最近邻法

    清理两类见的边界,去掉类别混杂的样本,使两类边界更清晰,此即剪辑最近邻方法。这种方法的性能在理论上明显好于一般的最近邻法。

    剪辑1-NN最近邻法

    将测试样本分为参照集和测试集,剪辑掉测试集中被错分的样本,再将剩下判决正确的样本组成剪辑样本集,然后再利用剪辑样本集采用最近邻规则对待识模式进行分类。

    剪辑K-NN最近邻法

    简单说就是用K-NN进行法剪辑,再用1-NN法进行分类。

    重复剪辑最近邻法

    在样本足够多时,可以重复进行剪辑,从而提高分类性能。

    MULTIEDIT算法
    1.将样本集X^{(N)}随机分为s个子集,s≥3。

    2.用最近邻法,以X_{(i+1)_{mods}}2为参照集,对X_i中的样本进行分类。

    3.去掉上步错分的样本。

    4.用所留下的样本构成新的样本集。

    5.如果经过k次迭代再没有样本被剪辑掉则停止;否则转至第一步。

    展开全文
  • 连续K最近邻(CKNN)查询是最近邻查询的扩展,可广泛地应用于地理信息系统、城市规划、智能交通等领域.CKNN查询搜索某一路径上所有点的K个最近的感兴趣对象.本文研究基于交通路网的连续K最近邻查询问题,不同于传统的...
  • 共享最近邻聚类算法(SNN)在处理大小不同、形状不同以及密度不同的数据集上具有很好的聚类效果,但该算法还存在以下不足:(1)时间复杂度为O(n2),不适合处理大规模数据集;(2)没有明确给出参数阈值的简单指导性操作方法;...
  • 通过matlab实现了最近邻分类算法
  • Java 中不可修改的 KDTree 实现,支持最近邻、k-最近邻和半径搜索。 要使用,您希望存储在树中的数据必须实现 KDData 接口,这需要实现一个方法,该方法提供表示数据位置的双精度数组。 依赖项是用于测试的 Google...
  • 移动的K多元最近邻查询
  • 最近邻分类器

    2012-04-19 11:30:20
    matlab,用于分类的最近邻分类器,简单易懂
  • 最近邻规则的聚类算法,欧式距离,起始点阈值可设定。 带有聚类效果评估。 采用二维特征空间中的10个样本对程序进行验证 x1 = (0,0),x2 = (3,8) x3 = (2,2),x4 = (1,1) x5 = (5,3),x6 = (4,8),x7 = (6,3),x8 = ...
  • 基于自然最近邻的聚类算法
  • TSP_NN 旅行商问题 (TSP) 最近邻 (NN) 算法最近邻算法产生不同的结果取决于选择哪个城市作为起点。 这个函数决定多个起点和返回的最近邻路线这些路线中最好的概括: 1. 一名推销员前往每个城市并完成返回他出发的...
  • matlab最近邻空间权重矩阵(nearest-neighbor spatial weight matrix),需要使用x,y坐标生成。(英文版)
  • 研究关联限制在最近邻分类中的应用,提出结合关联限制的最近邻分类算法PCNN.算法分成两个阶段:首先通过自学习过程,成对地添加施加关联限制的样本对;然后再进行一般的最近邻分类.引入最大半径和有效距离,并进一步给...
  • 在分析现有群组最近邻查询中位置隐私保护的基础上,提出LBS中一种面向位置隐私保护的群组最近邻查询方法。该方法采用分布式系统结构,克服了集中式匿名系统结构所存在通信瓶颈和攻击重点的缺陷。在此基础上根据用户...
  • 提出了基于遗传进化的最近邻聚类算法, 该算法结合了遗传算法(GA )与最近邻聚类算法 (NN )。 对要进行分类的样本和特征量进行优化选取, 去除位于类交界的模糊样本, 并对样本分类有效的 特征量进行放大, 对...
  • NFL最近邻tezhengxian

    2015-03-09 14:20:08
    使用最近邻特征线作为距离度量工具实现样本识别
  • MATLAB源码集锦-复杂网络最近邻耦合网络程序
  • 利用最近邻插值法实现图像的缩小与放大.....................................................................................
  • 机器学习K最近邻算法.py
  • 煤矿井下突发安全事故后,科学判断...本文将反向最近邻的查询算法加以改进,用于查询救助点周围井下人员的分布情况,为实施最有效的救援提供依据。实验表明该算法适用于井下无线传感器网络中的移动对象的反向最近邻查询。
  • 然后计算最近邻样本的距离权重,并用该权重描述最近邻和其他近邻对预测结果的影响;最后使用新的目标函数为待测样本分类。通过在图片、Web页面文本数据等数据集上的实验表明,所提算法得到了更好的分类结果,并且...

空空如也

空空如也

1 2 3 4 5 ... 20
收藏数 37,290
精华内容 14,916
关键字:

最近邻