精华内容
下载资源
问答
  • 特征提取方法

    万次阅读 2018-04-18 10:48:51
    潜在语义索引潜在语义索引(Latent Semantic Indexing,以下简称LSI),也叫Latent Semantic...LSI方法可以用作特征降维、文本相似度计算等。优缺点:(1)SVD是非常耗时的,主题模型非负矩阵分解(NMF)可以很好的解...

    潜在语义索引

    潜在语义索引(Latent Semantic Indexing,以下简称LSI),也叫Latent Semantic Analysis ,简称LSA。本文中称为LSI。LSI是一种主题模型,他是利用SVD奇异值分解方法来获得文本的主题的。奇异值分解详见点击打开链接

    LSI方法可以用作特征降维、文本相似度计算等。

    优缺点:

    (1)SVD是非常耗时的,主题模型非负矩阵分解(NMF)可以很好的解决该问题;

    (2)主题值的选取对结果有较大的影响,很难选择适合的k值。层次狄利克雷过程(HDP)可以自动选择主题个数;

    (3)LSI得到的不是一个概率模型,缺乏统计基础,结果难以解释。PLSA和LDA是基于概率分布的主题模型来代替基于矩阵分解的主题模型。

    主成分分析

    主成分分析(Principal Component Analysis,PCA), 是一种统计方法。通过正交变换将一组可能存在相关性的变量转换为一组线性不相关的变量,转换后的这组变量叫主成分。

    在用统计分析方法研究多变量的课题时,变量个数太多就会增加课题的复杂性。人们自然希望变量个数较少而得到的信息较多。在很多情形,变量之间是有一定的相关关系的,当两个变量之间有一定相关关系时,可以解释为这两个变量反映此课题的信息有一定的重叠。主成分分析是对于原先提出的所有变量,将重复的变量(关系紧密的变量)删去多余,建立尽可能少的新变量,使得这些新变量是两两不相关的,而且这些新变量在反映课题的信息方面尽可能保持原有的信息。

    设法将原来变量重新组合成一组新的互相无关的几个综合变量,同时根据实际需要从中可以取出几个较少的综合变量尽可能多地反映原来变量的信息的统计方法叫做主成分分析或称主分量分析,也是数学上用来降维的一种方法。

    计算流程如下:

    (1)对样本生成特征向量矩阵

    (2)先计算每一列特征的平均值,然后每一维度都需要减去该列的特征平均值

    (3)计算特征的协方差矩阵(为什么是协方差矩阵呢?)

    (4)针对协方差矩阵进行特征值和特征向量的计算

    (5)对计算得到的特征值进行从大到小的排序

    (6)取出前K个特征向量和特征值,并进行回退,即得到了降维后的特征矩阵

    例子

    设数据集为,表中x、y、z表示有3个特征词,一共10个样本。


    (1)求出每个特征词的平均值。


    (2)减去平均值后的特征值


    (3)计算协方差矩阵(协方差矩阵分为2种,一个是样本间的,一个是特征间的)


    (4)计算特征值和特征向量



    (5)将特征值按从大到小的顺序进行排序,选择其中最大的k个,然后将其对应的k个特征向量分别作为列向量组成特征向量矩阵。

    这里的特征向量有3个,我们选择其中2个,第一个和第三个特征值。

    最后得到降维后的矩阵为

    *=

    这样就得到了原始样本的2维特征向量空间。

    Python代码:

    from numpy import * 
    from numpy.linalg import *

    x = []
    for i in range(0,10):
    temp = []
    for j in range(0,3):
    w = random.randint(1,20)
    temp.append(w)
    x.append(temp)
    print(x)
    w1 = 0.0
    w2 = 0.0
    w3 = 0.0
    for i in range(0,3):
    for j in range(0,10):
    if (i==0):
    w1 += x[j][0]
    if (i==1):
    w2 += x[j][1]
    if (i==2):
    w3 += x[j][2]
    w1 = w1/10.0
    w2 = w2/10.0
    w3 = w3/10.0
    for i in range(0,3):
    for j in range(0,10):
    if (i==0):
    x[j][0] -= w1
    if (i==1):
    x[j][1] -= w2
    if (i==2):
    x[j][2] -= w3
    x = array(x)
    c = print(cov(x.T))
    x = array([
    [20.6222,14.4222,10.8667],
    [14.4222,25.2111,14.3778],
    [10.8667,14.3778,27.1556]
    ])
    print(eig(x))

    线性判别分析

           在自然语言处理领域, LDA是隐含狄利克雷分布(Latent Dirichlet Allocation,简称LDA),他是一种处理文档的主题模型。我们本文只讨论线性判别分析,因此后面所有的LDA均指线性判别分析。

    LDA是一种监督学习的降维技术,而PCA是无监督的降维技术,LDA是在降维的基础上考虑了类别的因素,希望得到的投影类内方差最小,类与类之间的方差最大。

    该方法的详细介绍以及LDA和PCA的区别详见最后一个参考文献,这里就不在重复了


    附:

    python 中log2计算方法

    def log2(num):

    return log(num)/log(2);


    参考文献

    基于主成分分析的人脸特征提取

    核函数主成分分析在粮虫特征提取中的应用

    https://blog.csdn.net/u014755493/article/details/69950744

    https://baike.baidu.com/item/%E4%B8%BB%E6%88%90%E5%88%86%E5%88%86%E6%9E%90/829840?fr=aladdin

    深度学习

    https://blog.csdn.net/ych1035235541/article/details/50974983

    https://blog.csdn.net/sunhuaqiang1/article/details/69396401

    https://www.cnblogs.com/pinard/p/6805861.html

    https://www.cnblogs.com/pinard/p/6244265.html

    展开全文
  • sift、lbp、hist、color、hog等特征提取方法 sift、lbp、hist、color、hog等特征提取方法
  • 融合多特征的运动目标特征提取方法
  • 边缘特征提取方法

    万次阅读 2019-02-22 16:30:11
    边缘特征提取方法

    分享一下我老师大神的人工智能教程。零基础!通俗易懂!风趣幽默!还带黄段子!希望你也加入到我们人工智能的队伍中来!https://blog.csdn.net/jiangjunshow

                   

    边缘检测是图形图像处理、计算机视觉和机器视觉中的一个基本工具,通常用于特征提取和特征检测,旨在检测一张数字图像中有明显变化的边缘或者不连续的区域,在一维空间中,类似的操作被称作步长检测(step detection)。边缘是一幅图像中不同屈原之间的边界线,通常一个边缘图像是一个二值图像。边缘检测的目的是捕捉亮度急剧变化的区域,而这些区域通常是我们关注的。在一幅图像中两度不连续的区域通常是以下几项之一:

    l        图像深度不连续处

    l        图像(梯度)朝向不连续处

    l        图像光照(强度)不连续处

    l        纹理变化处

    理想情况下,对所给图像应用边缘检测器可以得到一系列连续的曲线,用于表示对象的边界。因此应用边缘检测算法所得到的结果将会大大减少图像数据量,从而过滤掉很多我们不需要的信息,留下图像的重要结构,所要处理的工作即被大大简化。然而,从普通图片上提取的边缘往往被图像的分割所破坏,也就是说,检测到的曲线通常不是连续的,有一些边缘曲线段开,就会丢失边缘线段,而且会出现一些我们不感兴趣的边缘。这就需要边缘检测算法的准确性。下面介绍两个本文实现的边缘检测算法:canny算子和sobel算子进行边缘检测。

     

    1.1.1   Canny算子边缘检测

    Canny边缘检测算法基于一个多阶边缘算子,是由John F. Canny于1986年首先提出的[46],他不但给出了边缘检测的方法,也提出了边缘检测的计算理论。

    Canny边缘检测器使用一个基于高斯模型派生的检测模型,因为未处理图像可能含有噪声,所以开始在原始图像上应用一个高斯滤波器,结果是一个轻度平滑的图像,以至于不至于被单个噪声像素干扰全局重要参数。

    以一个5×5的高斯滤波模板为例(见公式3-7),对图像A应用高斯滤波可得B。下面对图像的光强梯度统计都基于图B。


    一幅图像中的边缘可能在方向上各有所异,所以Canny算法用四个滤波器分别检测图像中的水平、垂直和对角线边缘。边缘检测器(如 Roberts, Prewitt, Sobel)值返回一个水平方向分量Gx和竖直方向分量Gy,由此边缘梯度和方向即可确定:


    所有边缘的角度都在上述选定的四个方向(0°,45°,90°,135°)周围。下一步通过滞后性门限跟踪边缘线。

    与小的光强梯度相比,数值较大的光强梯度更容易作为边缘线。在大多数图像中定义一个门限值来确定光强梯度取值多少适合作为边缘线通常是不可行的,因此Canny算法使用滞后作用确定门限值。该方法使用两个门限分别定义高低边界。假设所有的边缘应该不受噪声影响而且是连续的曲线。因此我们设置一个高门限用于判定确定是边缘的曲线,再由此出发,利用方向信息跟踪那些可追踪的图像边缘。当追踪该边缘时,应用低门限可以让我们追踪那些含有边缘的区域直到找到下一个曲线的起点。

    如图 3‑5所示,(a)为原图的灰度图,(b)为高斯滤波平滑图,(c)和(d)分别是手动设置的高低门限值如图所示的canny边缘检测结果。根据多组图像数据测试发现,当canny高低门限值分别设置为50,150时能够保证大部分有效信息的保留且不会有过多冗余信息。因此后文中采用门限值[Thres1,Thres2]= 50,120 作为canny边缘检测参数。Opencv中以下代码实现:

          cvCanny(dst,src, 50, 120, 3 );




    1.1.1   Sobel算子边缘检测

    和Canny算子类似,Sobel算子[47]也是利用梯度信息对图像进行边缘检测的。对图像进行边缘检测时,计算每个像素的梯度并给出不同方向从明到暗的最大变化及其变化率。这个结果显示出图片在该点亮度变化为“急剧”还是“平滑”,由此可以判断该区域成为边缘的概率。在实际操作中,这个成为边缘的可能性(称为magnitude)计算比计算方向更为可靠,也更为便捷。在图像中的每个像素点,梯度向量只想亮度增长最大的方向,该梯度向量的长度对应于该方向的光强变化率。这就说明在同一像素图像上一个区域的某点的sobel算子是一个零向量,而且在边缘线上的点上有一组向量值为亮度梯度。

    数学上在原图像上应用3×3的掩膜计算水平和垂直两个方向的变化梯度近似值。如果我们定义A为源图像,和分别作为一幅图像的水平近似梯度和垂直近似梯度,计算方式如下:


    式3-9中,*表示二维卷积运算。这里建立的坐标系在x坐标方向向右,y坐标方向向下,在图像中的每个点,用式3-8描述总梯度大小及方向。用Sobel算子进行边缘检测结果见图 3‑6所示。


               

    分享一下我老师大神的人工智能教程。零基础!通俗易懂!风趣幽默!还带黄段子!希望你也加入到我们人工智能的队伍中来!https://blog.csdn.net/jiangjunshow

    展开全文
  • 1、有9个工件图像,要求从本章讲授的特征提取方法中,选择3~5种提取工件特征并给出数字结果;链码为必选方法,给出数字结果和图形显示,做到链码和原图像的双向变换显示。(实验报告中应描述相应的特征提取方法并略...
  • 数据特征提取方法

    万次阅读 2018-09-20 10:37:55
    数据挖掘特征提取方法-汇集、 特征提取方法、特征提取之PCA、机器学习 —— 基础整理(四)特征提取之线性方法:主成分分析PCA、独立成分分析ICA、线性判别分析LDA、【机器学习算法系列之三】简述多种降维算法...
    展开全文
  • 颜色特征提取方法

    千次阅读 2019-02-25 16:39:20
    颜色特征提取方法

    分享一下我老师大神的人工智能教程。零基础!通俗易懂!风趣幽默!还带黄段子!希望你也加入到我们人工智能的队伍中来!https://blog.csdn.net/jiangjunshow

                   

    计算机视觉的特征提取算法研究至关重要。在一些算法中,一个高复杂度特征的提取可能能够解决问题(进行目标检测等目的),但这将以处理更多数据,需要更高的处理效果为代价。而颜色特征无需进行大量计算。只需将数字图像中的像素值进行相应转换,表现为数值即可。因此颜色特征以其低复杂度成为了一个较好的特征。

    在图像处理中,我们可以将一个具体的像素点所呈现的颜色分多种方法分析,并提取出其颜色特征分量。比如通过手工标记区域提取一个特定区域(region)的颜色特征,用该区域在一个颜色空间三个分量各自的平均值表示,或者可以建立三个颜色直方图等方法。下面我们介绍一下颜色直方图和颜色矩的概念。


    颜色直方图:

    颜色直方图用以反映图像颜色的组成分布,即各种颜色出现的概率。Swain和Ballard最先提出了应用颜色直方图进行图像特征提取的方法[40],首先利用颜色空间三个分量的剥离得到颜色直方图,之后通过观察实验数据发现将图像进行旋转变换、缩放变换、模糊变换后图像的颜色直方图改变不大,即图像直方图对图像的物理变换是不敏感的。因此常提取颜色特征并用颜色直方图应用于衡量和比较两幅图像的全局差。另外,如果图像可以分为多个区域,并且前景与背景颜色分布具有明显差异,则颜色直方图呈现双峰形。

    颜色直方图也有其缺点:由于颜色直方图是全局颜色统计的结果,因此丢失了像素点间的位置特征。可能有几幅图像具有相同或相近的颜色直方图,但其图像像素位置分布完全不同。因此,图像与颜色直方图得多对一关系使得颜色直方图在识别前景物体上不能获得很好的效果。

    考虑到颜色直方图的以上问题,主色调直方图便产生了。所谓主色调直方图基于假设少数几个像素的值能够表示图像中的绝大部分像素,即出现频率最高的几个像素被选为主色,仅用主色构成的主色调直方图描述一幅图像。这样的描述子并不会降低通过颜色特征进行匹配的效果,因为从某种角度将,频度出现很小的像素点可以被视为噪声。

     

    颜色矩:

    颜色矩是一种有效的颜色特征,由Stricker和Orengo提出[41],该方法利用线性代数中矩的概念,将图像中的颜色分布用其矩表示。利用颜色一阶矩(平均值Average)、颜色二阶矩(方差Variance)和颜色三阶矩(偏斜度Skewness)来描述颜色分布。与颜色直方图不同,利用颜色矩进行图像描述无需量化图像特征。由于每个像素具有颜色空间的三个颜色通道,因此图像的颜色矩有9个分量来描述。由于颜色矩的维度较少,因此常将颜色矩与其他图像特征综合使用。

    颜色集:

    以上两种方法通常用于两幅图像间全局或region之间的颜色比较、匹配等,而颜色集的方法致力于实现基于颜色实现对大规模图像的检索。颜色集的方法由Smith和Chang提出[42],该方法将颜色转化到HSV颜色空间后,将图像根据其颜色信息进行图像分割成若干region,并将颜色分为多个bin,每个region进行颜色空间量化建立颜色索引,进而建立二进制图像颜色索引表。为加快查找速度,还可以构造二分查找树进行特征检索。


               

    分享一下我老师大神的人工智能教程。零基础!通俗易懂!风趣幽默!还带黄段子!希望你也加入到我们人工智能的队伍中来!https://blog.csdn.net/jiangjunshow

    展开全文
  • 里面包含了常用纹理特征提取方法(matlab),包括:分形维数、灰度差分统计、GMRF、Gabor、LBP
  • 本文论述了2DPCA和2DFLD等传统特征提取方法,并发展了2DFLD特征提取方法,提出分块的2DFLD特征提取方法,分析表明,该方法是2DFLD方法的推广,在人脸识别研究中优于传统的2DFLD方法。 核方法是新近发展起来的一种非...
  • 传统图像特征提取方法列表

    千次阅读 2019-09-24 10:05:33
    图像特征的操作步骤常见的特征提取方法:其他常用的特征检测算法 特征是什么? 常见的特征有:边缘、角,区域; 图像特征的操作步骤 目前图像特征的提取主要有两种方法:传统图像特征提取方法 和 深度学习方法。 ...
  • 常用故障特征提取方法_高正明 ,总结了常用的方法,值得学习
  • 首先基于线性特征提取方法(PCA)和非线性特征提取方法(LLE)对影响整经轴数的多维属性参数进行特征提取;然后采用前向神经网络进行整经轴数预测.数值计算结果表明,所提出的方法能满足实际生产过程整经轴数预测的需要....
  • 提出一种基于随机森林和转导推理的特征提取方法, 步骤如下: 1)利用带标签的训练样本建立随机森林模型; 2) 将无标签的测试数据导入随机森林模型中,生成全体数据(训练样本和测试数据)的相似性矩阵; 3)对该相似性矩阵...
  • 针对现有煤与矸石图像处理方法存在提取特征参数少、识别精度低等问题,提出了一种融合局部二值模式和灰度共生矩阵的煤与矸石图像纹理特征提取方法。首先将煤与矸石预处理后的图像转换为局部二值模式图像,再利用该图像...
  • 6种常用纹理特征提取方法:LBP、GLCM、GLDS、GMRF、Gabor等 纹理特征的提取分为基于结构的方法和基于统计数据的方法。一个基于结构的纹理特征提取方法是将所要检测的纹理进行建模,在图像中搜索重复的模式。
  • Python人脸图像特征提取方法 一、HOG人脸图像特征提取 1、HOG特征: 1) 主要思想: 2) 实现方法: 3) 性能提高: 4) 优点 2、HOG特征提取算法的实现过程: 二、Dlib人脸图像特征提取 1.Dlib介绍 2.主要特点 三、卷积...
  • 一种基于空间编码技术的轨迹特征提取方法
  • 文本特征提取方法

    千次阅读 2019-01-29 19:32:50
    特征提取方法: one-hot 和 TF-IDF one-hot 1.1 one-hot编码  什么是one-hot编码?one-hot编码,又称独热编码、一位有效编码。其方法是使用N位状态寄存器来对N个状态进行编码,每个状态都有它独立的寄存器位,并且...
  • 关于模式识别的一个问题:常用的几种特征提取方法和介绍,网上搜的都带有图像的特征和匹配方法,看着比较乱。 谁能直接介绍一下特征提取方法,谢谢
  • 图像特征提取方法的综述,有助于图像特征提取
  • 主要讲解数据挖掘 中用于分类的时序数据特征提取方法,很好的学习资料
  • 基于GGDA(greedy GDA) 的训练数据减少和非线性特征提取方法. 该方法用greedy 核主成分分析方法的greedy 技 术对训练数据选取子集; 然后用GDA方法对子集而不是全部训练数据训练特征提取模型; 并用几种特征提取的...
  • 今天小编就为大家分享一篇使用python实现语音文件的特征提取方法,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
  • 基于DEM的流域水文特征提取方法研究,原立峰,,运用GIS软件ArcGIS,以黄土丘陵沟壑区小流域为例,探讨了从数字高程模型(DEM)中提取流域水文特征的详细过程,包括:DEM的生成和预处
  • 面向云计算的隐私保护图像特征提取方法研究 摘要本文提出一种有效实用的隐私保护方法用于计算环境中大规模加密图像数据的特征提取为了保证运算的安全性设计了安全乘法协议SMP和安全比较协议SCP该方法对原始图像数据...
  • 基于云平台的互信息最大化特征提取方法研究
  • 文本特征提取方法研究

    千次阅读 2016-10-26 13:32:40
    文本特征提取方法研究

空空如也

空空如也

1 2 3 4 5 ... 20
收藏数 14,544
精华内容 5,817
关键字:

特征提取方法