特征提取 订阅
特征提取是计算机视觉和图像处理中的一个概念。它指的是使用计算机提取图像信息,决定每个图像的点是否属于一个图像特征。特征提取的结果是把图像上的点分为不同的子集,这些子集往往属于孤立的点、连续的曲线或者连续的区域。特征的好坏对泛化性能有至关重要的影响。 [1] 展开全文
特征提取是计算机视觉和图像处理中的一个概念。它指的是使用计算机提取图像信息,决定每个图像的点是否属于一个图像特征。特征提取的结果是把图像上的点分为不同的子集,这些子集往往属于孤立的点、连续的曲线或者连续的区域。特征的好坏对泛化性能有至关重要的影响。 [1]
信息
领    域
计算机视觉和图像处理
定    义
通过影像分析和变换提取所需特征
类    型
角、边缘等
含    义
使用计算机提取图像信息
中文名
特征提取
外文名
feature extraction
特征提取定义
对某一模式的组测量值进行变换,以突出该模式具有代表性特征的一种方法。通过影像分析和变换,以提取所需特征的方法。特征提取是指使用计算机提取图像中属于特征性的信息的方法及过程。
收起全文
精华内容
参与话题
问答
  • 特征提取

    千次阅读 2017-03-15 10:35:05
    关于图像特征提取的几点小结: 基于颜色的特征提取:RGB颜色空间——HSV颜色空间 基于纹理的特征提取: LBP(Local Binary Pattern,局部二值模式)局部纹理算子;gabor滤波提取全局纹理,忽略表情局部变化 ...

    关于图像特征提取的几点小结:

    基于颜色的特征提取:RGB颜色空间——HSV颜色空间

    基于纹理的特征提取:  LBPLocal Binary Pattern,局部二值模式)局部纹理算子;gabor滤波提取全局纹理,忽略表情局部变化

    基于形状的特征提取:伦敦特征Hough (http://www.open-open.com/lib/view/open1440832074794.html) 从2D的图像特征提取应用到3D图像的形状特征提取、傅里叶形状描述法

    基于空间关系的特征提取:指图像中分割出来的多个目标之间的相互的空间位置或相对方向关系,这些关系也可以分为连接/邻接关系、交叠/重叠关系和包含/包容关系等。

    展开全文
  • SIFT特征提取分析

    万次阅读 多人点赞 2012-06-06 22:06:09
    SIFT(Scale-invariant feature transform)是一种检测局部特征的算法,该算法通过求一幅图中的特征点(interest points,or corner points)及其有关scale 和 orientation 的描述子得到特征并进行图像特征点匹配,...

    SIFT(Scale-invariant feature transform)是一种检测局部特征的算法,该算法通过求一幅图中的特征点(interest points,or corner points)及其有关scale 和 orientation 的描述子得到特征并进行图像特征点匹配,获得了良好效果,详细解析如下:

    算法描述

    SIFT特征不只具有尺度不变性,即使改变旋转角度,图像亮度或拍摄视角,仍然能够得到好的检测效果。整个算法分为以下几个部分:

    1. 构建尺度空间

    这是一个初始化操作,尺度空间理论目的是模拟图像数据的多尺度特征

    高斯卷积核是实现尺度变换的唯一线性核,于是一副二维图像的尺度空间定义为:


    其中 G(x,y,σ) 是尺度可变高斯函数 

    (x,y)是空间坐标,是尺度坐标。σ大小决定图像的平滑程度,大尺度对应图像的概貌特征,小尺度对应图像的细节特征。大的σ值对应粗糙尺度(低分辨率),反之,对应精细尺度(高分辨率)。为了有效的在尺度空间检测到稳定的关键点,提出了高斯差分尺度空间(DOG scale-space)。利用不同尺度的高斯差分核与图像卷积生成。

    下图所示不同σ下图像尺度空间:



    关于尺度空间的理解说明:2kσ中的2是必须的,尺度空间是连续的。在  Lowe的论文中 ,将第0层的初始尺度定为1.6(最模糊),图片的初始尺度定为0.5(最清晰). 在检测极值点前对原始图像的高斯平滑以致图像丢失高频信息,所以 Lowe 建议在建立尺度空间前首先对原始图像长宽扩展一倍,以保留原始图像信息,增加特征点数量。尺度越大图像越模糊。 


    图像金字塔的建立:对于一幅图像I,建立其在不同尺度(scale)的图像,也成为子八度(octave),这是为了scale-invariant,也就是在任何尺度都能够有对应的特征点,第一个子八度的scale为原图大小,后面每个octave为上一个octave降采样的结果,即原图的1/4(长宽分别减半),构成下一个子八度(高一层金字塔)。



    尺度空间的所有取值,i为octave的塔数(第几个塔),s为每塔层数

    由图片size决定建几个塔,每塔几层图像(S一般为3-5)0塔的第0层是原始图像(或你double后的图像),往上每一层是对其下一层进行Laplacian变换(高斯卷积,其中σ值渐大,例如可以是σ, k*σ, k*k*σ),直观上看来越往上图片越模糊。塔间的图片是降采样关系,例如1塔的第0层可以由0塔的第3down sample得到,然后进行与0塔类似的高斯卷积操作。


    2. LoG近似DoG找到关键点<检测DOG尺度空间极值点>

    为了寻找尺度空间的极值点,每一个采样点要和它所有的相邻点比较,看其是否比它的图像域和尺度域的相邻点大或者小。如图所示,中间的检测点和它同尺度的8个相邻点和上下相邻尺度对应的9×2个点共26个点比较,以确保在尺度空间和二维图像空间都检测到极值点。 一个点如果在DOG尺度空间本层以及上下两层的26个领域中是最大或最小值时,就认为该点是图像在该尺度下的一个特征点,如图所示。


    同一组中的相邻尺度(由于k的取值关系,肯定是上下层)之间进行寻找


    s=3的情况

     在极值比较的过程中,每一组图像的首末两层是无法进行极值比较的,为了满足尺度变化的连续性(下面有详解)
    我们在每一组图像的顶层继续用高斯模糊生成了 3 幅图像,高斯金字塔有每组S+3层图像。DOG金字塔每组有S+2层图像.

    ==========================================
    这里有的童鞋不理解什么叫“为了满足尺度变化的连续性”,现在做仔细阐述:
    假设s=3,也就是每个塔里有3层,则k=21/s=21/3,那么按照上图可得Gauss Space和DoG space 分别有3个(s个)和2个(s-1个)分量,在DoG space中,1st-octave两项分别是σ,kσ; 2nd-octave两项分别是2σ,2kσ;由于无法比较极值,我们必须在高斯空间继续添加高斯模糊项,使得形成σ,kσ,k2σ,k3σ,k4σ这样就可以选择DoG space中的中间三项kσ,k2σ,k3σ(只有左右都有才能有极值),那么下一octave中(由上一层降采样获得)所得三项即为2kσ,2k2σ,2k3σ,其首项2kσ=24/3。刚好与上一octave末项k3σ=23/3尺度变化连续起来,所以每次要在Gaussian space添加3项,每组(塔)共S+3层图像,相应的DoG金字塔有S+2层图像。
    ==========================================

    使用Laplacian of Gaussian能够很好地找到找到图像中的兴趣点,但是需要大量的计算量,所以使用Difference of Gaussian图像的极大极小值近似寻找特征点.DOG算子计算简单,是尺度归一化的LoG算子的近似,有关DOG寻找特征点的介绍及方法详见http://blog.csdn.net/abcjennifer/article/details/7639488极值点检测用的Non-Maximal Suppression


    3. 除去不好的特征点

    这一步本质上要去掉DoG局部曲率非常不对称的像素。


    通过拟和三维二次函数以精确确定关键点的位置和尺度(达到亚像素精度),同时去除低对比度的关键点和不稳定的边缘响应点(因为DoG算子会产生较强的边缘响应),以增强匹配稳定性、提高抗噪声能力,在这里使用近似Harris Corner检测器。

    ①空间尺度函数泰勒展开式如下:对上式求导,并令其为0,得到精确的位置, 得

    ②在已经检测到的特征点中,要去掉低对比度的特征点和不稳定的边缘响应点。去除低对比度的点:把公式(2)代入公式(1),即在DoG Space的极值点处D(x)取值,只取前两项可得:


    若   ,该特征点就保留下来,否则丢弃。

    ③边缘响应的去除
    一个定义不好的高斯差分算子的极值在横跨边缘的地方有较大的主曲率,而在垂直边缘的方向有较小的主曲率。主曲率通过一个2×2 的Hessian矩阵H求出:

    导数由采样点相邻差估计得到。

    D的主曲率和H的特征值成正比,令α为较大特征值,β为较小的特征值,则

    令α=γβ,则

     (r + 1)2/r的值在两个特征值相等的时候最小,随着r的增大而增大,因此,为了检测主曲率是否在某域值r下,只需检测

    if (α+β)/ αβ> (r+1)2/r, throw it out.   在Lowe的文章中,取r=10。



    4. 给特征点赋值一个128维方向参数

    上一步中确定了每幅图中的特征点,为每个特征点计算一个方向,依照这个方向做进一步的计算, 利用关键点邻域像素的梯度方向分布特性为每个关键点指定方向参数,使算子具备旋转不变性。


    为(x,y)处梯度的模值和方向公式。其中L所用的尺度为每个关键点各自所在的尺度。至此,图像的关键点已经检测完毕,每个关键点有三个信息:位置,所处尺度、方向,由此可以确定一个SIFT特征区域。


    梯度直方图的范围是0~360度,其中每10度一个柱,总共36个柱。随着距
          中心点越远的领域其对直方图的贡献也响应减小.Lowe论文中还提到要使用高斯函数对直方图进行平滑,减少突变的影响。

    在实际计算时,我们在以关键点为中心的邻域窗口内采样,并用直方图统计邻域像素的梯度方向。梯度直方图的范围是0~360度,其中每45度一个柱,总共8个柱, 或者每10度一个柱,总共36个柱。Lowe论文中还提到要使用高斯函数对直方图进行平滑,减少突变的影响。直方图的峰值则代表了该关键点处邻域梯度的主方向,即作为该关键点的方向


    直方图中的峰值就是主方向,其他的达到最大值80%的方向可作为辅助方向

    由梯度方向直方图确定主梯度方向

    该步中将建立所有scale中特征点的描述子(128维)

    Identify peak and assign orientation and sum of magnitude to key point.
      The user may choose a threshold to exclude key points based on their assigned sum of magnitudes.


    关键点描述子的生成步骤


     通过对关键点周围图像区域分块,计算块内梯度直方图,生成具有独特性的向量,这个向量是该区域图像信息的一种抽象,具有唯一性。


    5. 关键点描述子的生成

    首先将坐标轴旋转为关键点的方向,以确保旋转不变性。以关键点为中心取8×8的窗口。

    Figure.16*16的图中其中1/4的特征点梯度方向及scale,右图为其加权到8个主方向后的效果。

    图左部分的中央为当前关键点的位置,每个小格代表关键点邻域所在尺度空间的一个像素,利用公式求得每个像素的梯度幅值与梯度方向,箭头方向代表该像素的梯度方向,箭头长度代表梯度模值,然后用高斯窗口对其进行加权运算。


    图中蓝色的圈代表高斯加权的范围(越靠近关键点的像素梯度方向信息贡献越大)。然后在每4×4的小块上计算8个方向的梯度方向直方图,绘制每个梯度方向的累加值,即可形成一个种子点,如图右部分示。此图中一个关键点由2×2共4个种子点组成,每个种子点有8个方向向量信息。这种邻域方向性信息联合的思想增强了算法抗噪声的能力,同时对于含有定位误差的特征匹配也提供了较好的容错性。


    计算keypoint周围的16*16的window中每一个像素的梯度,而且使用高斯下降函数降低远离中心的权重。

    在每个4*4的1/16象限中,通过加权梯度值加到直方图8个方向区间中的一个,计算出一个梯度方向直方图。

    这样就可以对每个feature形成一个4*4*8=128维的描述子,每一维都可以表示4*4个格子中一个的scale/orientation. 将这个向量归一化之后,就进一步去除了光照的影响。

    5. 根据SIFT进行Match

    生成了A、B两幅图的描述子,(分别是k1*128维和k2*128维),就将两图中各个scale(所有scale)的描述子进行匹配,匹配上128维即可表示两个特征点match上了。


    实际计算过程中,为了增强匹配的稳健性,Lowe建议对每个关键点使用4×4共16个种子点来描述,这样对于一个关键点就可以产生128个数据,即最终形成128维的SIFT特征向量。此时SIFT特征向量已经去除了尺度变化、旋转等几何变形因素的影响,再继续将特征向量的长度归一化,则可以进一步去除光照变化的影响。 当两幅图像的SIFT特征向量生成后,下一步我们采用关键点特征向量的欧式距离来作为两幅图像中关键点的相似性判定度量。取图像1中的某个关键点,并找出其与图像2中欧式距离最近的前两个关键点,在这两个关键点中,如果最近的距离除以次近的距离少于某个比例阈值,则接受这一对匹配点。降低这个比例阈值,SIFT匹配点数目会减少,但更加稳定。为了排除因为图像遮挡和背景混乱而产生的无匹配关系的关键点,Lowe提出了比较最近邻距离与次近邻距离的方法,距离比率ratio小于某个阈值的认为是正确匹配。因为对于错误匹配,由于特征空间的高维性,相似的距离可能有大量其他的错误匹配,从而它的ratio值比较高。Lowe推荐ratio的阈值为0.8。但作者对大量任意存在尺度、旋转和亮度变化的两幅图片进行匹配,结果表明ratio取值在0. 4~0. 6之间最佳,小于0. 4的很少有匹配点,大于0. 6的则存在大量错误匹配点。(如果这个地方你要改进,最好给出一个匹配率和ration之间的关系图,这样才有说服力)作者建议ratio的取值原则如下:

    ratio=0. 4 对于准确度要求高的匹配;
    ratio=0. 6 对于匹配点数目要求比较多的匹配; 
    ratio=0. 5 一般情况下。
    也可按如下原则:当最近邻距离<200时ratio=0. 6,反之ratio=0. 4。ratio的取值策略能排分错误匹配点。



    当两幅图像的SIFT特征向量生成后,下一步我们采用关键点特征向量的欧式距离来作为两幅图像中关键点的相似性判定度量。取图像1中的某个关键点,并找出其与图像2中欧式距离最近的前两个关键点,在这两个关键点中,如果最近的距离除以次近的距离少于某个比例阈值,则接受这一对匹配点。降低这个比例阈值,SIFT匹配点数目会减少,但更加稳定。

     

    实验结果:







    Python+opencv实现:


    import cv2
    import numpy as np
    #import pdb
    #pdb.set_trace()#turn on the pdb prompt
    
    #read image
    img = cv2.imread('D:\privacy\picture\little girl.jpg',cv2.IMREAD_COLOR)
    gray = cv2.cvtColor(img,cv2.COLOR_BGR2GRAY)
    cv2.imshow('origin',img);
    
    #SIFT
    detector = cv2.SIFT()
    keypoints = detector.detect(gray,None)
    img = cv2.drawKeypoints(gray,keypoints)
    #img = cv2.drawKeypoints(gray,keypoints,flags = cv2.DRAW_MATCHES_FLAGS_DRAW_RICH_KEYPOINTS)
    cv2.imshow('test',img);
    cv2.waitKey(0)
    cv2.destroyAllWindows()



    C实现:


    // FeatureDetector.cpp : Defines the entry point for the console application.
    //  
    //  Created by Rachel on 14-1-12.  
    //  Copyright (c) 2013年 ZJU. All rights reserved.  
    //  
    
    #include "stdafx.h"
    #include "highgui.h"
    #include "cv.h"
    #include "vector"
    #include "opencv\cxcore.hpp"
    #include "iostream"
    #include "opencv.hpp"
    #include "nonfree.hpp"
    #include "showhelper.h"
    
    using namespace cv;
    using namespace std;
    
    int _tmain(int argc, _TCHAR* argv[])
    {
    	//Load Image 
    	Mat c_src1 =  imread( "..\\Images\\3.jpg");
    	Mat c_src2 = imread("..\\Images\\4.jpg");
    	Mat src1 = imread( "..\\Images\\3.jpg", CV_LOAD_IMAGE_GRAYSCALE);
    	Mat src2 = imread( "..\\Images\\4.jpg", CV_LOAD_IMAGE_GRAYSCALE);
    	if( !src1.data || !src2.data )
    	{ std::cout<< " --(!) Error reading images " << std::endl; return -1; }
    
    	//sift feature detect
    	SiftFeatureDetector detector;
    	std::vector<KeyPoint> kp1, kp2;
    
    	detector.detect( src1, kp1 );
    	detector.detect( src2, kp2 );
    	SiftDescriptorExtractor extractor;
    	Mat des1,des2;//descriptor
    	extractor.compute(src1,kp1,des1);
    	extractor.compute(src2,kp2,des2);	
    	Mat res1,res2; 
    	int drawmode = DrawMatchesFlags::DRAW_RICH_KEYPOINTS;
    	drawKeypoints(c_src1,kp1,res1,Scalar::all(-1),drawmode);//在内存中画出特征点
    	drawKeypoints(c_src2,kp2,res2,Scalar::all(-1),drawmode);
    	cout<<"size of description of Img1: "<<kp1.size()<<endl;
    	cout<<"size of description of Img2: "<<kp2.size()<<endl;
    
    	//write the size of features on picture
    	CvFont font;    
    	double hScale=1;   
    	double vScale=1;    
    	int lineWidth=2;// 相当于写字的线条    
    	cvInitFont(&font,CV_FONT_HERSHEY_SIMPLEX|CV_FONT_ITALIC, hScale,vScale,0,lineWidth);//初始化字体,准备写到图片上的   
    	// cvPoint 为起笔的x,y坐标   
    	IplImage* transimg1 = cvCloneImage(&(IplImage) res1);
    	IplImage* transimg2 = cvCloneImage(&(IplImage) res2);
    		
    	char str1[20],str2[20];
    	sprintf(str1,"%d",kp1.size());
    	sprintf(str2,"%d",kp2.size());
    
    
    	const char* str = str1;
    	cvPutText(transimg1,str1,cvPoint(280,230),&font,CV_RGB(255,0,0));//在图片中输出字符 
    
    	str = str2;
    	cvPutText(transimg2,str2,cvPoint(280,230),&font,CV_RGB(255,0,0));//在图片中输出字符 
    
    	//imshow("Description 1",res1);
    	cvShowImage("descriptor1",transimg1);
    	cvShowImage("descriptor2",transimg2);
    
    	BFMatcher matcher(NORM_L2);
    	vector<DMatch> matches;
    	matcher.match(des1,des2,matches);
    	Mat img_match;
    	drawMatches(src1,kp1,src2,kp2,matches,img_match);//,Scalar::all(-1),Scalar::all(-1),vector<char>(),drawmode);
    	cout<<"number of matched points: "<<matches.size()<<endl;
    	imshow("matches",img_match);
    	cvWaitKey();
    	cvDestroyAllWindows();
    
    	return 0;
    }
    





    ===============================
    基本概念及一些补充
    什么是局部特征?
      •局部特征从总体上说是图像或在视觉领域中一些有别于其周围的地方
      •局部特征通常是描述一块区域,使其能具有高可区分度
      •局部特征的好坏直接会决定着后面分类、识别是否会得到一个好的结果
     局部特征需具备的特性
      •重复性
      •可区分性
      •准确性
      •数量以及效率
      •不变性
     局部特征提取算法-sift
      •SIFT算法由D.G.Lowe 1999年提出,2004年完善总结。后来Y.Ke将其描述子部分用PCA代替直方图的方式,对其进行改进。
       •SIFT算法是一种提取局部特征的算法,在尺度空间寻找极值点,提取位置,尺度,旋转不变量
      •SIFT特征是图像的局部特征,其对旋转、尺度缩放、亮度变化保持不变性,对视角变化、仿射变换、噪声也保持一定程度的稳定性。
      •独特性好,信息量丰富,适用于在海量特征数据库中进行快速、准确的匹配。
      •多量性,即使少数的几个物体也可以产生大量SIFT特征向量。
      •可扩展性,可以很方便的与其他形式的特征向量进行联合。
    尺度空间理论
      •尺度空间理论目的是模拟图像数据的多尺度特征
      •其基本思想是在视觉信息图像信息处理模型中引入一个被视为尺度的参数, 通过连续变化尺度参数获得不同尺度下的视觉处理信息, 然后综合这些信息以深入地挖掘图像的本质特征。
    描述子生成的细节
      •以极值点为中心点,并且以此点所处于的高斯尺度sigma值作为半径因子。对于远离中心点的梯度值降低对其所处区域的直方图的贡献,防止一些突变的影响。
      •每个极值点对其进行三线性插值,这样可以把此极值点的贡献均衡的分到直方图中相邻的柱子上
    归一化处理
      •在求出4*4*8的128维特征向量后,此时SIFT特征向量已经去除了尺度变化、旋转等几何变形因素的影响。而图像的对比度变化相当于每个像素点乘上一个因子,光照变化是每个像素点加上一个值,但这些对图像归一化的梯度没有影响。因此将特征向量的长度归一化,则可以进一步去除光照变化的影响。
      •对于一些非线性的光照变化,SIFT并不具备不变性,但由于这类变化影响的主要是梯度的幅值变化,对梯度的方向影响较小,因此作者通过限制梯度幅值的值来减少这类变化造成的影响。
    PCA-SIFT算法
      •PCA-SIFT与标准SIFT有相同的亚像素位置,尺度和主方向。但在第4步计算描述子的设计,采用的主成分分析的技术。
      •下面介绍一下其特征描述子计算的部分:
        •用特征点周围的41×41的像斑计算它的主元,并用PCA-SIFT将原来的2×39×39维的向量降成20维,以达到更精确的表示方式。
        •它的主要步骤为,对每一个关键点:在关键点周围提取一个41×41的像斑于给定的尺度,旋转到它的主方向 ;计算39×39水平和垂直的梯度,形成一个大小为3042的矢量;用预先计算好的投影矩阵n×3042与此矢量相乘;这样生成一个大小为n的PCA-SIFT描述子。
    ===============================

    辅助资料:





    ===============================


    Reference:

    Lowe SIFT 原文:http://www.cs.ubc.ca/~lowe/papers/ijcv04.pdf

    SIFT 的C实现:https://github.com/robwhess/opensift/blob/master/src

    MATLAB 应用Sift算子的模式识别方法:http://blog.csdn.net/abcjennifer/article/details/7372880

    http://blog.csdn.net/abcjennifer/article/details/7365882

    http://en.wikipedia.org/wiki/Scale-invariant_feature_transform#David_Lowe.27s_method

    http://blog.sciencenet.cn/blog-613779-475881.html

    http://www.cnblogs.com/linyunzju/archive/2011/06/14/2080950.html

    http://www.cnblogs.com/linyunzju/archive/2011/06/14/2080951.html

    http://blog.csdn.net/ijuliet/article/details/4640624

    http://www.cnblogs.com/cfantaisie/archive/2011/06/14/2080917.html  (部分图片有误,以本文中的图片为准)





    关于computer vision的更多讨论与交流,敬请关注本博客和新浪微博Rachel____Zhang






    展开全文
  • 图像特征提取

    2016-06-05 20:56:14
    特征提取  定义:  图像特征提取因机器视觉产生而存在,计算机为识别图像而去提取作为图像构成的相关像素点,并对像素点进行分析确定以其特征归属的过程就是图像特征提取。从变换或映射的角度来看,它是对某一...

    特征提取

     定义:

       图像特征提取因机器视觉产生而存在,计算机为识别图像而去提取作为图像构成的相关像素点,并对像素点进行分析确定以其特征归属的过程就是图像特征提取。从变换或映射的角度来看,它是对某一模式的组测量值进行变换,以突出该模式具有代表性特征的一种方法,通过影像分析和变换,将部分区域的满足要求的特征点选取出来作为继续识别的信息输入。

    一般来讲,良好的特征应具备可区分性、可靠性、独立性、数量少这四个方面的特点。

    图像特征

     定义:是区分不同目标类别的依据,能够作为图像特征的因素应具有可重复性、可区分性、集中性等,而且能够应对亮度、旋转、尺度等变化的影响。

     分类:对于图像特征的分类可以从不同的角度进行划分,此处仅从图像空间特征空间两个角度考察,其中图像空间依从图像的底层特征,特征空间中体现的是原图变换后的高层特征,

        

    方法:

    Forstner,Haar,SIFT

    展开全文
  • matlab时域频域信号特征提取资料整合

    千次阅读 多人点赞 2019-09-28 15:31:44
    1 前言 最近在做一个项目,需要将声纳信号中的特征都提取出来进行分析。...1、首先,在特征提取之前需楼主明确是怎样的信号,怎样的应用,怎样的场景,因为针对不同应用和场景选择的特征提取也不近相同。 ...

    1 前言

    最近在做一个项目,需要将声纳信号中的特征都提取出来进行分析。资料查到头秃终于整合出来了些东西,记录一下。

    由于不是专业人员,如果发现任何错误请不要大意的附在评论区,我会及时修改,谢谢!

    2 思路

    思路这段引用自知乎大佬aresmiki的回答,我觉得OK。

    1、首先,在特征提取之前需楼主明确是怎样的信号,怎样的应用,怎样的场景,因为针对不同应用和场景选择的特征提取也不近相同。

    2、信号特征的提取往往都是用最简单有效的参数表示信号中的信息,这是根本目的。

    3、针对不同后端模型需要确定特征维度。

    4、开始特征提取前,信号往往需要做一些预处理,如滤波、去均值、去异常等等。

    特征提取有哪些方法:

    1、拿到时间域一维信号,简单统计和运算可以得到的特征有:均值,方差,均方根,峰值因子,峭度系数,波形因子,裕度因子、脉冲因子

    2、估计--分布参数一般服从某一类分布;

    3、频域,特征频率,均方频率,重心频率,频率方差

    4、小波方法提取的系数,小波滤波后的特征频率等等;

    5、信号,谱熵,排列熵,小波熵,EMD熵,包络谱熵等;

    6、谱峭度,快速谱峭度、小波谱峭度等;

    7、基于数学工具和降维的特征,如PCA,矩阵特征向量,矩阵的秩,特征根,SVD-奇异值、ICA等等;

    8、一些基于距离的度量、范数、马氏距离、分形参数,同胚流行等等;

    9、任何能表征信号特征的自定义参数均可以,注意有意义有时是结合实际需求的。

    3 预处理

    matlab的波形预处理还是很人性化的,具体说来“Signal Analyzer”工具箱好像就够用了,至于其他的工具箱大家也可以看看。

    这个工具箱在matlab顶上点选【APP】之后能找到,它的教程在官网上也很清楚了,传送门附上:点我传送

    这个网站里关于“Signal Analyzer”工具箱的使用教程在【使用Signal Analyzer App】超链接下。其他超链接里的内容也可以逛逛,说不定对你有些启发。

    下面的代码可以参考:

    %%  初始化
    clear
    clc
    
    %%  读取文件
    [sonar,fs] = audioread('test.wav');    %采样频率
    
    %%  滤波处理
    sonar = sonar - mean(sonar);    %去直流分量
    sonar = lowpass(sonar,0.5,'Steepness',0.85,'StopbandAttenuation',60);       %低通滤波
    sonar = highpass(sonar,0.5,'Steepness',0.85,'StopbandAttenuation',60);      %高通滤波

    4 时域特征提取

    %%  数据特征提取
    [nframes,nchannels] = size(sonar);  %采样点数与声道数
    time = nframes / fs;   %采样时间 = 采样总点数 / 每秒采样点数
    
    %%  双声道时域信息提取
    max_data = max(sonar);   %最大值
    min_data = min(sonar);   %最小值
    median_data = median(sonar);    %中位数
    mean_data = mean(sonar);     %平均值
    pk_data = max_data - min_data;     %峰差
    avg_data = mean(abs(sonar));     %整流平均值_绝对值的平均值
    var_data = var(sonar);      %方差
    sd_data = std(sonar);    %标准差
    ku_data = kurtosis(sonar);      %峭度
    sk_data = skewness(sonar);      %偏度
    rm_data = rms(sonar);       %均方根
    
    %%  左声道时域
    l_max = max_data(1);
    l_min = min_data(1);
    l_median = median_data(1);
    l_mean = mean_data(1);
    l_pk = pk_data(1);
    l_avg = avg_data(1);
    l_var = var_data(1);
    l_sd = sd_data(1);
    l_ku = ku_data(1);
    l_sk = sk_data(1);
    l_rm = rm_data(1);
    l_S = l_rm / l_avg;    %均方根因子
    l_C = l_pk / l_rm;     %峰值因子
    l_I = l_pk / l_avg;    %脉冲因子
    l_xr = mean(sqrt(abs(sonar(1))))^2;
    l_L =  l_pk/ l_xr;     %裕度因子
    
    %%  右声道频域
    r_max = max_data(2);
    r_min = min_data(2);
    r_median = median_data(2);
    r_mean = mean_data(2);
    r_pk = pk_data(2);
    r_avg = avg_data(2);
    r_var = var_data(2);
    r_sd = sd_data(2);
    r_ku = ku_data(2);
    r_sk = sk_data(2);
    r_rm = rm_data(2);
    r_S = r_rm / r_avg;    %均方根因子
    r_C = r_pk / r_rm;     %峰值因子
    r_I = r_pk / r_avg;    %脉冲因子
    r_xr = mean(sqrt(abs(sonar(2))))^2;
    r_L =  r_pk/ r_xr;     %裕度因子

    5 频域特征提取

    这块写的我也没啥自信了,毕竟是根据网上东拼西凑的资料写出来的。

    %%  双声道频域信息提取
    [fft_sonar,f_range] = positiveFFT(sonar,fs);  
    N = length(fft_sonar);      %fft采样点数
    subplot(5,2,5);
    fft_amp = abs(fft_sonar);   %振幅(幅频特性)
    stem(f_range,fft_amp);  %x-正频率;y-振幅
    title('频域声纳波形');
    fft_phase = angle(fft_sonar);   %相频特性
    subplot(5,2,6);
    plot(f_range,fft_phase);
    title('相频特性图')
    
    amp_max = max(fft_amp);     %振幅最大值
    amp_min = min(fft_amp);     %振幅最小值
    amp_median = median(fft_amp);   %振幅中位数
    amp_mean = mean(fft_amp);       %振幅平均值
    amp_pk = amp_max - amp_min;     %振幅峰差
    amp_mph = amp_pk * 0.75;           %振幅峰值阈值,阈值为75%的振幅峰差
    %[amp_pkfs,amp_pks] = findpeaks(fft_amp,'minpeakheight',amp_mph);
    %amp_pkfs = amp_pkfs / N * fs/2;
    amp_pks = [];   %振幅峰值
    amp_pkfs = [];  %振幅峰值对应的频率
    for i = 1:N
        if amp_mph < fft_amp(i)
            amp_pks = [amp_pks,fft_amp(i)];
            amp_pkfs = [amp_pkfs,i / N * fs / 2];
        end
    end
    
    avg_fs = fs*[1:N] / N;
    avg_fft = 2 * fft_amp / N;
    
    amp_fc = sum(avg_fs .* avg_fft) / sum(avg_fft);     %重心频率
    amp_msf = sum(avg_fs.^2 .* avg_fft) / sum(avg_fft);    %均方频率
    amp_rmsf = sqrt(amp_msf);   %均方根频率
    amp_vf = sum((avg_fs - amp_fc).^2 .* avg_fft) / sum(avg_fft);  %频率方差
    amp_rvf = sqrt(amp_vf);     %频率标准差

    6 功率谱

    %%  双声道功率谱信息提取
    power = abs(fft_sonar).^2 / N;      %功率 = 傅里叶变换^2 / 区间长度,fft的幂
    subplot(5,2,7);
    plot(f_range,power);
    title('功率谱');
    power_y = 10*log10(power);      %放大低频
    power_y(1) = mean(power_y);     %去除直流影响
    subplot(5,2,8);
    plot(f_range,power_y);
    title('放大低频的功率谱');
    
    power_max = max(power);     %功率最大值
    power_min = min(power);     %功率最小值
    power_median = median(power);       %功率中位数
    power_mean = mean(power);           %功率平均值
    power_snr = 10*log10(power_max / (sum(power) - power_max));     %信噪比
    power_obw = obw(sonar,fs);      %占用带宽

    7 倒谱

    %%  双声道倒频谱信息提取
    cepstrum = real(ifft(log(abs(fft(sonar(:,1))))));
    during_time = 1/fs:1/fs:time;
    subplot(5,2,9);
    plot(during_time,cepstrum,'color',[29/255 176/255 184/255]);ylim([0 0.01]);
    title('左声道倒频谱');
    cepstrum = real(ifft(log(abs(fft(sonar(:,2))))));
    during_time = 1/fs:1/fs:time;
    subplot(5,2,10);
    plot(during_time,cepstrum,'color',[86/255 163/255 108/255]);ylim([0 0.01]);
    title('右声道倒频谱');

     

    展开全文
  • 机器学习水果识别——python+opencv实现物体特征提取

    万次阅读 多人点赞 2018-12-02 21:30:56
    文章目录一、用python+opencv实现物体特征提取1、读取图像、转为灰度图像并降噪2、获取水果轮廓将最大轮廓画入最开始的img图像并显示将小于某一规模的轮廓删除3、提取水果的面积周长及颜色获取二值图并计算面积...
  • 传统图像特征提取方法列表

    千次阅读 2019-09-24 10:05:33
    图像特征的操作步骤常见的特征提取方法:其他常用的特征检测算法 特征是什么? 常见的特征有:边缘、角,区域; 图像特征的操作步骤 目前图像特征的提取主要有两种方法:传统图像特征提取方法 和 深度学习方法。 ...
  • Gabor滤波器与特征提取

    万次阅读 2016-03-18 19:21:37
    Gabor滤波器,最主要使用优势体现在对物体纹理特征提取上。二维Gabor基函数能够很好地描述哺乳动物初级视觉系统中一对简单视觉神经元的感受野特性。随着小波变换和神经生理学的发展,Gabor变换逐渐演变成二维Gabor...
  • 时域、频域提取特征都是针对某段长度的样本而提取出来的一个统计特征值;而时频域则是针对某段长度得到的统计特征值则不止一个,有多个,比如小波能量谱等;如果把时域、频域及时频域得到的特征指标作为一个整体特征...
  • ORB特征提取详解

    万次阅读 多人点赞 2016-09-22 18:46:48
    ORB(Oriented FAST and Rotated BRIEF)是一种快速特征点提取和描述的算法。这个算法是由Ethan Rublee, Vincent Rabaud, Kurt Konolige以及Gary R....特征提取是由FAST(Features from Accelerated Segment Test
  • EEMD分解后的特征提取

    千次阅读 2019-10-30 10:53:57
    有篇论文里讲到对eemd特征的分解,然后使用函数进行特征提取,大概步骤如下: 使用 EEMD 对原始振动信号进行四层分解,即得到四个 IMF 分量,之后对所得到的 IMF 分量和原始振动信号及各自频谱分别提取 9 个时域特征...
  • 本人当前对小波理解不是很深入,通过翻阅网络他人博客,进行汇总总结,重新调试Matlab代码,实现对小波与小波包、小波包分解与信号重构、小波包能量特征提取,供大家参考。以下的所有内容均搬运自 cqfdcw 用户 。...
  • 小波包变换常用于提取非线性信号的特征,常应用于故障诊断领域的故障特征提取
  • 语音识别中特征提取MFCC、FBANK、语谱图特征提取

    万次阅读 多人点赞 2018-11-06 09:43:13
    好久没写博客了,今天更新一下使用Python提取声学模型的特征,一共三种特征,分别是MFCC、FABNK以及语谱图特征,直接上Python代码。 # -*- coding:utf-8 -*- # author:zhangwei """ 该脚本用于提取语音特征,...
  • 运动想象丨特征提取 MATLAB例程(一)

    千次阅读 热门讨论 2018-08-18 14:32:55
    运动想象BCI丨特征提取 MATLAB例程(一) 开源是一种情怀,像开源致敬! 源码地址:M-MohammadPour/EEGClassification 特征提取   实施脑电信号分类,该计划分为两个阶段:   第一阶段是使用自回归(AR...
  • 心电图中的各个波形都...所以识别这些波形以及提取相应特征对我们后续做心律失常的分类很重要。 我们在用算法做心律失常判别分类之前,有两个关键点: 第一步: 识别检测ECG信号中的波群(目前主要是先定位QRS波...
  • 图像特征提取(二)——HOG特征

    千次阅读 2019-05-27 15:27:50
    HOG特征最早出现在2005年CVPR上,法国的研究人员NavneetDalal和BillTriggs利用HOG特征+SVM进行行人检测,在当时得到了了较好的检测效果,OpenCV还把HOG特征提取集成成了API。 HOG特征原文链接:https://...
  • 图像特征提取三大法宝:HOG特征,LBP特征,Haar特征 一、HOG特征 1、HOG特征: 即局部归一化的梯度方向直方图,是一种对图像局部重叠区域的密集型描述符, 它通过计算局部区域的梯度方向直方图来构成特征。方向...
  • 纹理特征提取

    万次阅读 多人点赞 2012-04-04 14:08:34
    一个基于结构的纹理特征提取方法是将所要检测的纹理进行建模,在图像中搜索重复的模式。该方法对人工合成的纹理识别效果较好。但对于交通图像中的纹理识别,基于统计数据的方法效果更好。 1.1.1 LBP纹理特征 LBP...
  • ICA特征提取

    千次阅读 2014-07-03 08:31:10
    看完了ICA的一整套原理介绍后,感觉完整的介绍和andrew ng的课程中的ICA特征提取关系不是很大;在ICA的理论中,主要用于盲源分离的,也就是混合的观测数据X,通过一个正交的且其范数为1的分离矩阵W(其实是实现旋转...
  • Matlab 图像特征提取

    万次阅读 2018-10-11 10:50:59
    在图像处理过程中,尤其是图像相似度的匹配,在图片量比较小的情况下,深度学习的效果往往达不到期望,所以需要利用传统图像处理的方法,对图像特征进行提取,常用的方法有lbp,hog,sift,surf。 lbp算法主要是对图片...
  • 特征提取算法简单学习笔记

    万次阅读 2018-01-30 14:21:13
    特征提取:将原始特征转换为一组具有明显物理意义(Gabor、几何特征[角点、不变量]、纹理[LBP HOG])或者统计意义或核的特征 特征选择:从特征集合中挑选一组最具统计意义的特征,达到降维 我的理解: 特征提取:...
  • EEG信号特征提取(PSD)

    2017-08-30 06:17:51
    因为刚入门做EEG情感数据分析,所以对特征提取存在一些困扰,具体在于使用spectrogram计算PSD后,如何提取特定频域带的PSD呢?是计算平均power(用bandpower)吗? 具体问题如下: 如果对于一段采样频率是200Hz的信号...
  • 代码:小波包分解与重构、小波包能量特征提取

    万次阅读 多人点赞 2017-10-19 20:07:03
    1、小波变换的理解 傅里叶变换——短时傅里叶变换——小波变换。 参考文献:以下两篇参考资料讲述得十分清楚,有助于理解小波变换。 但具体的数学角度阐述,请参考其他资料。 (1)知乎专栏:形象易懂讲解算法I——...
  • SURF特征提取分析

    万次阅读 多人点赞 2013-11-28 00:26:44
    计算机视觉中,引入尺度不变的特征,主要的思想是每个检测到的特征点都伴随着对应的尺寸因子。当我们想匹配不同图像时,经常会遇到图像尺度不同的问题,不同图像中特征点的距离变得不同,物体变成不同的尺寸,如果...
  • 视觉和声音是人类固有的感觉输入。我们的大脑是可以迅速进化我们的能力来处理视觉和听觉信号的,一些系统甚至在出生前就对刺激做出反应。另一方面,语言技能是学习得来的。他们需要几个月或几年的时间来掌握。...

空空如也

1 2 3 4 5 ... 20
收藏数 35,580
精华内容 14,232
关键字:

特征提取