精华内容
下载资源
问答
  • 平面度算法讲解 基于MATLAB 回归分析 的平面度评定方法
  • 最小二乘法计算平面度

    千次阅读 2020-08-13 23:42:16
    通过最小二乘法,可以求解平面的参数:a,b,ca,b,ca,b,c,进而求解平面度。 本文假定测量数据为: #-- coding:UTF-8 -- #空间平面的方程:z = ax + by + c #目标:求解a,b,c的值 #已知条件:12个被测点的三维坐标 ...

    在已知平面内数据点的三维坐标的情况下,求解平面方程的参数。已知平面的方程式为:
    z = a x + b y + c z=ax+by+c z=ax+by+c
    通过深度相机检测到平面上的 n n n个点云数据 p ( x i , y i , z i ) p(x_{i},y_{i},z_{i}) p(xi,yi,zi)。通过最小二乘法,可以求解平面的参数: a , b , c a,b,c a,b,c,进而求解平面度。

    1. 定义单个数据点的误差项: δ i = a x i + b y i − z i + c \delta_{i}=ax_{i}+by_{i}-z_{i}+c δi=axi+byizi+c
    2. 对于 n n n组数据,定义所有数据的最小二乘问题: F ( a , b , c ) = Σ i = 1 n δ i 2 = Σ i = 1 n ( a x i + b y i − z i + c ) 2 F(a,b,c)=\Sigma_{i=1}^{n}{\delta_{i}^2}=\Sigma_{i=1}^{n}(ax_{i}+by_{i}-z_{i}+c)^2 F(a,b,c)=Σi=1nδi2=Σi=1n(axi+byizi+c)2
    3. 平面方程的自变量为 a , b , c a,b,c a,b,c且不相关,让 F ( a , b , c ) F(a,b,c) F(a,b,c)分别对 a , b , c a,b,c a,b,c求导,并使其为0。

    { Δ F Δ a = Σ i = 1 n 2 x i ( a x i + b y i − z i + c ) = 0 Δ F Δ b = Σ i = 1 n 2 y i ( a x i + b y i − z i + c ) = 0 Δ F Δ c = Σ i = 1 n 2 ( a x i + b y i − z i + c ) = 0 ⇓ 将 a , b , c 写 到 方 程 的 一 边 ( 便 于 写 成 矩 阵 形 式 进 行 求 解 ) { a Σ i = 1 n x i 2 + b Σ i = 1 n x i y i + c Σ i = 1 n x i = Σ i = 1 n x i z i a Σ i = 1 n x i y i + b Σ i = 1 n y i 2 + c Σ i = 1 n y i = Σ i = 1 n y i z i a Σ i = 1 n x i + b Σ i = 1 n y i + n c = Σ i = 1 n z i ⇓ [ Σ x i 2 Σ x i y i Σ x i Σ x i y i Σ y i 2 Σ y i Σ x i Σ y i n ] [ a b c ] = [ Σ x i z i Σ y i z i Σ z i ] \left \{ \begin{aligned} &\frac{\Delta F}{\Delta a}=\Sigma_{i=1}^{n}2x_{i}(ax_{i}+by_{i}-z_{i}+c)=0 \\ &\frac{\Delta F}{\Delta b}=\Sigma_{i=1}^{n}2y_{i}(ax_{i}+by_{i}-z_{i}+c)=0 \\ &\frac{\Delta F}{\Delta c}=\Sigma_{i=1}^{n}2(ax_{i}+by_{i}-z_{i}+c)=0\\ \end{aligned} \right .\\ \Downarrow \\ 将a,b,c写到方程的一边(便于写成矩阵形式进行求解) \\ \left \{ \begin{aligned} &a\Sigma_{i=1}^{n}{x_{i}^2}+b\Sigma_{i=1}^{n}{x_iy_i}+c\Sigma_{i=1}^{n}{x_i}=\Sigma_{i=1}^{n}{x_iz_i} \\ &a\Sigma_{i=1}^{n}{x_{i}y_{i}}+b\Sigma_{i=1}^{n}{y_{i}^{2}}+c\Sigma_{i=1}^{n}{y_i}=\Sigma_{i=1}^{n}{y_iz_i} \\ &a\Sigma_{i=1}^{n}{x_{i}}+b\Sigma_{i=1}^{n}{y_{i}}+nc=\Sigma_{i=1}^{n}{z_i}\\ \end{aligned} \right .\\ \Downarrow \\ \begin{bmatrix} \Sigma{x_{i}^2}&\Sigma{x_iy_i}&\Sigma{x_i}\\ \Sigma{x_{i}y_{i}}&\Sigma{y_{i}^{2}}&\Sigma{y_i}\\ \Sigma{x_{i}}&\Sigma{y_{i}}&n\\ \end{bmatrix} \begin{bmatrix} a\\b\\c \end{bmatrix}=\begin{bmatrix} \Sigma{x_iz_i}\\ \Sigma{y_iz_i}\\ \Sigma{z_i}\\ \end{bmatrix} ΔaΔF=Σi=1n2xi(axi+byizi+c)=0ΔbΔF=Σi=1n2yi(axi+byizi+c)=0ΔcΔF=Σi=1n2(axi+byizi+c)=0a,b,c(便)aΣi=1nxi2+bΣi=1nxiyi+cΣi=1nxi=Σi=1nxiziaΣi=1nxiyi+bΣi=1nyi2+cΣi=1nyi=Σi=1nyiziaΣi=1nxi+bΣi=1nyi+nc=Σi=1nziΣxi2ΣxiyiΣxiΣxiyiΣyi2ΣyiΣxiΣyinabc=ΣxiziΣyiziΣzi

    此后就是求解 A x = b Ax=b Ax=b的问题。

    #-- coding:UTF-8 --
    #空间平面的方程:z = ax + by + c
    #目标:求解a,b,c的值
    #已知条件:12个被测点的三维坐标
    import numpy as np
    p=[[0,0,3.52],
       [1,0,2.3],
       [2,0,-2.69],
       [0,1,-2.65],
       [1,1,3.25],
       [2,1,4.36],
       [0,2,-2.36],
       [1,2,4.56],
       [2,2,-3.54],
       [0,3,2.36],
       [1,3,-5.65],
       [2,3,2.59]
       ]
    n = len(p)
    B=[0,0,0]
    A = np.zeros((3,3),np.float32)
    for i in range(n):
        B[0] = B[0] + p[i][0]*p[i][2]
        B[1] = B[1] + p[i][1]*p[i][2]
        B[2] = B[2] + p[i][2]
        A[0][0] = A[0][0] + p[i][0]**2
        A[0][1] = A[0][1] + p[i][0]*p[i][1]
        A[0][2] = A[0][2] + p[i][0]
        A[1][0] = A[0][1]
        A[1][1] = A[1][1] + p[i][1]**2
        A[1][2] = A[1][2] + p[i][1]
        A[2][0] = A[0][2]
        A[2][1] = A[1][2]
        A[2][2] = n
    # 【1】计算拟合平面的系数a,b,c
    x = np.matmul(np.linalg.inv(A),B)
    print(B)
    print(A)
    print(x)
    
    # 【2】计算平面度
    # 计算被一个被测点的实际高度Z与理想高度Zs之间的差值
    # 平面度的值即为被测点最大差值与最小差值的差
    delta = np.zeros((n,),np.float32)
    for i in range(n):
        delta[i] = p[i][2] - (x[0]*p[i][0]+x[1]*p[i][1]+x[2])
    print(delta)
    flatness = max(delta) - min(delta)
    print(flatness)
    
    [5.899999999999999, 0.17999999999999616, 6.049999999999999]
    [[20. 18. 12.]
     [18. 42. 18.]
     [12. 18. 12.]]
    [-0.01875    -0.59300001  1.41241658]
    [ 2.1075835   0.90633345 -4.0649166  -3.4694166   2.4493334   3.5780835
     -2.5864165   4.3523335  -3.7289166   2.7265835  -5.2646666   2.9940834 ]
    9.617001
    
    展开全文
  • 本文就平面的误差的数学模型与最小乘法建立理想平面的数学模型展开分析讨论;并结合事例分析,得出较客观的评定平面误差或测量较大的平面度误差,最小二乘法是最佳的方法
  • 常用的相似度计算方法原理及实现

    千次阅读 2019-04-01 20:07:11
    在数据分析数据挖掘以及搜索引擎中,我们经常需要知道个体间差异的大小,进而评价个体的相似性类别。常见的比如数据分析中比如相关分析,数据挖掘中的分类聚类(K-Means等)算法,搜索引擎进行物品推荐时。...

    在数据分析和数据挖掘以及搜索引擎中,我们经常需要知道个体间差异的大小,进而评价个体的相似性和类别。常见的比如数据分析中比如相关分析,数据挖掘中的分类聚类(K-Means等)算法,搜索引擎进行物品推荐时。
    相似度就是比较两个事物的相似性。一般通过计算事物的特征之间的距离,如果距离小,那么相似度大;如果距离大,那么相似度小。比如两种水果,将从颜色,大小,维生素含量等特征进行比较相似性。
    问题定义:有两个对象X,Y,都包含N维特征,X=(x1,x2,x3,………,xn),Y=(y1,y2,y3,………,yn),计算X和Y的相似性。常用的有五种方法,如下。

    1、欧几里得距离(Eucledian Distance)

    欧氏距离是最常用的距离计算公式,衡量的是多维空间中各个点之间的绝对距离,当数据很稠密并且连续时,这是一种很好的计算方式。

    因为计算是基于各维度特征的绝对数值,所以欧氏度量需要保证各维度指标在相同的刻度级别,比如对身高(cm)和体重(kg)两个单位不同的指标使用欧式距离可能使结果失效。



    代码:
    这里写图片描述

    2、曼哈顿距离(Manhattan Distance)


    这里写图片描述

    Manhattan distance = |x1 – x2| + |y1 – y2|,p1 at (x1, y1) and p2 at (x2, y2).

    代码:
    这里写图片描述

    3、明可夫斯基距离(Minkowski distance)

    明氏距离是欧氏距离的推广,是对多个距离度量公式的概括性的表述,看看下图


    这里写图片描述

    公式:
    这里写图片描述

    从公式我们可以看出,

    • 当p1,“明可夫斯基距离”变成“曼哈顿距离”
    • 当p2,“明可夫斯基距离”变成“欧几里得距离”
    • 当p==∞,“明可夫斯基距离”变成“切比雪夫距离”

    代码:
    这里写图片描述

    4、(余弦相似度)Cosine Similarity

    余弦相似度用向量空间中两个向量夹角的余弦值作为衡量两个个体间差异的大小。相比距离度量,余弦相似度更加注重两个向量在方向上的差异,而非距离或长度上。



    代码:
    这里写图片描述

    5、Jaccard Similarity

    Jaccard系数主要用于计算符号度量或布尔值度量的个体间的相似度,因为个体的特征属性都是由符号度量或者布尔值标识,因此无法衡量差异具 体值的大小,只能获得“是否相同”这个结果,所以Jaccard系数只关心个体间共同具有的特征是否一致这个问题。



    对于上面两个对象A和B,我们用Jaccard计算它的相似性,公式如下


    这里写图片描述

    首先计算出A和B的交(A ∩ B),以及A和B的并 (A ∪ B):




    然后利用公式进行计算:



    代码:

    这里写图片描述

    六、皮尔森相关系数(Pearson Correlation Coefficient)

    又称相关相似性,通过Peason相关系数来度量两个用户的相似性。计算时,首先找到两个用户共同评分过的项目集,然后计算这两个向量的相关系数。

    公式:


    这里写图片描述

    实现汇总:

    这里写图片描述

    参考资料

    1、Implementing the five most popular Similarity Measures in Python
    2、相似度方法总结



    欧氏距离与余弦相似度
      欧氏距离是最常见的距离度量,而余弦相似度则是最常见的相似度度量,很多的距离度量和相似度度量都是基于这两者的变形和衍生,所以下面重点比较下两者在衡量个体差异时实现方式和应用环境上的区别。
      借助三维坐标系来看下欧氏距离和余弦相似度的区别:
    在这里插入图片描述
      从图上可以看出距离度量衡量的是空间各点间的绝对距离,跟各个点所在的位置坐标(即个体特征维度的数值)直接相关;而余弦相似度衡量的是空间向 量的夹角,更加的是体现在方向上的差异,而不是位置。如果保持A点的位置不变,B点朝原方向远离坐标轴原点,那么这个时候余弦相似度cosθ是保持不变 的,因为夹角不变,而A、B两点的距离显然在发生改变,这就是欧氏距离和余弦相似度的不同之处。

    根据欧氏距离和余弦相似度各自的计算方式和衡量特征,分别适用于不同的数据分析模型:欧氏距离能够体现个体数值特征的绝对差异,所以更多的用于 需要从维度的数值大小中体现差异的分析,如使用用户行为指标分析用户价值的相似度或差异;而余弦相似度更多的是从方向上区分差异,而对绝对的数值不敏感, 更多的用于使用用户对内容评分来区分用户兴趣的相似度和差异,同时修正了用户间可能存在的度量标准不统一的问题(因为余弦相似度对绝对数值不敏感)。

    展开全文
  • 为了解决在测量平面线轮廓中由于存在被测轮廓与其测量基准间存在位置误差而影响评定精度的问题,提出了一种基于遗传算法自适应的计算平面线轮廓误差的新方法.该方法满足最小条件原理,它利用样条插值函数拟合...
  • matlab人脸识别论文

    万次阅读 多人点赞 2019-10-11 17:41:51
    特征脸方法原理简单、易于实现,它把人脸作为一个整体来处理,大大降低了识别复杂度。但是特征脸方法忽视了人脸的个性差异,存在着一定的理论缺陷。研究表明:特征脸方法随光线角度及人脸尺寸的影响,识别率会有所...

    摘 要

     本文设计了一种基于BP神经网络的人脸识别系统,并对其进行了性能分析。该系统首先利用离散小波变换获取包含人脸图像大部分原始信息的低频分量,对图像数据进行降维;再由PCA算法对人脸图像进行主成分特征提取,进--步降低图像数据的处理量;最后使用经过训练后的BP神经网络对待测人脸进行分类识别。详细介绍了离散小波变换PCA特征提取以及BP神经网络分类设计。通过系统仿真实验与分析发现:人脸特征的提取是该系统的关键;同时,由于人脸灰度信息的统计特征与有监督训练BP神经网络分类器,使该系统只在固定类别,并且光照均匀的人脸识别应用场景中具有较高的识别准确率。因此,很难在复杂环境中应用。
    

    关键词:人脸识别;人工神经网络;离散小波变换; PCA; BP神经网络
    Abstract
    In this paper, a face recognition system based on BP neural network is designed and its performance is analyzed. The system first uses discrete wavelet transform to obtain the low-frequency components which contain most of the original information of the face image, and then uses PCA algorithm to extract the principal component features of the face image, progressively reducing the processing capacity of the image data. Finally, the trained BP neural network is used to classify and recognize the tested face. Discrete wavelet transform PCA feature extraction and BP neural network classification design are introduced in detail. Through the system simulation experiment and analysis, it is found that the extraction of facial features is the key of the system. At the same time, because of the statistical features of gray information and the supervised training of BP neural network classifier, the system only has a high recognition accuracy in fixed categories and uniform illumination of face recognition application scenarios. Therefore, it is difficult to apply in complex environment.

    Key words: face recognition; artificial neural network; discrete wavelet transform; PCA; BP neural network
    1绪论

      人脸识别是模式识别研究的一个热点,它在身份鉴别、信用卡识别,护照的核对及监控系统等方面有着I泛的应用。人脸图像由于受光照、表情以及姿态等因索的影响,使得同一个人的脸像矩阵差异也比较大。因此,进行人脸识别时,所选取的特征必须对上述因素具备-一定的稳定性和不变性。主元分析(PCA)方法是一种有效的特征提取方法,将人脸图像表示成一一个列向量,经过PCA变换后,不仅可以有效地降低其维数,同时又能保留所需要的识别信息,这些信息对光照、表情以及姿态具有一定的不敏感性。 在获得有效的特征向量后,关键问题是设计具有良好分类能力和鲁棒性的分类器、支持向量机(SVI )模式识别方法,兼顾调练误差和泛化能力,在解决小样本、非线性及高维模式识别问题中表现出许多特有的优势。
    

    1.1人脸识别技术的细节

    一般来说,人脸识别系统包括图像提取、人脸定位、图形预处理、以及人脸识别(身份确认或者身份查找)。系统输入一般是一张或者一系列含有未确定身份的人脸图像,以及人脸数据库中的若干已知身份的人脸图像或者相应的编码,而其输出则是一系列相似度得分,表明待识别的人脸的身份。
    1.2人脸识别技术的广泛应用

    一项技术的问世和发展与人类的迫切需求是密切相关的,快速发展的社会经济和科学技术使得人类对安全(包括人身安全、隐私保护等)得认识越来越重视。人脸识别得一个重要应用就是人类的身份识别。一-般来说, 人类得身份识别方式分为三类:
    1.特征物品,包括各种证件和凭证,如身份证、驾驶证、房门钥匙、印章等;
    2.特殊知识,包括各种密码、口令和暗号等;

    3.人类生物特征,包括各种人类得生理和行为特征,如人脸、指纹、手形、掌纹、虹膜. DNA、签名、语音等。前两类识别方式属于传统的身份识别技术,其特点是方便、快捷,但致命的缺点是安全性差、易伪造、易窃取。特殊物品可能会丢失、偷盗和复制,特殊知识可以被遗忘、混淆和泄漏。相比较而言,由于生物特征使人的内在属性,具有很强的自身稳定性和个体差异性,因此生物特征是身份识别的最理想依据。基于以上相对独特的生物特征,结合计算机技术,发展了众多的基于人类生物特征的身份识别技术,如DNA识别技术、指纹识别技术、虹膜识别技术、语音识别技术和人脸识别技术等。生物识别技术在上个世纪已经有了- -定得发展,其中指纹识别技术已经趋近成熟,但人脸识别技术的研究还处于起步阶段。指纹、虹膜、掌纹等识别技术都需要被识别者的配合,有的识别技术还需要添置复杂昂贵的设备。人脸识别可以利用已有的照片或是摄像头远距离捕捉图像,无需特殊的采集设备,系统的成本低。并且自动人脸识别可以在当事人毫无觉察的情况下完成身份确认识别工作,这对反恐怖活动有非常重要的意义。基于人脸识别技术具有如此多的优势,因此它的应用前最非常广阔,已成为最具潜力的生物特征识别技术之一
    1.3人脸识别技术的难点

      虽然人类可以毫不困难地根据人脸来辨别一个人,但是利用计算机进行完全自动的人脸识别仍然有许多困难。人脸模式差异性使得人脸识别成为-个非常困难的问题,表现在以下方面:
    
      1.人脸表情复杂,人脸具有多样的变化能力,人的脸上分布着Ii十多块面部肌肉,这些肌肉的运动导致不同面部表情的出现,会造成人脸特征的显著改变。
    
      2.随着年龄而改变,随着年龄的增长,皱纹的出现和面部肌肉的松驰使得人脸的结构和纹理都将发生改变。
    
      3.人脸有易变化的附加物,例如改变发型,留胡须,戴帽子或眼镜等饰物。4.人脸特征遮掩,人脸全部、部分遮掩将会造成错误识别。
    
      5.人脸图像的畸变,由于光照、视角、摄取角度不同,可能造成图像的灰度。
    

    1.4国内外研究状况

    人脸识别是人类视觉最杰出的能力之-。 它的研究涉及模式识别、图像处理、生物学、心理学、认知科学,与基于其它生物特征的身份鉴别方法以及计算机人机感知交互领域都有密切联系。人脸识别早在六七十年代就引起了研究者的强烈兴趣。20世纪60年代,Bledsoe 提出了人脸识别的半自动系统模式与特征提取方法。70年代,美、英等发达国家开始重视人脸识别的研究工作并取得进展。1972 年,Harmon 用交互人脸识别方法在理论上与实践上进行了详细的论述。同年,Sakai 设计了人脸图像自动识别系统。80年代初
    T. Minami 研究出了优于Sakai的人脸图像自动识别系统。但早期的人脸识别一般都需要人的某些先验知识,无法摆脱人的干预。进入九十年代,由于各方面对人脸识别系统的迫切需求,人臉识别的研究变的非常热门。人脸识别的方法有了重大突破,进入了真正的机器自动识别阶段,如Kartbunen-Loeve变换等或新的神经网络技术。人脸识别研究

    得到了前所未有的重视,国际上发表有关人脸识别等方面的论文数量大幅度增加,仅从1990年到2000年之间,sCl 及EI可检索到的相关文献多达数千篇,这期间关于人脸识别的综述也屡屡可见。国外有许多学校在研究人脸识别技术,研究涉及的领域很广。这些研究受到军方、警方及大公司的高度重视和资助,国内的一些知名院校也开始从事人脸识别的研究。

      人脸识别是当前模式识别领域的一个前沿课题,但目前人脸识别尚处于研究课题阶段,尚不是实用化领域的活跃课题。虽然人类可以毫不困难地由人脸辨别一个人,但利用计算机进行完全自动的人脸识别存在许多困难,其表现在:人脸是非刚体,存在表情变化:人脸随年龄增长面变化:发型、眼镜等装饰对人脸造成遮挡:人脸所成图像受光照、成像角度、成像距离等影响。人脸识别的困难还在于图像包括大量的数据,输入的像素可能成百上千,每个像素都含有各自不同的灰度级,由此带来的计算的复杂度将会增加。现有的识别方法中,通过从人脸图像中提取出特征信息,来对数据库进行检索的方法速度快,而利用拓扑属性图匹配来确定匹配度的方法则相对较快。
    

    1.5人脸识别的研究内容

    人脸识别技术(AFR)就是利用计算机技术,根据数据库的人脸图像,分析提取出有效的识别信息,用来“辨认”身份的技术。人脸识别技术的研究始于六十年代末七十年代初,其研究领城涉及图像处理、计算机视觉、模式识别、计算机智能等领城,是伴随着现代化计算机技术、数据库技术发展起来的综合交叉学科。
    1.5.1人脸识别研究内容

      人脸识别的研究范围广义上来讲大致包括以下hi个方面的内容。
    
      1.人脸定位和检测(Face Detection) :即从动态的场景与复杂的背景中检测出人臉的存在并且确定其位置,最后分离出来。这一任务主要受到光照、噪声、面部倾斜以及各种各样遮挡的影响。
    
      2.人脸表征(Face Representation) (也称人脸特征提取) :即采用某种表示方法来表示检测出人脸与数据库中的已知人脸。通常的表示方法包括几何特征(如欧氏距离、曲率、角度)、代数特征(如矩阵特征向量)、固定特征模板等。
    
      3.人脸识别(Face Recogni tion) :即将待识别的人脸与数据库中已知人脸比较,得出相关信息。这一过程的核心是选择适当的人脸表征方法与匹配策略。
    
      4.表情姿态分析(Expression/Gesture Analysis) :即对待识别人脸的表情或姿态信息进行分析,并对其加以归类。
    
    
      5.生理分类(Physical Classi fication) :即对待识别人脸的生理特征进行分析,得出其年龄、性别等相关信息,或者从几幅相关的图像推导出希望得到的人脸图像,如从父母图像推导出孩子脸部图像和基于年龄增长的人脸图像估算等。
    
      人臉识别的研究内容,从生物特征技术的应用前景来分类,包括以下两个方面:人脸验证与人脸识别。
    
      1.人脸验证((Face Veri ficat ion/Authenticat ion):即是回答“是不是某人?"的问题.它是给定一幅待识别人脸图像,判断它是否是某人的问题,属于一对一的两类模式分类问题,主要用于安全系统的身份验证。
    
      2.人脸识别(Face 。Recognition) :即是回答“是谁”的问题。它是给定-幅待识别人脸图像,再已有的人脸数据库中,判断它的身份的问题。它是个“-对多”的多类模式分类问题,通常所说的人脸识别即指此类问题,这也是本文的主要研究内容。
    

    1.5.2人脸识别系统的组成

      在人脸识别技术发展的几十年中,研究者们提出了多种多样的人脸识别方法,但大部分的人脸识别系统主要由三部分组成:图像预处理、特征提取和人脸的分类识别。一个完整的自动人脸识别系统还包括人脸检测定位和数据库的组织等模块,如图1.1.其中人脸检测和人脸识别是整个自动人脸识别系统中非常重要的两个环节,并且相对独立。下面分别介绍这两个环节。
    

    人脸检测与定位,检测图像中是否由人脸,若有,将其从背景中分割出来,并确定其在图
    像中的位置。在某些可以控制拍摄条件的场合,如警察拍罪犯照片时将人脸限定在标尺内,此时人脸的定位很简单。证件照背景简单,定位比较容易。在另一些情况下,人脸在图像
    中的位置预先是未知的,比如在复杂背景下拍摄的照片,这时人脸的检测与定位将受以下因素的影响: :

      1.人脸在图像中的位置、角度、不固定尺寸以及光照的影响:
    
      2.发型、眼睛、胡须以及人脸的表情变化等,3.图像中的噪声等。
    
      特征提取与人脸识别,特征提取之前一般都要敌几何归一化和灰度归一化的工作。前者指根据人脸定位结果将图像中的人脸变化到同一位置和大小:后者是指对图像进行光照补偿等处理,以克服光照变化的影响,光照补偿能够一定程度的克服光照变化的影响而提高识别率。提取出待识别的人脸特征之后,即进行特征匹配。这个过程是一对多或者一对一的匹配过程,前者是确定输入图像为图象库中的哪一个人(即人脸识别),后者是验证输入图像的人的身份是否属实(人脸验证).  
    

    以上两个环节的独立性很强。在许多特定场合下人脸的检测与定位相对比较容易,因此“特征提取与人脸识别环节”得到了更广泛和深入的研究。近几年随着人们越来越关心各种复杂的情形下的人臉自动识别系统以及多功能感知研究的兴起,人脸检测与定位才作为一个独立的模式识别问题得到了较多的重视。本文主要研究人脸的特征提取与分类识别的问题。

    2基于bp神经网络的人脸识别算法

      虽然人脸识别方法的分类标准可能有所不同,但是8前的研究主要有两个方向,一类是从人脸图像整体(Holistic Approaches)出发,基于图像的总体信息进行分类识别,他重点考虑了模式的整体属性,其中较为著名的方法有:人工神经网络的方法、统计模式的方法等。另一类是基于提取人脸图像的几何特征参数(Feature-Based Approaches), 例如眼、嘴和鼻子的特征,再按照某种距离准则进行分类识别。这种方法非常有效,因为人脸不是刚体,有着复杂的表情,对其严格进行特征匹配会出现困难。面分别介绍- -些常 用的方法,前两种方法属于从图像的整体方面进行研究,后三种方法主要从提取图像的局部特征讲行研究。
    
    
      2.1基于特征脸的方法
    

    特征脸方法(cigenface)是从生元分析方法PCA c Principal ComponentAnalysis 导出的一种人脸分析识别方法,它根据一-组人脸图像构造主元子空间,由于主元具有人脸的形状也称作特征脸。识别时将测试图像投影到主元子空间上得到了-组投影系数,然后和各个已知人的人脸图像进行比较识别,取得了很好的识别效果。在此基础上出现了很多特征脸的改进算法。

      特征脸方法原理简单、易于实现,它把人脸作为一个整体来处理,大大降低了识别复杂度。但是特征脸方法忽视了人脸的个性差异,存在着一定的理论缺陷。研究表明:特征脸方法随光线角度及人脸尺寸的影响,识别率会有所下降。
    

    2.2基于bp神经网络的方法

    一、实验要求采用三层前馈BP神经网络实现标准人脸YALE数据库的识别,编程语言为C系列语言。
    二、BP神经网络的结构和学习算法实验中建议采用如下最简单的三层BP神经网络,输入层为,有n个神经元节点,输出层具有m个神经元,网络输出为,隐含层具有k个神经元,采用BP学习算法训练神经网络。BP神经网络的结构BP网络在本质上是一种输入到输出的映射,它能够学习大量的输入与输出之间的映射关系,而不需要任何输入和输出之间的精确的数学表达式,只要用已知的模式对BP网络加以训练,网络就具有输入输出对之间的映射能力。BP网络执行的是有教师训练,其样本集是由形如(输入向量,期望输出向量)的向量对构成的。在开始训练前,所有的权值和阈值都应该用一些不同的小随机数进行初始化。BP算法主要包括两个阶段:

    2.2.1向前传播阶段

    ①从样本集中取一个样本(Xp,Yp),将Xp输入网络,其中Xp为输入向量,Yp为期望输出向量。
    ②计算相应的实际输出Op。在此阶段,信息从输入层经过逐级的变换,传送到输出层。这个过程也是网络在完成训练后正常运行时执行的过程。在此过程中,网络执行的是下列运算:

    (2) 向后传播阶段
    ①计算实际输出Op与相应的理想输出Yp的差;
    ②按极小化误差的方法调整权矩阵。这两个阶段的工作一般应受到精度要求的控制

    (1)作为网络关于第p个样本的误差测度(误差函数)。

    (2)如前所述,之所以将此阶段称为向后传播阶段,是对应于输入信号的正常传播而言的,也称之为误差传播阶段。为了更清楚地说明本文所使用的BP网络的训练过程,首先假设输入层、中间层和输出层的单元数分别是N、L和M。X=(x0,x1,…,xN-1)是加到网络的输入矢量,H=(h0,h1,…,hL-1)是中间层输出矢量,Y=(y0,y1,…,yM-1)是网络的实际输出矢量,并且用D=(d0,d1,…,dM-1)来表示训练组中各模式的目标输出矢量。输出单元i到隐单元j的权值是Vij,而隐单元j到输出单元k的权值是Wjk。另外用θk和Φj来分别表示输出单元和隐单元的阈值。于是,中间层各单元的输出为:

    (3)而输出层各单元的输出是:

    其中f(*)是激励函数,采用S型函数:

    2.2.2在上述条件下,网络的训练过程如下:

    (1) 选定训练集。由相应的训练策略选择样本图像作为训练集。
    (2) 初始化各权值Vij,Wjk和阈值Φj,θk,将其设置为接近于0的随机值,并初始化精度控制参数ε和学习率α。
    (3) 从训练集中取一个输入向量X加到网络,并给定它的目标输出向量D。
    (4) 利用式(3)计算出一个中间层输出H,再用式(4)计算出网络的实际输出Y。
    (5) 将输出矢量中的元素yk与目标矢量中的元素dk进行比较,计算出M个输出

    误差项:

    对中间层的隐单元也计算出L个误差项:

    (6) 依次计算出各权值和阈值的调整量:

    (8) 当k每经历1至M后,判断指标是否满足精度要求:E≤ε,其中E是总误差函数。

    如果不满足,就返回(3),继续迭代。如果满足,就进入下一步。
    (9) 训练结束,将权值和阈值保存在文件中。这时可以认为各个权值已经达到稳定,分类器形成。再一次进行训练时,直接从文件导出权值和阈值进行训练,不需要进行初始化。

    YALE数据库是由耶鲁大学计算视觉与扼制中心创立,包括15位志愿者,每个人有11张不同姿势、光照和表情的图片,共计165张图片,图片均为80*100像素的BMP格式图像。我们将整个数据库分为两个部分,每个人的前5幅图片作为网络的训练使用,后6副图片作为测试使用。测试样例:

    输入输出:

      神经网络在人脸识别应用中有很长的历史。早期用于人脸识别的神经网络主要是Kohonen自联想映射神经网络,用于人脸的“回忆”。所谓“回忆”是指当输入图像上的人脸受噪声污染严重或部分缺损时,能用Kohonen网络恢复出原来完整的人脸。Intrator 等人用一个无监督/监督混合神经网络进行人脸识别。其输入是原始图像的梯度图像,以此可以去除光照的变化。监督学习目的是寻找类的特征,有监督学习的目的是减少训练样本被错分的比例。这种网络提取的特征明显,识别率高,如果用几个网络同时运算,求其平均,识别效果还会提高。
    
      与其他类型的方法相比,神经网络方法在人脸识别上有其独到的优势,它避免了复:杂的特征提取工作,可以通过学习的过程获得其他方法难以实现的关于人脸识别的规律和规则的隐性表达。此外,神经网络以时示方式处理信息,如果能用硬件实现,就能显著提高速度。神经网络方法除了用于人脸识别外,还适用于性别识别、种族识别等。
    

    2.3弹性图匹配法

    弹性图匹配方法是-种基于动态链接结构DLA C Dynamic Link Architecture的方法。它将人脸用格状的稀疏图表示,图中的节点用图像位置的Gabor小波分解得到的特征向量标记,图的边用连接节点的距离向量标记。匹配时,首先J找与输入图像最相似的模型图,再对图中的每个节点位置进行最佳匹配,这样产生-一个变形图,其节点逼近模型图的对应点的位置。弹性图匹配方法对光照、位移、旋转及尺度变化都敏感。此方法的主要缺点是对每个存储的人臉需计算其模型图,计算量大,存储量大。为此,Wiskott 在原有方法的基础上提出聚東图匹配,部分克服了这些缺点。在聚束图中,所有节点都已经定位在相应目标上。对于大量数据库,这样可以大大减少识别时间。另外,利用聚束图还能够匹配小同人的最相似特征,因此可以获得关于未知人的性别、胡须和眼镜等相关信息。
    2.4基于模板匹配的方法
    模板匹配法是一-种经典的模式识别方法,这种方法大多是用归一一化和互相关,直接计算两副图像之间的匹配程度。由于这种方法要求两副图像上的目标要有相同的尺度、取向和光照条件,所以预处理要做尺度归一化和灰度归一化的工作。最简单的人脸模板是将人脸看成-一个椭圆,检测人臉也就是检测图像中的椭圆。另一种方法是将人脸用一-组独立的小模板表示,如眼睛模板、嘴巴模板、鼻子模板、眉毛模板和下巴模板等。但这些模板的获得必须利用各个特征的轮廓,而传统的基于边缘提取的方法很难获得较高的连续边缘。即使获得了可靠度高的边缘,也很难从中自动提取所需的特征量。模板匹配方法在尺度、光照、旋转角度等各种条件稳定的状态下,它的识别的效果优于其它方法,但它对光照、旋转和表情变化比较敏感,影响了它的直接使用。2.5基于人脸特征的方法人脸由眼睛、鼻子、嘴巴、下巴等部件构成,正因为这些部件的形状、大小和结构上的各种差异才使得世界上每个人脸千差万别,因此对这些部件的形状和结构关系的几何描述,可以作为人脸识别的重要特征。几何特征最早是用于人脸检测轮廓的描述与识别,首先根据检测轮廓曲线确定若干显著点,并由这些显著点导出- -组用于识别的特征度量如距离、角度等。采用儿何特征进行正面人脸识别一般是通过提取人眼、口、鼻等重要特征点的位置和眼睛等重要器官的几何形状作为分类特征。
    定位眼睛往往是提取人脸几何特征的第-步。由于眼睛的对称性以及眼珠呈现为低灰度值的圆形,因此在人脸图像清晰瑞正的时候,眼睛的提取是比较容易的。但是如果人脸图像模糊,或者噪声很多,则往往需要利用更多的信息(如眼睛和眉毛、鼻子的相对位置等),而且.这将使得眼睛的定位变得很复杂。而且实际图像中,部件未必轮廓分明,有时人用眼看也只是个大概,计算机提取就更成问题,因而导致描述同-一个人的不同人脸时,其模型参数可能相差很大,面失去识别意义。尽管如此,在正确提取部件以及表情变化微小的前提下,该方法依然奏效,因此在许多方面仍可应用,如对标准身份证照片的应用。

    2.5九个人脸库介绍

    1. FERET人脸数据库
      http://www.nist.gov/itl/iad/ig/colorferet.cfm
      由FERET项目创建,此图像集包含大量的人脸图像,并且每幅图中均只有一个人脸。该集中,同一个人的照片有不同表情、光照、姿态和年龄的变化。包含1万多张多姿态和光照的人脸图像,是人脸识别领域应用最广泛的人脸数据库之一。其中的多数人是西方人,每个人所包含的人脸图像的变化比较单一。

    2. CMU Multi-PIE人脸数据库
      http://www.flintbox.com/public/project/4742/
      由美国卡耐基梅隆大学建立。所谓“PIE”就是姿态(Pose),光照(Illumination)和表情(Expression)的缩写。CMU Multi-PIE人脸数据库是在CMU-PIE人脸数据库的基础上发展起来的。包含337位志愿者的75000多张多姿态,光照和表情的面部图像。其中的姿态和光照变化图像也是在严格控制的条件下采集的,目前已经逐渐成为人脸识别领域的一个重要的测试集合。

    3. YALE人脸数据库(美国,耶鲁大学)
      http://cvc.cs.yale.edu/cvc/projects/yalefaces/yalefaces.html
      由耶鲁大学计算视觉与控制中心创建,包含15位志愿者的165张图片,包含光照、表情和姿态的变化。
      Yale人脸数据库中一个采集志愿者的10张样本,相比较ORL人脸数据库Yale库中每个对象采集的样本包含更明显的光照、表情和姿态以及遮挡变化。

    4. YALE人脸数据库B
      https://computervisiononline.com/dataset/1105138686
      包含了10个人的5850幅在9种姿态,64种光照条件下的图像。其中的姿态和光照变化的图像都是在严格控制的条件下采集的,主要用于光照和姿态问题的建模与分析。由于采集人数较少,该数据库的进一步应用受到了比较大的限制。

    5. MIT人脸数据库
      由麻省理工大学媒体实验室创建,包含16位志愿者的2592张不同姿态(每人27张照片),光照和大小的面部图像。

    6. ORL人脸数据库
      https://www.cl.cam.ac.uk/research/dtg/attarchive/facedatabase.html
      由英国剑桥大学AT&T实验室创建,包含40人共400张面部图像,部分志愿者的图像包括了姿态,表情和面部饰物的变化。该人脸库在人脸识别研究的早期经常被人们采用,但由于变化模式较少,多数系统的识别率均可以达到90%以上,因此进一步利用的价值已经不大。
      ORL人脸数据库中一个采集对象的全部样本库中每个采集对象包含10幅经过归一化处理的灰度图像,图像尺寸均为92×112,图像背景为黑色。其中采集对象的面部表情和细节均有变化,例如笑与不笑、眼睛睁着或闭着以及戴或不戴眼镜等,不同人脸样本的姿态也有变化,其深度旋转和平面旋转可达20度。

    7. BioID人脸数据库
      https://www.bioid.com/facedb/
      包含在各种光照和复杂背景下的1521张灰度面部图像,眼睛位置已经被手工标注。

    8. UMIST图像集
      由英国曼彻斯特大学建立。包括20个人共564幅图像,每个人具有不同角度、不同姿态的多幅图像。

    9. 年龄识别数据集IMDB-WIKI
      https://data.vision.ee.ethz.ch/cvl/rrothe/imdb-wiki/
      包含524230张从IMDB和Wikipedia爬取的名人数据图片。应用了一个新颖的化回归为分类的年龄算法。本质就是在0-100之间的101类分类后,对于得到的分数和0-100相乘,并将最终结果求和,得到最终识别的年龄

    3matlab分析人脸方法介绍
    人脸识别之一:查找图片中的人脸并用方框圈出
    这种类似于智能手机拍照时,屏幕里那个框任务头部的红框。大致步骤为:获取RGB图片—>转换为灰度图像—>图像处理—>人脸识别。代码如下:clear all
    clc

    %获取原始图片
    i=imread(‘face.jpg’);
    I=rgb2gray(i);
    BW=im2bw(I); %利用阈值值变换法将灰度图像转换成二进制图像
    figure(1);
    imshow(BW);
    %最小化背景
    [n1 n2]=size(BW);
    r=floor(n1/10);
    c=floor(n2/10);
    x1=1;x2=r;
    s=r*c;

    for i=1:10
    y1=1;y2=c;
    for j=1:10
    if(y2<=c || y2>=9c) || (x11 || x2r10)
    loc=find(BW(x1:x2,y1:y2)==0);
    [o p]=size(loc);
    pr=o*100/s;
    if pr<=100
    BW(x1:x2,y1:y2)=0;
    r1=x1;r2=x2;s1=y1;s2=y2;
    pr1=0;
    end
    imshow(BW);
    end
    y1=y1+c;
    y2=y2+c;
    end
    x1=x1+r;
    x2=x2+c;
    end
    figure(2)
    subplot(1,2,1);
    imshow(BW)
    title(‘图像处理’);
    %人脸识别
    L=bwlabel(BW,8);
    BB=regionprops(L,‘BoundingBox’);
    BB1=struct2cell(BB);
    BB2=cell2mat(BB1);

    [s1 s2]=size(BB2);
    mx=0;
    for k=3:4:s2-1
    p=BB2(1,k)*BB2(1,k+1);
    if p>mx && (BB2(1,k)/BB2(1,k+1))<1.8
    mx=p;
    j=k;
    end
    end
    subplot(1,2,2);
    title(‘人脸识别’);
    imshow(I);
    hold on;
    rectangle(‘Position’,[BB2(1,j-2),BB2(1,j-1),BB2(1,j),BB2(1,j)],‘EdgeColor’,‘r’)实验效果图:

             从实验效果图中,可以看出红框框出了人脸部分。
    

    人脸识别之二:由输入的人像识别出数据库中人像
    这种情况类似于手机人脸解锁,通过当前的人脸去和保存的人脸做比对来实现解锁等功能;从网上看了好多资料,由于个人能力有限大多都没仿真出来,最后通过学习PCA算法,了解到可通过PCA算法对输入矩阵降维,提取特征值和特征向量的方式来做人脸比对。具体的PCA的东西在这里不作介绍,主要介绍一下如何实现人脸比对。
    大致步骤:制作人脸数据样本—>PCA提取样本数据特征值—>人脸比对1.人脸样本
    从网上搜集了10张人脸图片,来制作成样本。

                         %读取转换10张图片,生成数据矩阵function ImgData = imgdata()  
    

    %导入图片
    picture1 = rgb2gray(imread(‘1.jpg’));
    picture2 = rgb2gray(imread(‘2.jpg’));
    picture3 = rgb2gray(imread(‘3.jpg’));
    picture4 = rgb2gray(imread(‘4.jpg’));
    picture5 = rgb2gray(imread(‘5.jpg’));
    picture6 = rgb2gray(imread(‘6.jpg’));
    picture7 = rgb2gray(imread(‘7.jpg’));
    picture8 = rgb2gray(imread(‘8.jpg’));
    picture9 = rgb2gray(imread(‘9.jpg’));
    picture10 = rgb2gray(imread(‘10.jpg’));
    [m,n] = size(picture1);
    picture_ten = {picture1,picture2,picture3,picture4,picture5,picture6,picture7,picture8,picture9,picture10};
    for i=1:10
    %把mn的矩阵变换成1(mn)的矩阵
    ImgData(i,:) = reshape(picture_ten{i},1,m
    n);
    end
    %数据范围缩小到0到1之间
    ImgData = double(ImgData)/255;

    PCA分析function Cell_ten = PCA(imgdata,k)
    [m,n] = size(imgdata);
    img_mean = mean(imgdata); %计算每列平均值
    img_mean_ten = repmat(img_mean,m,1); %复制m行平均值至矩阵img_mean_ten
    Z = imgdata - img_mean_ten;
    T = Z’Z;%协方差矩阵
    [V,D] = eigs(T,k); %计算T中最大的前k个特征值与特征向量
    img_new = imgdata
    V*D; %低维度下的各个人脸的数据
    Cell_ten = {img_new,V,D};3.通过输入测试人脸从数据库中找到相对应人脸function face= facefind(Cell_ten,testdata)%此函数代码借鉴于他人,还未征求其同意,这里就暂时略过这里testdata是测试图片的数据4.主程序调用img=imgdata(); %图片矩阵数据
    Cell_ten=PCA(img,2);% PCA
    face1=facefind(Cell_ten,imread(‘test.jpg’));%识别
    subplot(1,2,1)
    imshow(‘test.jpg’)
    title(‘测试图像’)
    subplot(1,2,2)
    imshow(strcat(num2str(face1),’.jpg’))
    title(‘数据库图像’)测试效果: 使用这个方式可以实现简单的人脸识别,但精确度不高;

    4 分析算法
    在人脸识别系统中有许多关键环节,其中最重要的莫过于特征提取。利用主成分分析法(PCA)进行特征提取是目前应用最多的提取方法。作为一种科学的统计方法,它在模式识别、信号处理、数字图像处理等等领域都有广泛涉猎。基于PCA中空间原始数据主要特征提取,减少数据冗余的思想,一些在低维特征空间的数据被处理,并合理保留了原始数据中有用的信息,数据空间中维数过高的问题也得以解决。
    4.1  主成分分析的基本原理

    实际上主成分分析就是一种数学降维演算方法,用若干个综合变量来代替原本更多的变量,让这些综合变量尽可能的实现对原有变量信息的取代,并保持彼此之间不存在关联。这种多变量化为少数相互无关的变量且信息量不变的统计分析方法就叫做主成分分析法。
      假设F1表示原变量的首个线性组合所组成的主要成分指标,就有F1=a11X1+a21X2+…ap1Xp。根据这个数学式可知,如果在每一个主成分中提取一个信息量,即可用方差(F1)进行度量,随着方差F1的增大,F1所包含的信息也就越多,同时它的线性组合选取也可表示为X1、X2…XP,它们都被称为方差F1中的第一主成分。如果第一主成分不足以代表原有的P个变量信息时,就可以考虑选取F2,即第二个线性组合,借由它来反映原本的有效信息。在F2中可以不显示第一主成分中已有的信息,以数学语言来表达要求的话即Cov(F1,F2)=0,其中F2为第二主成分。所以按照实际原变量的变化需求,就可以构造出多个主成分指标。
      4.2人脸识别的技术特点

    人脸识别是模式识别中的重要分支,它是指通过计算机系统来分析人脸图像,从中获取有价值的识别信息,从而辨识身份。所以说从技术特点上来看,人脸识别具有以下几个关键特色。
     1、PCA算法
    算法大致步骤:
    设有m条n维数据。
    1)将原始数据按列组成n行m列矩阵X;
    2)将X的每一行(这里是图片也就是一张图片变换到一行)进行零均值化,即减去这一行的均值(样本中心化和标准化);将所有的样本融合到一个矩阵里面特征向量就是变换空间的基向量U=[u1,u2,u3,u4,…],脑袋里面要想到一个样本投影变换就是该空间的一个点,然后对于许多点可以用KNN等不同的方法进行分类。
    3)求出协方差矩阵C=1mXXTC=1mXXT C=\frac {1 }{m } XX^TC=m1XXT;
    4)求出协方差矩阵的特征值及对应的特征向量;
    5)将特征向量按对应特征值大小从上到下按行排列成矩阵,取前k行组成矩阵P;
    6)Y=PXY=PX Y=PXY=PX即为降维到kk kk维后的数据。
      对数据进行中心化预处理,这样做的目的是要增加基向量的正交性,便于高维度向低纬度的投影,即便于更好的描述数据。
      对数据标准化的目的是消除特征之间的差异性,当原始数据不同维度上的特征的尺度不一致时,需要标准化步骤对数据进行预处理,使得在训练神经网络的过程中,能够加速权重参数的收敛。
      过中心化和标准化,最后得到均值为0,标准差为1的服从标准正态分布的数据。
      求协方差矩阵的目的是为了计算各维度之间的相关性,而协方差矩阵的特征值大小就反映了变换后在特征向量方向上变换的幅度,幅度越大,说明这个方向上的元素差异也越大(越有投影的必要,矩阵相乘的过程就是投影),故而选取合适的前k个能以及小的损失来大量的减少元数据的维度。

    2、PCA原理推导
    基于K-L展开的PCA特征提取:

    5.算法优化方法
    我用了三种方法对其进行优化
    1.采用动量梯度下降算法训练 BP 网络。
    训练样本定义如下:
    输入矢量为
    p =[-1 -2 3 1
    -1 1 5 -3]
    目标矢量为 t = [-1 -1 1 1]
    2. 采用贝叶斯正则化算法提高 BP 网络的推广能力。在本例中,我们采用两种训练方法,即 L-M 优化算法(trainlm)和贝叶斯正则化算法(trainbr),用以训练 BP 网络,使其能够拟合某一附加有白噪声的正弦样本数据。其中,样本数据可以采用如下MATLAB 语句生成:
    输入矢量:P = [-1:0.05:1];
    目标矢量:randn(’seed’,78341223);
    T = sin(2piP)+0.1randn(size§);
    3. 采用“提前停止”方法提高 BP 网络的推广能力。对于和例 2相同的问题,在本例中我们将采用训练函数 traingdx 和“提前停止”相结合的方法来训练 BP 网络,以提高 BP 网络的推广能力。在利用“提前停止”方法时,首先应分别定义训练样本、验证样本或测试样本,其中,验证样本是必不可少的。在本例中,我们只定义并使用验证样本,即有
    验证样本输入矢量:val.P = [-0.975:.05:0.975]
    验证样本目标矢量:val.T = sin(2
    pival.P)+0.1randn(size(val.P))
    值得注意的是,尽管“提前停止”方法可以和任何一种 BP 网络训练函数一起使用,但是不适合同训练速度过快的算法联合使用,比如 trainlm 函数,所以本例中我们采用训练速度相对较慢的变学习速率算法 traingdx 函数作为训练函数。
    参考文献

    [1] HongZiquan.AlgbricFeatureExcaciofmftfoReonino[JPatteo Recognition. 1991. 22 (1) :43~44.
    [2] Yuille A L Detcction Templates for Face Recognitio[JCognitive Neuroscience , 1991. 191-200
    [3]卢春雨张长水局城区城特征的快速人脸检测法[D北京:清华大学学报.1999.96 (1) ;4-6.
    [4]陈刚,减飞虎实用人脸识别系统的本征脸法实现[D]2001年5月230():45-46.
    [
    5]杜平,徐大为,刘重庆,基F整体特征的人脸识别方法的研究[12003年6月49 (3) ;382-383.
    [6] Chow G, Li X. Towards A System for Automatic Facial Feature Detctio[U] 1993. 2903)2-3.
    [7]杨变若,王煎法,杨未来人脸全局特iE识别研究[Z]1997年11月3(5):; 871-875.
    [8]边肇棋,张学工阎平凡等模式识别D]北京:清华大学出版社2000 302)16-17.

    致 谢

      从毕业设计的选题到论文的指导到最后定稿,期间遇到了无数的困难和阻碍,也曾想过对自己降低要求,也曾想过放弃最初想要坚持的设计,但是最后在孙老师和同学的鼓励和陪伴下,努力克服了所有的困难,独立完成了毕业设计和论文的书写。尤其是要感射我的论文指导老师孙老师,不厌其烦的对我的设计进行指导修改,耐心的帮助我改进设计帮助我搜集相关的资料,感谢孙老师如母亲--般的关怀,在孙老师身上不仅学习到了对学术严谨的态度,更被孙老师亲切无私的个人魅力所感染。
    
      还要感谢我的同学和其他所有的老师,他们严谨的学术态度,宽容待人严于律己的处世风范都使我受益良多。
    
    展开全文
  • 路径规划基本介绍(一)

    万次阅读 多人点赞 2019-04-24 21:30:03
    这里仅针对静态路径规划方法进行简单的介绍,以下路径规划仅指在静态环境下的路径规划。 在进行路径规划的时候,我们首先需要考虑的有以下几个方面: a.起点与终点的位置获取 b.障碍物的环境表示 c.规划方法 d.搜索...

    一、路径规划的作用
    路径规划主要是让目标对象在规定范围内的区域内找到一条从起点到终点的无碰撞安全路径。路径规划中有静态路径规划以及动态路径规划。这里仅针对静态路径规划方法进行简单的介绍,以下路径规划仅指在静态环境下的路径规划。
    在进行路径规划的时候,我们首先需要考虑的有以下几个方面:
    a.起点与终点的位置获取
    b.障碍物的环境表示
    c.规划方法
    d.搜索方法
    二、路径规划需要考虑的几个方面
    1.起点与终点的位置获取
    这个问题很简单,说白了就是我们如何让机器人知道起点和终点的位置。在静态路径规划的情况下,我们通常已知了机器人所处的环境,即地图。而地图则是一个存储着数据的二维数组。这样,我们就可以通过数组的下标唯一的确定数组中的一个或多个元素,即确定地图上的起点与终点位置。当然,在实际的情况中,可能会比这复杂得多,例如机器人在确定自身在地图中的位置时(即起点),会需要其本身所携带的各种传感器,如摄像头,激光雷达,红外传感器,陀螺仪等,通过传感器的数据来感知周围的环境,从而得知自身的位置。因为我们讨论路径规划,所以这部分不会进行很详细的介绍。
    2.障碍物的环境表示
    在进行路径规划的时候,我们需要让机器人知道地图上的哪些区域是可以通行的,哪些是不可以通行的,这样,我们根据一定的规则,就可以避开不可通行的区域,到达目的地。对一个机器人来说,它根据传感器的数据绘制出完整的地图后,就得到了它的活动空间的一个有效描述,即环境模型。在规划前首先要做的就是将环境的描述由外部的原始形式通过一系列处理转化围合式规划的内部的世界模型,这个过程称为环境建模,其中主要的是障碍物的表示方法。合理的环境表示有利于建立规划方法和选择合适的搜索算法,最终实现较少的时间和内存开销而规划出较为满意的路径。不同的路径规划方法正是基于不同的环境建模。
    a.栅格表示法
    栅格法通过使用大小相同的栅格画风空间环境,并用数组来表示环境。每个栅格点或在障碍物空间,火灾自由空间。对于混合栅格点(即一部分是自由空间,一部分是障碍物空间),依据其各自占据的比例将其归属于自由空间或障碍物空间。障碍物在数组中表示为1 ,自由空间表示为0.最短路径是通过搜索这张栅格地图来得到的。规划空间表达具有一致性、规范性和简单性,它同时具有表达不规则障碍物的能力。其缺点是存在着空间开销和求解精度之间的精度。
    栅格地图,二维数组中存储的元素数值就代表了环境中不同的情况
    b.单元数法
    单元数法是为了克服栅格法的缺点。其主要思想是通过将环境空间划分为大小不同的单元来进行环境的描述。常用做法是:将环境空间划分为几个比较大的单元(一般来说,二维空间划分成4部分,称为4×树,三维空间划分为8部分,称为8叉树),其划分的单元的工作空间可能是以下三个部分:自由空间、障碍物空间、混合空间。其优点是自适应性较好。主要缺点是计算单元之间的邻接关系时的损失较大,并且计算的算法实现要比栅格法更加复杂。
    3.规划方法
    为了解决路径规划问题,人们已经探索出很多有效的求解方法。他们不是互相排斥的,并且常常结合起来共同实现路径。大致可以分为两类:传统方法和智能方法。
    a.传统方法
    i— 几何法
    几何法抽取的是环境的几何特征。利用其结合特性将环境空间映射到一个加权(权值可以使两点之间的几何距离)图上,这样就能把避开障碍物的路径规划问题转化成一个简单的图搜索的问题上。基于几何法的路径规划方法一般分为3步:
    1>.在搜索图中找到起点
    2>.在搜索图中找到目标点
    3>.把这两个点用图中不穿过障碍物的折线或曲线连接起来,就得到了一条无碰撞路径。
    几何法包括:
    a.可视图法(Visibility Graph)
    该方法将所有障碍物的顶点(集合为V0)、起始点s、目标点g用直线组合相连,同时要求三者之间的连线均不能穿过障碍物,即直线是可视的,给图中的边赋权值,构造图G(V,E)。然后采用某种搜索方法规划最优路径。该方法在障碍物数目或行状不复杂的时候可以使用,但是当这二者不满足的情况下,所构造的图G(V,E)会成千成百的增加计算量,因此,有些聪明的人将其进行了一些改进,使得它不用保存那么多的信息也可以完成路径规划,这种方法叫切线法。切线法
    可视图
    优点:概念直观,实现简单
    缺点:缺乏灵活性,即一旦起点和目标点发生改变,就要重新构造可视图,且路径不是最优
    b.Voronoi图法
    该方法使用一系列的节点来定义的,这些节点到附近的两个或多个障碍物的边缘是等距的。Voronoi图把空间划分成若干个区域,每个区域只包含一个障碍物的边缘(类似于brushfram方法)
    Voronoi图法
    优点:路径安全性十分高
    缺点:计算量十分的大,路径不是最优
    c.自由空间法
    把环境分成两部分,即障碍物空间和自由空间。用某种搜索策略在自由空间中找到一条路径。按照划分自由空间方法的不同又可分为:凸区法、三角形法、广义锥法。
    优点:路径无碰撞,比较灵活,起始点和目标点的改变不会引起连通图的重构。
    缺点:在某些情况下,路径偏离前景目标太远,另外规划出的路径形态比较复杂,精度不高。
    ii— 单元划分法
    单元划分的典型特征是划分空间与搜索是交叉进行的。这种方法把自由空间划分为一个由简单的单元所构成的集合,各单元之间的连线的邻接关系也同时被计算。首先标识出起点和目标点的所在的单元,再连接两点之间的连续单元格,就得到了一条安全路径。单元的花粉可以依赖障碍物,也可以独立于障碍物。
    对于前者,障碍物的边界用于生成单元格的边界,所得到的自由单元的集合精确的定义自由空间,其优点是:有效的表达了障碍物,最后所得的单元格少,相对于独立于障碍物的单元划分法搜索节点少。其缺点是:单元分解与计算单元之间的邻接关系的开销较大。
    对于独立于障碍物的单元分解,环境空间被划分为一些有规则形状的单元,算法简单。在所有单元中,如没有包含障碍物,称其为空单元:若被障碍物充满,则为满单元,若部分包含障碍物,称其为混合单元。八段元视为节点,其间的相邻关系用弧线连接起来,得到一个网络连通图,于是寻找安全路径问题变为图的搜索。其优点是:划分简单,易于实现。缺点是:
    不一定精确表示障碍物,改善途径是增加单元的数量,就可以提高换分的精度。
    iii— 人工势场法
    实际上是一种拟物方法,模拟自然界中的静电场,流体等。人工势场法
    BrushFire
    iiii— 数学分析方法
    这种方法将由起点到终点寻找最优路径问题转化为求一组带约束条件目标函数的极值问题,将路径规划问题转化成一个函数优化问题。由于这种优化是非线性的,并带有许多种限制条件,故往往使用离散化方法来找到最优解。
    b.智能路径规划方法
    i—基于模糊逻辑的路径规划
    模糊逻辑避障是一种仿人控制过程,其原理就是根据总结的规则确定输出值。该方法最大的特点是参考人的驾驶经验,计算量不大,易做到边运动边规划,能够满足实时性要求。同时克服了势场法的局部最优的问题。其缺点是:人的经验也不一定是完备的;输入量增多时,推理规则和模糊表会急剧膨胀
    ii— 基于神经网络方法的路径规划
    路径规划是感知空间到行为空间的一种映射。映射关系可以用不同的方式表示,但很难用精确地数学方程表示。而神经网络巧妙地避开了这一难题,通过其网络的自学习来达到建立精确模型的目的。缺点是:典型样本获得难度较大,网络训练速度不一,学习机制会有缺陷。
    iii—基于遗传算法的路径规划
    以自然遗传机制和自然选择等生物进化理论为基础,构造了一类随机化搜索算法。他利用选择、交叉和变异等遗传操作来培养控制机构的计算过程,在某种程度上对生物进化过程做数学方式的模拟。其特点为:对参数的编码进行操作而不是参数本身;作为并行算法,在某种程度上适用于全局搜索;是用的是随机搜索过程;对于待优函数基本上没有任何要求,只利用适应度信息。缺点是:运算速度不快进行众多的规划要占用较大的存储空间和运算时间;有时候会提前收敛。
    4.搜索方法
    给定一种环境空间的表示方法(环境的抽象)和规划技术(数学的理论表达)后,求避障路径问题就变成了求解数学问题的最优解的问题,也就是搜索一个从起点到终点的连续节点序列问题。搜索技术分为三类:基于微积分搜索技术、有指导的随机搜索技术和枚举技术。
    a.基于微积分搜索集输
    该技术使用微积分理论求解满足一组充分必要条件问题的最优解。由于方法的理论工具是传统的微积分,因此利用这种搜索技术的前提是目标函数与约束条件要有解析表达式,并且可导。而避障路径规划问题很难归纳出这样的解析表达式。在人工势场方法中,实际上也还是将路径规划问题转化为求解高维度函数的极值问题。这种技术易于陷入局部最优解。
    b.有指导的随机搜索技术
    该技术以枚举法为基础,附加了一些指导搜索过程的信息。其两个主要的子集是模拟退火算法(SAA)和遗传算法(GA)。
    c.枚举法
    该技术是搜索目标函数的域空间中的每一个点,他们实现简单,但可能会需要大量的计算。常用的有深度优先搜索(DFS)、广度优先搜索(BFS)、A*搜索、Dijkstra搜索、波传播算法等。
    波传播算法即是从水波中得到的启发。波传播算法就是模拟了这一过程,将环境视为水面,起点视为石子,这样,水波总能会经过目标点。波传播算法以波形分为矩形波传播算法和圆形波传播算法。

    矩形波

    矩形波传播算优点:简单易行,只要栅格大小选取得当,并且起点与终点之间存在路径,运用该方法一定能找到到一条合适的路径。缺点:路劲不一定是最优。这种方法把路径长短用经过此格子时的波的传播圈数来度量。事实上,路径的长短和经过的波的传播圈数不是严格的单调关系。
    圆形波

    圆形波的传播优点:可以找到比矩形波较优的路径。缺点是:栅格环境下,构造圆形波增加了复杂度。主要难点是圆形波各圈半径的确定。因为栅格的连续和形状,当波圈增加时,其半径等差增加并不是对应栅格个数的等差增加,如果半径增加选择大了,在波覆盖时就会漏掉一些格子;反之如果减小了,不仅会做一些无用的覆盖,而且会大大增加复杂度。实际上,圆形波的提出者的算法并不是真正的圆形波,还是用矩形波来传播,用类似于圆形波的距离概念进行填写的。上述的图片不是太清晰,可以看下面这一个图。在这里插入图片描述
    d.搜索算法的比较
    基于微积分的搜索技术,可分为直接法和间接法,直接法根据目标函数的梯度来确定下一步的搜索方向,如Newton法,共轭梯度法和尺度变换法等。直接法采用的是一种爬山法,即根据最陡的方向爬上一个局部最优解。间接法则从极值的必要条件出发导出一组方程,然后求解方程组再通过比较求得极值,然而导出的方程一般是非线性的,他的求解非常困难,所以,对一些很简单的问题才使用间接法。
    由于遗传算法是一种马氏链过程,虽有一些关于收敛性的研究,但是还是缺乏中肯的分析。
    经典搜索算法中一些算法程序的实现非常简单,搜索出的结果非常接近最优结果,有的甚至就是最优结果。例如A*搜索算法,Dijkstra算法,贪心算法等。其中Dijkstra算法与贪心算法容易陷入局部最优而导致路径很差或路径规划失败,因此需要我们有针对性的运用他们。
    本文还有一些内容没有补充完整,稍后再进行补充。内容大部分参考了一篇论文,以下是原论文的链接:
    参考论文链接http://xueshu.baidu.com/usercenter/paper/show?paperid=08ed3a8e7c2e4c58411bcf4fe43590eb&site=xueshu_se
    待续。。。。。

    展开全文
  • 足式机器人较传统的四轮式履带式有着无与伦比的优势,其在复杂环境中具有更高的机动性,在军事任务抢险任务中能够发挥出比传统轮式更大的作用。要想让机器人更智能,首先要做到的是让机器人能够像人或动物一样...
  • C#基础教程-c#实例教程,适合初学者

    万次阅读 多人点赞 2016-08-22 11:13:24
    本章介绍C#语言的基础知识,希望具有C语言的读者能够基本掌握C#语言,并以此为基础,能够进一步学习用C#语言编写window应用程序Web应用程序。当然仅靠一章的内容就完全掌握C#语言是不可能的,如需进一步学习C#语言...
  • 机器学习算法 综述(入门)

    万次阅读 多人点赞 2019-06-16 21:59:28
    学习了一个学期机器学习算法,从什么都不懂到对十个机器学习算法有一定的了解,下面总结一下十大机器学习算法,从算法的概念、原理、优点、缺点、应用等方面来总结,如果有错误的地方,欢迎指出。 目录 1.决策树...
  • 在传统计算公式的基础上,利用递推原理推导出一种新型的较为容易判别平面机构自由的方法――― 断杆法,并用实例证明了该计算方法的正确性实用性。“断杆法”克服了传统公式对运动副的依赖,并且通过 将机构分组,...
  • 关于举办“分子动力学模拟及第一性原理计算方法与应用”系列培训班的通知 各有关单位: 分子动力学模拟、第一性原理计算被广泛用于生命科学、化学工程、物理、医药、材料科学、电子学等领域。由于传统实验需要大量...
  • 好久没更博客了,最近刚做完毕设,打算就用到的方法大概的做几个简介,有些方法网上也有很多简介,但是多多少少我发现都有点不太仔细或者便于理解,今天刚好总结一下这段时间用到的算法之一,然后也算梳理一下思绪。...
  • 移动web开发笔记

    万次阅读 2016-05-15 20:12:27
    - device-aspect-ratio:aspect-ratio类似,基于设备渲染平面宽度高度的宽高比。 - color:每种颜色的位数。例如min-color: 16会检测设备是否拥有16位颜色。 - color-index:设备的颜色索引表中的颜色数。值...
  • WPF开发教程

    万次阅读 多人点赞 2019-07-02 23:13:20
    ------WPF开发教程 目录 WPF基础入门....... 1. WPF基础之体系结构......2. WPF基础之XAML....3. WPF基础之基元素......4. WPF基础之属性系统......5. WPF基础之路由事件......7. WPF基础之样式设置模板化... ...
  • 计算机图形学导论

    千次阅读 多人点赞 2018-10-12 22:42:46
    一些先进的辐射着色计算方法可能只计算房间中从墙面、地板与房顶反射的环境光,而并不计算复杂物体反光对于辐射着色的影响,或者在辐射着色计算中使用同样尺寸及纹理的简单物体取代复杂物体。如果场景中运动的辐射...
  • 《工程电磁场(第三版)》(倪光正 主编)复习

    万次阅读 多人点赞 2019-08-23 12:00:33
    度计算公式 矢量的旋度是一个矢量 方向环量积分路径循行的方向满足右手螺旋定则,且为获得最大环量位置的面积元的发现方向 ,其大小表征了每单位面积上的最大环量。 因此旋度描述了漩涡源的强度。 ...
  • 刚体变换只改变物体的空间位置(平移)朝向(旋转),而不改变其形状的变换(一种记忆方法,硬的东西:比如石头,你不能改变他的形状,只能把它旋转或者平移),可用两个变量来描述:正交单位旋转矩阵R,三维平移矢量T...
  • 计算机组成原理知识点

    万次阅读 多人点赞 2017-09-25 11:17:08
    计算机组成原理(Computer Organization)是依据计算机体系结构,在确定且分配了硬件子系统的概念结构功能特性的基础上,设计计算机各部件的具体组成,以及它们之间的连接关系,实现机器指令级的各种功能特性,这...
  • 1、地球赤道上环绕地球一周走一圈共40075.04公里,而@一圈分成360°,而每1°()有60,每一度一秒在赤道上的长度计算如下: 40075.04km/360°=111.31955km 111.31955km/60=1.8553258km=1855.3m  而每一分又有60秒,...
  • 主成分分析

    万次阅读 多人点赞 2014-03-12 10:07:24
    主成分分析 在实际问题中,我们经常会遇到研究多个变量的问题,而且在多数情况下,多个变量之间常常存在一定的相关性。由于变量个数较多再加上变量之间的相关性,势必增加了...第一节 主成分分析的原理及模型 一、
  • 3D成像方法汇总介绍:这里要介绍的是真正的3D成像,得到物体三维的图形,是立体的图像。而不是利用人眼视觉差异的特点,错误感知到的假三维信息。原理上分类:主要常用有:1、双目立体视觉法(S...
  • 指纹识别的原理和方法

    千次阅读 2020-05-28 11:43:41
     指纹识别技术主要涉及四个功能:读取指纹图象、提取特征、保存数据比对。  在一开始,通过指纹读取设备读取到人体指纹的图象,取到指纹图象之后,要对原始图象进行初步的处理,使之更清晰。  接下来...
  • 基于MATLAB的水果分级设计

    万次阅读 多人点赞 2018-06-14 14:19:35
    基于MATLAB的水果分级识别技术研究摘 要本次毕业设计介绍了基于MATLAB的水果分级自动识别,利用手机端获取苹果的样本图像,应用MATLAB软件编程... 在苹果大小识别方面,比较了不同的大小计算方法,选择了利用图...
  • 一、国内外知名激光雷达公司盘点 国外激光雷达公司产品概况   ...就目前市面上的主流激光雷达产品而言,用于环境探测地图构建的雷达,按技术路线大体可以分为两类,一类是三角测距激光...
  • 2d Laser Odomter 内外参数标定工具原理及使用方法

    万次阅读 多人点赞 2019-03-15 12:26:07
    两轮差速轮式机器人可以基于码盘数据两轮间距以及车轮半径进行航迹推演,得到机器人的轨迹。激光雷达也可以利用 icp 等算法计算出两时刻间机器人的相对运动量。因此,可以利用两者数据进行融合定位,本博客根据 ...
  • Gabor滤波器与特征提取

    万次阅读 多人点赞 2016-03-18 19:21:37
    一、Gabor滤波器 Gabor滤波器,最主要使用优势体现在对物体...Gabor滤波器对于图像的亮度对比变化以及人脸姿态变化具有较强的健壮性,并且它表达的是对人脸识别最为有用的局部特征,故在计算机视觉及纹理分析中
  • 某点的颜色为P(R,G,B),灰度计算方法: 浮点算法:Gray = R*0.3+G*0.59+B*0.11; 整数方法:Gray = (R*30+G*59+B*11)/100; 移位方法:Gray = (R*76+G*151+B*28)&gt;&gt;8; 平均值法:Gray =(R+G+B)/3...
  • 常见文本相似度计算方法简介

    千次阅读 2020-04-25 20:51:16
    本文首发于知乎(https://zhuanlan.zhihu.com/p/88938220),主要介绍了文本相似度计算的基本思路常用方法
  • 机器视觉基础知识汇总

    千次阅读 多人点赞 2018-05-11 14:10:45
    【机器视觉的优势】机器视觉系统具有高效率、高度自动化的特点,可以实现很高的分辨率精度速度。机器视觉系统与被检测对象无接触,安全可靠。人工检测与机器视觉自动检测的主要区别有: 【系统组成】一个典型的...

空空如也

空空如也

1 2 3 4 5 ... 20
收藏数 30,981
精华内容 12,392
关键字:

平面度计算方法和原理