精华内容
参与话题
问答
  • 图像识别技术原理和神经网络的图像识别技术

    千次阅读 多人点赞 2019-03-03 19:44:58
    图像识别技术是信息时代的一门...简单分析了图像识别技术的引入、其技术原理以及模式识别等,之后介绍了神经网络的图像识别技术和非线性降维的图像识别技术及图像识别技术的应用。从中可以总结出图像处理技术的应用...

    图像识别技术是信息时代的一门重要的技术,其产生目的是为了让计算机代替人类去处理大量的物理信息。随着计算机技术的发展,人类对图像识别技术的认识越来越深刻。图像识别技术的过程分为信息的获取、预处理、特征抽取和选择、分类器设计和分类决策。简单分析了图像识别技术的引入、其技术原理以及模式识别等,之后介绍了神经网络的图像识别技术和非线性降维的图像识别技术及图像识别技术的应用。从中可以总结出图像处理技术的应用广泛,人类的生活将无法离开图像识别技术,研究图像识别技术具有重大意义。

    1图像识别技术的引入

    图像识别是人工智能的一个重要领域。图像识别的发展经历了三个阶段:文字识别、数字图像处理与识别、物体识别。图像识别,顾名思义,就是对图像做出各种处理、分析,最终识别我们所要研究的目标。今天所指的图像识别并不仅仅是用人类的肉眼,而是借助计算机技术进行识别。虽然人类的识别能力很强大,但是对于高速发展的社会,人类自身识别能力已经满足不了我们的需求,于是就产生了基于计算机的图像识别技术。这就像人类研究生物细胞,完全靠肉眼观察细胞是不现实的,这样自然就产生了显微镜等用于精确观测的仪器。通常一个领域有固有技术无法解决的需求时,就会产生相应的新技术。图像识别技术也是如此,此技术的产生就是为了让计算机代替人类去处理大量的物理信息,解决人类无法识别或者识别率特别低的信息。

    1.1图像识别技术原理

    其实,图像识别技术背后的原理并不是很难,只是其要处理的信息比较繁琐。计算机的任何处理技术都不是凭空产生的,它都是学者们从生活实践中得到启发而利用程序将其模拟实现的。计算机的图像识别技术和人类的图像识别在原理上并没有本质的区别,只是机器缺少人类在感觉与视觉差上的影响罢了。人类的图像识别也不单单是凭借整个图像存储在脑海中的记忆来识别的,我们识别图像都是依靠图像所具有的本身特征而先将这些图像分了类,然后通过各个类别所具有的特征将图像识别出来的,只是很多时候我们没有意识到这一点。当看到一张图片时,我们的大脑会迅速感应到是否见过此图片或与其相似的图片。其实在“看到”与“感应到”的中间经历了一个迅速识别过程,这个识别的过程和搜索有些类似。在这个过程中,我们的大脑会根据存储记忆中已经分好的类别进行识别,查看是否有与该图像具有相同或类似特征的存储记忆,从而识别出是否见过该图像。机器的图像识别技术也是如此,通过分类并提取重要特征而排除多余的信息来识别图像。机器所提取出的这些特征有时会非常明显,有时又是很普通,这在很大的程度上影响了机器识别的速率。总之,在计算机的视觉识别中,图像的内容通常是用图像特征进行描述。

    1.2模式识别

    模式识别是人工智能和信息科学的重要组成部分。模式识别是指对表示事物或现象的不同形式的信息做分析和处理从而得到一个对事物或现象做出描述、辨认和分类等的过程。

    计算机的图像识别技术就是模拟人类的图像识别过程。在图像识别的过程中进行模式识别是必不可少的。模式识别原本是人类的一项基本智能。但随着计算机的发展和人工智能的兴起,人类本身的模式识别已经满足不了生活的需要,于是人类就希望用计算机来代替或扩展人类的部分脑力劳动。这样计算机的模式识别就产生了。简单地说,模式识别就是对数据进行分类,它是一门与数学紧密结合的科学,其中所用的思想大部分是概率与统计。模式识别主要分为三种:统计模式识别、句法模式识别、模糊模式识别。

    2图像识别技术的过程

    既然计算机的图像识别技术与人类的图像识别原理相同,那它们的过程也是大同小异的。图像识别技术的过程分以下几步:信息的获取、预处理、特征抽取和选择、分类器设计和分类决策。

    信息的获取是指通过传感器,将光或声音等信息转化为电信息。也就是获取研究对象的基本信息并通过某种方法将其转变为机器能够认识的信息。

    预处理主要是指图像处理中的去噪、平滑、变换等的操作,从而加强图像的重要特征。

    特征抽取和选择是指在模式识别中,需要进行特征的抽取和选择。简单的理解就是我们所研究的图像是各式各样的,如果要利用某种方法将它们区分开,就要通过这些图像所具有的本身特征来识别,而获取这些特征的过程就是特征抽取。在特征抽取中所得到的特征也许对此次识别并不都是有用的,这个时候就要提取有用的特征,这就是特征的选择。特征抽取和选择在图像识别过程中是非常关键的技术之一,所以对这一步的理解是图像识别的重点。

    分类器设计是指通过训练而得到一种识别规则,通过此识别规则可以得到一种特征分类,使图像识别技术能够得到高识别率。分类决策是指在特征空间中对被识别对象进行分类,从而更好地识别所研究的对象具体属于哪一类。

    3图像识别技术的分析

    随着计算机技术的迅速发展和科技的不断进步,图像识别技术已经在众多领域中得到了应用。2015年2月15日新浪科技发布一条新闻:“微软最近公布了一篇关于图像识别的研究论文,在一项图像识别的基准测试中,电脑系统识别能力已经超越了人类。人类在归类数据库Image Net中的图像识别错误率为5.1%,而微软研究小组的这个深度学习系统可以达到4.94%的错误率。”从这则新闻中我们可以看出图像识别技术在图像识别方面已经有要超越人类的图像识别能力的趋势。这也说明未来图像识别技术有更大的研究意义与潜力。而且,计算机在很多方面确实具有人类所无法超越的优势,也正是因为这样,图像识别技术才能为人类社会带来更多的应用。

    3.1神经网络的图像识别技术

    神经网络图像识别技术是一种比较新型的图像识别技术,是在传统的图像识别方法和基础上融合神经网络算法的一种图像识别方法。这里的神经网络是指人工神经网络,也就是说这种神经网络并不是动物本身所具有的真正的神经网络,而是人类模仿动物神经网络后人工生成的。在神经网络图像识别技术中,遗传算法与BP网络相融合的神经网络图像识别模型是非常经典的,在很多领域都有它的应用。在图像识别系统中利用神经网络系统,一般会先提取图像的特征,再利用图像所具有的特征映射到神经网络进行图像识别分类。以汽车拍照自动识别技术为例,当汽车通过的时候,汽车自身具有的检测设备会有所感应。此时检测设备就会启用图像采集装置来获取汽车正反面的图像。获取了图像后必须将图像上传到计算机进行保存以便识别。最后车牌定位模块就会提取车牌信息,对车牌上的字符进行识别并显示最终的结果。在对车牌上的字符进行识别的过程中就用到了基于模板匹配算法和基于人工神经网络算法。
      3.2非线性降维的图像识别技术

    计算机的图像识别技术是一个异常高维的识别技术。不管图像本身的分辨率如何,其产生的数据经常是多维性的,这给计算机的识别带来了非常大的困难。想让计算机具有高效地识别能力,最直接有效的方法就是降维。降维分为线性降维和非线性降维。例如主成分分析(PCA)和线性奇异分析(LDA)等就是常见的线性降维方法,它们的特点是简单、易于理解。但是通过线性降维处理的是整体的数据集合,所求的是整个数据集合的最优低维投影。经过验证,这种线性的降维策略计算复杂度高而且占用相对较多的时间和空间,因此就产生了基于非线性降维的图像识别技术,它是一种极其有效的非线性特征提取方法。此技术可以发现图像的非线性结构而且可以在不破坏其本征结构的基础上对其进行降维,使计算机的图像识别在尽量低的维度上进行,这样就提高了识别速率。例如人脸图像识别系统所需的维数通常很高,其复杂度之高对计算机来说无疑是巨大的“灾难”。由于在高维度空间中人脸图像的不均匀分布,使得人类可以通过非线性降维技术来得到分布紧凑的人脸图像,从而提高人脸识别技术的高效性。

    3.3图像识别技术的应用及前景

    计算机的图像识别技术在公共安全、生物、工业、农业、交通、医疗等很多领域都有应用。例如交通方面的车牌识别系统;公共安全方面的人脸识别技术、指纹识别技术;农业方面的种子识别技术、食品品质检测技术;医学方面的心电图识别技术等。随着计算机技术的不断发展,图像识别技术也在不断地优化,其算法也在不断地改进。图像是人类获取和交换信息的主要来源,因此与图像相关的图像识别技术必定也是未来的研究重点。以后计算机的图像识别技术很有可能在更多的领域崭露头角,它的应用前景也是不可限量的,人类的生活也将更加离不开图像识别技术。

    图像识别技术虽然是刚兴起的技术,但其应用已是相当广泛。并且,图像识别技术也在不断地成长,随着科技的不断进步,人类对图像识别技术的认识也会更加深刻。未来图像识别技术将会更加强大,更加智能地出现在我们的生活中,为人类社会的更多领域带来重大的应用。在21世纪这个信息化的时代,我们无法想象离开了图像识别技术以后我们的生活会变成什么样。图像识别技术是人类现在以及未来生活必不可少的一项技术。
      人工智能、大数据、云计算和物联网的未来发展值得重视,均为前沿产业,多智时代专注于人工智能和大数据的入门和科谱,在此为你推荐几篇优质好文:
      AI可以识别图像,但它能理解标题吗?
    http://www.duozhishidai.com/article-10635-1.html
      图像识别经历了哪几个阶段,主要应用在哪些领域?
    http://www.duozhishidai.com/article-6461-1.html
      图像识别技术是什么,应用于智能家居哪些领域
    http://www.duozhishidai.com/article-133-1.html


    多智时代-人工智能大数据学习入门网站|人工智能、大数据、物联网云计算的学习交流网站

    多智时代-人工智能大数据学习入门网站|人工智能、大数据、云计算、物联网的学习服务的好平台
    展开全文
  • 手势识别 技术

    千次阅读 2019-04-19 16:02:27
    手势识别可以分为基于可穿戴设备的识别、基于触摸技术识别和基于计算机视觉的识别。 一、基于可穿戴设备的识别 1、在手势交互过程中,可以直接采集每根手指的弯曲姿态,通过数据归一化和平滑处理两根手指之间...

    手势识别可以分为基于可穿戴设备的识别、基于触摸技术的识别和基于计算机视觉的识别。

    一、基于可穿戴设备的识别

    1、在手势交互过程中,可以直接采集每根手指的弯曲姿态,通过数据归一化和平滑处理两根手指之间方位的时空参数。然后,手势识别模型训练可以选择有效的特征参数。所采集的位置参数一般具有较高的精度。因此,手势模型训练方法的选择对手势识别效果影响较大。

    Mehdi S A, Khan Y N. Sign language recognition using sensor gloves. In: Proceedings of the 9th International Conference on Neural Information Processing. 2002, 2204−2206 DOI:10.1109/ICONIP.2002.1201884

    使用人工神经网络(ANN)模型进行基于感觉手套的美国手语识别,然后将其翻译成英语

    Shi J F, Chen Y, Zhao H M. Node-Pair BP Network Based Gesture Recognition by Data Glove. System Simulation Technology, 2008, 4(3): 154−157 DOI:10.3969/j.issn.1673-1964.2008.03.003 

    通过传感器获得不同输出节点的实测值,并将这些节点配对成一个BP神经网络来识别手势

    Rung-Huei L, Ming O. A real-time continuous gesture recognition system for sign language. In: Proceedings Third IEEE International Conference onAutomatic Face and Gesture Recognition. 1998, 558−567 DOI:10.1109/AFGR.1998.671007 

    用数据手套采集了51个基本姿势,包括6个方向,8个动作原始数据。然后利用隐马尔可夫模型进行建模,建立了一个能识别250种台湾手语的词汇系统。由这些手势组成的连续句平均识别率达到80.4%

    Liu M T, Lei Y. Chinese finger Alphabet flow recognition system based on data glove. Computer Engineering, 2011, 37 (22): 168−170 

    使用数据手套Ultra 5进行数据采集,并结合BP神经网络和Markov对汉语拼音进行识别

    Wu J Q, Gao W, Chen L X. A system recognizing Chinese finger-spelling alphabets based on data-glove input. Pattern Recognition andArtificial Intelligence, 1999(1): 74−78 

    将神经网络与学习决策树相结合,建立了一个识别模型,利用数据手套构建了一个中文手指拼写手势识别系统。

    Weissmann J, Salomon R. Gesture recognition for virtual reality applications using data gloves and neural networks. In: IJCNN'99 International Joint Conference on Neural Networks Proceedings. 1999, 2043−2046 DOI:10.1109/IJCNN.1999.832699 

    通过数据手套获得了18个不同手指关节的测量值,并利用BP和径向基函数建立了多个不同的神经网络模型用于手势识别。一些神经网络模型能够识别特定的手势,其准确率甚至达到了100%

    2、此外,当输入数据手套的数据转换为虚拟手模型与对象交互,通常需要进行碰撞检测来确定对象和手之间的接触情况,并通过接触情况确定手的操作条件。

    Xu Y H, Li J R. Research and implementation of virtual hand interaction in virtual mechanical assembly. Machinery Design & Manufacture, 2014(5): 262−266 

    边界框法进行碰撞检测,并将检测结果与手势库,它决定此时角是否符合定义的动作,从而实现了虚拟装配技术的虚拟手。该方法的精度相对较差,不可能实现相对复杂的交互。在未来,将有可能通过虚拟力分析和运动分析来确定手和物体之间的相对位置。

    3、随着MEMS技术的发展,传感器变得小型化、智能化,进一步推动了基于传感器的手势识别可穿戴设备的发展。利用传感器获取目标的角速度、加速度等运动信息,可以直接获取手势的空间位置,不需要进行手势分割。通过对信息的建模和分析,可以对交互手势进行识别。

    Mirabella O, Brischetto M, Mastroeni G. MEMS based gesture recognition. In: 3rd International Conference on Human System Interaction. 2010, 599−604 DOI:10.1109/HSI.2010.5514506 

    创造了一种手势识别系统,允许用户浏览数码照片、家庭电视或通过预定义的手势为身体残疾的人提供特殊服务。系统利用加速度传感器读取手势的输入数据,通过HMM训练,识别用户自定义手势的状态,用户可以根据应用程序的需要向手势列表中添加一个新的手势。

    Kela J, Korpipää P, Mäntyjärvi J, Kallio S, Savino G, Jozzo L, Marca D. Accelerometer-based gesture control for a design environment. Personal & Ubiquitous Computing, 2006, 10(5): 285−299 DOI:10.1007/s00779-005-0033-8 

    使用加速度计控制器和HMM来收集和识别用户的输入手势,研究手势模态对用户交互的影响。结果表明,不同的人对同一任务偏好不同的交互手势。对于某些任务,手势比语音、激光笔、平板电脑等交互方式更加自然,甚至可以增强与其他方式的交互。

    Xu J, Liu C H, Meng Y X. Gesture recognition base on wearable controller. Application of Electronic Technique, 2016, 42(7): 68−71 

    定义了六种简单手势类型,通过陀螺仪和加速度计获取手势数据,提取手势长度和能量等六个特征,并使用决策树分类器识别出六种手势

    He Z Y, Jin L W, Zhen L X, Huang J C. Gesture recognition based on 3D accelerometer for cell phones interaction. In: APCCAS2008 - 2008IEEEAsia Pacific Conference on Circuits and Systems. 2008, 217−220 DOI:10.1109/APCCAS.2008.4745999 

    在手机上添加加速度计,获取用户操作时手势的运动状态,提取离散余弦变换(DCT)快速傅里叶变换(FFT)和小波包分解(WPD)的三个不同特征,并使用SVM进行分类训练。与其他两种特征相比,基于wpd的特征提取方法对17种复杂手势识别的准确率较高,达到了87.36%

    Schlömer T, Poppinga B, Henze N, Boll S. Gesture recognition with a Wii controller. In: Proceedings of the 2nd international conference on Tangible and embedded interaction. Bonn, Germany,ACM, 2008: 11−14 DOI:10.1145/1347390.1347395 

    研究了基于wii控制器的交互式应用程序的手势识别效果。该系统允许用户对操作手势进行预训练。首先,用滤波方法对原始数据进行平滑处理。平滑后,通过k-均值数据压缩得到训练样本。然后利用HMM训练得到识别系统,将该系统的手势识别结果与其他模式融合,应用于多媒体交互

    4、利用生物电获取用户的手势信息已成为近年来的研究热点。肌电(electromyography, EMG)识别用户手势的原理是根据运动过程中肌肉信号的变化来识别用户当前的动作。

    获取肌肉信号的方法主要有两种。一种是在皮肤下植入电极,直接获得生理信号。虽然这种方法不容易受到外界环境的影响,但它具有侵入性,对使用者有物理损伤的风险。另一种常用的方法是通过放置电极检测皮肤表面电流的变化来分析使用者的运动状态。该方法虽然容易受到外界环境的影响,但操作简便,对用户的危害小,符合人机交互的交互原理。

    Saponas T S, Tan D S, Morris D, Balakrishnan R. Demonstrating the feasibility of using forearm electromyography for muscle-computer interfaces. In: Proceedings of the SIGCHI Conference on Human Factors in Computing Systems. Florence, Italy,ACM, 2008: 515−524 

    研究了人类肌肉活动信号和计算界面之间的感知交互,用户不需要依赖特定的动作或其他物理设备进行交互。在用户上臂附近的窄带区域布置了10个传感器。以250ms为间隔获取用户的EMG信号,提取包括频域功率和相位相干性在内的74个特征。利用SVM训练分类模型。结果表明,该方法可以区分手指运动或点击、手指位置差、压力等级等四种手势集

    Amma C, Krings T, Böer J, Schultz T. Advancing Muscle-Computer Interfaces with High-Density Electromyography. In: Proceedings of the 33rd Annual ACM Conference on Human Factors in Computing Systems. Seoul, Republic of Korea,ACM, 2015: 929−938 DOI:10.1145/2702123.2702501 

    按8×24的栅极排列192个电极,间隔10mm。排列整齐的电极阵列被放置在前臂肌肉上,以获得高密度的肌电图信号。电极间的差异由两个电极记录。每八个电极中就有一个不包含有意义的数据,所以有168个可用的数据通道。使用提取通道的均方根(RMS)作为输入特征,使用朴素贝叶斯分类器识别预定义的27个手势。此外,分类器还进一步分析了电极数量和电极位置对识别结果的影响。

    Huang D, Zhang X, Saponas T S, Fogarty J, Gollakota S. Leveraging Dual-Observable Input for Fine-Grained Thumb Interaction Using Forearm EMG. In: Proceedings of the 28th Annual ACM Symposium on User Interface Software & Technology. Charlotte, NC, USA,ACM, 2015: 523−528 DOI:10.1145/2807442.2807506 

    由于前臂拇指运动的肌电图信号相对较弱,黄提出使用双通道手机训练数据法来识别拇指的细粒度手势,包括左键、右键、点击、长按或更复杂的手指运动。其中一个通道是利用电极获取用户的手势运动,另一个通道是通过触摸屏手机加速度计获取的手势运动状态作为输入信号。最后,利用k近邻(KNN)算法对拇指手势进行分类识别。该识别结果对基于拇指的交互式系统具有重要意义。

     

    二、基于触摸技术的识别

    触摸手势是用手指或其他工具在触摸屏上直接执行的操作。基于触摸手势输入法,触摸手势识别主要分为单触摸手势识别和多触摸手势识别。

    经典的单触摸手势识别算法有如下两种:

    1、Rubine算法

    Rubine D H. The automatic recognition of gestures. Carnegie Mellon University, 1992

    通过提取任意输入手势的起始角正弦值、余弦值、手势总长度等13个特征,构造手势特征集,并基于统计识别方法构造分类器。对于包含30个单点位置的手势路径,分类器的准确率可达97%。该算法的关键是能否准确地选择识别特征。

    2、$1算法

    Wobbrock J O, Wilson A D, Li Y. Gestures without libraries, toolkits or training: a $1 recognizer for user interface prototypes. In: Proceedings of the 20th annual ACM symposium on User interface software and technology. Newport, Rhode Island, USA,ACM, 2007: 159−168 DOI:10.1145/1294211.1294238 

    核心思想是对输入的手势轨迹进行重新采样,将采样轨迹中心点与x轴的连线旋转到0度,将旋转后的手势缩放到标准的正方形大小并进行手势平移。然后,对处理过的手势和搜索匹配模板使用“黄金选择搜索”(GSS),得到每个模板的最佳匹配得分。得分最高的手势是最终识别的手势。由于$1算法只能识别单笔手势,研究人员提出了$N算法和$P算法。

    (1)、$N算法

    Anthony L, Wobbrock J O. A lightweight multistroke recognizer for user interface prototypes. In: Proceedings of Graphics Interface 2010. Ottawa, Ontario, Canada, Canadian Information Processing Society, 2010: 245−252 

    可以在不知道方向或轨迹顺序的情况下识别多笔画手势。其原理是N个手势轨迹可以根据顺序和方向生成2N种情况。根据手势的顺序将手势轨迹从头部连接到尾部,得到估计的N个手势模板集。然后按照$1的方法将手势轨迹与模板设置匹配,以最高分手势作为最终匹配手势。由于排列和组合的多样性,它可能会导致大量的N美元内存消耗和执行成本变得很高。

    (2)、$P算法

    VatavuR-D, Anthony L, Wobbrock J O. Gestures as point clouds: a $P recognizer for user interface prototypes. In: Proceedings of the 14th ACM international conference on Multimodal interaction. Santa Monica, California, USA, ACM, 2012: 273−280 DOI:10.1145/2388676.2388732

    提出删除多个动作的时间序列信息,把它变成一组点云。这将输入gesture-matching问题转化为点对点匹配的时间复杂度O (n)问题,并利用匈牙利算法减少搜索时间复杂度O (n3),可有效解决时间复杂度问题$ n的一代。目前,很多触控交互都是基于多点触控手势交互,例如Apple touchpad的多点手指手势触控。对于多点触摸手势识别,可以对多点触摸手势进行预处理。然后,计算一个虚拟单点,然后使用一个触摸手势识别它。

     

    三、基于计算机视觉的识别

    手势图像信息由一个或多个摄像头采集,采集的数据进行预处理,包括去噪信息增强。然后,利用分割算法获取图像中的目标手势。通过视频处理和分析得到当前手势的分类和描述,最后通过手势识别算法对目标手势进行识别。基于手势的手势识别主要由手势分割手势分析手势识别三部分组成。

    1、手势分割

    第一步是对输入图像执行手势分段。手势分割过程主要包括手势定位手势分割两部分。

    (1)、手势定位

    手势定位过程在包含手势的图像帧序列中从复杂背景中提取手势区域,实现手势与背景的分离。手势定位后,通过算法将当前手势从背景区域分割出来。静态手势只需要提取单个帧图像的手势特征,而动态手势则需要对提取的帧序列进行手势分析。常用的手势分割方法有基于运动信息的检测分割、基于视觉特征的检测分割和基于多模式融合的检测分割。基于运动信息的检测分割主要包括光流法和差分法。光流法不需要预先获取图像背景来表示复杂环境下的手势运动,但要求背景图像保持静止,对光照要求较高。

    Hackenberg G, McCall R, Broll W. Lightweight palm and finger tracking for real-time 3D gesture control. In: 2011 IEEE Virtual Reality Conference. 2011, 19−26 DOI:10.1109/VR.2011.5759431

    使用光流方法实时跟踪手势。在静态背景下,差分法对手势的分割效果较好。对于一个移动的背景,需要对背景进行建模和区分。

    Freeman W T, Weissman C D. Television control by hand gestures. International Workshop on Automatic Face & Gesture Recognition, 1995: 179−183 

    使用Running Average方法对背景进行建模,然后进行手势分割

    (2)、手势分割

    基于明显特征的分割方法主要包括肤色分割、纹理分割、手形分割和轮廓分割。

    (a)、肤色分割

    肤色分割方法是最常用的方法:

    Kaufmann B, Louchet J, Lutton E. Hand Posture Recognition Using Real-Time Artificial Evolution. In: Applications of Evolutionary Computation. Berlin, Heidelberg, Springer Berlin Heidelberg, 2010, 251−260 DOI:10.1007/978-3-642-12239-2_26 

    Flasiński M, Myśliński S. On the use of graph parsing for recognition of isolated hand postures of Polish Sign Language. Pattern Recognition, 2010, 43(6): 2249−2264 DOI:10.1016/j.patcog.2010.01.004 

    使用集群的肤色在颜色空间建立肤色模型,如肤色建模通过RGB颜色空间:

    Bergh M V d, Gool L V. Combining RGB and ToF cameras for real-time 3D hand gesture interaction. In: Proceedings of the 2011 IEEE Workshop onApplications of Computer Vision (WACV). IEEE Computer Society, 2011: 66−72 DOI:10.1109/WACV.2011.5711485 

    Jones M J, Rehg J M. Statistical Color Models with Application to Skin Detection. International Journal of Computer Vision, 2002, 46(1): 81−96 DOI:10.1023/A:1013200319198 

    Weng C, Li Y, Zhang M, Guo K, Tang X, Pan Z. Robust Hand Posture Recognition Integrating Multi-cue Hand Tracking. In: Entertainment for Education Digital Techniques and Systems. Berlin, Heidelberg, Springer Berlin Heidelberg, 2010, 497−508 DOI:10.1007/978-3-642-14533-9_51 

    翁等人使用贝叶斯手势分割,建立肤色模型,然后结合皮肤的颜色,运动,和手势识别的轮廓形状信息,大大提高了分割精度。

    这些分割方法不受手形的影响,但由于光照引起的肤色变化,分割错误率大大提高。

    (b)、基于多模式融合的分割方法主要是为了克服复杂环境对分割条件的影响,并结合各种特征,如表观特征和运动信息。当使用单色可穿戴设备或背景来简化场景分割时,为了提高分割的准确性,有时会用手进行标记,这极大地影响了交互的自然度,从而限制了应用范围。其次,对手势进行建模和分析。

    主要包括基于外观的手势建模基于三维模型的手势建模

    基于外观的手势建模可以分为二维静态模型运动模型。常用的策略有颜色特征、轮廓几何、可变形gabarit:

    Ju S X, Black M J, Yacoob Y. Cardboard People: A Parameterized Model of Articulated Image Motion. In: Proceedings of the 2nd International Conference onAutomatic Face and Gesture Recognition. IEEE Computer Society, 1996: 38 70

    Kervrann C, Heitz F. Learning structure and deformation modes of nonrigid objects in long image sequences. 1995 

    和移动图像参数。颜色特征是最常用的建模方法。

    Ren H B, Xu G H, Lin X Y. Hand gesture recognition based on characteristic curves. Journal of Software, 2002, 13(5): 987−993

    用单台相机捕捉手部运动图像,用颜色、运动、边缘等多种信息建模,建立手部运动的坐标系来识别手势[71]。利用圆周、质心、边界盒等几何特征建立轮廓几何模型。

    Priyal P S, Bora P K. A robust static hand gesture recognition system using geometry based normalizations and Krawtchouk moments. Pattern Recognition, 2013, 46(8): 2202−2219 DOI:10.1016/j.patcog.2013.01.033

    使用旋转归一化方法对手势区域的图像进行对齐,并使用KravtCouk矩作为轮廓特征训练模型来识别静态手势。通过一组能够描述全局运动的物体轮廓插值节点,建立了基于gabarit的可变形模型。

    最简单的插值方法是分段线性函数。

    Ju S X, Black M J, Minneman S, Kimber D. Analysis of Gesture and Action in Technical Talks for Video Indexing. In: Proceedings of the 1997 Conference on Computer Vision and Pattern Recognition. IEEE Computer Society, 1997: 595 

    Ju等人利用snake算法分析了课堂上的视频浏览和索引手势。

    基于运动图像参数的模型与其他模型的不同之处在于,它们是由视频序列中对象的平移、旋转和方向等运动参数建模的。

    Luo Q, Kong X, Zeng G, Fan J. Human action detection via boosted local motion histograms. Machine Vision and Applications, 2010, 21(3): 377−389 DOI:10.1007/s00138-008-0168-5

    提出在真实场景中使用一个新的描述符和一个局部运动直方图来描述运动模式,然后通过增强方法选择特征。该方法仅利用局部特征建立了明显的手势建模,计算复杂度较低。利用基于三维的手势模型建立当前图像的三维模型,并根据相关参数计算手势状态。常用的手势模型包括三维骨架模型、三维纹理体模型和三维几何模型。

    骨架模型是最常用的三维模型。

    Shotton J, Fitzgibbon A, Cook M, Sharp T, Finocchio M, Moore R, Kipman A, Blake A. Real-time human pose recognition in parts from single depth images. In: CVPR 2011, 2011, 1297−1304 DOI:10.1109/CVPR.2011.5995316 

    使用Kinect生成的深度数据进行骨建模。

    2、手势分析

    手势分析由特征检测和参数估计两部分组成。

    特征检测用于从分割后的手势中提取图像特征参数。图像特征主要包括视觉特征和语义特征。视觉特征包括颜色、纹理和轮廓,语义特征代表对图像内容的理解。

    参数估计根据模型的不同使用不同的方法。

    Lu W-L, Little J J. Simultaneous Tracking and Action Recognition using the PCA-HOG Descriptor. In: Proceedings of the The 3rd Canadian Conference on Computer and Robot Vision. IEEE Computer Society, 2006: 6 DOI:10.1109/CRV.2006.66 

    先用方向梯度直方图(HOG)描述运动员的面积,然后用主成分分析(PCA)将HOG投影到线性子空间中,得到PCA-HOG描述特征。曲棍球和足球的实验表明,该方法在光照、姿态和视角的变化下,对跟踪和识别结果具有较强的鲁棒性。

    3、手势识别

    手势识别主要是基于传统的机器学习方法和神经网络。使用传统的机器学习模型识别基于视觉的手势有很多方法。

    Moni M A, Ali A B M S. HMM based hand gesture recognition. A review on techniques and approaches. In: 2009 2nd IEEE International Conference on Computer Science and Information Technology. 2009, 433−437 DOI:10.1109/ICCSIT.2009.5234536

    静态手势识别采用模板识别,动态手势识别采用与时域信息相关的HMM。

    所选择的识别方法与手势的类型有很大的相关性。

    Keskin C, Erkan A, Akarun L. Real time hand tracking and 3D gesture recognition for interactive interfaces using HMM. In: Proceedings of International Conference onArtificial Neural Networks. 2003 

    戴着有色手套,用一对普通的网络摄像头捕捉用户的手势数据,训练HMM模型对用户预定义的八个手势进行实时跟踪和识别。

    近年来,随着深度学习的发展,该技术已广泛应用于手势识别领域。

    Chai X, Liu Z, Yin F, Liu Z, Chen X. Two streams Recurrent Neural Networks for Large-Scale Continuous Gesture Recognition. In: 2016 23rd International Conference on Pattern Recognition, 2016, 31−36 DOI:10.1109/ICPR.2016.7899603 

    同时采集彩色图像和深度图像,提取手势的骨骼特征和梯度直方图特征。然后将提取的特征融合起来,建立快速rnn,将连续的手势分割成孤立的手势。通过一个简单的递归神经网络(SRNN)。通过简单递归神经网络(SRNN)和长短时记忆(LSTM),建立了用于连续手势识别的双流递归神经网络2S-RNN。

    Tsironi E, Barros P, Wermter S. Gesture recognition with a convolutional long short-term memory recurrent neural network. In: Proceedings of the European Symposium on Artificial Neural Networks, Computational Intelligence and Machine Learning (ESANN). Bruges, Belgium, 2016, 213−218 

    Tsironi等结合卷积神经网络(CNN)对视觉特征的敏感性和LSTM对连续事件的有效性,提出了卷积长短时记忆递归神经网络(CNNLSTM)。

    四、多模态交互技术与手势识别

    在日常交流中,人们不仅使用手势,还通过语音、触觉、眼神等多种感知方式来表达信息。因此,多模态交互提供了两种或两种以上模态协作交互方法。利用用户的不同感知方式与计算机交互更加自然和有效,是未来交互的方式。对于不同的模态,模态之间的信息具有互补性和冗余性。例如,当用户用语言描述对象时,他或她会无意识地摆动手臂来增强或补充描述。在虚拟现实场景中,选择合适的多模态交互技术和融合方法,对于提高交互协作效率至关重要。手势和声音的结合可以直观地表达用户的意图。用户可以通过语音命令来确认手势的含义,手势可以消除噪声对操作的影响。因此,手势在VR交互中经常被用到。

    Bolt R A.“Put-that-there” : Voice and gesture at the graphics interface. Acm Siggraph Computer Graphics, 1980, 14(3): 262−27

    Bolt提出的“Put that there”系统是最早的多模态交互系统之一。该系统将手势和语音结合起来,使用户可以通过语音和指向手势在大屏幕显示界面中生成和编辑图形的形状、颜色、大小等属性

    Cohen P R, Johnston M, McGee D, Oviatt S, Pittman J, Smith I, Chen L, Clow J. QuickSet: multimodal interaction for distributed applications. In: Proceedings of the fifth ACM international conference on Multimedia. Seattle, Washington, USA,ACM, 1997: 31−40

    开发的QuickSet系统通过实时分析语音和手势,建立了支持军事训练的地图导航系统

    Chatterjee I, Xiao R, Harrison C. Gaze + Gesture: Expressive, Precise and Targeted Free-Space Interactions. In: Proceedings of the 2015 ACM on International Conference on Multimodal Interaction. Seattle, Washington, USA, ACM, 2015: 131−138 DOI:10.1145/2818346.2820752

    除了语音模式,手势也可以与其他模式融合,比如凝视。手势模态与凝视相融合,在不同场景下进行离散或连续的交互。例如,当用户执行关闭web窗口的任务时,当关闭图标被注视时,可以在任何位置轻击图标

    Velloso E, Turner J, Alexander J, Bulling A, Gellersen H. An Empirical Investigation of Gaze Selection in Mid-Air Gestural 3D Manipulation. In: Human-Computer Interaction – INTERACT 2015. Cham: Springer International Publishing, 2015, 315−330 DOI:10.1007/978-3-319-22668-2_25 

    当移动对象的位置时,没有必要直接指向要移动的对象。用户可以用自己的视线选择要移动的物体,然后通过手势在任意起始位置的轨迹来指定物体移动的轨迹。通过视觉选择的对象将跟随手势轨迹到达最终位置

    目前的多模态融合方法主要包括早期融合和晚期融合。早期融合是指原始数据在信号级的融合。这种融合方法适用于模式间的紧密耦合。后期融合采用统一的数据表示,对每种模态的数据进行独立处理,然后进行语义融合和分析。该融合方法更适合于不同时间尺度特征的多模态融合;因此得到了广泛的应用

    Sim K C. Speak-as-you-swipe (SAYS): a multimodal interface combining speech and gesture keyboard synchronously for continuous mobile text entry. In: Proceedings of the 14th ACM international conference on Multimodal interaction. Santa Monica, California, USA,ACM, 2012: 555−560 DOI:10.1145/2388676.2388793

    提出了一种将语音和手势键盘两种模式相结合的say多模态交互系统,提高了文本输入的效率和准确性。利用隐马尔可夫模型对手势和语音模型进行训练,然后利用概率方法对模型进行融合。融合模型表明,两种模式提供的互补信息能够有效区分一些混淆词,从而提高了文本输入预测的准确性。在20000字输入系统中,仅使用手势键盘的文本预测准确率为92.2%。但在正常噪声条件下,与两种模式相结合,文本预测准确率为96.4%。在噪声环境下,文本预测准确率为94%

    Kopp S, Tepper P, Cassell J. Towards integrated microplanning of language and iconic gesture for multimodal output. In: Proceedings of the 6th International Conference on Multimodal Interfaces. New York, NY,ACM Press, 2004: 97−104

    由Kopp等人建立的NUMACK导航系统将语音和手势结合起来,可以回答用户提出的关于校园建筑及其位置的问题。该系统首先将获取的特定地标性手势(如手势表示和运动轨迹)映射到图像描述特征,然后将获取的语音信息转换为文本,并使用描述语句规划(SPUD)系统对获取的文本信息进行分析。然后对现有的SPUD系统进行扩展,将图像描述转换为语法树的一部分,并基于文本信息构造集成到语法树中。最后,构建了基于多模态融合的层次本体结构。这样,手势表示使用户在交流过程中保持较高的注意力,通过文本的准确表达减少手势信息中的歧义,从而获得更好的表达准确性和表意效果

    表中列出了近年来发展起来的具有代表性的手势识别和交互技术。在实际操作中,可以根据不同的交互场景选择合适的交互设备,建立手势识别系统。不同的手势识别系统具有不同的特征。基于数据手套等可穿戴设备的手势识别系统能够直接获取用户与虚拟世界对象接触的信息,具有较高的准确性。然而,传感器的性能、数量和位置对识别能力有很大的影响。MEMS进一步提高了传感器获取数据的能力,但由于它主要捕捉对象的运动信息,所以主要用于动态手势识别。肌电作为一种重要的生理信号,通过运动过程中生理信号的变化来识别使用者当前的状态。它通常用于动态手势交互场景。对于肌肉表面信号的识别方法,电极的位置、数量和环境对识别能力有很大的影响。基于触摸技术的手势识别的外部干扰相对较小。单触摸识别效果较好。对于多点触控,通常将其转化为单点触控问题进行预处理识别。基于计算机视觉的手势识别包括单目、双目、多视点和深度相机识别方法。主要包括手势分割、手势特征提取与分析以及识别模型的建立。对于单目相机来说,信息量相对较小,识别速度较快,但结果受外部环境的干扰较大,精度较低。该双目相机可以利用相机的相对位置坐标恢复手势的空间位置,建立三维手势模型。具有识别范围大、精度高等特点。然而,该装置需要校准,其精度受基线和分辨率的限制。此外,它包含更多的信息,需要更高的计算能力。深度照相机不需要校准。利用结构光或ToF方法可以获得手势的深度信息,但测量范围相对较小,容易受到阳光的影响。因此,它主要应用于室内场景。由于单个手势模态所表达的信息相对有限,将手势与其他模态结合使用,不仅提供了更多的交互信息,而且使交互更加自然。这将是未来VR的主要交互方式。如何针对不同的交互场景选择合适的融合方法,建立有效的多模态融合模型,是未来研究的重点。

    展开全文
  • 人脸识别技术和人脸识别特征

    千次阅读 2018-12-10 23:00:51
    人脸识别,是基于人的脸部特征信息进行身份识别的一种生物识别技术。用摄像机或摄像头采集含有人脸的图像或视频流,并自动在图像中检测和跟踪人脸,进而对检测到的人脸进行脸部的一系列相关技术,通常也叫做人像识别...

               人脸识别,是基于人的脸部特征信息进行身份识别的一种生物识别技术。用摄像机或摄像头采集含有人脸的图像或视频流,并自动在图像中检测和跟踪人脸,进而对检测到的人脸进行脸部的一系列相关技术,通常也叫做人像识别、面部识别。

          人脸识别是一项热门的计算机技术研究领域,它属于生物特征识别技术,是对生物体(一般特指人)本身的生物特征来区分生物体个体。

          生物特征识别技术所研究的生物特征包括脸、指纹、手掌纹、虹膜、视网膜、声音(语音)、体形、个人习惯(例如敲击键盘的力度和频率、签字)等。

          相应的识别技术就有人脸识别、指纹识别、掌纹识别、虹膜识别、视网膜识别、语音识别(用语音识别可以进行身份识别,也可以进行语音内容的识别,只有前者属于生物特征识别技术)、体形识别、键盘敲击识别、签字识别等。

          三大关键技术

          1、基于特征的人脸检测技术

          通过采用颜色、轮廓、纹理、结构或者直方图特征等进行人脸检测。

          2、基于模板匹配人脸检测技术

          从数据库当中提取人脸模板,接着采取一定模板匹配策略,使抓取人脸图像与从模板库提取图片相匹配,由相关性的高低和所匹配的模板大小确定人脸大小以及位置信息。

          3、基于统计的人脸检测技术

          通过对于“人脸”和“非人脸”的图像大量搜集构成的人脸正、负样本库,采用统计方法强化训练该系统,从而实现对人脸和非人脸的模式进行检测和分类。

          四大特征

          1、几何特征

          从面部点之间的距离和比率作为特征,识别速度快,内存要求比较小,对于光照敏感度降低。

          2、基于模型特征

          根据不同特征状态所具有概率不同而提取人脸图像特征。

          3、基于统计特征

          将人脸图像视为随机向量,并用统计方法辨别不同人脸特征模式,比较典型的有特征脸、独立成分分析、奇异值分解等。

          4、基于神经网络特征

          利用大量神经单元对人脸图像特征进行联想存储和记忆,根据不同神经单元状态的概率实现对人脸图像准确识别。


    1.人脸识别应用于哪些场景,主要面临哪些挑战

    http://bbs.duozhishidai.com/thread-251-1-1.html

    2.人脸识别,在我们的生活中有哪些应用

    http://bbs.duozhishidai.com/thread-169-1-1.html

    3.生物特征识别技术实现原理与前景分析

    http://www.duozhishidai.com/article-18868-1.html

     

    展开全文
  • 1 人脸识别理论 2 人脸识别应用 2.1 开发环境 2.2 3总结

    人脸识别四个步骤,分别为人脸图像采集及检测,人脸图像预处理(对齐),人脸图像特征提取和人脸图像匹配与识别.

    1 人脸图像采集及检测

    • 人脸图像采集
      即通过摄像镜头获取人脸的数字图像.
    • 人脸检测(判断是否有人脸)
      人脸检测是人脸识别的预处理,在图像中标定出人脸的位置和大小.人脸图像中包含的模式特征十分丰富,如直方图特征,颜色特征,模板特征,结构特征及哈尔特征(Haar-like feature)等.人脸检测是将这些有用的信息提取出来,利用这些特征进行人脸检测.
      (1) 对检测的对象进行概率统计,得到检测对象的特征,建立检测模型;
      (2) 用得到的模型匹配输入的图像,如果有匹配则输入匹配的区域,无则无动作;
    • 人脸检测算法
      模板匹配模型,Adaboost模型,其中Adaboost模型在速度与精度的综合性能上表现最好,特点是训练慢,检测快,基本可达到视频流实时检测.

    2 人脸图像预处理

    实现人脸对齐,即检测到输入图片中的人脸目标,需要对人脸图像预处理,因为同一个人不同图像序列中的姿态,表情会发生变化,不利于人脸特征提取,因此需要将人脸图像变换到统一的角度和姿态,人脸会受到各种条件的限制和随机干扰,通过找到的人脸基准点如眼角,鼻尖,嘴尖等部位,并进行如下操作:

    序号 预处理
    1 缩放
    2 旋转
    3 拉伸
    4 光线补偿
    5 灰度变换
    6 直方图均衡化
    7 规范化
    8 几何校正
    9 过滤
    10 锐化

    3 人脸图像特征提取

    人脸特征提取是将人脸图像信息数字化,将一张人脸图像转换为一串数字(一般称为特征向量)。如对一个人脸,找到他的眼睛左边、嘴唇右边、鼻子、下巴等位置,利用特征点间的欧氏距离、曲率和角度等提取出特征分量,最终将相关的特征连接成一个长的特征向量。

    4 人脸图像匹配与识别

    人脸匹配与识别是将提取的人脸图像的特征数据与数据库中存储的人脸特征模板进行搜索匹配。根据相似度对身份进行判断,设定一个阈值,当相似度超过这个阈值,则将匹配得到的结果输出。
    识别与匹配有确认和辨认两种形式,确认即一对一进行比较,核实身份;辨认即一对多进行图像匹配,从N个人中找到目标。

    5 识别算法

    人脸识别发展如下表:

    时间 方法 训练数据 方法描述 LFW精度
    1990 Eigenface <1万 主成分分析 60.02%
    2006 LBP+CSML <1万 局部二值模式 85.57%
    2013 High-dim LBP 10万 高维LBP+Joint Bayesian 95.17%
    2014 DeepFace 400万 CNN+softmax 97.35%
    2014 Deep ID 20万 CNN+softmax 97.45%
    2015 VGG 260万 VGG+Softmax 98.95%
    2016 FaceNet 2亿 Inception+Triplet-loss 99.63%

    5.1 20世纪的人脸识别:基于集合特征,基于模板匹配和子空间算法

    (1) 子空间算法将人脸当成一个高维向量,将向量投影到低维空间中,投影之后得到的低维向量达到对不同的人具有良好的区分度,代表算法是Eigenface(PCA,主成分分析)和FisherFace(LDA,线性判别分析).PCA核心即是对高维向量投影后尽可能多的保留原始数据的主要信息,降低数据的冗余信息.LDA核心是最大化类间差距和最小化类内差距,保证同一个人的不同人脸图像投影后聚集在一起,不同的人脸图像投影之后用大间距分开.两者均使用求解矩阵的特征值和特征向量,通过降维处理图像数据.
    (2)人脸在高维空间中的分布是非线性的,可使用非线性降维算法,代表有流形学习和核(kernel)技术,流形学习假设向量在高维空间中的分布具有某些几何形状,然后保持这些几何形状约束的前提下将向量投影到低维空间中,这种投影是经过非线性变换完成的.
    (3) 隐马尔科夫模型(HMM)对光照,表情和姿态的变化更加鲁棒,神经网络也有应用,但使用的数据集较少,效果一般.

    5.2 21世纪开始人脸识别方法转向:人工特征+分类器

    (1) 分类器有较成熟的案例,如神经网络,支持向量机,贝叶斯等,人工特征提取是该类方法的优势.
    (2) 描述图像特征方法应用与人脸图像特征提取,如HOG,SIFT, Gabor和LBP等,典型有LBP,该方法简单有效,解决了光照敏感问题,但存在姿态和表情识别准确率低的问题.其中巅峰之作为"High-dim LBP",验证了高维特征和验证性存在正相关的关系,及人脸维度愈高,验证的准确度就愈高,该方法融合了各种特征,未成为主流.

    5.3 深度学习的时代:利用深度学习提取特征(CNN)

    (1) 利用CNN对海量数据进行学习,提取图像特征.
    (2) Facebook提出DeepFace方法,该方法是CNN应用于人脸识别领域的奠基,使用3D模型来做人脸对齐任务,CNN针对对齐后的人脸Patch进行多类的分类学习,使用交叉熵损失函数(softmax)进行问题优化,最后通过特征嵌入得到固定长度的人脸特征向量.
    (3) DeepID是香港中文大学唐晓鸥团队提出的方法,使用四层卷积,最后一层为softmax,中间为隐藏层,提取人脸特征,使用Multi-patch分别训练模型最后组合成高维特征,人脸验证阶段使用联合贝叶斯方法,通过学习一个多类(10000类,每类约20个实例)人脸识别任务学习特征,随人脸数据集增加,DeepID泛化能力越强.
    (4) 谷歌推出FaceNet方法,使用三元组损失函数替代了常用的softmax交叉熵损失函数,在一个超球空间进行优化类内距离更紧凑,类间距离更远,最后得到一个紧凑的128维人脸特征,网络使用GoogleNet的Inception模型,模型参数量较小,精度更高,损失函数可追溯到:LDA算法.

    6 总结

    人脸识别广泛应用于身份核实和信息安全以及安防领域。优势如下

    • (相对于其他生物识别技术而言)非接触,用户无需和设备直接接触;
    • 非强制性,被识别的人脸图像信息可以主动获取;
    • 并发性,实际应用场景可以进行多个人脸的分拣、判断和识别;

    [参考文献]
    [1]https://zhuanlan.zhihu.com/p/36416906
    [2]https://blog.csdn.net/qq_40027052/article/details/79020643


    展开全文
  • 图像识别技术可能是以图像的主要特征为基础的,每个图像都有它的特征。在人类图像识别系统中,对复杂图像的识别往往要通过不同层次的信息加工才能实现。图像识别技术是立体视觉、运动分析、数据融合等实用技术的基础...
  • 浅谈人脸识别技术原理分析

    千次阅读 2019-08-08 16:23:14
    人脸识别,是基于人的脸部特征信息进行身份识别的一种生物识别技术。需要用摄像机或摄像头采集含有人脸的图像或者视频,并自动在图像中检测和跟踪人脸,从而对检测到的人脸进行脸部的认证一系列相关技术,一般情况下...
  • SAR图像目标识别技术研究170713

    千次阅读 2017-10-12 14:04:16
    SAR图像目标识别技术研究西安电子科技大学硕士论文 / 2015.3 Q note 2017.07.13研究背景 合成孔径雷达(Synthetic Aperture Radar,SAR)是一种微波遥感成像雷达,与光学、红外等雷达相比,它的成像受气候等条件的限制...
  • 随着科技的发展,人脸识别技术逐渐成为生物识别技术应用的重要领域,在生活中多个场景可进行“刷脸”完成,使人脸在多个场景中成为了重要的使用方式。在人脸识别技术的发展下,人脸识别技术有哪些方案呢?畅视智能与...
  • Java OCR 图像智能字符识别技术,可识别中文

    万次下载 热门讨论 2012-02-08 09:58:34
    Java OCR 图像智能字符识别技术,可识别中文。具体详见:http://blog.csdn.net/white__cat/article/details/38461449
  • 人脸识别技术项目实战精品课程

    千人学习 2018-12-10 13:33:35
    本课程是针对腾讯人工智能云平台的人脸识别技术的应用,开发的项目实战视频课程,主要有人脸拍照,头像上传,人脸登录,新增个体,删除个体,新增人脸,删除人脸,自动抓拍,自动识别等功能,系统采用jsp,ajax,...
  • 浅谈图像识别技术原理与价值

    千次阅读 多人点赞 2020-04-01 09:33:08
    图像识别技术是人工智能的重要领域。它是指图像的对象识别技术,用于识别不同模式的目标和对象。本文从图像识别的技术原理、识别过程以及应用范围方面讲述对图片识别技术的整体认知。 目录 图像识别技术原理 ...
  • 语音识别是十年来发展最快的技术之一,随着AI的不断发展,深度学习让语音识别技术得到了质的飞跃,开始从实验室走向市场,并逐步走到人们的生活中。 我们现在所用的语音输入法,以及以语音为智能交互入口的智能家居...
  • 人脸识别技术

    千次阅读 2019-05-31 16:31:05
    一、人脸识别技术概述 二、深度学习技术的原理 三、梯度下降 四、基于 CNN 卷积神经网络进行人脸识别 一、人脸识别技术概述 人脸识别技术大致由人脸检测和人脸识别两个环节组成。 之所以要有人脸检测,不光是...
  • 最近一段时间在为本科毕业设计做一些知识储备,方向与手写识别的系统设计相关,在看到一篇2019年题为《基于深度学习的脱机手写汉字识别技术研究》的工学硕士论文后,感觉收获比较大,准备把自己的总结和一些想法记录...
  • 声纹识别技术

    千次阅读 2018-12-18 22:32:30
    语音识别、声纹识别、语义识别的区别 很多除接触AI的小伙伴, 不清楚语音识别和声纹识别的区别,经常混淆概念,以为语音识别、声纹识别、语义识别是同一回事,其实不然。 声纹识别和语音识别在原理上一样,都是...
  • 文字识别(二)--字符识别技术总览

    千次阅读 2019-02-18 10:45:12
    最近入坑研究OCR,看了比较多关于...所以想写一篇关于OCR技术的综述,对OCR相关的知识点都好好总结一遍,以加深个人理解。 什么是OCR? OCR英文全称是Optical Character Recognition,中文叫做光学字符识别。它...
  • 2018-11-29 08:17:30 近年来,人脸识别在科技领域声名鹊起,频频登上热搜榜单。...人脸识别技术正式起步是在美国,彼时,我国还未开始接触该技术。即使起步晚,但经过科研人员和学者们多年尽心尽力的研...
  • 手势识别技术综述

    万次阅读 2019-06-15 16:36:18
    随着计算机在社会中的普及,促进人机交互(HCI,Human–Computer Interaction)技术的发展将对计算机的使用产生积极影响。因此,人们越来越重视研究用于跨域人机障碍的新技术。研究的最终目标是将人机交互变得如同人...
  • 语音识别是十年来发展最快的技术之一,随着AI的不断发展,深度学习让语音识别技术得到了质的飞跃,开始从实验室走向市场,并逐步走到人们的生活中。 我们现在所用的语音输入法,以及以语音为智能交互入口的智能家居...
  • 【虹膜识别】虹膜识别技术概述

    千次阅读 2020-02-06 09:40:48
    虹膜识别技术概述 本文主要讨论虹膜识别技术的背景以及虹膜识别系统的组成。作为笔记分享交流用。
  • 本课程是针对腾讯人工智能云平台的身份证识别技术的应用,开发的项目实战视频课程,主要有身份证正反面拍照识别,上传图片识别,网页调用摄像头等功能,系统采用jsp,ajax,myBatis,mysql数据库及腾讯AI智能等技术开发...
  • 护照识别ocr识别技术

    2018-08-21 18:41:27
    一、护照识别OCR技术应用背景护照是一个国家的公民出入本国国境和到国外旅行或居留时, 由本国发给的一种证明该公民国籍和身份的合法证件。如今,在很多APP中都涉及到对护照信息录入录入,由于护照上的信息量非常大...
  • 图像识别技术

    千次阅读 2018-11-10 10:26:01
    图像识别技术
  • 一、人脸识别技术基本认识 1、文献综述与基本认识 本节来源于:人脸检测与深度学习 关于人脸检测算法的文献 总结: 商用算法总结: 列举出共十七项商用算法,百度IDL提出DenseBox第三版(加粗蓝色)是...
  • 语音识别技术的前世今生【前世篇】

    千次阅读 多人点赞 2019-07-22 16:04:42
    2.孤立词识别 2.1 特征提取 2.2 动态弯算法 2.3 GMM(Gaussian mixture model) 2.4 HMM(Hidden markov model) 2.5 EM训练算法 2.6 语音识别基本方程 3.连续语音识别 3.1 语言模型 3.2 大词汇量 3.3 语音...
  • 所谓生物识别技术就是,通过计算机与光学、声学、生物传感器和生物统计学原理等高科技手段密切结合,利用人体固有的生理特性,(如指纹、脸象、虹膜等)和行为特征(如笔迹、声音、步态等)来进行个人身份的鉴定。...
  • 人脸识别技术应用场景与前景

    千次阅读 2019-07-12 12:36:11
     随着人工智能的发展,人脸识别也不落后,争相向人们展示它的风采,在一些比较发达的城市,普遍运用刷脸的方式来解决问题,在不知不觉中大家都要靠脸吃饭了,这绝对不是贬义词。大家都知道现下流行的小鲜肉、网红...
  • 人脸识别之人脸识别技术综述

    万次阅读 2016-09-14 13:11:12
     近年来,随着计算机技术的迅速发展,人脸自动识别技术得到广泛研究与开发,人脸识别成为近30年里模式识别和图像处理中最热门的研究主题之一。人脸识别的目的是从人脸图像中抽取人的个性化特征,并以此来识别人的身...
  • 语音识别技术简史

    千次阅读 2019-08-22 16:30:21
    【CSDN 编者按】语音识别自半个世纪前诞生以来,一直处于不温不火的状态,直到 2009 年深度学习技术的长足发展才使得语音识别的精度大大提高,虽然还无法进行无限制领域、无限制人群的应用,但也在大多数场景中提供...
  • 语音识别技术之孤立词识别

    千次阅读 2019-04-05 15:27:34
    1.孤立词识别 1.1 模版比较法 计算距离 比较距离 1.2 特征提取 一帧信号,通常为20-50ms 微观上足够长:至少包含2-3个周期 宏观上足够长:在一个音素之内(例如:你好,包含了4个因素 ne yi he ao) 频谱具有...

空空如也

1 2 3 4 5 ... 20
收藏数 37,819
精华内容 15,127
关键字:

识别技术