精华内容
下载资源
问答
  • OpenCV 3和Qt5计算机视觉应用开发_源码 OpenCV 3和Qt5计算机视觉应用开发_源码
  • 计算机视觉应用综述

    千次阅读 2018-12-09 10:05:19
    近年来,我们随处可以听到一个词,“人工智能”。机器的智能化成为了现今的一大研究热点,...那么计算机视觉具体有哪些应用呢? 无人驾驶  无人驾驶又称自动驾驶,是目前人工智能领域一个比较重要的研究方向,让汽...

        近年来,我们随处可以听到一个词,“人工智能”。机器的智能化成为了现今的一大研究热点,而机器要变得更加智能,必然少不了对外界环境的感知。有研究表明,人对外界的环境的感知70%以上来自人类的视觉系统,机器也是如此,大多数的信息都包含在图像中,人工智能的实现少不了计算机视觉。那么计算机视觉具体有哪些应用呢?

    1. 无人驾驶

        无人驾驶又称自动驾驶,是目前人工智能领域一个比较重要的研究方向,让汽车可以进行自主驾驶,或者辅助驾驶员驾驶,提升驾驶操作的安全性。目前已经有一些公司研发出了自动泊车等辅助驾驶功能并得以应用。目前这方面做得比较好的是谷歌的无人驾驶汽车。国内也有一些比较好的公司,如百度无人驾驶车已经在一些园区得以应用,还有图森未来的货运车也完成了多次路测,并已经投入市场使用。

        计算机视觉在无人驾驶中起到了非常关键的作用,比如道路的识别,路标的识别,红绿灯的识别,行人识别等等平常驾驶过程中需要注意的。另外还包括三维重建及自主导航,通过激光雷达或者视觉传感器可以重建三维模型,辅助汽车进行自主定位及导航,进行合理的路径规划和相关决策。

    2.人脸识别

       人脸识别技术目前已经研究得相对比较成熟,并在很多地方得到了应用,且人脸识别准确率目前已经高于人眼的识别准确率,很多高铁站及门禁的地方都用到了人脸识别,很多都有刷脸系统,有些城市甚至在银行取钱都可以直接刷脸。

    3.无人安防

       安防一直是我国比较重视的问题,也是人们特别重视的问题,在很多重要地点都安排有巡警巡查,在居民小区以及公司一般也都有保安巡查来确保安全。随着计算机视觉的发展,计算机视觉技术已经能够很好的应用到安防领域,目前很多智能摄像头都已经能够自动识别出异常行为以及可疑危险人物,及时提醒相关安防人员或者报警,加强安全防范。

    4.车辆车牌识别

        车辆车牌识别目前已经是一种非诚成熟的技术了,高速路上的违章检测,车流分析,安全带识别,智能红绿灯,还有停车场的车辆身份识别等都用到了车辆车牌识别,不仅能识别出车牌的号码,目前车辆识别技术已经能对道路上的车辆车型进行识别,通过识别摄像头获取的图像,能获取到车辆的型号及颜色等特征。

    5.智能识图

        智能识图是我们生活中比较常见的计算机视觉的应用了。看到一个纸质文档,想要把其转换成电子文档,直接把文档拍下来,用相关软件进行文字识别,就能把图像中的文字自动转换成电子文档,甚至还能自动翻译成其他语言。看到一件衣服或一个物品,想在网上找他的来源等其他相关信息,直接输入图片,以图搜图,很快就能找到很多该图片出现的地方以及很多类似的图片。甚至还有些能直接告诉你图片中的物体是个什么东西,或者大概判断图片中的人像的大概年龄等比较好玩的功能。

    6.3D重构

        3D重构之前在工业领域应用比较多,可以用于对三维物体进行建模,方便测量出物体的各种参数,或者对物体进行简单复制。最近也慢慢开始应用到民用领域了,比如新出的华为mate20系列手机,就已经可以对玩偶进行三维建模,并能够设置一些特定的动作,让玩偶“活”起来,甚至可以与人进行一些互动。当然这里与人互动还用到AR技术。

    7.VR/AR

        VR/AR技术相信大家都已经比较熟悉了。VR眼睛在前两年卖得特别火爆,还有一些9D游戏机,就是利用VR技术让人能够有一种身临其境的感觉。而AR技术目前比较常见的可能是双十一时候淘宝的天猫,还有之前比较火爆的宠物捕获游戏,可以在现实场景中加入一些其他元素,目前这个领域还在快速发展中。很多方便人们生活的应用也在不断推出,比如智能翻译,用手机对着需要翻译的字,在这个界面上就自动显示出相关的翻译,或者后面可能实现的虚拟试衣间等,将大大的方便人们的生活。

     

    8.智能拍照

        这个相信是大家很熟悉的一个名词了,基本每个智能手机都开始配有这个功能。最基础的功能包括自动曝光,自动白平衡,自动对焦等,还有一些去燥算法,能很好的提高手机拍照的图像质量。随着计算机视觉技术的进步,一些自动美颜算法,自动挂件,自动滤镜,场景切换等越来越多有趣的功能都被开发出来。还有一些图像处理软件,像专业的Photoshop,还有比较民用化的美图秀秀,美颜相机等,基本也都是利用计算机视觉的技术。

    9.医学图像处理

        常见的医学成像,比如B超,核磁共振,X光拍片等。随着AI技术的发展,还开始有一些AI诊断的功能,AI根据图像的特征对相关疾病的可能性进行分析。

    10.无人机

        随着无人机技术的发展,计算机视觉技术在无人机上的应用必不可少,军用无人机中,可以对目标进行自动识别并自主导航,精确制导等,民用的无人机也类似,例如大疆的无人机,能够跟踪人进行实时的拍照,还有一些手势控制等。还有一些特殊场景的应用,例如电力巡检,农作物分析等。

    11.工业检测

        工业领域计算机视觉也得到了充分应用,例如产品缺陷检测,工业机器人姿态控制,利用立体视觉来获得工件和机器人之间的相对位置姿态。

    12.其他

        计算机视觉还有很多应用,随着技术的发展,应用领域也会越来越多。在工业领域的应用,在机器人技术方面的应用,这里就不一一的赘述了。相信随着计算机视觉技术的不断发展,我们的生活能够越来越智能化,便捷化。

        因为机器视觉课程刚好布置了这门作业,所以大概总结了一下,自己之前一段时间也在找计算机视觉相关的工作,所以多数还是根据自己对这个行业的了解来写的,难免和其他相关的总结有点类似。转载请注明出处。

    参考文献:

    https://36kr.com/p/5074487.html

    http://wb.qdqss.cn/html/qdwb/20180226/qdwb303829.html

    展开全文
  • 流式应用 使用Streamlit的深度学习和计算机视觉应用
  • 互联视觉 使算法在计算机视觉应用程序中易于使用和组合。
  • 机器学习及在计算机视觉应用,浙江大学CAD实验室何晓飞研究员的报告
  • OpenCV 3和Qt5计算机视觉应用开发 英文版 mobi版 其他版本可以通过calibre软件自行转换
  • 视觉相机 在Cyclone II FPGA上使用D5M相机的色盲计算机视觉应用
  • 2016中国人工智能行业系列研究——中国计算机视觉应用专题研究报告
  • 卷积神经网络之计算机视觉应用(一) 一 引言  21世纪开始,卷积神经网络就被成功的大量用于检测、分割、物体识别以及图像的各个领域。值得一提的是,图像可以在像素级别进行打标签,这样就可以应用在比如自动...

     卷积神经网络之计算机视觉应用(一)

    一 引言

     21世纪开始,卷积神经网络就被成功的大量用于检测、分割、物体识别以及图像的各个领域。值得一提的是,图像可以在像素级别进行打标签,这样就可以应用在比如自动电话接听机器人、自动驾驶汽车等技术中。尽管卷积神经网络应用的很成功,但是它被计算机视觉以及机器学习团队开始重视是在2012年的ImageNet竞赛。在该竞赛中,深度卷积神经网络被用在上百万张网络图片数据集,这个数据集包含了1000个不同的类。该结果达到了前所未有的好,几乎比当时最好的方法降低了一半的错误率。这个成功来自有效地利用了GPU、ReLU、一个新的被称为dropout的正则技术,以及通过分解现有样本产生更多训练样本的技术。这个成功给计算机视觉带来一个革命。如今,卷积神经网络用于几乎全部的识别和探测任务中。最近一个更好的成果是,利用卷积神经网络结合回馈神经网络用来产生图像标题。那么到底什么是卷积运算,什么是卷积神经网络,我们现在就来一探究竟。

    二 卷积网络

     卷积网络,也叫作卷积神经网络(convolutional neural network ,CNN),是一种专门用来处理具有类似网格结构的数据的神经网络。例如时间序列数据(可以认为是在时间轴上有规律地采样形成的一维网络)和图像数据(可以看作二维的像素网格)。卷积神经网络在诸多领域表现优异。“卷积神经网络”一词表明该网络使用了卷积这种数学运算。卷积神经网络是一种特殊的线性运算。卷积神经网络是指那些至少在网络的一层中使用卷积运算来代替一般的矩阵乘法运算的神经网络。

    三 卷积神经网络在图像上的应用

     那么到底什么是卷积运算,如何在图像上使用卷积运算,我们通过下图来具体说明。


     我们以上图为例,图像A为一个拥有6*6 36个像素点的原始灰白图片,我们用3*3的卷积核B来对其做卷积运算。卷积核就像一个窗口一样在图像A上进行滑动,每次移动一个步幅,那个一个共能够产生4*4 16个位置,因此我们得到了一个4*4的输出C。  那么每次卷积核在对应位置进行的卷积运算实质就是对应位置元素的乘积之和(如上图中所示)。我们进行公式的推广,若 一个n*n的原始图像,卷积核的大小为f*f,每次移动的步幅大小为一的话,我们就得到以下公式:

    C(经过卷积运算后图像的边)=n-f+1




     现在我们了解了如何在图像上进行卷积运算,那么我们来看一个更加贴切真实生活同时也更加复杂的例子来巩固下所学习到的知识。如下图所示,我们现在的输入图像由原来的单通道变成了三个通道(卷积核的通道数量等于原始图像的通道数量),分别来代表红色,绿色,蓝色三个色彩通道,那么这就相当于我们平时生活中的彩色照片了。我们的卷积核也相应的变成三个,因为要分别对应于RGB三个通道进行卷积运算,每个卷积核中的参数的设定通常来说是不相同的,这其实就相当于从不同的色彩角度来分析这张彩色图片了。


     上图还是进行我们熟悉的卷积运算,唯一我们需要注意的是6*6*3的原始图像和3*3*3的卷积核进行的卷积运算最后得出的结果是4*4的输出图像,因为一个卷积核代表从一个特征对图像进行处理(如:垂直边缘,水平边缘),卷积核的通道数目与原始图像的通道数目是相等的,最后我们把同一位置的各个通道进行卷积运算后的值相加来作为最后的输出(例如上图中:RGB三个通道卷积运算的结果相加才是最后的输出)。再对另一个的卷积核进行运算后我们又会得到一个二维的输出图像,把这两个结果叠加到一起我们就得到了一个完整的卷积运算后的结果了。当然我们还可以再增加卷积核的数量,这就相当于我们从更多的角度来分析处理这张彩色图片了,我们最后得到结果的通道数目和卷积核的数量是相等,例如上图中我们有两个3*3*3的卷积核,那么我们的输出就是4*4*2的三维结果。若我们有4个3*3*3的卷积核,那么我们的结果就变成了4*4*4了。

     最后我们对重要知识点再进行回顾,对公式进行推广。卷积核的通道数目Nc和原始图像的通道数目Nc是相等的,输出图像的通道数目x是和卷积核的个数相等的,我们只要明确理解了这两个重要的点,对卷积运算中的参数就不会再混淆了。若我们有一个n*n*Nc的原始图像,有x个f*f*Nc的卷积核,那么我们的输出图像应该为(n-f+1)*(n-f+1)*x。



    下一篇文章我们将介绍卷积神经网络中的池化层,以及如何使用CNN来进行手写体识别。







    展开全文
  • OpenCV 3和Qt5计算机视觉应用开发_源码
  • 一篇遗传算法在计算机视觉应用的论文,简单明了,给大家一个思路
  • 实用计算机视觉应用 Ahmed Fawzy Mohamed Gad的“使用带有CNN的深度学习的实用计算机视觉应用程序”的源代码 这本书可在亚马逊上找到: :
  • OpenCV 3计算机视觉应用程序编程手册,第三版 这是Packt发行的《 的代码存储库。 它包含从头到尾完成本书所必需的所有支持项目文件。 关于这本书 《 OpenCV 3计算机视觉应用程序编程手册第三版》全面介绍了OpenCV库...
  • Computer Vision Foundations and Applications-Fei-Fei Li-Stanford,计算机视觉应用课件-李飞飞-斯坦福
  • 用MATLAB编写的代码,包含计算机视觉的很多功能
  • 目标检测作为图像处理和计算机视觉领域中的经典课题,在交通监控、图像检索、人机交互等方面有着广泛的应用。它旨在一个静态图像(或动态视频)中检测出人们感兴趣的目标对象。传统的目标检测算法中特征提取和分类决策...

    欢迎大家关注我们的网站和系列教程:http://www.tensorflownews.com/,学习更多的机器学习、深度学习的知识!

    目标检测作为图像处理和计算机视觉领域中的经典课题,在交通监控、图像检索、人机交互等方面有着广泛的应用。它旨在一个静态图像(或动态视频)中检测出人们感兴趣的目标对象。传统的目标检测算法中特征提取和分类决策分开进行,对特征选取的要求就更加严格,在面对复杂场景的时候很难得到理想效果。自Hinton教授提出深度学习理论,越来越多的研究人员发现在目标检测领域应用深度学习,可以有效提高检测效果和性能,于是深度学习在实时视频的目标检测开始获得大规模的应用。时至今日,其检测效率和精度已经有了极大提高。

    一、传统检测算法

    传统的目标检测一般使用滑动窗口的框架,主要包括三个步骤:先利用不同尺寸的滑动窗口框住图中的某一部分作为候选区域;然后提取候选区域相关的视觉特征——比如人脸检测常用的Harr-like特征,行人检测和普通目标检测常用的HOG(Histogram of Oriented GradientSIFT(Scale Invariant Feature Transform)特征等;最后利用分类器进行识别,比如常用的SVM模型。

    经典传统检测算法之DPM

    传统的目标检测中,多尺度形变部件模型DPM(Deformable Part Model)是出类拔萃的,连续获得VOC(Visual Object Class)2007到2009的检测冠军,2010年其作者Felzenszwalb Pedro被VOC授予“终身成就奖”。DPM把物体看成了多个组成的部件(比如人脸的鼻子、嘴巴等),用部件间的关系来描述物体,这个特性非常符合自然界很多物体的非刚体特征。DPM可以看做是HOG+SVM的扩展,很好的继承了两者的优点,在人脸检测、行人检测等任务上取得了不错的效果,但是DPM相对复杂,检测速度也较慢,从而也出现了很多改进的方法。


    图1 DPM检测流程

    二、目前检测算法

    正当大家热火朝天改进DPM性能的时候,基于深度学习的目标检测横空出世,迅速盖过了DPM的风头,很多之前研究传统目标检测算法的研究者也开始转向深度学习。基于深度学习的目标检测发展起来后,其实效果也一直难以突破。比如C. Szegedy等人提出的基于DNN的检测算法在VOC 2007测试集合上的mAP只能达到约30%,P. Sermane等人提出的OverFeat在ILSVRC 2013测试集上的mAP只能达到24.3%。2013年R-CNN[8]诞生了,在VOC 2007测试集检测的mAP大幅提升至48%,随着研究的不断深入,各类先进检测算法不断涌出。

    1.YOLO

    2015年Joseph Redmon提出了一个新的物体检测方法YOLO(You Only Look Once), 顾名思义是指只看一次就可以知道‘是否存在’以及‘在哪儿’,进一步把目标判定和目标识别合二为一,所以识别性能有了很大提升,达到每秒45帧,而在快速版YOLO(Fast YOLO,卷积层更少)中,可以达到每秒155帧。


    图2 YOLO检测系统

    针对一张图片,YOLO的处理步骤为:把输入图片缩放到448×448大小;运行卷积网络;对模型置信度卡阈值,得到目标位置与类别。对VOC数据集来说,YOLO就是把图片统一缩放到448×448,然后每张图平均划分为7×7=49个小格子,每个格子预测2个矩形框及其置信度,以及20种类别的概率。 舍弃了Region proposal阶段,加快了速度,但是定位精度比较低,与此同时带来的问题是,分类的精度也比较低。在各类数据集上的平均表现大概为54.5%mAP。


    图3 YOLO模型

    2.Faster R-CNN

    2015年S Ren等人对R-CNN系列又提出了改进型Faster R-CNN,运用一种区域建议网络RPN(Region Proposal Network),它和检测网络共享全图的卷积特征,使得区域建议几乎不花时间。RPN是一个全卷积网络, 在每个位置同时预测目标边界和客体性得分。 将RPN 生成的高质量区域建议框,用于Fast R-CNN来检测,通过一种简单的交替运行优化方法,RPN和Fast R-CNN 可以在训练时共享卷积特征,应用共享卷积,计算建议框的边际成本是很小的(例如每个图像10ms)。这种将一直以来分离的候选区域提取阶段和卷积神经网络分类过程融合到了一起,使用端到端的网络进行目标检测,在速度以及精度上都得到了显著的提高。


    图4 Fast R-CNN框架

    在每个图像用了300 个建议框的情况下,对于较深的VGG-16 模型,Faster R-CNN检测系统在GPU 上的帧率达到5fps(包含所有步骤),对于较为简单的模型,帧率可以达到17 fps,在PASCAL VOC 2007 和PASCAL VOC2012 上 实 现 了 最 高 的 目 标 检 测 准 确 率 (PASCAL VOC2007:73.2%mAP , PASCAL VOC2012:70.4%mAP)。


    图5 Region Proposal Network(RPN)

     

    3.SSD

    之后,针对于Faster R-CNN与YOLO网络中出现的不足, SSD网络对YOLO 网络进行了相应的改进。SSD的框架如图6所示,图6(a)表示带有两个Ground Truth边框的输入图片,图6(b)和(c)分别表示8×8网格和4×4网格,显然前者适合检测小的目标,比如图片中的猫,后者适合检测大的目标,比如图片中的狗。在每个格子上有一系列固定大小的Box(有点类似前面提到的Anchor Box),这些在SSD称为Default Box,用来框定目标物体的位置,在训练的时候Ground Truth会赋予给某个固定的Box,比如图6(b)中的蓝框和图6(c)中的红框。


    图6 SSD框架

    SSD的网络分为两部分,前面的是用于图像分类的标准网络(去掉了分类相关的层),后面的网络是用于检测的多尺度特征映射层,从而达到检测不同大小的目标。SSD和YOLO的网络结构对比如图7所示。


    图7 SSD和YOLO的网络结构对比

    SSD在保持YOLO高速的同时效果也提升很多,主要是借鉴了Faster R-CNN中的Anchor机制,同时使用了多尺度。因Default Box的形状以及网格大小是事先固定的,那么对特定的图片小目标检测效果较差。

     

    写在最后:计算机视觉领域技术更新很快,本次只对三个热门目标检测算法做了简单介绍。想了解更多计算机视觉相关最新技术更新请持续关注公众号:磐创AI。

    【注】:文中所用引用文献,回复可见。

    相关项目实战推荐:

    相关项目实战推荐:

    YOLO: https://zhuanlan.zhihu.com/p/29555602

    SSD: https://zhuanlan.zhihu.com/p/29586716

    Faster R-CNN:https://github.com/endernewton/tf-faster-rcnn

    本篇文章出自http://www.tensorflownews.com,对深度学习感兴趣,热爱Tensorflow的小伙伴,欢迎关注我们的网站!

    展开全文
  • 简介本教程将为大家详细介绍如何使用深度学习部署套件的推理引擎(包含在英特尔® 计算机视觉 SDK Beta 测试版 R3中)。推理指使用训练的神经网络从数据(比如图像)推理出某种意义的过程。在下面的代码示例中,视频...

    简介

    本教程将为大家详细介绍如何使用深度学习部署套件的推理引擎(包含在英特尔® 计算机视觉 SDK Beta 测试版 R3中)。推理指使用训练的神经网络从数据(比如图像)推理出某种意义的过程。在下面的代码示例中,视频(逐帧)馈送至推理引擎(我们训练的神经网络),然后输出结果(图像分类)。推理过程通过不同的神经网络架构(AlexNet*、GoogleNet* 等)来完成。本示例在 GoogleNet 模型上使用 Single Shot MultiBox Detector (SSD)。关于如何使用 SSD 的示例,请参阅英特尔® 开发人员专区的本文

    推理引擎要求将该模型转化成 IR(中间代码)文件。本教程将详细介绍如何使用 Model Optimizer 提取现有模型 (GoogleNet) 并将其转化成 IR(中间代码)文件。

    本教程结束后,大家将看到视频上通过检测多个对象(比如人或汽车)进行推理;例如下图,大家可以看到示例图像正进行以下操作:

    在推理引擎上运行神经网络有何不同之处?

    • 推理引擎可优化推理过程,支持用户显著提高深度学习部署在英特尔® 架构上的运行速度。更多关于英特尔® 处理器显卡的性能信息,请参阅本文
    • 推理可在硬件(比如英特尔® GPU 或英特尔® FPGA 加速卡)上运行,而非 CPU。

    推理引擎如何运行?

    推理引擎提取神经网络模型的表示并对其进行优化,以在 CPU 中充分利用高级英特尔® 指令集,并使其兼容其他硬件加速器(GPU 和 FPGA)。为此,将模型文件(.caffemodel,.prototxt)提供给 Model Optimizer,然后该程序处理这些文件并输出两个新文件:.bin 和 .xml。运行应用时使用这两个新文件,而不是原始的模型文件。在本示例中,提供有 .bin 和 .xml 文件...阅读全文

    展开全文
  • 计算机视觉应用:除草、养鸡等等 2012年09月25日 ⁄ 创业, 技术, 科研 ⁄ 共 463字 ⁄ 评论数 7 ⁄ 被围观 463 阅读+ 这个新闻http://www.iheima.com/html/2012/cxzc_0911/3085.html是讲一帮...
  • 计算机视觉 算法与应用 中文版与英语版, 计算机视觉 算法与应用 中文版与英语版
  • 计算机视觉算法与应用中文版,学习计算机视觉最基本的书
  • 计算机视觉实战:使用OpenCV快速构建视觉应用 计算机视觉实战:使用OpenCV快速构建视觉应用
  • 计算机视觉

    千次阅读 多人点赞 2019-08-16 10:44:58
    01 计算机视觉 02 计算机视觉应用 03 机器学习训练图像的流程 04 深度学习图像识别流程 05 卷积神经网络 06 物体检测 07 传统目标检测方法 基于深度神经网络的目标检测 ...
  • 计算机视觉:算法与应用》探索了用于分析和解释图像的各种常用技术,描述了具有一定挑战性的视觉应用方面的成功实例,兼顾专业的医学成像和图像编辑与拼接之类有趣的大众应用,以便学生能够将其应用于自己的照片和...
  • 计算机视觉应用.pdf

    2021-10-04 04:58:09
    计算机视觉应用.pdf
  • 计算机视觉—算法与应用》是计算机视觉入门的经典书籍
  • 计算机视觉-算法与应用

空空如也

空空如也

1 2 3 4 5 ... 20
收藏数 140,516
精华内容 56,206
关键字:

计算机视觉应用