精华内容
下载资源
问答
  • 目标识别
    千次阅读
    2018-10-09 11:26:46

    1.研究意义

    众所周知,当前是信息时代,信息的获得、加工、处理以及应用都有了飞跃发展。人们认识世界的重要知识来源就是图像信息,在很多场合,图像所传送的信息比其他形式的信息更丰富、真切和具体。人眼与大脑的协作使得人们可以获取、处理以及理解视觉信息,人类利用视觉感知外界环境信息的效率很高。事实上,据一些国外学者所做的统计,人类所获得外界信息有80%左右是来自眼睛摄取的图像。由此可见,视觉作为人类获取外界信息的主要载体,计算机要实现智能化,就必须能够处理图像信息。尤其是近年来,以图形、图像、视频等大容量为特征的图像数据处理广泛应用于医学、交通、工业自动化等领域。

    自然界的一切图像都是连续变化的模拟图像,在日常生活中,这些图像中的运动目标往往是我们比较关心的,如:行人、行驶的交通工具以及其他的物体。目标检测和识别是计算机视觉和数字图像处理的一个热门方向,广泛应用于机器人导航、智能视频监控、工业检测、航空航天等诸多领域。因此,目标识别也就成为了近年来理论和应用的研究热点,它是图像处理和计算机视觉学科的重要分支,也是智能监控系统的核心部分。它的目的就是如何快速、准确地检测出监控视频中的目标,即从序列图像中将目标提取出来。

    随着社会经济的不断发展,城市化步伐的不断加速,城市的工作、生活秩序显得越来越紊乱,实时的人数统计有着重要意义。如:可以通过统计等候电梯的人数来优化调度电梯,以此提高电梯的利用率,减少用户的等待时间。可以通过统计经过十字路口、丁字路口人群流动繁忙的交通场合的人数,可以合理安排交通警察或保安人员的工作时间和工作额度。


     

    2.研究现状

    目标识别是指用计算机实现人的视觉功能,它的研究目标就是使计算机具有从一幅或多幅图像或者是视频中认知周围环境的能力(包括对客观世界三维环境的感知、识别与理解)。目标识别作为视觉技术的一个分支,就是对视场内的物体进行识别,如人或交通工具,先进行检测,检测完后进行识别,然后分析他们的行为。目前,国际上许多高校和研究所,如麻省理工学学院、牛津大学等都专门设立了针对目标检测和识别的研究组或者研究实验室。美英等国家已经研究了大量的相关项目。一些著名公司和研究机构,如IBM、Microsoft、麻省理工学院等近几年来投入了大量的人力物力来进行智能监控系统的研究,部分成果已经转化为产品投入了市场。

    目前在国内的研究机构中,中国科学院自动化研究所下属的模式识别国家重点实验室视觉监控研究处于领先地位。自动化所在交通场景视觉监控、人的运动视觉监控和行为模式识别方面进行了深入研究。另外他们也总结了英国雷丁大学VIEWS的车辆交通监控原型系统的研究经验,在之前的理论研究的基础上,自行设计并初步实现了一个拥有完全自主知识产权的交通监控原型系统vstart(Visual surveillance star)。国内其他高校如上海交通大学、北京航空航天大学也对这方面进行了研究。


     

    3.目标识别

    3.1目标识别的任务

    识别出图像中有什么物体,并报告出这个物体在图像表示的场景中的位置和方向。对一个给定的图片进行目标识别,首先要判断目标有没有,如果目标没有,则检测和识别结束,如果有目标,就要进一步判断有几个目标,目标分别所在的位置,然后对目标进行分割,判断哪些像素点属于该目标。

    3.2目标识别的过程

    3.2.1目标的识别大体框架:

     

    目标识别往包含以下几个阶段:预处理,特征提取,特征选择,建模,匹配,定位。目前物体识别方法可以归为两类:一类是基于模型的或者基于上下文识别的方法,另一类是二维物体识别或者三维物体识别方法。对于物体识别方法的评价标准,Grimson总结出了大多数研究者主要认可的4个标准:健壮性(robustness)、正确性(correctness)、效率(efficiency)和范围(scope)

    3.2.2训练分类器所需训练样本的创建

    训练样本包括正样本和负样本;其中正例样本是指待检目标样本(例如人脸或汽车等),负样本指其它不包含目标的任意图片(如背景等),所有的样本图片都被归一化为同样的尺寸大小(例如,20x20)。

    3.2.4预处理

           预处理是尽可能在不改变图像承载的本质信息的前提下,使得每张图像的表观特性(如颜色分布,整体明暗,尺寸大小等)尽可能的一致,以便于之后的处理过程。预处理有生物学的对应。瞳孔,虹膜和视网膜上的一些细胞的行为类似于某些预处理步骤,如自适应调节入射光的动态区域等等。预处理和特征提取之间的界线不完全分明。有时两者交叉在一起。它主要完成模式的采集、模数转换、滤波、消除模糊、减少噪声、纠正几何失真等预处理操作。因此也要求相应的设备来实现。

    预处理经常与具体的采样设备和所处理的问题有关。例如,从图象中将汽车车牌的号码识别出来,就需要先将车牌从图像中找出来,再对车牌进行划分,将每个数字分别划分开。做到这一步以后,才能对每个数字进行识别。以上工作都应该在预处理阶段完成。

    从理论上说,像预处理这种先验式的操作是不应该有的。因为它并不为任何目的服务,所以完全可以随意为之而没有“应该怎么做”的标准,大部分情况下预处理是看着实验结果说话。这是因为计算机视觉目前没有一个整体的理论框架,无法从全局的高度来指导每一个步骤应该如何进行。在物体识别中所用到的典型的预处理方法不外乎直方图均衡及滤波几种。像高斯模糊可以用来使得之后的梯度计算更为准确;而直方图均衡可以克服一定程度的光照影响。值得注意的是,有些特征本身已经带有预处理的属性,因此不需要再进行预处理操作。

    预处理通常包括五种基本运算:

        (1)编码:实现模式的有效描述,适合计算机运算。

        (2)阀值或者滤波运算:按需要选出某些函数,抑制另一些。

        (3)模式改善:排除或修正模式中的错误,或不必要的函数值。

        (4)正规化:使某些参数值适应标准值,或标准值域。

        (5)离散模式运算:离散模式处理中的特殊运算。

    3.2.5特征提取

    由图像或波形所获得的数据量是相当大的。例如,一个文字图像可以有几千个数据,一个心电图波形也可能有几千个数据。为了有效地实现分类识别,就要对原始数据进行变换,得到最能反映分类本质的特征。这就是特征选择和提取的过程。一般我们把原始数据组成的空间叫测量空间,把分类识别赖以进行的空间叫做特征空间,通过变换,可把在维数较高的测量空间中表示的模式变为在维数较低的特征空间中表示的模式。特征提取是物体识别的第一步,也是识别方法的一个重要组成部分,好的图像特征使得不同的物体对象在高维特征空间中有着较好的分离性,从而能够有效地减轻识别算法后续步骤的负担,达到事半功倍的效果,下面是对一些常用的特征提取方法:

    (1)颜色特征。颜色特征描述了图像或图像区域所对应的景物的表面性质,常用的颜色特征有图像片特征、颜色通道直方图特征等。

    (2)纹理特征。纹理通常定义为图像的某种局部性质,或是对局部区域中像素之间关系的一种度量。纹理特征提取的一种有效方法是以灰度级的空间相关矩阵即共生矩阵为基础的,其他方法还有基于图像友度差值直方图的特征提取和基于图像灰度共生矩阵的特征提取。

    (3)形状特征。形状是刻画物体的基本特征之一,用形状特征区别物体非常直观,利用形状特征检索图像可以提高检索的准确性和效率,形状特征分析在模式识别和视觉检测中具有重要的作用。通常情况下,形状特征有两类表示方法,一类是形状轮廓特征描述,另一类是形状区域特征。形状轮廓特征主要有:直线段描述、样条拟合曲线、博立叶描述子、内角直方图以及高斯参数曲线等等,形状区域特征主要有:形状的无关矩、区域的面积、形状的纵横比等。

    (4)空间特征。空间特征是指图像中分割出来的多个目标之间的相互的空间位置或者相对方向关系,有相对位置信息,比如上下左右,也有绝对位置信息,常用的提取空间特征的方法的基本思想为对图像进行分割后,提取出特征后,对这些特征建立索引。

    目标比较盛行的有:Haar特征、LBP特征、HOG特征和Shif特征等;他们各有千秋,得视你要检测的目标情况而定。

     

    3.2.6特征选择

    再好的机器学习算法,没有良好的特征都是不行的;然而有了特征之后,机器学习算法便开始发挥自己的优势。在提取了所要的特征之后,接下来的一个可选步骤是特征选择。特别是在特征种类很多或者物体类别很多,需要找到各自的最适应特征的场合。严格地来说,任何能够在被选出特征集上工作正常的模型都能在原特征集上工作正常,反过来进行了特征选择则可能会丢掉一些有用的特征;不过由于计算上的巨大开销,在把特征放进模型里训练之前进行特征选择仍然是相当重要的。

    3.2.7建模

    一般物体识别系统赖以成功的关键基础在于,属于同一类的物体总是有一些地方是相同的。而给定特征集合,提取相同点,分辨不同点就成了模型要解决的问题。因此可以说模型是整个识别系统的成败之所在。对于物体识别这个特定课题,模型主要建模的对象是特征与特征之间的空间结构关系;主要的选择准则,一是模型的假设是否适用于当前问题;二是模型所需的计算复杂度是否能够承受,或者是否有尽可能高效精确或者近似的算法。

           模型表示涉及到物体具有那些重要属性或特征以及这些特征如何在模型库中表示,有些物体模型定义为一系列局部的统计特征,即generative模型,有些是采用物体的特征以及物体特征之间的相互关系定义的,比如位置关系等,即discriminative模型,或者是二者的混合模型。对于大多数物体来说,几何特征描述是可以很有效的;但对于另外一些物体,可能需要更一般的特征或函数来表示。物体的表示应该包含所有相关信息,但没用任何冗余信息,并且将这些信息以某种方式组织起来,使得物体识别系统的不同组元能够容易访问这些信息。

    3.2.8用训练样本来训练分类器

    这得先明白分类器是什么?百度百科的解释是:“使待分对象被划归某一类而使用的分类装置或数学模型。”可以这样理解,举个例子:人脑本身也算一个分类器,只是它强大到超乎想象而已,人对事物的识别本身也是一个分类的过程。人在成长或者学习过程中,会通过观察A类事物的多个具体事例来得到对A类事物性质和特点的认识,然后以后遇到一个新的物体时,人脑会根据这个事物的特征是否符合A类事物性质和特点,而将其分类为A类或者非A类。(这里只是用简单的二分类问题来说明)。那么训练分类器可以理解为分类器(大脑)通过对正样本和负样本的观察(学习),使其具有对该目标的检测能力(未来遇到该目标能认出来)。

    分类器按特征类型分为数值型分类器和符号型两大类。数值型分类器包括统计分类器(统计理论为基础)、模糊分类器(模糊集理论为基础)、人工神经元网络(模拟生物神经系统的电子系统,也可以用软件在计算机上实现)、人工智能分类器(基于逻辑推理或专家系统结构)。符号型分类器包括句法分类器(基于句法分析和自动机理论)、人工智能分类器(基于逻辑推理或专家系统结构)。 其中符号型分类器具有更大的灵活性,所以能处理较为复杂的模式分类问题。但是目前对符号型分类器的研究远没有数值型分类器成熟。为了使分类检测准确率较好,训练样本一般都是成千上万的,然后每个样本又提取出了很多个特征,这样就产生了很多的的训练数据,所以训练的过程一般都很耗时的。

    目标比较盛行的分类器有:SVM支持向量机、AdaBoost算法等;其中检测行人的一般是HOG特征+SVM,OpenCV中检测人脸的一般是Haar+AdaBoost,OpenCV中检测拳头一般是LBP+ AdaBoost。随着深度学习的兴起,现在深度学习在物体识别上取得了相当好的成果。

    3.2.9匹配

    在得到训练结果之后(在描述、生成或者区分模型中常表现为一簇参数的取值,在其它模型中表现为一组特征的获得与存储),接下来的任务是运用目前的模型去识别新的图像属于哪一类物体,并且有可能的话,给出边界,将物体与图像的其它部分分割开。一般当模型取定后,匹配算法也就自然而然地出现。在描述模型中,通常是对每类物体建模,然后使用极大似然或是贝叶斯推理得到类别信息;生成模型大致与此相同,只是通常要先估出隐变量的值,或者将隐变量积分,这一步往往导致极大的计算负荷;区分模型则更为简单,将特征取值代入分类器即得结果。

    一般匹配过程是这样的:用一个扫描子窗口在待检测的图像中不断的移位滑动,子窗口每到一个位置,就会计算出该区域的特征,然后用我们训练好的分类器对该特征进行筛选,判定该区域是否为目标。然后因为目标在图像的大小可能和你训练分类器时使用的样本图片大小不一样,所以就需要对这个扫描的子窗口变大或者变小(或者将图像变小),再在图像中滑动,再匹配一遍。

    3.2.10目标识别方法

           物体识别方法就是使用各种匹配算法,根据从图像已提取出的特征,寻找出与物体模型库中最佳的匹配,它的输入为图像与要识别物体的模型库,输出为物体的名称、姿态、位置等等。大多数情况下,为了能够识别出图像中的一个物体,物体识别方法一般由5个步骤组成:特征提取;知觉组织;索引;匹配;验证

           经典的物体识别方法:

    1)         Bag ofwords(BoW)方法。BoW 方法主要是采用分类方法来识别物体,BoW 方法是来自于自然语言处理,在自然语言处理中是用来表示一篇文档是有一袋子词语组成的,在计算机视觉的物体识别方法中,将图像比作文档,将从图像中提取的特征比作词语,即一幅图像是有一袋子特征组成的,如图1 所示。BoW 方法首先需要一个特征库,特征库中的特征之间是相互独立的,然后图像可以表示为特征库中所有特征的一个直方图,最后采用一些生成性(generative)方法的学习与识别来识别物体。

    2)         Partsand structure 方法。BoW 方法的一个主要缺点为特征之间是相互独立的,丢失了位置信息,Parts and structure 方法采用了特征之间的关系,比如位置信息和底层的图像特征,将提取出的特征联系起来。 Pictorial Structure(PS)提出的弹簧模型,物体部件之间的关系用伸缩的弹簧表示,对于特征之间的关系的模型表示,还有星型结构、层次结构、树状结构等。

    3)         生成性(generative)方法与鉴别性(Discriminative)方法。生成性方法检查在给定物体类别的条件下,图像中出现物体的可能性,并以此判定作为检测结果的得分,鉴别性方法检查图像中包含某个类别出现的可能性与其他类的可能性之比,从而将物体归为某一类。

    3.2.11分割

           一旦在图像中潜在目标的位置找到了,就要从背景中尽可能准确的将目标提取出来,即将目标从背景中分割出来。当存在噪声和杂波干扰时,信噪比可能很低,这是将会给分割造成困难。

           目标的分割算法有很多。每个分割算法都要解决两个问题:分割准则和执行方法。

    (1)MeanShift聚类

    Meanshift聚类也可以用在边缘检测、图像规则化、跟踪等方面。基于meanshift的分割需要精密的参数调整以得到较好的分割效果,如颜色和空间核带宽的选择,区域尺寸最小值的阈值设定。

    (2)Graph-cut

    图像分割可以建模为graph-cut问题。图G的顶点V由图像像素点构成;通过剪除加权的边分割为N个不相连的子图。两个子图间被剪除的边的权和称为cut。权值由颜色、光照、纹理等因素计算得到。通常应用在跟踪目标轮廓上;与MeanShift相比,它所需要参数较少,但计算开销和内存开销较大。

    (3)主动轮廓

    主动轮廓曲线将一个闭合轮廓曲线推演为目标边界,从而实现图像分割。这个过程由轮廓的能量函数来操纵。这个问题需要解决三个方面问题:一是能量函数的确定,二是轮廓曲线的初始化,三是轮廓表达方式的选择。


     

    4.存在问题

    虽然目标识别已经被广泛研究了很多年,研究出大量的技术和算法,识别方法的健壮性、正确性、效率以及范围得到了很大的提升,但在目标检测和识别这方面仍然存在着许多不足,体现在一下几个方面。

    (1)目标之间互遮挡和人体自遮挡问题,尤其是在拥挤状态下,多人的检测更是难处理。 

    (2)获取物体的观测数据时会受到多方面的影响。在不同的视角对同一物体也会得到不同的图像,物体所处的场景的背景以及物体会被遮挡,背景杂物一直是影响物体识别性能的重要因素,场景中的诸多因素,如光源、表面颜色、摄像机等也会影响到图像的像素灰度,要确定各种因素对像素灰度的作用大小是很困难的,这些使得图像本身在很多时候并不能提供足够的信息来恢复景物。

    (3)同样的图像在不同的知识导引下,会产生不同的识别结果,知识库的建立不仅要使用物体的自身知识,如颜色、纹理、形状等,也需要物体间关系的知识,知识库的有效性与准备性直接影响了物体识别的准确性。

    (4)物体本身是一个高维信息的载体,但是图像中的物体只是物体的一个二维呈现,并且在人类目前对自己如何识别物体尚未了解清楚,也就无法给物体识别的研究提供直接的指导。

    (5)目前人们所建立的各种视觉系统绝大多数是只适用于某一特定环境或应用场合的专用系统,而要建立一个可与人的视觉系统相比的通用视觉系统是非常困难的,虽然存在着很多困难。

    (6)目标之间互遮挡,尤其是在拥挤状态下,目标检测很不稳定,检测结果也很不理想,这个问题还需要进一步的研究解决。


     

    5.未来研究思路

             目标检测和识别仍然存在着诸多的问题,以后目标识别可以从以下几个方面改进:

    (1)形状特征的研究。目前大部分的形状特征仍然是基于有向梯度,这是否是足够的,形状是否应该有更高一层的抽象表示,还值得进一步的研究。

    (2)物体的表示与描述。如何描述物体,物体不应该是独立的,物体与物体之间的交互应该考虑进来。物体不应该是一组独立的特征的集合,物体识别应该放在一个更大的上下文环境中来重新考察。

    转载自:https://blog.csdn.net/liuheng0111/article/details/52348874

    更多相关内容
  • 目标检测的数据扩展

    千次阅读 2019-06-24 17:41:09
    论文:Augmentation for small object detection Abstract 这些年来目标检测领域经历了令人...除了这些改进,目标检测与大目标检测领域还是有不小的差距。我们MS COCO上分析了当前SOTA的模型Mask-RCNN。...

    参考:https://blog.csdn.net/abrams90/article/details/89371797

    论文:Augmentation for small object detection

    Abstract

    这些年来目标检测领域经历了令人印象深刻的进展。除了这些改进,在小目标检测与大目标检测领域还是有不小的差距。我们在MS COCO上分析了当前SOTA的模型Mask-RCNN。研究成果展示GT目标与预测的anchors的重叠远远小于期望的IoU阈值。我们猜测这可能是由两个情况导致的:1、只有少部分样本包含小目标;2、即使在包含小目标的样本中,小目标的数目也不够。我们因此提出过采样那些包含小目标的样本,通过多次复制粘贴那些小目标到样本中达到数据扩展的效果。这样使得我们可以平衡检测器在小目标与大目标检测中的表现。我们评估了不同的粘贴扩展策略,最终与当前MS COCO上SOTA方法相比我们在实例分割上达到了9.7%的相对改进,在小目标检测上达到了7.1%的相对改进。

    1 Introduction

    图像的目标检测是当前CV工作的一个重要基础任务,通常是许多现实应用中的第一步工作,包括机器人、自动驾驶、卫星、航空图像分析、医学图像中的组织与肿瘤定位。当前目标检测问题正经历许多变革。MS COCO目标检测竞赛中AP从2015年的0.373【32】发展到2017年的0.525(主要的竞赛度量指标IoU=.50:.05:.95),相似的结果在MS COCO实例分割竞赛中也可以找到。尽管有这些改进,现有解决方案在小目标上的表现还是不如预期,这里小目标的定义以MS COCO为例在表1中展示。它展示出了小目标与大目标检测中的巨大差距。图一中列出了排名靠前的MS COCO实例分割比赛结果。可以观察到实例分割也面临着类似的问题。例如,如图二中SOTA的Mask-RCNN模型的预测结果,模型漏检了大多数小目标样本。

    对于许多下游任务来说小目标检测相当重要。对于自动驾驶车辆安全来说,从高清图像中检测出小样本或者远距离样本相当重要。许多目标,例如交通灯【11】【34】或者行人【31】,在高清样本中很难被察觉。在医学图像中,对于肿块或者肿瘤的早期检测对于尽早的精准诊断十分重要,然而这些目标很有可能大小只有几个像素【3】【29】。工业自动检测通过定位物料表面小的视觉瑕疵来从小目标检测中受益【1】【30】。还有卫星图像分析,在这个应用中例如汽车、船与房子这样的目标都需要被有效的标注出来【28,21】。在平均一个像素表示0.5到5m的分辨率下,这些目标有可能只有几个像素。换句话说,小目标检测与分割需要投入更多的精力,因为在现实世界中部署了更复杂的系统。我们因此提出了一种改进小目标检测的新方法。

    我们的研究在MS COCO数据加上,专注于SOTA的Mask R-CNN检测器。除了小目标外我们注意到这个数据集还有两个特点。首先,我们观察到数据集中包含小目标的样本数量较少,这样潜在的让目标检测模型更关注中大目标的检测。第二,由小目标覆盖的区域更小,这样小目标的位置会缺少多样性。我们推测这使得小目标检测的在验证时的通用性变得很难,因为他们只出现在样本中很少被训练到的位置。

    我们通过过采样包含小目标图像的方式解决上述第一个问题。第二个问题通过在包含小目标样本中多次复制粘贴小目标来解决。当粘贴每个目标的时候,我们保证粘贴的目标与现有的目标不重叠。这增加了小目标位置的多样性,同时保证目标出现在合适的上下文,如图3所示。每个样本中小目标个数的增加进一步解决了匹配的anchor数目问题。总体来说,我们在MS COCO数据集,使用SOTA的Mask R-CNN模型,在小目标实例分割上取得了9.7%的相对改进,在小目标检测上取得了7.1%的相对改进。

    2 Related Work

    3 Identifying issues with detecting small objects

    本章中,我们首先大致介绍MS COCO数据集与我们实验中用到的目标检测模型。之后我们讨论MS COCO数据集中的问题与训练中anchor匹配过程,这导致了小目标检测难的问题。

    3.1 MS COCO

    我们在MS COCO检测数据集上【25】进行试验。MS COCO 2017目标检测数据集包含11287张训练样本,5000张验证样本,40670张测试样本。80类860001个BBOX的目标与36781个实例掩模。

    在MS COCO检测挑战中,主要的评估度量方式是AP。总的来说,AP定义为TP与所有召回的样本中正样本的平均比例。由于目标需要同时被定位与正确分类,只有在BBOX或者掩模的IoU大于0.5,并且被正确分类的时候才被认为正确。AP得分通过80类与10个阈值均衡分布在0.5到0.95间的IoU的平均得到。度量结果也包括不同目标尺寸的AP结果。本文中,我们主要关注小目标的AP。

    3.2 Mask R-CNN

    我们的实验中使用【16】中实现的Mask R-CNN,使用ResNet-50作为backbone,使用文献【17】中的设置学习超参数的方法进行线性尺度规则设定。我们的训练周期比【16】中的短。我们使用基础学习率0.01在四块GPU上迭代了36k次。在优化方式上,我们使用sgd,momentum设置为0.9,权重衰减协设置为0.0001。分别在24K与32K次迭代的时候将学习率下降0.1倍。所有其他参数保持【16】中Mask R-CNN+FPN+ResNet-50的baseline设置。

    网络的region proposal阶段使我们研究的重点。我们用FPN来产生目标的proposal【24】。它预测出来自5个不同尺度(322,642,1282,2562,5122)与三个aspect ratios(1,0.5,2)的15个目标proposal。Anchor如果与任何标注位置的IoU大于0.7那么就产生一个正样本标签。

    3.3 Small object detection by Mask R-CNN on MS COCO

    在MS COCO中41.43%的训练集样本为小样本,只有34.4%与24.2%的是中型或者大样本。换句话说,只有大约一半的样本包含小目标,而70.07%与82.28%的训练样本中包含中大尺寸的样本,如表2。这确认了小目标检测的第一个issue:只有少量的样本包含小目标。

    第二个issue在考虑每一类大小的类别的整体目标区域时马上就显示出来了。只有1.23%的标注像素属于小目标。中型的目标占了8倍以上的区域,约10.18%的标注像素,与此同时,绝大部分像素,82.28%是属于大型目标的。任何在这样的数据集训练的检测器都不可能学习到足够小目标的信息,无论是从图像还是从像素的角度。

    正如本章之前提到的,每个通过rpn网络预测的anchor如果与GT的IoU最高或者与任何GT高于0.7那么将会被标记成正样本。这对大目标来说有先天优势,大目标跨越多个滑窗区域,通常匹配的上多个anchor,而小目标可能仅仅能在小IoU的情况下匹配上单个anchor。如表2中所列,只有29.96%的anchors是域小目标匹配成功了,而44.49%的anchors与大目标匹配。从另外的角度看,这意味着每个大目标有2.54个anchors匹配,而小目标平均只有一个。此外,由于Average Max IoU度量方式的原因,即使小目标最匹配的anchor的IoU通常也比较低。小目标的平均最大IoU仅仅只有0.29,而中大目标最匹配的anchors往往高达0.57与0.66。我们在图5中可视化展示了这个现象。实验结果展示,在计算rpnloss的时候小目标的贡献要小得多,这使得整个网络跟拟合中大型目标。

    4 Oversampling and Augmentation

    我们通过明确的分析MS COCO数据集中之前章节提到的小目标相关问题来解决优化目标检测器在小目标检测上性能表现问题。详细的说,我们将包含小目标的样本过采样并且进行小目标数据扩展来促使模型更加关注与小目标。尽管我们是在Mask R-CNN框架进行评估的,但是在其它框架下这种方法也同样适用,因为无论是过采样还是数据扩展都是在数据预处理阶段做的。

    Oversampling

    我们通过相对少的包含小目标的在训练时过采样来解决样本少的问题【4】。这个方法是花费最少并且最直接的方式来缓解MS COCO数据集并且改进在小目标检测中的表现。实验中,我们改变过采样率,探索过采样不仅仅在小目标检测,而且在中大型目标检测中同样有效。

    Augmentation

    在过采样的同时,我们也使用专注于小目标的数据扩展方法。MS COCO中的实例分割mask使得我们可以将任意目标从它原来的位置进行拷贝。拷贝被粘贴在不同的位置。通过增加每张样本中小目标的个数,匹配的anchor的数据增加了。这样改进了小目标在RPN训练期间在loss函数中的贡献。

    在将目标粘贴到新路径之前,我们进行随机变换。我们通过将目标尺寸在±20%范围,旋转在±15°范围缩放。我们只考虑未被遮挡的目标,因为使用有遮挡区域的不连续样本会失真。我们确保新粘贴的目标不与任何现有的目标重叠,至少与图像边界保持5个像素的距离。

    在图4中,我们可视化展示了提出的数据扩展策略,与它如何在训练阶段增加匹配的anchor数量,从而得到更好的小目标检测器。

    5 Experimental Setup

    5.1 Oversampling

    第一组实验中我们演技包含小目标样本过采样的作用。我们依次改变过采样率为2/3/4。我们离线的将小目标样本进行拷贝而不是随机在线过采样来提高效率。

    5.2 Augmentation

    第二组实验中,我们研究数据扩展在小目标检测与分割中的作用。我们在每张样本中复制粘贴所有小目标样本一次。我们还过采样了包含小目标的样本来研究过采样与数据扩展策略之间的影响。

    我们测试了三组设置。第一组测试中,我们将所有包含小目标的样本替换为复制粘贴过的样本。第二组测试中,我们将这些样本进行过采样。最后一组设置,我们使用原始样本与扩展后的样本,相当于过采样包含小目标样本两次,并且数据扩展会得到更多小目标

    5.3 Copy-Pasting Strategies

    有多种复制粘贴小目标的方式。我们考虑使用三种不同的策略。首先,我们在样本中选择一个小目标,并在随机位置粘贴多次。第二,我们选择多个小目标,在任意位置只粘贴一次。最后,我们一起使用上述三种数据扩展方式。这样我们保留了原始样本与扩展后的样本。

    5.4 Pasting Algorithms

    粘贴小目标的时候,有两件事需要考虑。第一,我们必须决定目标是否可以与其它目标重叠。尽管我们选择不使用任何重叠,我们还是通过实验证明了这是一个好选择。第二,是否选择对粘贴的目标进行边缘平滑。我们实验证明与什么都不做相比,使用多种核尺寸的高斯滤波器可以提升表现。

    6 Result and Analysis

     

     

    展开全文
  • 项目管理如何制定项目目标

    千次阅读 2020-02-27 15:42:33
    一、目标必须是现实可行的 目标是综合了范围、成本、时间、质量、人力资源...因此制定目标过程中,项目经理必须争取自己的话语权,认真分析目标的可行性,充分考虑项目中可能存在的问题和风险,并就双方差异主动...

    一、目标必须是现实可行的

    目标是综合了范围、成本、时间、质量、人力资源各方因素权衡的结果,是可以实现的。领导直接规定目标,这种方式非常简单粗暴,只管公司利润,不管员工死活。要知道一个不现实的目标,不但不能像磁铁一样吸引员工为之努力工作,反而可能会大大打击员工的积极性。
    在这里插入图片描述
    因此在制定目标的过程中,项目经理必须争取自己的话语权,认真分析目标的可行性,充分考虑项目中可能存在的问题和风险,并就双方差异主动与领导进行沟通,力求达成一致。假如等到项目开展到后半段,项目经理才发现原来的目标有很多不切实际的地方,比如工作量与想象的有太大出,如果这个时候项目经理才提出目标不科学,将责任推给公司领导,只会让领导更加觉得项目经理无能、没有担当。

    有些人担心,这样“讨价还价”领导会不会嫌我烦?确实有个别领导不喜欢员工提出异议,觉得他在讲条件、不听指挥,但大部分领导还是乐于与项目经理讨论这些问题的,因为这说明项目经理对项目有全面系统的思考,重要细节都已经考虑过了,这样做事领导会更加放心。公司最怕的不是挑剔的项目经理,而是没有想法的项目经理。对于质量和进度目标,由于涉及到客户方的直接利益,如果经过评估确实需要变更,还必须与客户和监理等方面进行沟通,确保各方的认识一致。在这里插入图片描述

    二、目标必须获得所有人认同

    一个目标可以要想将员工团结起来,把大家凝聚在一起,还必须获得项目团队的认同。项目中经常出现这样的情况,项目经理和上级领导确定目标后,项目经理将目标通知给大家,也不理会员工的意见。等到目标眼看无法完成的时候,项目经理对员工“兴师问罪”,员工会理直气壮的说,我当就说过这个目标不可能实现的。这是一个项目目标没有获得员工认同的典型例子,项目经理等于复制了公司对项目“拍脑袋”的决策模式,是一种不负责任的做法。要想得大家的认同,最好的办法就是让员工直接参与评估和制定项目目标。

    三、制定项目目标的三种方式

    相对于公司或者部门,一个项目的目标是比较容易确定的,这是由项目的天然特性决定的。为了做一件事情,做好这件事情就是项目的目标。项目目标一般在项目章程或项目任务书或项目立项书中进行确定。项目目标的制定有自上而下、自下而上以及双方共同制定三种方式。

    1、自上而下

    项目目标由上司制定,直接下发给项目组。领导在制定目标时,总是希望越高越好,他们相信有压力才会有动力,员工才会拼命地往前赶。他们常见的做法是质量和进度要求直接与合同保持一致,而成本限制往往是合同金额按一定比例计算出来的。这一类型的工作公司往往管理层过于强势和精明,氛围比较紧张,员工的压力比较交大。在这里插入图片描述

    2、自下而上

    由项目组制定后,交给公司领导层进行审批。这种公司的管理层一般比较温和,公司气氛也比较缓和。

    3、双方共同制定

    一般由公司或项目组先制定一份初始的目标,然后根据项目的实际情况,公司和项目组一起进行分析讨论确定。这种公司的氛围一般比较民主化,能够具体问题具体分析,尊重员工的意见。

    展开全文
  • ERP沙盘实践课程近年受到广泛关注,已有文献对该课程的定位、教学目标、教学设计问题研究很少,而该类问题...教学方法上针对课堂教学过程中遇到的问题引入任务式教学法和案例教学法,最后对课程的成绩评定方式提出建
  • 教学目标四个维度_教学目标很重要

    千次阅读 2020-11-21 23:58:49
    教学目标 教学目标有也叫学习目标...教学目标还要分解为课堂目标,课堂目标包括学的目标,教的目标,策略的目标,这些目标组成一张课堂网,将知识学习,技能形成,思维培养连接起来,共同作用于学习的主体——学生。...

    教学目标

    332eb46d2a24eca96b6dfff70986a0af.png

    教学目标有也叫学习目标,这两种提法的主体虽然不一样,前者强调了老师,后者强调了学生,但是内容上是对等的,是一致的。教学目标目标是课堂的主线和统率,不管是课堂结构还是教学环节,不管是训练内容还是老师讲授内容,都要受控于目标。教学目标还要分解为课堂目标,课堂目标包括学的目标,教的目标,策略的目标,这些目标组成一张课堂网,将知识学习,技能形成,思维培养连接起来,共同作用于学习的主体——学生。

    一、课堂教学目标的三个维度

    1.知识目标。这是第一个维度,也是基础维度,学习和掌握学科知识是整个学习过程的第一步,是掌握学科的表述语言,是为了实现解决学科问题的基础环节,这个维度是面向全体学生的,也是保底教学的重要环节,这个维度要做到扎实,准确,熟练。

    2.技能目标。这是第二个维度,在熟练地掌握了基础知识之后,再运用这些知识去解决一些实际问题,在应用的过程中进一步巩固和夯实知识目标,当这种技能固化成本能之后,技能目标才算是被真正地掌握。技能目标最关键的最难的是举一反三,触类旁通,也就是教学中的固化和迁移环节。

    3.思维目标。思维时看不见摸不着的,但是他有具体的表现形式,通过这些外在的形式来追寻思维的轨迹。教学的本质就是教会学生成为一个思维的强者,有了学科思维就等于给了学生打开学科大门的钥匙,所谓的思维就是指用学科的语言和方法解决学科本身及学科外延问题的途径,这个过程具有很强的再生性和创造性,也存在明显的思维层次和思维质量。思维目标的实现实际上就是终极的教学目标地实现。这个维度要贯穿于整个教学过程,包括教师对教学的内容地设计,包括前两个维度的实现,包括学生的学,包括老师的教,包括目标的实现过程。

    3a0a41de0a18462383731176c8c0bac0.png

    二、教学目标的性质

    1.统领性

    教学目标具有统领性。一节课的所有环节都应该围绕着这个既定的目标展开,所有教学内容的设计都围绕着这个目标选择,学生练习的内容,老师讲授的内容,导入,小结全部受制于目标。与目标无关的一律不涉及,目标就像是一篇文章的主旨,整个课堂要呈现出一种总分的结构形式。

    2. 层次性

    教学目标具有层次性。课堂目标不宜过多地设置,每节课的目标1——2个即可。如果设置两个教学目标,那么这两个目标之间要具有关联性和层次性。如果是一个目标,那么在教学过程中要将这一个目标分解成几个子目标,这几个子目标受制于目标,子目标之间呈现出层次性,梯度性,符合学生的认知规律,由浅入深,层层递进,螺旋上升,而且让不同层次的学生都有所获。

    3. 可测性

    教学目标具有可测性。目标设定之后还要有检测,如果设定的目标不能够检测或者评价,那么这样的目标就是不能成立的,需要修改或者重新设定。对目标的检测可以是总结性的检测,也可是环节性的检测。而且通过检测目标来发现学生的问题,从而找到教学的切入点。

    4.严谨性

    教学目标具有严谨性。在设立目标的时候要考虑到学生的学情,要考虚到考点,要考虑到教材编排目的,要考到这个目标在这个单元,这本书,以及整个知识体系中的位置。在表述的时候更要严谨,首先必须体现学科性,其次还要体现三维性,第三要体现可检测性。

    4ffc8f1f3749b59eae38e07c2f6c133c.png

    三、教学目标陈述要明晰和规范。

    1.目标的行为主体是学生,行为主体“学生”两字可不出现,但必须隐含。如,(学生)会默写2首古诗。

    2.目标的陈述主要是为了便于评价和测量及验收,因此行为动词要清晰,不能含糊其辞,否则无法规定教学的正确方向。如“学生形成爱国情感,提高写作能力”,这样的目标无法测量和评价。

    3.有时单靠行为动词无法将目标清晰地表达出来,因此需要一些附加的限制条件,可以加上学习情景、工具、时间、空间等限制。如“40分钟内能写出500字语言通顺的记叙文”,“40分钟”就是限制条件。

    4.教学目标四个组成要素:行为主体、行为动词、行为条件和表现程度。如“在3分钟内(行为条件),学生(行为主体)能算出(行为动词)至少20道题(表现程度)”。当然,并不是所有的目标呈现方式都要包括这四个要素,有时,为了陈述简便,可以省略行为主体或行为条件,但前提是不会引起误解或多种解释。

    7f8f4476eddeab7876619bad86c4dd3b.png

    四、教学目标的层级架构

    无论哪一类目标都应该有科学的层级架构,以便更好地评价教与学的水平。以下是结果性目标和体验性目标的层级架构,不同的目标层级体现了不同的学习水平,并用不同的行为动词来描述。

    1·知识性目标可以分为如下三个层级:

    ①了解水平。包括再认或回忆知识;识别、辦认事实或证据;举出例子;描述对象的基本特征等。行为动词如说出、背通、辨认、回忆、选出、举例、列举、复述、描述、识别、再认等。

    ②理解水平。包括把握内在逻辑联系;与已有知识建立联系;进行解释、推断、区分、扩展;提供证据;收集、整理信息等。行为动词如解释、说明、阐明、比较、分类、归纳、概述、概括、判断、区别、提供、把……转换、猜测、预测、估计、推断、检索、收集、整理等。

    ③应用水平。包括在新的情境中使用抽象的概念、原则;进行总结、推广;建立不同情境下的合理联系等。行为动词如应用、使用、质疑、辩护、设计、解决、撰写、拟定、检验、计划、总结、推广证明、评价等。

    2.技能性目标可以分为如下三个层级:

    ①模仿水平。包括在原型示范和具体指导下完成操作;对所提供的对象进行模拟、修改等。行为动词如模拟、重复、再现、模仿、例证、临摹、扩展、缩写等。

    ②独立操作水平。包括独立完成操作;进行调整与改进;尝试与已有技能建立联系等。行为动词如完成、表现、制订、解决、拟定、安装、绘制、测量、尝试、试验等。

    ③迁移水平。包括在新的情境下运用已有技能;理解同一技能在不同情境中的适用性等。

    行为动词如联系、转换、灵活运用、举一反三、触类旁通等。

    3.思维目标可以分为如下四个层级:

    ①一级思维。人们常说的顺向思维、逆向思维、形象思维、逻辑思维、创造性思维等等,是描述人们的思维方式,并非对思维深度划分等级。不论用哪一种思维方式考察同一事物或事件,都有一个共同的起点,我们将对起点的事物或事件的再现、复述的思维深度定为一级思维。对《课标》规定的知识点概念能复述,能再现,其思维层次达到一级。

    ②二级思维:找出与起点直接发生关系的事物或事件的思维层次。就是对知识内在联系的理解,能理顺概念间的上位、下位、同位关系,深刻理解知识的内涵与外延。

    ③三级思维:与起点事物或事件不能直接发生关系,必须通过一次中间事物或事件才能发生关系的思维层次。

    ④四级思维:必须通过二次中间事物或事件才能与起点事物或事件发生关系的思维层次。

    a8252c01700362c6b5ec16c641f42a4b.png
    展开全文
  • 答:启动过程组、规划过程组、执行过程组、监控过程组、收尾过程组。 2.项目管理的十大知识领域(分五个模块记忆)? 总纲:项目整合管理、项目范围管理 三重制约理论:项目进度管理、项目成本管理、项目质量管理 ...
  • MATLAB视频运动目标检测

    千次阅读 2021-08-25 11:54:51
    摘要视频运动目标检测与跟踪算法是计算机视觉领域的一个核心课题,也是智能视频监控系统的关键底层技术。它融合了图像处理、人工智能等领域的研究成果,已经广泛应用于安保监控、智能武器、视频会议、视频检索等各个...
  • 区块链P2P网络协议演进过程

    千次阅读 2021-09-15 17:03:18
    区块链最大的特点是去中心化和分布式,区块链共识机制使得参与节点共同为系统提供服务,实现中心化系统类似金融中介机构的功能。共识机制是网络大部分节点约定时间段内对交易状态达成相同的确认,其中共识性通过...
  • 区角活动是幼儿园教育教学活动的重要...教师区角活动的指导应灵活多样,巧用图示法、观察记录法等有效策略,强调幼儿的主体地位,促进幼儿快乐、主动的学习富有个性的发展。关键词: 区角内容; 区角材料; ...
  • 一、课题背景视频运动目标检测与跟踪算法是计算机视觉领域的一个核心课题,也是智能视频监控系统的关键底层技术。它融合了图像处理、人工智能等领域的研究成果,已经广泛应用于安保监控、智能武器、视频会议、视频...
  •   图像的目标检测(Object Detection)算法大体上可以分为基于传统手工特征的时期(2013年以前)以及基于深度学习的目标检测时期。从技术发展上来讲,目标检测的发展则经历了包围框回归、卷积神经网络的兴起、多参考...
  • 制定目标时需要遵循的SMART原则

    万次阅读 2016-02-13 20:13:56
    作为一名职业项目经理(PM,Project Manager)或者团队领导(TL,Team Leader)不要试图去控制团队的每个人的思想和行为,因为那几乎是不可实现的;但是可以通过有效的目标管理来让所有...目标就是项目管理的灯塔。
  • 软件过程改进

    千次阅读 2019-12-07 19:03:28
    是指从形成开发软件概念起,所开发的软件使用以后,直到失去使用价值消亡为止的整个过程。一般来说,整个生存周期包括计划(定义)、开发、运行(维护)三个时期,每一个时期又划分为若干阶段。每个阶段有明确的任务...
  • 软件过程改进练习题

    千次阅读 2019-12-09 18:15:00
    软件过程方法从上世纪90年代开始软件开发得到应 用,被许多软件开发组织所接受。并被认为是软件生产达到 工业化前的一个必须经历的阶段,是软件工程学科发展的 一个重要里程碑,软件过程理论是现代软件开发...
  • 如何做好目标激励

    千次阅读 2015-12-13 22:36:14
    组织愿景是指建立组织员工共同价值基础之上的,对组织发展的共同愿望。组织愿景属于长线激励,对高层而言较有效。 总的来说,长线激励包括企业相对抽象的目标、公司发展方向、未来的规模、公司的发展与个人的关系...
  • 目标管理体系:OKR

    千次阅读 2016-09-09 14:09:01
    一、什么是OKR体系?...浓缩一起就是“为确保达成企业目标的关键结果分解与实施”。 OKR是企业进行目标管理的一个简单有效的系统,能够将目标管理自上而下贯穿到基层。对一个项目来说,设定目标是非常
  • OKRS如何进行目标的对齐?

    千次阅读 2020-08-20 18:10:36
    工作场所,我们对领导者做什么以及如何与不同部门的同事之间建立联系充满了好奇,OKR则是实现上下左右目标对齐、实现横纵协同的首选工具。 OKR并非独立的孤岛,恰好相反,它建立了协同联系的网络。垂直、...
  • 关于如何改进YOLOv3进行红外小目标检测的?

    千次阅读 多人点赞 2020-09-21 15:26:00
    数据集部分改进①过采样②图片任意位置复制小目标5.修改Backbone①注意力模块②即插即用模块③ 修改FPN④修改激活函数⑤用成熟的网络替换backbone⑥ SPP系列6.修改Loss经验性总结参考网址 最近看了一篇关于别人...
  • 阿里组织架构的”大中台+小前台

    千次阅读 2019-04-23 11:01:41
    希望你也加入到人工智能的队伍来!点击浏览教程 一、什么是“大中台、小前台” 关键词:精准打击、管理高效、资源整合、灵活敏捷 阿里巴巴 “大中台、小前台”机制的提出,某种程度上是从传统的事业部制向准...
  • 目标检测入门之(二)综述(下)

    千次阅读 2018-07-24 16:25:38
    作者 | 李家丞( 同济大学数学系本科在读,现格灵深瞳算法部实习生) 近年来,深度学习模型逐渐取代传统机器视觉方法而成为目标检测领域的主流算法,本...如何从图像解析出可供计算机理解的信息,是机器视觉的...
  • 超硬核!数据结构学霸笔记,考试面试吹牛就靠它

    万次阅读 多人点赞 2021-03-26 11:11:21
    顺序:根据元素存储器的相对位置表示关系 链式:借助指针表示关系 数据类型:是一个值的集合和定义这个值集上的一组操作的总称。 抽象数据类型:是指一个数学模型以及定义该模型上的一组操作。(仅仅取决于...
  • 什么是过程挖掘,过程挖掘算法如何各类学术和商业系统得以实现,以及过程挖掘面临哪些技术挑战。本文将进行深入探讨。 IEEE过程挖掘工作组  过程挖掘(process mining),指从现代信息系统常见的...
  • 新旧ERP系统替换过程中的数据迁移

    千次阅读 2018-08-07 10:30:01
    由于各种原因,越来越多的企业面临着ERP系统替换问题,而系统更换前,...因此,进行新旧ERP系统替换过程中,企业CIO们除了要对新ERP系统进行项目需求、规划、实施,解决用户应用习惯以及开发相关接口外,还要认...
  • 卷积神经网络——目标检测

    千次阅读 2018-09-09 16:59:40
    这意味着,我们不仅要用算法判断图片是不是一辆汽车,还要图片标记出它的位置,用边框或红色方框把汽车圈起来,这就是定位分类问题。其中“定位”的意思是判断汽车图片的具体位置。比如,你正在做一个...
  • 《华为数据之道》对企业管理和使用数据做了系统的总结,其中有不少的原理值得借鉴。征得出版社许可后,摘录部分章节分享给大家,本文为摘录的第5篇,感兴趣的读者可以点击图片购买图书作参考。业界都...
  • 41.你对西方不同的管理学说和经验有什么看法?(600字以内) 西方管理思想是不同的 从管理方式来看, 中国重视人的力量,认为人是管理的核心,以人为本,强调”天人合一”,注重人际化和社会化。西方管理学偏重...
  • 平时的工作,我控制管理主要关注的是目标完成、问题反馈、风险管控、时间节点、资源投入、结果审核,秉持以终为始(重点关注最终的任务要求和时间节点,以指导当下工作)、过程反馈(每日跟踪、每月跟踪、...
  • 博客地址:天阑之蓝的博客,学习过程中不免有困难和迷茫,希望大家都能这学习的过程中肯定自己,超越自己,最终创造自己。 数据分析师之——定义产品成功:指标和目标一、定义正确的指标二、设定目标三、战略与...
  • 1. 课题的意义雷达目标模拟器通过...实现模拟的手段很多,模拟的结果是要复现蕴含雷达目标目标环境的回波信号。采用雷达目标模拟技术,可以加速现代雷达的研究和开发,提高雷达操作手的技术水平。雷达目标模...

空空如也

空空如也

1 2 3 4 5 ... 20
收藏数 34,633
精华内容 13,853
关键字:

在目标设立过程中