精华内容
下载资源
问答
  • 针对机器视觉中目标跟踪出现的遮挡问题,在原有的DAT(Distractor-Aware Tracking)算法框架上引入遮挡检测机制,提出了DDAT(Detection-DAT)算法。该机制首先提取目标的颜色特征,通过颜色特征计算目标帧间的相似度,利用...
  • 遮挡 目标检测

    2021-07-11 10:36:04
    Repulsion Loss: Detecting ...Repulsion Loss 遮挡场景下的目标检测 yolo loss: https://github.com/AAA-Fan/Repulsion_loss_yolo_pytorch/blob/ba4db86b9980438f7a76e47e246d79fe90092516/utils.py ...

    Repulsion Loss: Detecting Pedestrians in a Crowd

    Repulsion Loss 遮挡场景下的目标检测

    https://github.com/herbwood/RDIoU/blob/9cfb41a79a11efaec396d7e0b521d271b5bac941/model/retinanet/network.py

    RDIoU Loss : Repulsion Distance IoU Loss for Reducing False Positive Rate in Crowd Scene Detection

     

     

    yolo loss:

    https://github.com/AAA-Fan/Repulsion_loss_yolo_pytorch/blob/ba4db86b9980438f7a76e47e246d79fe90092516/utils.py<

    展开全文
  • 将基于注意力机制的特征融合算法与YOLO V3相结合,构建多尺度目标检测器,并利用Focal loss和GIOU loss来设计检测器的损失函数。在PASCAL VOC和KITTI数据集上对不同算法进行对比实验,实验结果表明,多尺度目标检测器...
  • 目标检测中的遮挡问题及优化

    万次阅读 多人点赞 2019-01-11 11:54:15
    尽管目标检测算法整体上已经相对比较成熟,但是在特殊场景下的表现还有很多优化空间,比如图片中的目标有遮挡、图像运动模糊、目标为可改变形状的非刚性物体等。本文主要是针对遮挡问题,之前在做游戏目标检测时也...


    尽管目标检测算法整体上已经相对比较成熟,但是在特殊场景下的表现还有很多优化空间,比如图片中的目标有遮挡、图像运动模糊、目标为可改变形状的非刚性物体等。本文主要是针对遮挡问题,之前在做游戏目标检测时也遇到过这个问题,当时只是考虑增加训练样本的多样性,最近,笔者读了几篇解决目标检测中的遮挡问题的文章,也看了一些网友的解析,觉得若有所悟,不自觉地想把自己的理解记录下来,自认为“一万个人眼中有一万个哈姆雷特”,希望能够从某个侧面对大家有所帮助。

    目标检测中存在两类遮挡,(1)待检测的目标之间相互遮挡;(2)待检测的目标被干扰物体遮挡。比如下图,
    在这里插入图片描述
    具体来说,如果检测任务的目标是汽车和人,那么汽车被人遮挡,而且人被干扰物体(牛)遮挡。因为算法只学习待检测的物体的特征,所以第二种遮挡只能通过增加样本来优化检测效果。

    在现实的检测任务中,只有比较特殊的场景需要考虑遮挡问题,比如行人检测、公交车上密集人群检测、牲畜数量计算等,本文将介绍的两篇文章是针对行人检测问题的,也可以复用到其它的应用场景(ps: 大家如果想发paper,也可以借鉴这两篇文章解决问题的方式)。

    1 Repulsion Loss: Detecting Pedestrians in a Crowd

    1.1 现有方法的缺点

    在上一篇博客中,笔者解释了目标检测中的后处理算法,这些后处理算法只能够能够去除冗余的proposals,对于误召回和漏检两种情况就无能为例了,该论文同样为face++出品,只不过从模型优化的角度解决误召回和漏检的问题。

    比如下面的这张图,使用Faster RCNN等经典的检测器,其中 T 1 、 T 2 T_{1}、T_{2} T1T2为Groundtruth框,而 P 1 、 P 2 、 P 3 P_{1}、P_{2}、P_{3} P1P2P3为anchors(锚框),由于 P 2 P_{2} P2中包含了 T 2 T_{2} T2的部分区域,所以 P 2 P_{2} P2对应的proposal很容易受到 T 2 T_{2} T2的干扰,导致回归出来的proposal同时包含了目标 T 1 、 T 2 T_{1}、T_{2} T1T2的部分区域,不精准(?)。

    可以更进一步来思考这个问题,假设图中的预测框 P 1 P_{1} P1不存在,也即 T 1 T_{1} T1对应的proposals只有 P 2 P_{2} P2,如果 T 2 T_{2} T2对应的max score的proposal近似为 P 3 P_{3} P3,那么当 P 2 P_{2} P2 P 3 P_{3} P3的IoU大于阈值时,在后处理nms阶段就会把 P 2 P_{2} P2过滤掉,从而导致更严重的情况, T 1 T_{1} T1漏召回了(?)。
    在这里插入图片描述

    1.2 解决办法

    针对上面不精准漏召回的情况,比较直接的想法是,能不能让 P 2 P_{2} P2对应的预测框不受 T 2 T_{2} T2的干扰呢,想法很好,但是具体该怎么告诉模型不受干扰呢?

    作者类比于磁铁的吸引力和排斥力作用,提出了Repulsion loss(斥力损失)。如下图,斥力损失的作用是对预测的proposal进行约束,使其不仅要靠近Target T T T引力作用),还要远离其它的Groundtruth物体 B B B以及 B B B对应的proposals(斥力作用)。如果 T T T的Surrounding Groundtruth包含了除 B B B以外的其它目标,则斥力损失会要求预测的proposal远离所有这些目标。
    在这里插入图片描述

    1.3 对问题做数学建模

    作者提出了两个损失函数,RepGT和RepBox,前者用于对proposal向其它目标偏移的情况进行惩罚,从而实现斥力作用(编号为A),后者用于对proposal向其它目标对应的proposals靠近的情况进行惩罚,从而实现斥力作用(编号为B),因此检测结果对NMS算法更加鲁棒。斥力损失的数学表达式如下,
    在这里插入图片描述
    其中, L A t t r L_{Attr} LAttr表示引力作用, L R e p G T L_{RepGT} LRepGT表示斥力作用A, L R e p B o x L_{RepBox} LRepBox表示斥力作用B。 α 、 β \alpha、\beta αβ为超参数,用于平衡不同作用的权重。

    作者是针对行人检测任务,为了简化,只考虑Two-class的情况,前景和背景,其中所有的前景为同一类别。

    P = ( l P , t P , w P , h P ) P = (l_{P}, t_{P}, w_{P}, h_{P}) P=(lP,tP,wP,hP) G = ( l G , t G , w G , h G ) G = (l_{G}, t_{G}, w_{G}, h_{G}) G=(lG,tG,wG,hG)分别表示anchor和groundtruth的坐标, P + = { P } P_{+} = \{P\} P+={P}表示所有的Positive anchors, G 0 = { G } G^{0} = \{G\} G0={G}表示所有的groundtruth框,这里的 G 0 G^{0} G0表示下面公式中G对应的罗马符号形式(笔者不知道怎么敲出来这种形式?)。

    1.3.1 引力作用

    对于指定的anchor P ∈ P + P\in P_{+} PP+,可以计算它与所有groundtruth框的IoU,取IoU最大的作为Target框,公式表示如下,
    在这里插入图片描述
    定义 B P B^{P} BP为anchor P对应的预测框,那么需要满足预测框逼近Target框,度量两个框的逼近程度的方式包括欧氏距离、 S m o o t h L 1 Smooth_{L_{1}} SmoothL1距离、IoU等,作者使用了 S m o o t h L 1 Smooth_{L_{1}} SmoothL1距离,并且,对于训练集batch中的每一张图,需要考虑所有的anchors,因此公式表达如下,
    在这里插入图片描述

    1.3.2 斥力作用A

    对于指定的anchor P ∈ P + P\in P_{+} PP+,可以计算它与所有groundtruth框的IoU,取IoU第二大的作为Target框,公式表示如下,
    在这里插入图片描述
    斥力作用A用于对 B P B^{P} BP逼近 G R e p P G_{Rep}^{P} GRepP的情况进行惩罚,作者使用了IoG(Intersection over Ground-truth)指标来衡量逼近程度,公式表达如下,
    在这里插入图片描述
    其中,
    在这里插入图片描述
    在这里插入图片描述
    在这里插入图片描述
    在这里插入图片描述

    1.3.3 斥力作用B

    在上面的1.1部分,解释了当不同Target对应的预测框靠的太近时,容易出现漏召回的情况,斥力作用B用于将不同Target对应的预测框分离开。

    对于所有的groundtruth框 G 0 = { G } G^{0} = \{G\} G0={G}表示,每个框 G G G都对应了一组anchors,那么所有的anchors可以分成 ∣ G 0 ∣ |G^{0}| G0组,公式表达如下,
    在这里插入图片描述
    显然,对于不同组中的anchors,比如 P i 、 P j P_{i}、P_{j} PiPj,斥力作用B要求它们对应的预测框 B P i 、 B P j B^{P_{i}}、B^{P_{j}} BPiBPj尽量远离,也即预测框之间的IoU越小越好,公式表达如下,
    在这里插入图片描述
    其中, 1 \bold{1} 1表示identity函数, ϵ \epsilon ϵ为一个很小的常数,防止分母为0。

    从优化目标可以看出,不同Target对应的预测框最终会分的很开,避免了NMS后处理中因为合并预测框导致的漏召回情况。

    1.4 数学模型的求解

    这一部分没什么好解释的,主要是考验大家的工程能力了,包括代码编写和调参技巧等(?)。

    2 Occlusion-aware R-CNN: Detecting pedestrians in a Crowd

    该论文由中科院出品,也是用来解决行人检测中的遮挡问题的。主要从2个方面做的优化,优化目标+网络结构。

    2.1 优化目标

    跟face++的工作有一些区别,这里的优化有两个目标,(1)所有的预测框逼近对应的Target框;(2)属于同一Target框的多个预测框尽量集中。原文中的话是这么说的,“To enforce the proposals locate closely and compactly to the ground-truth object”,其中“closely”对应目标(1),“compactly”对应目标(2)。具体的公式表达如下,
    在这里插入图片描述
    其中, L r e g L_{reg} Lreg对应目标(1), L c o m L_{com} Lcom对应目标(2),这里的"com"是"compactly"的缩写。

    2.2 PORoI层

    PORoI,全称为“Part Occlusion-aware RoI Pooling Unit”,在Faster RCNN算法中,RPN部分会生成目标的候选区域,如下图中的红色方框所示,ROI Pooling会将该红色区域缩放到固定尺寸,记作 m × m m\times m m×m,对于行人检测任务,作者考虑到人体人体具有特殊的结构,为了充分利用这一prior knowledge,从红色候选区域中切分出5个子区域,如图中蓝色的框所示。每一个蓝色框经过ROI Pooling操作后都会变成尺寸为 m × m m\times m m×m的特征图。

    因为这5个子区域可能会有遮挡,图中的“Occlusion process unit”是用来生成对应子区域的“可见度”打分,若该子区域被遮挡,则打分较低,否则打分较高,作者作用用了element-wise sum操作将所有子区域的特征合并,用于最终的分类和定位任务。

    笔者认为,该PORoI层存在两处待改进的地方,(1)将人体分成5个子区域是否合理,分成更多的子区域是否会效果更好,作者文中没有贴相关对比;(2)因为不同子区域对应不同的特征,“Eltw sum”操作进行特征融合,破坏了特征的结构性,需要探索更加合理的特征融合方式,使它能结合位置先验信息。
    在这里插入图片描述

    3 总结

    (1)两篇文章都是针对行人检测中的遮挡问题,提出解决办法;

    (2)face++的工作仅从优化目标的角度考虑,中科院的工作同时从优化目标和网络结构的角度考虑;

    (3)两篇文章都是基于Faster RCNN算法框架做优化,且效果基本相当;

    4 启发

    (1)做出好的工作可以从优化损失函数和网络结构两方面考虑,对网络结构不需要完全颠覆已有结构,可以根据问题灵活定制某些层,也算是创新了。

    (2)之前一直觉得,搞深度学习很少用到公式推导,工作内容一般都是围绕着洗数据和跑模型的,但是,看了这两篇文章,笔者发现这些好的工作成果,往往是作者先发现现有算法存在的问题,然后想到解决的办法,再做数学建模,最后则是工程实现了。这里比较重要的一环就是如何使用数学公式对问题进行建模,所以大家不用担心积累的数学功底派不上用场了,一起加油吧(?)。


    5 参考资料

    https://arxiv.org/abs/1711.07752

    https://arxiv.org/abs/1807.08407

    https://zhuanlan.zhihu.com/p/43655912

    展开全文
  • 基于遮挡检测的粒子滤波行人目标跟踪算法研究
  • 目标检测跟踪算法综述

    千次阅读 2019-07-09 16:19:22
    在特定的场景中,一些经典的算法可以实现比较好的目标跟踪效果。本文介绍了一般的目标跟踪算法,对几个常用的算法进行对比,并详细介绍了粒子滤波算法和基于轮廓的目标跟踪算法。最后简单介绍了目标遮挡的处理、多...

    运动目标跟踪是视频监控系统中不可缺少的环节。在特定的场景中,有一些经典的算法可以实现比较好的目标跟踪效果。本文介绍了一般的目标跟踪算法,对几个常用的算法进行对比,并详细介绍了粒子滤波算法和基于轮廓的目标跟踪算法。最后简单介绍了目标遮挡的处理、多摄像头目标跟踪和摄像头运动下的目标跟踪。

    一、一般的目标跟踪算法

      一般将目标跟踪分为两个部分:特征提取、目标跟踪算法。其中提取的目标特征大致可以分为以下几种:

      1) 以目标区域的颜色直方图作为特征,颜色特征具有旋转不变性,且不受目标物大小和形状的变化影响,在颜色空间中分布大致相同。

      2) 目标的轮廓特征,算法速度较快,并且在目标有小部分遮挡的情况下同样有较好的效果。

      3) 目标的纹理特征,纹理特征较轮廓特征跟踪效果会有所改善。

      目标跟踪的算法大致可以分为以下四种:

      1) 均值漂移算法,即meanshift算法,此方法可以通过较少的迭代次数快速找到与目标最相似的位置,效果也挺好的。但是其不能解决目标的遮挡问题并且不能适应运动目标的的形状和大小变化等。对其改进的算法有camshift算法,此方法可以适应运动目标的大小形状的改变,具有较好的跟踪效果,但当背景色和目标颜色接近时,容易使目标的区域变大,最终有可能导致目标跟踪丢失。

      2) 基于Kalman滤波的目标跟踪,该方法是认为物体的运动模型服从高斯模型,来对目标的运动状态进行预测,然后通过与观察模型进行对比,根据误差来更新运动目标的状态,该算法的精度不是特高。

      3) 基于粒子滤波的目标跟踪,每次通过当前的跟踪结果重采样粒子的分布,然后根据粒子的分布对粒子进行扩散,再通过扩散的结果来重新观察目标的状态,最后归一化更新目标的状态。此算法的特点是跟踪速度特别快,而且能解决目标的部分遮挡问题,在实际工程应用过程中越来越多的被使用。

      4) 基于对运动目标建模的方法。该方法需要提前通过先验知识知道所跟踪的目标对象是什么,比如车辆、行人、人脸等。通过对要跟踪的目标进行建模,然后再利用该模型来进行实际的跟踪。该方法必须提前知道要跟踪的目标对象是什么,然后再去跟踪指定的目标,这是它的局限性,因而其推广性相对比较差。

    二、基于粒子滤波的运动目标跟踪

      粒子滤波实现运动目标跟踪分为四个步骤:1)初始化提取运动目标特征;2)特征搜索阶段;3)决策阶段;4)粒子重采样。这后面三个过程的依次循环实现的对运动目标的跟踪。

      1)提取运动目标特征

      这个阶段需要通过人机交互选定待跟踪的目标,通过计算跟踪目标的特征,如目标的颜色特征,计算该区域颜色空间的直方图,以此作为描述目标的特征。

      2)特征搜索阶段

      初始化提取了目标的特征后,就可以去在目标的周围撒粒子搜索目标对象。撒粒子的方法有很多,例如:a)均匀分布的放:即在整个视频画面中均匀的撒粒子。b)在目标的附近以高斯分布来撒粒子,即靠近目标的地方多撒些,离目标较远的地方少放些。每个粒子按照初始化时候得到的目标特征计算出它所处的位置的颜色特征,并计算该直方图向量与目标的直方图向量的相似性程度。然后对每个粒子与目标计算出的相似度做归一化,使得所有粒子的相似度加起来和等于1。

      3)决策阶段

      根据每个粒子与目标的相似程度做加权平均。设第i个粒子的坐标是,它和目标的相似度是,则目标的最可能的位置为:,,n为粒子的个数。

      4)粒子重采样

      粒子重采样就是根据相似度的大小重新分配粒子的个数,即在相似度最高的粒子出放更多的粒子,在相似度低的粒子那少放粒子。粒子滤波算法的核心思想就是粒子的随机采样和粒子的重要性重采样。因为不知道目标在那个位置,就随机的进行撒粒子。撒完粒子后,根据描述目标的特征相似度来计算每个粒子的相似度,然后在相似度高的地方多撒些粒子,相似度低的地方少撒粒子,这就是粒子滤波的思想。

    三、基于轮廓的跟踪

      形状复杂的目标是很难用简单的几何形状来描述的。基于轮廓的目标跟踪方法提供了更准确的形状描述。这种方法的主要思想是利用前一帧建立的目标模型找到当前帧的目标区域。模型可以是目标区域的颜色直方图、边缘或轮廓。基于轮廓的目标跟踪方法大体上可以分为形状匹配、轮廓跟踪。前者搜索目标在当前帧特征,后者通过状态空间模型或直接最小化能量函数推导初始轮廓在当前帧的位置。

    1、形状匹配方法

      这种方法和基于模板的目标跟踪方法相似,基本思想都是在当前帧中搜索目标的轮廓和目标的相关模型。另一种方法是在连续帧中寻找关联轮廓,使用目标的外观特征,建立轮廓关联,或者称为轮廓匹配,和点匹配方法类似。

      首先,由背景减除发来进行轮廓检测;再次,提取轮廓后,计算目标的模型和每个轮廓之间距离来实现匹配;目标的模型可以是密度函数(颜色特征或边缘直方图)、目标边缘、轮廓边界或这些信息的组合。

    2、轮廓跟踪

      从上一帧的轮廓位置预测出当前帧的轮廓。当前帧和上一帧的目标轮廓有重叠部分,大体上可分为两中实现方式,用状态空间模型对目标的轮廓的形状和运动状态建模,或用梯度搜索进行推演轮廓。梯度搜索是一种轮廓能量最小化方法。

      1)状态空间模型的目标跟踪

      由轮廓的形状和目标的运动参数(如,速度、加速度、运动方向等)定义目标的状态,在轮廓的后验概率最大时更新目标状态。

      2)能量最小化方法的目标跟踪

      此方法和目标分割方法类似,其中的分割和跟踪部分都是通过梯度下降法或贪婪算法来最小化能量。

      3)讨论

      轮廓跟踪通常在跟踪整个目标区域时使用,其最突出的优点在于能更好的适应目标形状的变化。在轮廓跟踪算法中,目标表达可以是外观模型、形状模型、运动模型或这几个模型的组合。目标模型可密度函数进行建模,目标形状用轮廓子空间形式进行建模。在直观的轮廓搜索中基于外观的形状表达得到普遍应用。Hausdroff距离是对基于边缘形状的表达的最广泛测量方法。

    四、遮挡处理

      通常,遮挡可以分为三种情况:目标间遮挡、背景遮挡、自遮挡。对于目标之间的相互遮挡,可以选择根据目标的位置和目标特征的先验知识来处理这一问题。而对于场景结构的导致的部分遮挡此方法则难以判断,因为难以辨认究竟是目标形状发生变化还是发生遮挡。所以,处理遮挡问题的通用方法是用线性或非线性动态建模方法对运动目标进行,并在目标发生遮挡时,预测目标的可能位置,一直到目标重新出现时再修正它的位置。可以用卡尔曼滤波器来实现估计目标的位置,也可以用粒子滤波对目标做状态估计。或者使用:轮廓投影、光流特征等方法。

    五、多摄像头目标跟踪

      多摄像头目标跟踪的需求一般来自于以下两方面:

      1)深度跟踪和遮挡处理;

      2)扩大跟踪场景区域。

      多摄像头跟踪中的一个重要问题是如何处理不同摄像头之间的视角的对应关系。一般情况下可以人工定义,也可以根据观测的场景和运动目标进行自动计算。

    六、摄像头运动下的目标跟踪

      摄像头运动时就没法通过背景相减法获取目标的具体位置和大小描述, 这种情况下对目标的特征描述和目标跟踪算法的就要求较高。常用的方法有以下几种:

    质心跟踪算法

      这种跟踪方式主要用于跟踪有界目标,如飞机,目标和背景的差异较大。目标完全在视频画面内,跟踪时,常常需要用一些图像预处理算法,如对比度增强、图像去噪、双极性增强等。

    边缘跟踪算法

      当要跟踪的目标有一个或多个边缘并且同时具有不确定的边缘,此时边缘跟踪的效果最好。典型的跟踪对象是发射中的火箭,它有很好的前边缘,但是尾部边缘却由于喷气而不确定。

    场景锁定跟踪算法

      该算法主要用于在复杂场景的目标跟踪。适合于从空中对监控地面或者地面场景的监控。这个算法会跟踪视频画面中的多个目标,然后跟据每个点的运动状态,估计整个场景全局运动,场景中的运动目标和运动目标的定位是自动选择的。当跟踪的目标移动到视频画面外时,新的目标可以被自动标识。

    组合跟踪算法

      这种方法顾名思义就是利用两种或两种以上的具有互补特性的算法的组合:如将质心类算法和相关类算法进行组合。组合后的算法就能够适合于目标大小、形状、及表面特征变化较大的场景。

    展开全文
  • 为提升原始SSD算法的小目标检测精度及鲁棒性,提出一种基于通道注意力机制的SSD目标检测算法。在原始SSD算法的基础上对高层特征图进行全局池化操作,结合通道注意力机制增强高层特征图的语义信息,并利用膨胀卷积...
  • | 2020年5篇目标检测算法最佳综述 我们对2020年全部计算机视觉综述论文进行了分方向梳理,本文为第一篇,目标检测方向。 引言 在过去的一年中,计算机视觉领域出现了许多优秀的工作,并推动了相关领域的技术发展与...

    转载自 https://mp.weixin.qq.com/s?__biz=MzI5MDUyMDIxNA%3D%3D&chksm=ec1ca170db6b286683ee4897950ee799708be668f1eac63be918ab185a4ae860cc0ee411addf&idx=1&mid=2247535753&scene=21&sn=b4db91cd7395399cf59c45db3968d6d4#wechat_redirect

    大盘点 | 2020年5篇目标检测算法最佳综述

    我们对2020年全部计算机视觉综述论文进行了分方向梳理,本文为第一篇,目标检测方向。

    引言

    在过去的一年中,计算机视觉领域出现了许多优秀的工作,并推动了相关领域的技术发展与进步。去年上半年,极市曾盘点过计算机视觉领域综述论文,并进行了分类整理,得到了很多读者的支持。因此,在2021年初,我们对2020年出现的全部计算机视觉综述论文进行了分方向梳理,希望能帮助大家学习进步。本文是第一篇,目标检测方向。

     

    综述一

    标题:Deep Domain Adaptive Object Detection: a Survey(深度域适应目标检测)
    作者:Wanyi Li, Peng Wang
    单位:中国科学院自动化研究所
    链接:https://arxiv.org/abs/2002.06797

    Image

    本文共梳理了46篇相关文献,由中科院自动化所学者发布。基于深度学习(DL)的目标检测已经取得了很大的进展,这些方法通常假设有大量的带标签的训练数据可用,并且训练和测试数据从相同的分布中提取。然而,这两个假设在实践中并不总是成立的。深域自适应目标检测(DDAOD)作为一种新的学习范式应运而生。本文综述了深域自适应目标检测方法的研究进展。

    深度域适应目标检测算法概述:ImageImageImage

    综述二

    标题:Foreground-Background Imbalance Problem in Deep Object Detectors: A Review(深度目标检测器中前景-背景不平衡问题综述)
    作者: Joya Chen, Tong Xu
    单位: 中国科学技术大学
    链接: https://arxiv.org/abs/2006.09238

    Image

    本文研究了不平衡问题解决方案的最新进展。分析了包括一阶段和两阶段在内的各种深度检测器中不平衡问题的特征。将现有解决方案分为两类:抽样和非抽样方案,并在COCO上进行了实验对比。

    Image

    上图总结了用于解决各种对象检测框架中的前景-背景不平衡问题的不同解决方案(即基于anchor-based one-stage, anchor-free onestage, two-stage的方法)。这些解决方案包括小批量偏差采样,OHEM,IoU平衡采样,人为丢失,GHM-C,ISA,ResObj,免采样,AP丢失,DR丢失。文章在检测管道中可视化它们的使用范围。

    Image

    上图为前景-背景不平衡问题的不同解决方案的比较。文章通过准确性(AP),相对准确性改进(∆AP),超参数的数量(参数)和效率(速度)进行了比较。

    综述三

    标题:A Review and Comparative Study on Probabilistic Object Detection in Autonomous Driving(自动驾驶中的概率目标检测方法综述与比较研究)
    作者:Di Feng,Ali Harakeh,Steven Waslander,Klaus Dietmayer
    单位:乌尔姆大学、多伦多大学
    链接:https://arxiv.org/abs/2011.10671

    Image

    近年来,深度学习已成为实际的目标检测方法,并且提出了许多概率目标检测器。然而,关于深度目标检测的不确定性估计尚无总结,而且现有方法不仅建立在不同的网络上架构和不确定性估算方法,而且还可以使用各种评估指标对不同的数据集进行评估。结果,方法的比较仍然具有挑战性,最适合特定应用的模型选择也是如此。本文旨在通过对现有的用于自动驾驶应用的概率目标检测方法进行回顾和比较研究,来缓解这一问题。

    下图为城市驾驶场景中概率对象检测的概念图。使用分类概率对每个对象进行分类,并使用置信区间预测其边界框。RGB相机图像来自BDD100k数据集。

    Image

    不确定性估计在自动驾驶中的应用及实例参考:Image

    最先进的概率目标检测器中通常包含的关键构建块的插图,包括基础网络,检测头和后处理阶段。架构图下方还列出了每个构件的可能变体。2D图像上的输出检测结果显示为类别概率(橙色),边界框平均值(红色)和边界框角协方差矩阵的95%置信度等值线(绿色)。

    Image

    概率目标检测器概述:Image

    通过测试BDD验证数据集上的检测器,不进行数据集偏移的评估。将所有七个动态对象类别的结果取平均值。对于NLL,较低的值表示较好的性能。

    Image

    综述四

    标题:An Overview Of 3D Object Detection(三维目标检测技术综述)
    作者:Yilin Wang, Jiayi Ye
    单位: 阿尔伯塔大学
    链接:https://arxiv.org/abs/2010.15614

    Image

    本文共梳理37篇相关文献。由阿尔伯塔大学学者发布。点云3D对象检测最近受到了广泛关注,并成为3D计算机视觉社区中一个活跃的研究主题。然而,由于点云的复杂性,在LiDAR(光检测和测距)中识别3D对象仍然是一个挑战。行人,骑自行车的人或交通锥等物体通常用稀疏点表示,这使得仅使用点云进行检测就相当复杂。在这个项目中,我们提出了一个使用RGB和点云数据来执行多类对象识别的框架。我们使用现有的2D检测模型来定位RGB图像上的感兴趣区域(ROI),然后在点云中进行像素映射策略,最后将初始2D边界框提升到3D空间。我们使用最近发布的nuScenes数据集(包含许多数据格式的大规模数据集)来训练和评估我们提出的体系结构。

    YOLO的3D点云中的对象检测示例:

    综述五

    标题:Camouflaged Object Detection and Tracking: A Survey(伪装目标检测与跟踪研究综述)
    作者:Ajoy Mondal
    单位: IIIT Hyderabad
    链接:https://arxiv.org/abs/2012.13581

    运动目标的检测和跟踪应用于各个领域,包括监视,异常检测,车辆导航等。关于目标检测和跟踪的文献非常丰富,然而,由于其复杂性,对伪装目标检测与跟踪的研究目前取得的进展有限。本文从理论角度回顾了基于计算机视觉算法的现有伪装目标检测和跟踪技术。还讨论了该领域中一些值得探讨的问题及未来的研究方向。

    Image

    上图为各种挑战的直观图示。(a)照明变化,(b)背景杂波,(c)部分遮挡,(d)完全遮挡,(e)物体比例改变,(f)物体方向改变,(g)伪装物体,(h )姿势变化,以及(i)不规则形状的物体。

    以上是对2020年发布的目标检测方向的综述论文的总结梳理,如有遗漏和不足之处,欢迎大家在评论区补充建议。在下篇,我们将对2020年图像分割方向的综述论文进行梳理。

    展开全文
  • 目标检测算法——小目标检测

    千次阅读 2021-07-01 18:35:25
    一、定义 1、以物体检测领域的通用数据集COCO...1、包含小目标的样本数量较少,这样潜在的让目标检测模型更关注中大目标的检测。 2、由小目标覆盖的区域更小,这样小目标的位置会缺少多样性。我们推测这使得小目标
  • 在矿井运动目标检测中,为了改善传统混合高斯模型像素点不能精确匹配及参数迭代速度慢的问题,采用三帧差分法融合混合高斯背景模型,融合后的算法有效消除了背景更新不及时而导致的画面鬼影现象,而且运算速度得到明显...
  • 由于各类物体不同的外观,形状,姿态,加上成像时光照,遮挡等因素的干扰,目标检测一直是机器视觉领域最具有挑战性的问题。本文将针对目标检测(Object Detection)这个机器视觉中的经典任务进行解析,抛砖引玉。...
  • 传统的基于局部特征的图像目标检测算法具有对遮挡和旋转敏感、检测精度不高以及运算速度慢的特点,为了改进该算法的性能,提出了一种将图像局部特征应用于稀疏表示理论的图像目标检测算法。该算法利用随机树的方式...
  • two stage 、one stage 的目标检测算法

    万次阅读 2018-10-24 11:05:08
    AI 科技评论按:本文作者 Ronald,首发于作者的知乎专栏「炼丹师备忘录」,AI 科技评论获其授权转发。目前目标检测领域的深度学习方法主要分为两类:two stage 的目标检测算法;one...
  • 深度域适应目标检测算法概述: 综述二 标题:Foreground-Background Imbalance Problem in Deep Object Detectors: A Review(深度目标检测器中前景-背景不平衡问题综述) 作者: Joya Chen, Tong Xu 单位: 中国...
  • 深度学习的目标检测算法篇1

    千次阅读 2020-08-17 16:33:51
    一、研究意义 卷积神经网络(CNN)由于其强大的特征提取能力,近年来被广泛用于计算机视觉领域。1998年Yann LeCun等提出的LeNet-5网络...在过去六年中,由于深度学习和卷积网络的发展和进步,基于图像的目标检测和...
  • 目标检测之小目标检测遮挡问题

    千次阅读 2020-08-11 20:07:06
    小目标在原图中尺寸比较小,通用目标检测模型中,一般的基础骨干神经网络(VGG系列和Resnet系列)都几次下采样处理: 导致小目标在特征图的尺寸基本上只有个位数的像素大小,导致设计的目标检测分类器对小目标的...
  • one-stage和two-stage目标检测算法

    千次阅读 2019-08-26 22:41:31
    目前目标检测领域的深度学习方法主要分为两类:two stage 的目标检测算法;one stage 的目标检测算法。前者是先由算法生成一系列作为样本的候选框,再通过卷积神经网络进行样本分类;后者则不用产生候选框,直接将...
  • 运动目标跟踪算法

    万次阅读 多人点赞 2019-02-17 12:53:17
    在特定的场景中,一些经典的算法可以实现比较好的目标跟踪效果。本文介绍了一般的目标跟踪算法,对几个常用的算法进行对比,并详细介绍了粒子滤波算法和基于轮廓的目标跟踪算法。最后简单介绍了目标遮挡的处理、多...
  • 在这篇论文中,我们解决了在户外和室内场景中一般目标检测中的遮挡处理的挑战,然后我们参考了最近已经开展的工作来克服这些挑战。最后,讨论了未来可能的研究方向。
  • 目标检测算法综述—— Two-Stage方法

    千次阅读 2019-08-18 11:22:56
    由于各类物体不同的外观,形状,姿态,加上成像时光照,遮挡等因素的干扰,目标检测一直是机器视觉领域最具有挑战性的问题。 1.1、什么是目标检测 目标检测的任务是找出图像中所有感兴趣的目标(物体),确定...
  • 目标检测(7)—目标检测算法综述

    千次阅读 2019-04-08 19:37:32
    在前面几节中,我们已经介绍了什么是目标检测,以及如何...这里将会综述一下当前目标检测的研究成果,并对几个经典的目标检测算法进行概述,本文内容来自基于深度学习的目标检测,在后面几节里,会具体讲解每一种...
  • 红外弱小目标检测算法综述 —————— 参考文献: 李俊宏,张萍,王晓玮,黄世泽.红外弱小目标检测算法综述[J].中国图象图形学报,2020,25(09):1739-1753. —————— 依据是否利用帧间相关信息分为: 1、 基于单帧...
  • 本文收集了CVPR 2020 关于目标检测相关论文和算法,自动驾驶依然热门,所以带动着3D目标检测论文居多,当然2D目标检测依旧热门,神经架构搜索也开始在应用与目标检测,样本少和跨域的研究也是非常值得关注研究。...
  • 为解决判别尺度空间跟踪(DSST)算法在行人处于长期完全遮挡后又重新出现的情况下无法跟踪的问题, 提出了一种改进的跟踪算法(DDSST). 在DSST框架下,首先对行人目标跟踪, 然后, 引入高置信度指标计算策略作为跟踪准确...
  • (自己写的,需要转载请联系作者,或者标明出处呀,欢迎加微信交流:wx604954) ...本文介绍了目前发展迅猛的深度学习方法在目标检测中的最新应用进展,然后介绍了基于深度学习的目标检测算法在医学图像领域的应...
  • title: 3D单目(mono 3D)目标检测算法综述 date: 2021-01-22 22:08:39.000000000 +09:00 categories: [算法篇] tags: [CV, 3D, 综述] 欢迎访问个人博客:https://johneyzheng.top/ 前言 算法调研(相对完善) 2D升3D...
  • 【转载】传统目标检测算法总结

    千次阅读 2019-09-07 10:40:23
    上面对比的是传统目标检测算法中各自的优缺点,接下来要讲讲传统目标检测算法的通病。 1)基于滑动窗口的区域选择策略没有针对性,时间复杂度高,窗口冗余 2)手工设计的特征对于多样性的变化没有很好的鲁棒性 ...
  • 【机器学习】传统目标检测算法总结

    万次阅读 多人点赞 2018-08-03 23:49:23
    目标检测是什么 object detection,就是在给定的图片中精确找到物体所在位置,并标注出物体的类别。所以,object detection要解决的问题就是物体在哪里以及是什么的整个...目前学术和工业界出现的目标检测算法分成...

空空如也

空空如也

1 2 3 4 5 ... 20
收藏数 11,561
精华内容 4,624
关键字:

有遮挡目标检测算法