精华内容
下载资源
问答
  • RCNN系列发展历程

    2021-07-31 16:28:06
    RCNN算法流程图如下图所示,RCNN仍然延续传统物体检测思想,将物体检测当做分类任务处理,即先提取一系列的候选区域,然后对候选区域进行分类 具体过程主要包含四步: 候选区域生成。采用Region Proposal提取候选...

    开山之作:RCNN

    RCNN算法由Ross Girshick等人发表在CVPR 2014,将卷积神经网络应用于特征提取,并借助于CNN良好的特征提取性能,一举将PASCAL VOC数据集的检测率从35.1%提升到了53.7%
    RCNN算法流程图如下图所示,RCNN仍然延续传统物体检测思想,将物体检测当做分类任务处理,即先提取一系列的候选区域,然后对候选区域进行分类
    具体过程主要包含四步:

    • 候选区域生成。采用Region Proposal提取候选区域,例如Selective Search算法,先将图像分割成小区域,然后合并包含同一物体可能性最高的区域,并输出,在这一步提取约2000个候选区域。在提取完后,还需要将每一个区域进行归一化处理,得到固定大小的图像
    • CNN特征提取。将上述固定大小的图像,利用CNN网络得到固定维度的特征输出
    • SVM分类器。使用线性二分类器对输出的特征进行分类,得到是否属于此类的结果,并采用难样本挖掘来平衡正负样本的不平衡
    • 位置精修。通过一个回归器,对特征进行边界回归以得到更为精确的目标区域
      在这里插入图片描述
      RCNN虽然显著提升了物体检测效果,但仍然存在3个角度问题
    • RCNN需要多步训练,步骤繁琐且训练速度较慢
    • 由于实际分类中的全连接网络,因此输入尺寸是固定的,造成了精度的降低
    • 候选区域是需要提前提取并保存,占用空间较大

    端到端:Fast RCNN

    在RCNN之后,SPPNet算法解决了重复卷积计算与固定输出尺度两个问题,但仍然存在RCNN的其他弊端。在2015年,Ross Girshick独自提出了更快、更强的Fast RCNN算法,不仅训练的步骤可以实现端到端,而且算法基于VGG16网络,在训练速度上比RCNN快了近9倍多,在测试速度上快了213倍,并在VOC 2012数据集上达到了68.4%的检测率
    Fast RCNN算法框架如下图所示,相比RCNN,主要有3点改进

    • 共享卷积:将整幅图送到卷积网络中进行区域生成,而不是像RCNN那样一个个的候选区域,虽然仍采用Selective Search方法,但共享卷积的优点使得计算量大大减少
    • RoI Pooling:利用特征池化(RoI Pooling)的方法进行特征尺度变换,这种方法可以有任意大小图片的输入,使得训练过程更加灵活、准确
    • 多任务损失:将分类与回归网络放到一起训练,并且为了避免SVM分类器带来的单独训练与速度慢的缺点,使用了softmax函数进行分类
      在这里插入图片描述
      Fast RCNN算法虽然取得了显著的成果,但在该算法中,Selective Search需要消耗2~3秒,而特征提取仅需要0.2秒,因此这种区域生成发方限制了Fast RCNN算法的发挥空间,这也为后来的Faster RCNN算法提供了改进方向

    走向实时:Faster RCNN

    Faster RCNN算法发表于NIPS 2015,该算法最大的创新点在于提出了RPN(Region Proposal Network)网络,利用Anchor机制将区域生成与卷积网络联系到一起,将检测速度一举提升到了14 FPS(Frames Per Second),并在VOC 2012测试集上实现了70.4%的检测结果
    Anchor可以看做是图像上很多固定大小与宽高的方框,由于需要检测的物体本身也是一个个大小宽高不同的方框,因此Faster RCNN将Anchor当做强先验的知识,接下来只需要将Anchor与真实物体进行匹配,进行分类与位置的微调即可。相比起没有Anchor的物体检测算法,这样的先验无疑降低了网络的收敛速度,再加上一系列的工程优化,使得Faster RCNN达到了物体检测侧中的一个高峰

    展开全文
  • RCNN 关键流程 生成region proposal: 方法选用selective search,大约2000个图,并wrap到固定尺寸(227x227,各向同性缩放) 特征提取:CNN从每个region proposal中提取出一个4096维的特征(Alexnet等,5卷积层,2全...

    RCNN

    关键流程

    • 生成region proposal: 方法选用selective search,大约2000个图,并wrap到固定尺寸(227x227,各向同性缩放)
    • 特征提取:CNN从每个region proposal中提取出一个4096维的特征(Alexnet等,5卷积层,2全连接层),输出大致为2000x4096
    • 类别分类:SVM对4096维特征进行分类,得到一个2000x20的矩阵(20种类别),然后对每一列进行NMS非极大值抑制
    • 位置修正:回归器校正非极大值抑制后剩下的region proposal,输入CNN网络pool5层的特征,输出为xy方向的缩放和平移

    训练方法

    • 对CNN的有监督预训练:在ILSVRC样本集(只有分类标签)上对CNN网络进行有监督预训练,此时网络最后的输出是4096维特征->1000类分类的映射,并不完全是R-CNN的部分
    • 特定样本下CNN的微调:在PASCAL VOC 2007上进行,学习率是有监督预训练第一步学习率的1/10,将第1步中的1000类分类输出改为21类(20类+背景),注意此处仍然是softmax,而不是SVM。
      - 正样本:Ground Truth+与Ground Truth相交IoU>0.5的Region proposal
      - 负样本:与Ground Truth相交IoU≤0.5的建议框
    • 每一类的SVM的训练:输入正负样本在CNN网络计算下的4096维特征(fc7层)
      - 正样本:Ground Truth
      - 负样本:与Ground Truth相交IoU<0.3的建议框,由于负样本太多,采用hard negative mining的方法在负样本中选取有代表性的负样本
    • 每一类的Bounding-box regression训练
      - 正样本:与Ground Truth的IoU最大,且IoU>0.6的Region Proposal

    创新点

    • 采用数据驱动的特征提取方式(CNN网络)代替经验驱动的HOG、SIFT特征提取方式
    • 采用大样本下有监督预训练+小样本微调的方式解决小样本难以训练甚至过拟合等问题

    SPP-Net

    关键流程

    R-CNN中单幅图片大约有2000个region proposal,重复用CNN为每个region proposal提取特征极其费时。因此SPP-net提出在feature map上提取region proposal,这样就只需要在整幅图像上做一次卷积,大大提高了速度。
    在这里插入图片描述

    创新点

    • 使用空间金字塔池化层(Spatial Pyramid Pooling)替代原来的pool5
      在这里插入图片描述

    存在的问题

    • 同R-CNN一样,分开训练CNN、SVM、BB回归器,训练SVM的特征需要提前保存在磁盘,对磁盘空间要求大(一张图片有2000*4096 bytes存储,图片很多,造成对磁盘空间要求高)
    • CNN、SVM分开训练导致SVM loss无法更新SPP-Net之前卷积参数,因此即使采用更深的CNN网络进行特征提取,也无法保证SVM分类器精确率的提升
    • 使用Selective Search的方法提取 region proposal是在CPU上进行的,较GPU慢

    Fast RCNN

    关键流程

    • 生成region proposal: 方法选用selective search,大约2000个图
    • ROI Pooling:整体输入到CNN中,在最后一个卷积层上对每个region proposal求映射关系,并用一个ROI pooling layer来统一到相同的大小(替代掉最后一个pooling层)
    • 分类和回归:经过两个全连接层得到特征向量,分别输入到用于分类的softmax和bounding box回归

    在这里插入图片描述

    创新点

    • 直接使用Soft max进行分类,替换掉R-CNN中的SVM分类器
    • 将分类、回归一起进行多任务学习
    • 借鉴SPP-Net精髓,在Feature Map上获取region proposal

    Faster RCNN

    关键流程

    在这里插入图片描述

    创新点

    • 提出Region Proposal Network(RPN),实现了一个完全的End-To-End的CNN目标检测模型
    • 共享RPN与Fast R-CNN的特征
    展开全文
  • Faster RCNN是two stage算法的代表之一,在Faster RCNN提出前作者依次提出了RCNN,Fast RCNN这样一系列的深度学习的目标检测算法,这一过程也是作者对深度学习目标检测算法的不断完善,一直到Faster RCNN才完整的设计...

    前言

    RCNN--->SPPNet--->Fast-RCNN---->Faster-RCNN

    Faster RCNN是two stage算法的代表之一,在Faster RCNN提出前作者依次提出了RCNN,Fast RCNN这样一系列的深度学习的目标检测算法,这一过程也是作者对深度学习目标检测算法的不断完善,一直到Faster RCNN才完整的设计出了一个从图像端到检测目标的位置和类别信息输出的完整的网络。直到Faster RCNN的提出,整个深度学习目标检测算法的框架才基本完成,也标志着two stage目标检测算法框架的形成。

    传统检测算法大致流程如下:

    RCNN主要体现在特征提取部分进行了优化,特征提取部分传统的检测算法通常会提取颜色纹理等特征,深度的特征提取往往通过卷积神经网络来完成特征的提取。

    那么究竟是如何对传统的检测算法一步步的进行优化的呢?下面首先让我们看一下RCNN

    RCNN

    RCNN网络的主要改进在于使用深度神经网络进行特征提取,但整个框架的设计仍然是传统的目标检测算法的框架。因此RCNN网络依然存在传统的目标检测网络存在得那些问题,如:检测速度低下(效率低),精度依然难以满足实际需要。

    RCNN介绍

    步骤1:训练分类网络AlexNet

    步骤2:模型做fine-tuning

                类别1000改为20

                去掉FC

    步骤3:特征提取

    提取候选框(选择性搜索

    1. 生成区域集R,见论文《Efficient Graph-Based Image Segmentation》
    2. 计算区域集R里面每个相邻区域的相似度S={s1,s2,..}
    3. 找出相似度最高的两个区域,将其合并为新集,添加进R
    4. 从S中移除所有与3中有关的子集
    5. 计算新集与所有子集的相似度
    6. 跳至3,直到S为空

    这种生成候选区域的个数与滑动窗口相比少了很多,通过这一过程可以提高检测算法整体的速度。

    对于每一个区域:修正区域为CNN的输入,利用网络对候选框提取到特征。

    步骤4:训练SVM分类器:

    每个类别对应一个SVM

    步骤5:回归器精修候选框位置(利用线性回归模型判定框的准确度)

    RCNN缺点:

    1. 候选框选择算法耗时严重
    2. 重叠区域特征重复计算
    3. 分步骤进行,过程繁琐

     

    针对RCNN网络的这一系列缺点,SPPNet做出了改进,它的改进主要体现在如何对卷积特征进行共享

    SPPNet

    简介

    SPPNet提出了Spatial Pyramid Pooling,空间金字塔池化层。利用空间金字塔池化层就可以完成卷积特征的共享。

    事实上,CNN的卷积层不需要固定尺寸的图像,全连接层是需要固定大小输入的,因此提出了SPP层放到卷积层的后面,改进后的网络如下图所示:

    è¿éåå¾çæè¿°

    SPP的优点:

      1)任意尺寸输入,固定大小输出

      2)层多

      3)可对任意尺度提取的特征进行池化。

    SPPNet核心网络结构

    è¿éåå¾çæè¿°

    如果像上图那样将reponse map分成4x4 2x2 1x1三张子图,做max pooling后,出来的特征就是固定长度的(16+4+1)x256那么多的维度了。如果原图的输入不是224x224,出来的特征依然是(16+4+1)x256

     

     

    展开全文
  • FASTER RCNN发展历程

    千次阅读 2019-04-10 16:25:11
    目录 CVPR2018目标检测 1、Cascaded RCNN  2、Relation Networks for Object Detection 3、RefineDet  4、SNIP  5、R-FCN-3000  6、DES  7、STD...

    目录

    CVPR2018目标检测

    1、Cascaded RCNN 

    2、Relation Networks for Object Detection

    3、RefineDet 

    4、SNIP 

    5、R-FCN-3000 

    6、DES 

    7、STDN 

    ECCV2018目标检测

    1、IOU-Net

    ​2、DetNet

    ​3、RFB Net

    ​4、PFPNet

    ​5、CornerNet

    检测发展历程概览

    参考


    CVPR2018目标检测

    1、Cascaded RCNN 

    论文:Cascade R-CNN Delving into High Quality Object Detection 
    论文链接:https://arxiv.org/abs/1712.00726 
    代码链接:https://github.com/zhaoweicai/cascade-rcnn 
    详细内容请移步:Cascade RCNN算法笔记

    Cascaded RCNN这篇文章的出发点非常有意思,是通过分析输入proposal和ground truth的IOU与检测模型采用的用于界定正负样本的IOU关系得到结论:当一个检测模型采用某个阈值(假设u=0.6)来界定正负样本时,那么当输入proposal的IOU在这个阈值(u=0.6)附近时,该检测模型比基于其他阈值训练的检测模型的效果要好,参看FIgure1(c)。

    Cascaded RCNN通过级联几个检测网络达到不断优化预测结果的目的,与普通级联不同的是,cascade R-CNN的几个检测网络是基于不同IOU阈值确定的正负样本上训练得到的,前一个检测模型的输出作为后一个检测模型的输入,因此是stage by stage的训练方式,而且越往后的检测模型,其界定正负样本的IOU阈值是不断上升的。cascade R-CNN的实验大部分是在COCO数据集做的,而且效果非常出彩。

    这是在COCO数据集上的结果。

    2、Relation Networks for Object Detection

    论文:Relation Networks for Object Detection 
    论文链接:https://arxiv.org/abs/1711.11575 
    代码链接:https://github.com/msracver/Relation-Networks-for-Object-Detection 
    详细内容请移步:Relation Networks for Object Detection算法笔记Relation Networks for Object Detection源码解读(网络结构细节)

    这篇文章的出发点在于目前大部分的目标检测(object detection)算法都是独立地检测图像中的object,但显然如果模型能学到object之间的关系显然对于检测效果提升会有帮助,因此这篇文章希望在检测过程中可以通过利用图像中object之间的相互关系或者叫图像内容(context)来优化检测效果,这种关系既包括相对位置关系也包括图像特征关系。

    这篇文章提出了object relation module来描述object之间的关系,从而以attention的形式附加到原来的特征上最后进行回归和分类。实验是针对two stage系列的目标检测算法而言,在ROI Pooling后的两个全连接层和NMS模块引入object relation module,如Figure1所示,因此做到了完整的end-to-end训练。

    3、RefineDet 

    论文:Single-Shot Refinement Neural Network for Object Detection 
    论文链接:https://arxiv.org/abs/1711.06897 
    代码链接:https://github.com/sfzhang15/RefineDet 
    详细内容请移步:RefineDet算法笔记RefineDet算法源码 (一)训练脚本RefineDet算法源码(二)网络结构

    个人觉得RefineDet是一篇很不错的文章,该算法大致上是SSD算法和RPN网络、FPN算法的结合,可以在保持SSD高效的前提下提高检测效果(实验效果提升挺明显)。第一眼看到这篇文章就让我想起了RON,毕竟都是想做one stage和two stage的object detection算法结合。

    RefineDet的主要思想:一方面引入two stage类型的object detection算法中对box的由粗到细的回归思想(由粗到细回归其实就是先通过RPN网络得到粗粒度的box信息,然后再通过常规的回归支路进行进一步回归从而得到更加精确的框信息,这也是two stage类型的object detection算法效果优于one stage类型的一个重要原因)。另一方面引入类似FPN网络的特征融合操作用于检测网络,可以有效提高对小目标的检测效果,检测网络的框架还是SSD。

    网络结构参考Figure1。

    4、SNIP 

    论文:An Analysis of Scale Invariance in Object Detection – SNIP 
    论文链接:https://arxiv.org/abs/1711.08189 
    代码链接:http://bit.ly/2yXVg4c 
    详细内容请移步:SNIP 算法笔记

    这篇文章从数据集出发进行了非常详细的分析和实验对比,发现在COCO数据集中小目标占比要比ImageNet数据集大,这样在用ImageNt数据集的预训练模型时就会产生domain-shift问题,另外COCO数据集中的object尺寸变化范围非常大,即便采用multi-scale training的方式也很难训练一个检测器去cover所有scale的目标。

    因此,这篇文章针对前面提到的问题,提出一种新的训练模型的方式:Scale Normalization for Image Pyramids (SNIP),该算法主要包含两个改进点:1、为了减少前面所提到的domain-shift,在梯度回传时只将和预训练模型所基于的训练数据尺寸相对应的ROI的梯度进行回传。2、借鉴了multi-scale training的思想,引入图像金字塔来处理数据集中不同尺寸的数据。

    SNIP网络结构参考Figure6。

    5、R-FCN-3000 

    论文:R-FCN-3000 at 30fps: Decoupling Detection and Classification 
    链接:https://arxiv.org/abs/1712.01802 
    详细内容请移步:R-FCN-3000算法笔记

    这篇文章主要是成功将R-FCN算法(关于R-FCN算法的介绍可以看博客)应用在检测类别较多的场景下。首先当初提出R-FCN算法的主要目的在于引入position-sensitive score map解决原来Faster RCNN中ROI的重复计算问题,有效提升速度。但是如果检测的类别数非常多(比如这里的3000类),那么直接用R-FCN算法的话速度是很慢的,瓶颈正是生成分类支路的position-sensitive score map时计算量非常大,因此这篇文章通过解耦分类支路的position-sensitive score map生成的过程(将原来的分类支路拆分成两条支路,而回归支路还是采用R-FCN的回归支路,这篇文章不做修改,这是因为增加检测类别数增加不影响回归支路的计算量),从而在保证速度(30FPS)的情况下将R-FCN的分类类别数延伸至3000类。

    Figure2是F-RCN-3000的分类支路过程,该过程包含两条支路(Figure2上面那条是生成objectness score的过程,Figure2下面那条是生成fine-grained classification score的过程),这两条支路的结果的乘积才是最终的分类结果。在Figure2中回归部分并未画出,但是需要注意的是回归部分和R-FCN的回归部分是一样的。

     

    6、DES 

    论文:Single-Shot Object Detection with Enriched Semantics 
    论文链接:https://arxiv.org/abs/1712.00433 
    详细内容请移步:Detection with Enriched Semantics(DES)算法笔记

    Detection with Enriched Semantics(DES)主要是基于SSD做改进,也是为了解决SSD中对于小目标物体的检测效果不好的问题,因为SSD算法对小目标的检测只是利用了浅层的特征,并没有用到高层的语义特征。因此这篇文章的出发点就是为了增加用于检测的feature map的语义信息,主要的措施包括:1、引入segmentation module用于得到attention mask,从而提高low level的feature map的语义信息。2、引入global activation module用于提高high level的feature map的语义信息。

    实验效果不错,在VOC2007数据集上,DES512能达到81.7的mAP,而且在Titan X上的速度是31.7FPS(batch设置为8,不过比相同大小输入和相同特征提取网络的SSD算法慢一些)。

    网络结构参考Figure1。 

    7、STDN 

    论文:Scale-Transferrable Object Detection 
    论文链接:https://pan.baidu.com/s/1i6Yjvpz 
    详细内容请移步:Scale-Transferrable Detection Network(STDN)算法笔记

    Scale-Transferrable Detection Network(STDN)算法主要用于提高object detection算法对不同scale的object的检测效果。该算法采用DenseNet网络作为特征提取网络(自带高低层特征融合),基于多层特征做预测(类似SSD),并对预测结果做融合得到最终结果。该算法有两个特点:1、主网络采用DenseNet,了解DenseNet的同学应该知道该网络在一个block中,每一层的输入feature map是前面几层的输出feature map做concate后的结果,因此相当于高低层特征做了融合。高低层特征融合其实对object detection算法而言是比较重要的,FPN算法是显式地做了高低层特征融合,而SSD没有,这也是为什么SSD在小目标问题上检测效果不好的原因之一,因此该算法虽然看似SSD,但其实和SSD有区别。2、引入scale-transfer layer,实现了在几乎不增加参数量和计算量的前提下生成大尺寸的feature map(其他常见的算法基本上都是采用deconvolution或upsample),由于scale-transfer layer是一个转换操作,因此基本不会引入额外的参数量和计算量。

    网络结构参考Figure2。 

    ECCV2018目标检测

    1、IOU-Net

    论文:Acquisition of Localization Confidence for Accurate Object Detection
    论文链接:https://arxiv.org/abs/1807.11590
    详细博客介绍:IOU-Net 算法笔记

    这篇文章个人非常喜欢,我们知道在目标检测算法中最后一般都会通过NMS算法移除重复预测框,移除的依据是预测框的分类得分(classification confidence,也就是softmax层的概率输出),但是这种依据并不能很好地表征预测框的准确性,换句话说对于同一个ground truth而言,分类得分高的预测框并不一定比分类得分低的预测框好,这样就容易导致那些分类得分低,但是坐标和ground truth更接近,也就是坐标回归更准确的预测框在NMS阶段被过滤掉,导致最终指标的下降。因此这篇文章就提出IOU-Net,通过预测检测框和ground truth的IOU来解决这2个问题:1、提出IOU-guided NMS,也就是在NMS阶段引入回归得分(localization confidence)作为排序指标而不是采用传统的分类得分。2、提出optimization-based bbox refinement替换传统的regression-based方法,提高了回归部分的可解释性。另外这篇文章还提出了Precise ROI Pooling(PrROI Pooling),通过积分方式计算ROI特征使得前向计算的误差进一步降低,同时反向传播时基于连续输入值计算梯度使得反向传播连续可导,相比之下ROI Pooling和ROI Align由于采用量化或几个点插值方式求ROI特征,不可避免地带来一些噪声,而且在反向求导时只对特定输入回传梯度。

    Figure1是关于这篇文章出发点的介绍。


    2、DetNet

    论文:DetNet: A Backbone network for Object
    链接:https://arxiv.org/abs/1804.06215
    详细博客介绍:DetNet 算法笔记

    这篇关于目标检测的文章,主要是对检测算法的特征提取网络(backbone)做优化。我们知道目前大部分的目标检测算法在训练时都会用预训练的分类模型来提取特征,这些预训练模型是在ImageNet数据集上训练得到的,众多的实验也证明了这种做法的有效性。而DetNet这篇文章相当于研究更加有效的特征提取网络,出发点也非常直接,主要包含两点:1、分类任务和检测任务还是有一定差别的,因此用分类数据上训练的分类模型来提取特征用于检测任务不一定合适,比如检测任务比较关注目标的尺度特征,但是分类任务就不一定了。2、检测任务不仅仅要做目标的分类,而且要做目标的定位,这样的差异容易导致一些问题,比如在分类网络中常用的降采样操作可能对分类有效,因为增大了感受野,但是对于需要定位目标的检测任务而言就不一定有利,因为丢失了目标的位置信息。因此DetNet的提出主要也是针对这两个出发点,换句话说是设计了一个专门用于目标检测算法的特征提取网络,主要改进点包括:1、增加网络高层输出特征的分辨率,换句话说就是高层不对特征图做尺寸缩减。2、引入dilated卷积层增加网络高层的感受野,这是因为第一个改进点引起的感受野减小。3、减小网络高层的宽度,减少因增大分辨率带来的计算量。

    Figure1是第1个改进点。


    Figure2是关于第2、3个改进点。


    3、RFB Net

    论文:Receptive Field Block Net for Accurate and Fast Object Detection
    论文链接:https://arxiv.org/abs/1711.07767
    代码链接:https://github.com/ruinmessi/RFBNet
    详细博客介绍:RFB Net算法笔记

    这篇关于目标检测的文章,提出了RFB Net网络用于目标检测,可以在兼顾速度的同时达到良好的效果。该网络主要在SSD网络中引入Receptive Field Block (RFB) ,引入RFB的出发点通过模拟人类视觉的感受野加强网络的特征提取能力,在结构上RFB借鉴了Inception的思想,主要是在Inception的基础上加入了dilated卷积层(dilated convolution),从而有效增大了感受野(receptive field)。整体上因为是基于SSD网络进行改进,所以检测速度还是比较快,同时精度也有一定的保证。

    RFB结构如Figure4所示。


    RFB Net结构如Figure5所示。


    4、PFPNet

    论文:Parallel Feature Pyramid Network for Object Detection
    论文链接:http://openaccess.thecvf.com/content_ECCV_2018/html/Seung-Wook_Kim_Parallel_Feature_Pyramid_ECCV_2018_paper.html
    详细博客介绍:PFPNet 算法笔记

    这篇文章借鉴了SPP的思想并通过MSCA(multi-scale context aggregation)模块进行特征融合从而提出PFPNet(Parallel Feature Pyramid Network)算法来提升目标检测的效果。PFPNet整体上还是one stage类型的目标检测算法,思想借鉴了SSD,速度上有保证,效果上因为引入SPP思想构造特征金字塔,相当于加宽了网络,同时MSCA模块做类似FPN的特征融合操作,最后基于多层融合特征进行预测,因此效果也是很不错的,和CVPR2018的RefineDet效果基本上差不多。

    PFPNet的网络结构如Figure3所示。


    5、CornerNet

    论文:CornerNet: Detecting Objects as Paired Keypoints
    论文链接:https://arxiv.org/abs/1808.01244
    代码链接:https://github.com/umich-vl/CornerNet
    详细博客介绍:CornerNet 算法笔记

    这篇目标检测文章给人一种眼前一亮的感觉,简单说一下几个比较吸引我的点:1、将目标检测问题当作关键点检测问题来解决,也就是通过检测目标框的左上角和右下角两个关键点得到预测框,因此CornerNet算法中没有anchor的概念,这种做法在目标检测领域是比较创新的而且能够取得不错效果是很难的。2、整个检测网络的训练是从头开始的,并不基于预训练的分类模型,这使得用户能够自由设计特征提取网络,不用受预训练模型的限制。

    CornerNet算法整体结构如Figure4所示。

    检测发展历程概览

    https://github.com/hoya012/deep_learning_object_detection

    https://arxiv.org/pdf/1809.02165.pdf

     

    参考

    https://blog.csdn.net/wfei101/article/details/80861681 

    https://blog.csdn.net/qq_35451572/article/details/80758263#commentBox

    https://blog.csdn.net/u014380165/article/details/82025720

    https://blog.csdn.net/weixin_40245131/article/details/79754531

    https://blog.csdn.net/hw5226349/article/details/81906882(超级全)

    超级全的原文地址https://handong1587.github.io/deep_learning/2015/10/09/object-detection.html

    展开全文
  • faster-rcnn的好文章 懒人元 faster rcnn 知乎 一文读懂Faster RCNN 2 检测中常用模块 2.1 FPN上下文 Feature Pyramid Networks for Object Detection 论文笔记 对FPN的原理进行了分析,主要是论文解读。 一文看尽...
  • 目录前言一、两阶段检测算法发展历程R-CNN ![在这里插入图片描述](https://img-blog.csdnimg.cn/20201023163001392.png?x-oss-process=image/watermark,type_ZmFuZ3poZW5naGVpdGk,shadow_10,text_aHR0cHM6Ly9ibG9...
  • RCNN系列目标检测算法详解目录两阶段目标检测算法发展历程R-CNNR-CNN网络结构R-CNN网络效果Fast R-CNNFast R-CNN网络效果Faster R-CNNFaster R-CNN网络结构Anchor(锚框)RPN网络结构RPN网络训练策略RPN网络监督信息...
  • 文章目录计算机视觉:图像分类、目标检测、目标分割一、人脸检测二、Faster-RCNN1) 发展历程以及解决的问题2) 传统目标检测流程3) RCNN4) SPPNet5) Fast RCNN6) Faster RCNN 计算机视觉:图像分类、目标检测、目标...
  • 发展历程 基于区域提名的R-CNN家族对比总括 R-CNN(2014) SPP-Net Fast R-CNN(2015) Faster-RCNN Yolo:you only look once SSD: Single Shot MultiBox Detector YoloV2, Yolo9000 ...
  • 两阶段算法发展历程 R-CNN 核心思想 对每张图选取多个区域,然后每个区域作为一个样本进入一个卷积神经网络来提取特征 不足 计算量大:每个候选区域都需要通过CNN计算特征 质量差:selective search提取的区域...
  • 物体检测之FasterRCNN学习笔记

    千次阅读 2020-05-16 23:44:07
    FasterRCNN是kaiming大神在RCNN, FastRCNN之后提出的一种新算法,在当时达到了检测领域SOTA的performance,如今已有超过18000次引用量,可以说是想要入门detection领域的同学必读的一篇文章。 本人在入门的时候看到的...
  • 目标检测算法发展历程

    千次阅读 2020-02-23 17:48:50
    目标检测发展历程1.目标检测发展历程2.目标检测算法流程3. 传统目标检测方法4.深度学习目标检测方法 1.目标检测发展历程 2.目标检测算法流程 3. 传统目标检测方法 ...Two-stage(Faster RCNN系列) ...
  • 本文详细介绍了RCNN系列算法发展历程,包含大量细节,欢迎各位交流~
  • 二十年间的发展 如下图所示,以2014年为分水岭,目标检测在过去的二十年中可大致分为两个时期:2014年前的“传统目标检测期”及之后的“基于深度学习的目标检测期”。接下来我们详细谈论两个时期的发展。 ...
  • R-CNN 系列算法是目标检测 two-stage 类的代表算法,本文将从 问题背景,创新点,框架模块,训练流程,检测流程五个方面比较,了解它们的的发展历程,以及发展原因。 文章目录 一、任务描述 二、设计思路 三、名词...
  • tensorflow2.0实现faster-rcnn 张益新,算法工程师,3...
  • 从目标检测到图像分割简要发展

    千次阅读 2018-09-26 15:09:35
    欢迎大家关注我们的网站和系列教程:http://www.tensorflownews.com/,学习更多的机器学习、深度学习的知识! by 小韩 (来源: ...
  • 本博客记录了用pytorch实现的faster rcnn代码,完成VOC2007数据集,以及个人数据集的训练及测试过程。比较少做目标检测方向的实验,花了点时间调通代码,记录一下填坑过程。 ...整个RCNN系列的目标
  • a) 无特殊操作 直接使用最后一层 特征 进行目标检测,如RCNN YOLO系列,对小目标十分不友好,因为最后一层 特征 具有强语义、低分辨率,小目标很容易被忽略掉,小目标检测性能不友好; b) 单方向的特征金字塔 这个...
  • 计算机视觉应用可以分为: 1、图片识别(Image Classification) 2、目标 检测(Object Detection) 3、语义分割(Semantic Segmentation) 4、视频 理解(Video Understanding) ...经典的网络模型有 VGG 系列、Ince
  • 过两年的沉淀,rbg大神于2016年提出了R-CNN系列的封神之作——Faster-RCNN,全称:《Faster R-CNN: Towards Real-Time Object Detection with Region Proposal Networks》,同时何凯明博士也是这篇论文的作者之一。...
  • 目标检测系列——目标检测方法发展综述

    千次阅读 多人点赞 2020-03-23 20:33:31
    目标检测发展: 过去20年的进展: 整体而言,这些检测器可以分为两大主要类别: 两级式(2-stage):区域提议+检测(R-CNN系列),主要倾向于准 单级式(1-stage):无区域提议框架,提议和检测是整体的(SSD,YOLO...
  • 五、发展历程 首先用一张图说明三个架构的区别。 可以看出,他们的发展是从训练分散到统一的过程,开始还需要借助外部的模块 SS,后来可以构造一个联合框架。 从训练的角度,开始的训练是多阶段的(multi-satge:...
  • 目标检测学习总结之RCNN、SPP-net、Fast RCNN、Faster ...围绕这个问题,人们一般把其发展历程分为3个阶段:  1. 传统的目标检测方法  2. 以R-CNN为代表的结合region proposal和CNN分类的目标检测框架(R-CNN, SP...
  • 物体检测算法的历史发展脉络综述

    千次阅读 2019-05-14 16:50:05
     (rbg大神的主页,凭借DPM获得终身成就奖,之后的rcnn系列也是该大神创世之作) Object Detection with Discriminatively Trained Part Based Models   Visual Object Detection with Deformable Part ...
  • paper:Faster R-CNN: Towards Real-Time Object Detection with Region ...Faster R-CNN1 发展历程1.1 目前的卷积神经网络1.2 Faster R-CNN发展由来1.2.1 CNN1.2.2 RCNN(基于区域的卷积神经网络)1.2.3 Fast RC
  • Yolov5 系列1--- Yolo发展史以及Yolov5模型详解

    万次阅读 多人点赞 2020-09-28 20:45:27
    本文会从Yolo的发展历程开始,到损失函数,mAP的概念,最后到如何在代码层面训练你的定制化数据集。好了,让我们开始吧~ 1. YOLO (You Only Look Once) 的发展历史 这部分内容主要借鉴自 科技猛兽@知乎 在知乎的...
  • 目标检测发展

    千次阅读 多人点赞 2019-04-16 16:12:44
    图 7:里程碑检测框架 RCNN [65, 67] 的细节图示 图 8:用于一般目标检测的领先框架的高层面示意图。表 10 总结了这些方法的特性 4 基础性子问题 这一节将描述重要的子问题,包括特征表示、区域提议、形境...
  • 点上方蓝字计算机视觉联盟获取更多干货在右上方···设为星标★,与你不见不散仅作学术分享,不代表本公众号立场,侵权联系删除转载于:DeepBlue深兰科技AI博士笔记系列推荐周志华《...

空空如也

空空如也

1 2 3 4 5 ... 13
收藏数 242
精华内容 96
关键字:

rcnn系列发展历程