精华内容
下载资源
问答
  • 面膜检测器 使用卷积神经网络(CNN)的面罩检测器 所用技术 打开简历 凯拉斯 Python 屏幕截图
  • 这是一片关于深度学习在CNN场景中的对象检测器的论文。
  • 基于CNN分类和卷积的目标检测 基于CNN分类和卷积的目标检测 基于CNN分类和卷积的目标检测 基于CNN分类和卷积的目标检测
  • YOLOv3 对象检测器CNN(基于 )
  • 当下主流CNN物体检测器的对比评测

    千次阅读 2017-08-14 08:41:55
    ——对当下主流CNN物体检测器的评测 自2014年RCNN被提出以来,基于卷积神经网络的物体检测已经成为主流。Faster RCNN、SSD、YOLO、 R-FCN等诸多检测算法百花齐放,每种方法都在各自的维度上达到当时的state-of-...

    [转] https://www.leiphone.com/news/201708/69tubrJUvdaAPw1Z.html


    雷锋网(公众号:雷锋网) AI科技评论按:虽然CVPR 2017已经落下帷幕,但对精彩论文的解读还在继续。下文是Momenta高级研发工程师李俊对此次大会收录的Speed/Accuracy trade-offs for modern convolutional object detectors 一文进行的解读。

    如何选择物体检测器

    ——对当下主流CNN物体检测器的评测

    自2014年RCNN被提出以来,基于卷积神经网络的物体检测已经成为主流。Faster RCNN、SSD、YOLO、 R-FCN等诸多检测算法百花齐放,每种方法都在各自的维度上达到当时的state-of-the-art。而由于各种不同方法在实验时所使用的特征提取网络、图像分辨率、软硬件架构等诸多因素不尽相同,目前对于不同的检测方法一直缺乏一个实际的公平比较。这篇论文主要讨论多种物体检测算法在速度、精度做不同权衡时的表现,进而指导实际应用中对物体检测器的选择。

    在这篇文章里面我们主要讨论以下几点:

    • 本文为什么要做检测器对比

    • 如何对不同检测器做对比

    • 对比的结论是什么

    • 总结与思考

    1.为什么要做检测器对比

    近年来由于CNN的发展与应用,物体检测领域得到了快速发展,如Faster RCNN, R-FCN, Multibox, SSD, YOLO等算法已经成功应用于实际产品中,并在各种计算设备上展现出可观的性能。在实际应用中,由于不同的场景下有不同的限制和需求,需要根据实际情况权衡选择最适合的检测方法。这就需要我们对不同检测器的性能有更客观的认识。

    然而,从这些算法的原始文章很难直接获得对不同算法在多个维度的对比。一方面,不同方法的原始论文在特征提取网络、框匹配方式、框的表示、回归的Loss函数选择等方面存在差异(如下表所示)。另一方面,我们缺乏客观的评价标准:Pascal VOC或者COCO数据集上标准的评价准则mAP只能反映精度,而比赛获胜的方法通常会采用多模型融合,如multi-crop和multi-scale等方法来牺牲时间提升精度。

    CVPR精彩论文解读:对当下主流CNN物体检测器的对比评测

    我们需要系统客观地对不同算法在速度、精度、空间占用等多个维度进行评测,以用于指导选择在不同实际情景下所需要的最佳物体检测器。

    2.如何对不同检测器做对比

    本文对比了Faster RCNN, SSD和R-FCN三种方法,每种方法都基于TensorFlow的实现,对比单模型、单次前传的性能。每一种方法都首先在TensorFlow中复现了原论文的报告精度,然后在此基础上进行修改对比。具体地:特征提取器采用了VGG16, Resnet101, Inception V2, Inception V3, Inception Resnet V2, MobileNet等多个模型;Faster RCNN和R-FCN选用同样的feature map层来预测region proposal;SSD在最上层的feature map基础上加入多个2倍大小的额外层做预测;Faster RCNN和R-FCN的proposal数量从10变化到300;本文同时探索了feature map的stride从32变化到16、8的影响;保持参数量不变;匹配方式统一为二分图,匹配框统一encode为[10*x_c/w_a, 10*y_c/h_a, 5*logw, 5*logh],回归的loss统一设置为Smooth L1 Loss;输入图像分辨率统一resize到短边为600,同时对比了短边为300分辨率的情况;计算时间包含了一次forward加上post-processing的时间。

    3. 对比的结论是什么

    对比不同方法的速度-精度图如下:

    CVPR精彩论文解读:对当下主流CNN物体检测器的对比评测

    Faster RCNN使用更少的proposal,可以显著加速但仅仅小幅度影响了精度。另外SSD受feature extractor的影响没有Faster RCNN和R-FCN大。最后本文指出了满足速度要求情况下的最佳速度精度权衡的物体检测器。如下图所示:

    CVPR精彩论文解读:对当下主流CNN物体检测器的对比评测

    最快的模型为低分辨率下MobileNet+SSD,精度最高网络为Inception Resnet v2 + 300 proposal Faster RCNN。速度精度权衡到最佳的模型为Resnet 101 + 100 proposal Faster RCNN和Resnet 101 + 300 proposal R-FCN。

    4.总结与思考

    论文的价值体现在,在相对公平的环境中对比了当前最好的一些检测算法,通过大量不同配置的对比,对于实际应用中检测任务的方法选择给出了一定的指导。实际应用中Faster RCNN和R-FCN可以达到更好的速度与精度权衡折衷, 两步迭代的方案一边保证了高recall, 一边保证高precision。另外不考虑运行时间的话Faster RCNN仍然是刷榜的首选。

    CVPR 作者现场QA:

    1. 不考虑时间,当参数量相同时,哪种方法的精度更高?

    A:Faster RCNN > R-FCN > SSD,其中SSD的主要优势是快(同样参数量情况下)。

    2.    为什么two-stage的方案(Faster RCNN、R-FCN)会比SSD的精度更高?

    A:Faster RCNN第一步关注proposal的效果,第二步关注refine的效果。提取的ROI区域会有一个zoom in的效果,因而会比SSD混杂在一起单步学习精度更高。

    论文地址:https://arxiv.org/abs/1611.10012


    展开全文
  • 1. 滑动窗口检测器 滑动窗口检测器是一种暴力检测方法,从左到右,从上到下滑动窗口,然后利用分类识别目标。这里使用不同大小的窗口,因为一张图片可能展示从不同距离观测检测出不同的目标类型。 滑动窗口从...

    1. 滑动窗口检测器

    滑动窗口检测器是一种暴力检测方法,从左到右,从上到下滑动窗口,然后利用分类识别目标。这里使用不同大小的窗口,因为一张图片可能展示从不同距离观测检测出不同的目标类型。
    这里写图片描述
    滑动窗口从图像中可能剪切出不同大小的图像块,但是很多分类器只取固定大小的图像,所以这些图像是经过变形转换的。但是这样做并不影响准确率,因为分类器可以处理变形后的图像。
    变形图像被输入到CNN中,提取4096个特征,然后使用SVM和一个线性分类器来识别分类和边界框。
    这里写图片描述

    2. 选择性搜索(selective search SS)

    为了在滑动窗口检测器的基础上提高搜索速度,可以采用候选区域方法(region proposal method)创建目标检测的感兴趣区域(ROI)。在选择性搜索中,首先将每个像素作为一组,然后计算每一组的纹理,将两个最接近的组结合起来,我们通常对较小的组先分组,合并区域知道所有区域都合并在一起。下图展示了区域合并:
    这里写图片描述
    下面展示了区域合并过程中所有可能的ROI:
    这里写图片描述

    3. R-CNN

    R-CNN利用候选区域方法创建的2000多个ROI,并将这些ROI转换为固定大小的图像并送到CNN中。该网络架构后面一般会跟几个全连接层,以实现目标分类并提炼边界框
    这里写图片描述
    下面是R-CNN系统的流程图:
    这里写图片描述
    通过使用更少更高质量的ROI,R-CNN通常比滑动窗口方法更加快速准确

    4. 边界框回归器

    虽然相对于滑动窗口检测器来说,候选区域方法有很大的性能提升,但是整个算法仍然具有较大的计算复杂度。为了加速这个进程,我们通常会选用计算量较小的候选区域选择方法构建ROI,并在后面使用线性回归器(全连接层)进一步提炼边界框。
    这里写图片描述

    展开全文
  • 介绍滑动窗口检测器,选择性搜索,R-CNN,边界框回归器
    个人微信公众号:AI研习图书馆,欢迎关注~

    深度学习知识及资源分享,学习交流,共同进步~

    1. 滑动窗口检测器

    滑动窗口检测器是一种暴力检测方法,从左到右,从上到下滑动窗口,然后利用分类识别目标。这里使用不同大小的窗口,因为一张图片可能展示从不同距离观测检测出不同的目标类型。
    在这里插入图片描述
    滑动窗口从图像中可能剪切出不同大小的图像块,但是很多分类器只取固定大小的图像,所以这些图像是经过变形转换的。但是这样做并不影响准确率,因为分类器可以处理变形后的图像。
    变形图像被输入到CNN中,提取4096个特征,然后使用SVM和一个线性分类器来识别分类和边界框。

    在这里插入图片描述

    2. 选择性搜索(selective search/SS)

    为了在滑动窗口检测器的基础上提高搜索速度,可以采用候选区域方法(region proposal method)创建目标检测的感兴趣区域(ROI)。在选择性搜索中,首先将每个像素作为一组,然后计算每一组的纹理,将两个最接近的组结合起来,我们通常对较小的组先分组,合并区域知道所有区域都合并在一起。下图展示了区域合并:
    在这里插入图片描述
    下面展示了区域合并过程中所有可能的ROI:
    在这里插入图片描述

    3. R-CNN

    R-CNN利用候选区域方法创建的2000多个ROI,并将这些ROI转换为固定大小的图像并送到CNN中。该网络架构后面一般会跟几个全连接层,以实现目标分类并提炼边界框。
    在这里插入图片描述
    下面是R-CNN系统的流程图:
    在这里插入图片描述
    通过使用更少更高质量的ROI,R-CNN通常比滑动窗口方法更加快速准确。.

    4. 边界框回归器

    虽然相对于滑动窗口检测器来说,候选区域方法有很大的性能提升,但是整个算法仍然具有较大的计算复杂度。为了加速这个进程,我们通常会选用计算量较小的候选区域选择方法构建ROI,并在后面使用线性回归器(全连接层)进一步提炼边界框。
    在这里插入图片描述

    展开全文
  • 用于视频复制检测的两类3D-CNN分类组合
  • 近日,来自旷视和清华的研究者提出一种新型两步检测器 Light-Head R-CNN,改变两步检测器头重脚轻(heavy-head)的设计,实现速度和准确率的双重突破。

    近日,来自旷视和清华的研究者提出一种新型两步检测器 Light-Head R-CNN,改变两步检测器头重脚轻(heavy-head)的设计,实现速度和准确率的双重突破。

    近期基于 CNN 的目标检测器可以分为一步检测器和两步检测器。一步检测器通常聚焦于快速、高准确率地检测最佳点(sweet-spot)。两步检测器将任务分为两步:第一步(检测器体/body)生成多个 proposal,第二步(检测器头/head)识别 proposal。通常情况下,为了达到最高准确率,头的设计比较复杂。两步检测器检测最佳点通常速度较慢,但是准确率很高。

    两步检测器(two-stage detector)可以在效率和准确率方面都战胜一步检测器吗?来自旷视和清华的研究者发现典型的两步检测器如 Faster R-CNN [5] 和 R-FCN [17] 具备相同的特征:与主干网络连接的检测器头比较重(heavy head)。例如,Faster R-CNN 在 ResNet 第 5 阶段中部署两个大型全连接层或所有卷积层用于每个 RoI(感兴趣区域)识别和回归。每个区域的预测都很耗时,当使用大量 proposal 时,需要的时间就更多。此外,RoI pooling 之后的特征通道很多,使得第一个全连接层消耗大量内存,影响计算速度。与多次应用每个区域子网络的 Fast/Faster R-CNN 不同,基于区域的全卷积网络(R-FCN)[17] 尝试在所有 RoI 中共享计算。但是,R-FCN 需要使用 #classes × p × p(p 是随后的池化规模)通道生成非常大的额外得分图(score map),这同样需要大量内存和时间。Faster R-CNN 或 R-FCN 的重头设计使得在使用小的主干网络时两步检测器的竞争力较弱。

    这篇论文提出一种轻量级检测器头设计以构建一个高效、准确率高的两步检测器。具体来说,使用一个大内核可分卷积和少量通道(实验中使用的是α × p × p,且α ≤ 10)生成稀疏的特征图。该设计的计算量使随后的 RoI 子网络计算量大幅降低,检测系统所需内存减少。将一个廉价的全连接层附加到池化层上,充分利用分类和回归的特征表示。

    因其轻量级头部结构,该检测器能够实现速度和准确率之间的最优权衡,不管使用的是大主干网络还是小主干网络。如图 1 所示,该论文中的算法(Light-Head R-CNN)显著优于快速的一步检测器,如 SSD [22] 和 YOLOv2 [27]。此外,该算法还很灵活,适用于大型主干网络。基于 ResNet-101 主干网络,该算法优于顶尖的算法,包括两步检测器如 Mask R-CNN [7] 和一步检测器如 RetinaNet [20]。

    图 1. Light Head R-CNN 与之前的一步、两步检测器的对比。研究者展示了在不同主干网络上的结果。由于设计理念更好,Light Head R-CNN 显著优于其他检测器,且能够提供一个新的上包络线。注意:这里使用的所有结果都是使用单尺度训练获取的。多尺度训练结果见表 5。

    图 2. 方法概览。Light-Head R-CNN 在 RoI warping 之前使用大型可分卷积构建稀疏的特征图。研究者在 R-CNN 子网络中使用带有 2048 个通道的单个全连接层。由于更稀疏的特征图和廉价的 R-CNN 子网络,整个网络高效且达到很好的准确率。

    图 3. 大型可分卷积按顺序执行 k × 1 和 1 × k 卷积层。计算复杂度可以通过 C_mid 和 C_out 进一步进行控制。

    图 4. 该网络用于评估稀疏特征图的影响。研究者使该网络和 R-FCN 一样,除了降低用于 PSRoI pooling 的特征图通道。研究者添加额外的全连接层用于最终的预测。

    表 4. Light-Head R-CNN 的效果。R-FCN 和 Fast R-CNN 的基线基于设置 L(3.2)。

    表 5. 不同大小的单个模型在 COCO test-dev 上的对比。所有实验都使用 Resnet-101 作为基础特征提取器(除了 R-RMI 使用的是 Inception Resnet V2 [33])。Light-Head R-CNN 达到了最好的准确率,且超过之间的最优准确率。注意: test-dev 的结果与 mini-validation 上的结果有些微不同。「ms-train」代表多尺度训练。

    表 7. 高效 Xception,类似 Light-Head R-CNN 检测器的架构。Comp* 指网络的复杂度(浮点)。

    表 8. Light-Head R-CNN 检测器与其他检测器在 COCO test- dev 上的结果对比。Xception* 指小的 xception 如主干网络。通过添加一个小的基础模型,Light R-CNN 在准确率和速度上都达到了更好的表现,这表明该设计的灵活性。

    论文:Light-Head R-CNN: In Defense of Two-Stage Object Detector

    论文地址:https://arxiv.org/pdf/1711.07264.pdf

    在这篇论文中,我们首先研究了经典的两步方法慢于一步检测器(如 YOLO 和 SSD)的原因。我们发现 Faster R-CNN 和 R-FCN 会在 RoI warping 之前或之后进行高强度的计算。Faster R-CNN 包含两个全连接层用于 RoI 识别,而 R-FCN 会生成一个大型得分图。因此,这些网络的速度会被架构的 heavy-head(头重脚轻的)设计拖慢速度。即使大量简化了基础模型,计算成本也没有随之显著降低。

    我们提出了一种新的两步检测器 Light-Head R-CNN,用于克服当前两步方法的缺陷。在我们的设计中,通过使用一个稀疏的特征图和一个廉价的 R-CNN 子网络(池化和单全连接层),我们把网络的头部尽可能轻量化。我们基于 ResNet-101 的 Light-Head R-CNN 在 COCO 数据集上的性能超过当前最佳的目标检测器,同时保证时间效率。更重要的是,通过简单地用一个小型网络(如 Xception)替换主干网络,Light-Head R-CNN 在 COCO 数据集上获得了 30.7 mmAP 和 102 FPS 的结果,在速度和准确率上显著优于快速的一步检测器(如 YOLO 和 SSD)。模型代码稍后公布。

    展开全文
  • 近日,来自旷视和清华的研究者提出一种新型两步检测器 Light-Head R-CNN,改变两步检测器头重脚轻(heavy-head)的设计,实现速度和准确率的双重突破。 近期基于 CNN 的目标检测器可以分为一步检测器和两步检测...
  • ... 背景介绍 通用目标检测是计算机视觉领域最...尽管近年来自于CNN的目标检测算法较传统方法在准确率上取得的突飞猛进的进展,然而较目标分类问题而言依然还有很长一段路要走。早期的目标检测方法主要是由VJ框架...
  • CNN 究竟“看”到了什么?曲线检测器是否为可解释性带来了出路?.pdf
  • 基于CNN-LSTM的QRS检测器,用于ECG信号 该项目为ECG信号实现了基于深度学习的QRS检测器。 具体而言,使用了混合CNN-LSTM模型。 在测试集上,该模型的f1为0.79,准确度为0.95。 要正确理解这一点,请使用以下模型: #...
  • 一文读懂目标检测:R-CNN、Fast R-CNN、Faster R-CNN、YOLO、SSD   前言 之前我所在的公司七月在线开设的深度学习等一系列课程经常会讲目标检测,包括R-CNN、Fast R-CNN、Faster R-CNN,但一直没有比较好的...
  • 睿智的目标检测27——Pytorch搭建Faster R-CNN目标检测平台学习前言什么是FasterRCNN目标检测算法源码下载Faster-RCNN实现思路一、预测部分1、主干网络介绍2、获得Proposal建议框3、Proposal建议框的解码4、对...
  • 基于卷积神经网络的语音活动检测器 该GitHub存储库是以下论文的代码伴奏: 用于实时语音活动检测的卷积神经网络智能手机应用程序Abhishek Sehgal和Nasser Kehtarnavaz-达拉斯德克萨斯大学 摘要:本文提出了一种...
  • 基于CNN和多分类的恶意URLs检测
  • 库来构建检测器。 该检测器使用 CNN 分类器为 MSER 算法提出的区域确定数字与否。 先决条件 Python 2.7 keras 1.2.2 opencv 2.4.11 张量流-GPU == 1.0.1 等等。 运行这个项目所需的所有包的列表可以在 . Python环境 ...
  • Adding a Binarized CNN Accelerator to RISC-V for Person Detection
  • dlib CNN人脸检测器 张量流人脸检测器 探测器 pretrained_model 输入图像尺寸 OpenCV Haar级联 haarcascade_frontalface_default.xml 没有上限 OpenCV Resnet SSD面部测距仪 res10_300x300_ssd_iter_140000.caffe...
  • Faster R-CNN - 目标检测详解

    万次阅读 多人点赞 2018-02-11 15:51:42
    Faster R-CNN - 目标检测详解 [原文 - Faster R-CNN: Down the rabbit hole of modern object detection] 学习别人对于 Faster R-CNN 的理解,结合自己的理解,以掌握忽略的点. Object detection: an ...
  • 深度学习目标检测之 R-CNN 系列: 从 R-CNN 和 Fast R-CNN 到 Faster R-CNN 深度学习目标检测之 R-CNN 系列包含 3 篇文章: 从 R-CNN 和 Fast R-CNN 到 Faster R-CNN Faster R-CNN 网络详解 用 Faster R-CNN 训练...
  • 写在前面 这两周由于实习公司事情较多,来不及写博客。【计算机视觉——RCNN目标检测系列】的第三篇文章【非极大抑制和IoU】的文字材料已经准备好了,但是相关...R-CNN在2014年横空出世,作者是目标检测领域的大神Ro...
  • 目标检测(R-CNN、Fast R-CNN、Faster R-CNN) 1、目标检测(object detection) 图像识别是输入一张图像,输出该图像对应的类别。目标检测的输入同样是一张国像,但输出不单单是图像的类别,而是该图像中所含的...
  • Farsiu,“用于在自适应光学检眼镜中自动检测视锥光感受的开源软件使用卷积神经网络”,科学报告,2017年7月66日。根据GPL v2许可发布。 笔记: •该代码已在MatLab 2016b中进行了测试,并使用了MatConvNet团队...
  • 人脸检测——CascadeCNN

    万次阅读 2015-12-19 18:24:01
    本文介绍的人脸检测方法,来源于2015CVPR《A Convolutional Neural Network Cascade for Face Detection》。本篇文章的方法可以说是对经典的Viola jones方法的深度卷积网络实现,并没有让人眼前一亮的地方,但依然有...
  • 目标检测之R-CNN

    千次阅读 2018-07-12 21:45:58
    rbgirshick/rcnnRoss Girshick一直长期研究目标识别的问题,是目标识别领域做的非常的学者,尤其是在他提出R-CNN之前,目标检测一直处于停滞状态,性能已经无法大幅度提升了。直到R-CNN的出现,为...
  • CNN识别CT图像检测肺癌

    万次阅读 2018-04-18 12:26:53
    CNN识别CT图像检测肺癌原文:2nd place solution for the 2017 national datascience bowl 翻译参考:知乎用户王小新 Kaggle百万美元大赛优胜者:用CNN识别CT图像检测肺癌概要本文为2017年由Kaggle举办的数据科学...
  • 基R-CNN的物体检测

    千次阅读 2016-11-29 10:02:46
    主要是讲解2014年CVPR上的经典paper:《Richfeature hierarchies for Accurate Object Detection and Segmentation 》,这篇论文的算法思想又被称之为:R-CNN(Regions with Convolutional NeuralNetwork Features)...

空空如也

空空如也

1 2 3 4 5 ... 20
收藏数 33,266
精华内容 13,306
关键字:

cnn检测器