精华内容
下载资源
问答
  • YOLOV4结构

    2021-02-15 22:13:06
    1 yolov4网络结构 2 特征图尺寸变化 3 网络块 3.1 CSPn 3.2 SPP

    1 yolov4网络结构

    在这里插入图片描述

    2 特征图尺寸变化

    在这里插入图片描述

    3 网络块

    3.1 CSPn

    在这里插入图片描述

    3.2 SPP

    在这里插入图片描述

    展开全文
  • YOLOv4结构图 绘制过程参考了@木盏 该博主的思路 YOLOv3 结构图见下方链接 https://blog.csdn.net/leviopku/article/details/82660381 可能有错误之处,欢迎大家批评指正 图1 YOLOv4 的基本模块 图2 YOLOv4 ...

    YOLOv4结构图
    绘制过程参考了@木盏该博主的思路
    YOLOv3 结构图见下方链接

    https://blog.csdn.net/leviopku/article/details/82660381

    可能有错误之处,欢迎大家批评指正
    在这里插入图片描述图1 YOLOv4 的基本模块

    图1的每个模块的具体解释如下:

    (1) 空间金字塔池化(SPP,Spatial Pyramid Pooling)板块,目的主要是解决图像的纵横比(Ratio Aspect) 和输入图像的尺寸改变的情况,而不至于扭曲原始的图像,因此SPP的显著特点是使用多个窗口,用同一图像不同尺寸(Scale)作为输入,得到同样长度的池化特征,产生固定大小的输出。由于对输入图像的不同纵横比和不同尺寸,SPP同样可以处理,所以提高了图像的尺度不变(Scale-invariance)和降低了过拟合(Over-fitting),SPP对于特定的CNN网络设计和结构是独立的,只要把SPP放在最后一层卷积层后面,对网络的结构是没有影响, 只是替换了原来的池化层(Pooling layer)。

    (2) CSPDarknetconv2D_BN_Mish_block板块,是YOLOv4的基本组件。即卷积层加上BN层加上Mish[16]激活函数层。2019年Misra提出的Mish作为新的深度学习激活函数,该在最终准确度上比Swish(+494%)和ReLU(+1.671%)都有提高。同时YOLOv4在路径聚合网络(PANet,Path Aggregation Network)中继续使用v3中的带有Leaky ReLU的Conv2D_BN_Leaky_block板块。

    (3) 跨阶段局部块( CSP_block,Cross Stage Partial_block)是v3的残差块上的改进策略,运用了CSPNet上的设计。可以看到,相比于v3时单独的残差块,特征送入残差块之前的同时传播到了另一卷积块,二者输出后通过Concat乘法融合拼接,CSPNet这种设计的主要目的是在减少计算量的同时实现更丰富的梯度组合。这一目标是通过将基础层的特征映射划分为两部分,然后通过提出的跨阶段层次结构将它们合并。是过对梯度流的分裂使梯度流通过不同的网络路径传播。通过切换级联和转换步骤,传播的梯度信息可以具有很大的相关性差异。另外,CSPNet可以大大减少计算量,提高计算验证的速度和准确性。

    (4) 剩余部分的残差块和残差单元保持和YOLOv3所使用的结构相同,应用到v4当中的跨阶段局部块(CPSblock)。
    在这里插入图片描述 图2 YOLOv4 结构图

    展开全文
  • yolov3、yolov4可视化结构图,详细的yolov3、yolov4完整入门讲解在博客首页,包括yolov4详细的讲解,以及和yolov3不同之处。
  • AlexeyAB大神继承了YOLOv3, 在其基础上进行持续开发,将其命名为YOLOv4。并且得到YOLOv3作者Joseph Redmon的承认,下面是Darknet原作者的在readme中更新的声明。Darknet原作者pjreddie在readme中承认了YOLOv4来看看...

    AlexeyAB大神继承了YOLOv3, 在其基础上进行持续开发,将其命名为YOLOv4。并且得到YOLOv3作者Joseph Redmon的承认,下面是Darknet原作者的在readme中更新的声明。

    26be465c0e27f54d1c599db74d2bce69.png
    Darknet原作者pjreddie在readme中承认了YOLOv4

    来看看YOLOv4和一些SOTA模型的对比,YOLOv4要比YOLOv3提高了近10个点。

    b129291a333811012d135d803bbd1a1b.png
    FPS vs AP

    1. 思维导图

    YOLOv4总体上可以划分为两部分,一部分是讲Bag of freebies和Bag of Specials; 另外一部分讲的是YOLOv4的创新点。

    9a9cd21d54ba4c0bfe7295cccd93c1fd.png
    YOLOv4的思维导图

    Bag of freebies和Bag of specials涉及到的大部分trick在GiantPandaCV公众号历史文章中都有介绍,所以不一一列举,主要讲一下YOLOv4的创新点。

    2. 创新点

    1. Mosaic数据增强方法
    07c285133bac29206a0429eadd0df3fc.png
    镶嵌数据增强方法

    这个方法在解析U版YOLOv3的时候就讲过了,将4张不同的图片镶嵌到一张图中,其优点是:

    • 混合四张具有不同语义信息的图片,可以让检测器检测超出常规语境的目标,增强模型的鲁棒性。
    • 由于BN是从四张图片计算得到的,所以可以减少对大的mini-batch的依赖。

    评价:这个方法在U版YOLOv3中很早就出现了,在自己数据集上也用过,但是感觉效果并不是很稳定。笔者数据集只有一个类,所以可能不需要这种特殊的数据增强方法,欢迎各位读者通过自己的实验来验证这个数据增强方法的有效性。

    1. Self-Adversarial Training

    自对抗训练也是一种新的数据增强方法,可以一定程度上抵抗对抗攻击。其包括两个阶段,每个阶段进行一次前向传播和一次反向传播。

    • 第一阶段,CNN通过反向传播改变图片信息,而不是改变网络权值。通过这种方式,CNN可以进行对抗性攻击,改变原始图像,造成图像上没有目标的假象。
    • 第二阶段,对修改后的图像进行正常的目标检测。

    评价:笔者对对抗领域不是很熟悉,不是很理解这个部分。感觉这个部分讲解不是很详细,只是给出整个过程和描述,不是很能理解。

    1. CmBN
    c15c4e1dad723bb836d374d36f766c5e.png
    BN、CBN、CmBN示意图

    上图表达的是三种不同的BN方式,理解的时候应该从左往右看,BN是对当前mini-batch进行归一化。CBN是对当前以及当前往前数3个mini-batch的结果进行归一化。而本文提出的CmBN则是仅仅在这个Batch中进行累积。

    评价:在消融实验中,CmBN要比BN高出不到一个百分点。感觉影响不是很大。

    1. modified SAM
    940e0ca05137d3b3bcbc9edfd38c3c95.png
    modified SAM

    SAM实际上是之前解读的系列中的CBAM, CBAM含有空间注意力机制和通道注意力机制, SAM就是其中的空间注意力机制.

    d7cedc706c8c257f2a74b1fa2084fcf1.png
    CBAM中的SAM

    本文将Spatial-wise Attention变为Point-wise Attention, modified SAM中没有使用pooling, 而是直接用一个卷积得到的特征图直接使用Sigmoid进行激活, 然后对应点相乘, 所以说改进后的模型是Point-wise Attention.

    评价: 作者并没有给出改进后的SAMSAM的实验对比,所以并不清楚这个模块的性能到底怎样. 并且在yolov4.cfg中没有发现使用SAM的痕迹, 这非常奇怪..不知道作者将SAM用到了模型的哪个部分.

    1. modified PANet
    7919d7a134ec0d72f0fdeedb7302a58f.png
    Modified PANet

    PANet融合的时候使用的方法是Addition, 详解见:CVPR 2018 PANet

    这里YOLOv4将融合的方法由加法改为乘法,也没有解释详细原因,但是yolov4.cfg中用的是route来链接两部分特征。

    3. 结构

    YOLOv4的模型结构笔者读了一下yolov4.cfg文件,然后根据结构画出了大体结构。

    9ce57d14194e76bc1269be1b1272ddb6.png
    YOLOv4简化结构图

    其中没有详细展开backbone部分,其实backbone之前在解读CSPNet的时候就讲过了,YOLOv4使用的是CSPDarknet53作为Backbone。

    4. 总结

    读了这篇文章以后,给人留下深刻印象的不是创新点,而是Bag of freebies和Bag of specials。所以有人多人都说YOLOv4是拼凑trick得到的。YOLOv4中Bag of freebies和Bag of Specials两部分总结的确实不错,对研究目标检测有很大的参考价值,涵盖的trick非常广泛。但是感觉AB大神并没有将注意力花在创新点上,没有花更多篇幅讲解这创新性,这有些可惜。(ASFF中就比较有侧重,先提出一个由多个Trick组成的baseline,然后在此基础上提出ASFF结构等创新性试验,安排比较合理)

    此外,笔者梳理了yolov4.cfg并没有发现在论文中提到的创新点比如modified SAM, 并且通过笔者整理的YOLOv4结构可以看出,整体架构方面,可以与yolov3-spp进行对比,有几个不同点:

    • 换上了更好的backbone: CSDarknet53
    • 将原来的FPN换成了PANet中的FPN

    结构方面就这些不同,不过训练过程确实引入了很多特性比如:

    • Weighted Residual Connections(论文中没有详细讲)
    • CmBN
    • Self-adversarial-training
    • Mosaic data augmentation
    • DropBlock
    • CIOU loss

    总体来讲,这篇文章工作量还是非常足的,涉及到非常非常多的trick, 最终的结果也很不错,要比YOLOv3高10个百分点。文章提到的Bag of freebies和Bag of specials需要好好整理,系统学习一下。

    但是缺点也很明显,创新之处描述的不够,没能有力地证明这些创新点的有效性。此外,yolov4.cfg可能并没有用到以上提到的创新点,比如SAM。

    一家之言,欢迎大佬在文末留言讨论。

    5. 参考

    https://arxiv.org/pdf/2004.10934.pdf

    https://github.com/AlexeyAB/darknet

    对文章有疑问,可以解答SAM相关问题的欢迎在此处留言:

    点击此处留言

    想加入CV交流群进行交流的,欢迎添加笔者微信号,备注“CV交流”

    a071440cd9f896bae1a4a592b62b643c.png

    展开全文
  • 先放上YOLOv3和YOLOv4结构图,好有个大致的思路: YOLOv3: YOLOv4: 图中的说明: 1. Concat:张量拼接,会扩充两个张量的维度,例如2626256和2626512两个张量拼接,结果是2626768。Concat和cfg文件中的route功能...

    YOLOv4结构以及用到的tricks与创新总结

     本文参考了几位大佬的文章,然后作了下总结。(文中用到的图大部分来源于他们的文章,还有各算法对应的论文)文末参考链接附有这几位大佬的博客地址。
    这里顺便附上我在B站录的一个视频链接(结合了netron库可视化了yolov4的结构讲解):
    yolov4结构快速讲解(包会,不会我也没法哈哈)
    可在看完这篇博客后看,看完后yolov4的结构你就掌握了。

    先放上YOLOv3和YOLOv4的结构图,好有个大致的思路:

    YOLOv3:

    在这里插入图片描述

    YOLOv4:

    在这里插入图片描述
    图中的说明:
    1. Concat:张量拼接,会扩充两个张量的维度,例如2626256和2626512两个张量拼接,结果是2626768。Concat和cfg文件中的route功能一样。
    2. add:张量相加,张量直接相加,不会扩充维度,例如104104128和104104128相加,结果还是104104128。add和cfg文件中的shortcut功能一样。

    讲YOLOv4之前先来简单说下YOLOv3:

    YOLOv3改进之处:

    1. 多尺度预测:引入FPN,结合了3个尺度进行特征融合。
    2. 更好的基础分类网络Darknet-53,类似ResNet引入了残差结构。
    3. Softmax层被替换成一个1x1的卷积层+logistic激活函数的结构。
    分类损失采用binary cross-entropy loss(二分类交叉损失熵)
    4. Tiny-YOLOv3主要区别就是:只结合2个尺度进行特征融合。

    YOLOv4改进之处:

    YOLOv4的特点是集大成者,用到了相当多的tricks。
    文章将目前主流的目标检测器框架进行拆分:input、backbone、neck 和 head.

    总结一下YOLOv4框架:
    Backbone:CSPDarknet53
    Neck:SPP,FPN+PAN
    Head:YOLOv3
    YOLOv4 = CSPDarknet53 + SPP + (FPN+PAN) + YOLOv3

    本文主要从以上4个部分对YoloV4的创新之处进行讲解,让大家一目了然。
    (各部分有超链接直接点击即可跳到文中相应位置)

    1. 输入端:这里指的创新主要是训练时对输入端的改进,主要包括Mosaic数据增强cmBNSAT自对抗训练
    2. BackBone主干网络:将各种新的方式结合起来,包括:CSPDarknet53Mish激活函数Dropblock
    3. Neck:目标检测网络在BackBone和最后的输出层之间往往会插入一些层,比如Yolov4中的SPP模块FPN+PAN结构
    4. 预测端:输出层的锚框机制和Yolov3相同,主要改进的是训练时的损失函数CIOU_Loss,以及预测框筛选的nms变为DIOU_nms

    Mosaic数据增强(输入端部分):

    在这里插入图片描述
     Yolov4中使用的Mosaic是参考2019年底提出的CutMix数据增强的方式,但CutMix只使用了两张图片进行拼接,而Mosaic数据增强则采用了4张图片,随机缩放、随机裁剪、随机排布的方式进行拼接。
    使用原因:
     在平时项目训练时,小目标的AP一般比中目标和大目标低很多。而Coco数据集中也包含大量的小目标,但比较麻烦的是小目标的分布并不均匀。所以为了平衡小、中、大目标的占比数量。
    优点:
    1.扩充了数据集:随机使用4张图片随机拼接,且通过随机缩放可以获得很多小目标,让网络的鲁棒性更好。
    2.减少GPU:因为使用Mosaic增强进行训练时,4张图片被整合成一张图片,这样一来可以使mini-batch大小并不用很大,这样一个GPU就能达到比较好的效果。

    CmBN交叉小批量标准化(输入端部分):

    在这里插入图片描述
     上图为BN的处理过程,BN是对当前mini-batch进行归一化。
     CBN则是对当前及其前3个batch的结果进行归一化。且利用了泰勒多项式对前3次统计数据进行了补偿(因为每个batch都更新了一次参数,所以这4个batch的使用的是不同网络参数,所以这里才做补偿)。
     CmBN是CBN的改进,其区别在于其区别在于权重更新时间点不同。CBN是针对batch来说的,因为同一个batch内权重参数一样,因此计算不需要进行补偿。而CmBN是针对mini-batch来说的,其仅仅收集单个batch中的mini-batch之间的统计数据。(这里不太确定,应该是这样吧?)
    在这里插入图片描述

    SAT,Self-adversarial-training自对抗训练(输入端部分):

    自对抗训练(SAT)也是一种新的数据增强方法,它包括两步。
    1.利用原始图像生成对抗样本。
    2.通过在原有的模型训练过程中注入对抗样本,从而提升模型对于微小扰动的鲁棒性。

    Mish激活函数(backbone主干网络部分):

    Mish:x * tanh(ln(1+e^x))
    在这里插入图片描述
     ReLU和Mish的对比,Mish的梯度更平滑。相比之下,Mish能更好地保持准确性,这可能是因为它能更好地传播信息。平滑的激活函数允许更好的信息深入神经网络,从而得到更好的准确性和泛化。(具体的可以看mish论文)
    作者只在Backbone中采用了Mish激活函数,网络后面仍然采用Leaky_relu激活函数。

    CSPDarknet53(backbone主干网络部分):

    在这里插入图片描述
     我们先来看看CSP论文里的图,它是对比了DenseNet和CSPDenseNet。
     Yolov4在Backbone部分的一个主要改进点就是在ResBlock部分采用了CSP,相比较于原始的ResBlock,CSP将输入的特征图按照channel进行了切割,只使用原特征图的一半输入到残差网络中进行前向传播,另一半在最后与残差网络的输出结果直接进行按channel拼接(concatenate),这样做的好处在于:
    1、输入只有一半参与了计算,可以大大减少计算量和内存消耗;
    2、反向传播过程中,增加了一条完全独立的梯度传播路径,梯度信息不存在重复利用,如下图所示:
     下图为YOLOv4中的CSP块:
    在这里插入图片描述
     下图是我用netron可视化的yolov4的第一个CSP块,然而他并没有将特征图按channels平分送入两支路,而是直接将原特征图分别送入两支路,最后再concat。(所以作者知识借鉴了cspnet的思路,也许这样不平分可以保证特征的复用性,这里不太懂为啥没平分,不过作者这样做确实提高了模型的性能,说明有效)
    在这里插入图片描述

     下面对比一下darknet53(YOLOv3中采用),CSPdarknet53(YOLOv4中采用):
    在这里插入图片描述
    在这里插入图片描述

     说明一下:关于图中各模块的解释看最上面的YOLOv4总结构图。
     注意:YOLO V4使用时删去了最后的池化层、全连接层以及Softmax层
    CSPdarknet53优点:

    1.增强CNN的学习能力,使得在轻量化的同时保持准确性。
    2.优点二:降低计算瓶颈
    3.优点三:降低内存成本

    Dropblock(backbone主干网络部分):

     dropout的主要问题就是随机drop特征,这一点在FC层是有效的,但在卷积层是无效的效果并不好,因为卷积层的特征是空间相关的。当特征相关时,即使有dropout,信息仍能传送到下一层,导致过拟合。
    DropBlock是dropout的一种结构化形式。在DropBlock中,特征在一个block中,例如一个feature map中的连续区域会一起被drop掉(因为连续的区域它们之间的信息密切相关,删除连续的区域可以删除某些语义信息)。当DropBlock抛弃掉相关区域的特征时,为了拟合数据网络就不得不往别处寻找新的特征。(具体实现可以看dropblock论文)
    在这里插入图片描述

    SPP模块(Neck部分):

    YOLOv4中的SPP是在backbone和prediction之间的neck部分。neck部分是为了更好地提取融合特征,提升模型性能。
    在这里插入图片描述
     作者在SPP模块中,使用k={11,55,99,1313}的最大池化的方式,再将不同尺度的特征图进行Concat操作(即channels堆叠)。
     注意:这里最大池化采用padding操作,移动的步长为1,比如13×13的输入特征图,使用5×5大小的池化核池化,padding=2,因此池化后的特征图仍然是13×13大小。
    采用SPP模块的方式,比单纯的使用k*k最大池化的方式,更有效的增加主干特征的接收范围,显著的分离了最重要的上下文特征。

    FPN+PAN模块(Neck部分):

     FPN其实就是不同尺度特征融合预测,PAN是借鉴图像分割领域的PANet的创新点。Alexey将其拆分应用到Yolov4中,进一步提高特征提取的能力。。
     FPN结构我在我的另一篇博客有讲:FPN (feature pyramid network)特征金字塔网络
     这里直接根据YOLOv4中的FPN分析。再来看看YOLOv4的图:
    在这里插入图片描述
     可以看到经过几次下采样(CSPDarknet53中讲到,每个CSP模块前面的卷积核都是33大小,步长为2,相当于下采样操作),三个紫色箭头指向的地方,输出分别是7676、3838、1919。
    以及最后的Prediction中用于预测的三个特征图①1919255、②3838255、③7676255。[注:255表示80类别(1+4+80)×3=255]
     我们将Neck部分用立体图画出来,更直观的看下两部分之间是如何通过FPN+PAN结构融合的。
     (左:特征正常传递路径,中:FPN,右:引入了PAN(图中有两处用了PAN结构))
    在这里插入图片描述
     FPN层自顶向下传达强语义特征,而PAN则自底向上传达强定位特征(因为低级特征图还没有被下采样那么多,所以保留的定位信息肯定完整一点咯,而高层特征被下采样多次,更多地体现出的是较为高级抽象的语义信息咯),两两结合实属牛掰。
     PAN这里还有一点需要注意:
     原本的PANet网络的PAN结构中,两个特征图结合是采用shortcut操作(即add相加),而Yolov4中则采用concat(route)操作(即channels堆叠),特征图融合后的尺寸发生了变化。
    在这里插入图片描述

    CIOU_LOSS+DIOU_NMS(预测端部分):

    一般来说,目标检测的LOSS = 分类LOSS + BBOX回归LOSS。
    一个好的BBOX回归LOSS应该考虑三个重要几何因素:重叠面积、中心点距离,长宽比。
    近年BBOX回归LOSS的发展

    1. Smooth L1 LOSS
    2. IOU LOSS(2016)
    3. GIOU LOSS(2019)
    4. DIOU LOSS(2020)
    5. CIOU LOSS(2020)

    下面分别介绍这几种IOU LOSS:

    1.IOU LOSS(2016)

    在这里插入图片描述

    在这里插入图片描述
    IOU很简单就是交并比而已。
    在这里插入图片描述
    但存在如上图这两种情况的问题:
    问题1:无法优化两个框不相交的情形,当IOU为0时无法衡量两框之间的相对距离,此时LOSS不可导。
    问题2:如图状态2、3他们的IOU值是相同的,但IOU无法区分两者。

    2.GIOU LOSS(2019)

    在这里插入图片描述

    在这里插入图片描述
    GIOU虽然增加了衡量相交情况的方式,但是还是存在不足。
    在这里插入图片描述
    如图这种情况,它们的GIOU都是相同的,这时不就跟IOU一个样,区分不了位置关系。

    3.DIOU LOSS(2020)

    针对IOU和GIOU的问题,DIOU综合考虑了重叠面积,中心点距离。当目标框包裹预测框的时候,直接度量2个框的距离,因此DIOU_Loss收敛的更快。
    在这里插入图片描述

    在这里插入图片描述
    但问题是DIOU没有考虑到长宽比,如图:
    在这里插入图片描述
    如图它们的中心点距离相同,所以DIOU也是相同的。

    4.CIOU LOSS(2020)

    DIOU LOSS在CIOU LOSS的基础上增加了一项,将预测框和目标框的长宽比都考虑了进去:
    在这里插入图片描述
    在这里插入图片描述

    再来综合的看下各个Loss函数的不同点:
    IOU_Loss:主要考虑检测框和目标框重叠面积。
    GIOU_Loss:在IOU的基础上,解决边界框不重合时的问题。
    DIOU_Loss:在IOU和GIOU的基础上,考虑边界框中心点距离的信息。
    CIOU_Loss:在DIOU的基础上,考虑边界框宽高比的尺度信息。
    Yolov4中采用了CIOU_Loss的回归方式,使得预测框回归的速度和精度更高一些。

    DIOU_NMS

    为啥用CIOU LOSS 不用CIOU NMS呢?
     因为前面讲到的CIOU_loss,是在DIOU_loss的基础上,添加的影响因子,包含目标框ground truth的信息,在训练时用于回归。但在测试阶段,我们是没有ground truth的,所以不用CIOU LOSS新增加的项,即直接用DIOU LOSS。


    EndEndEndEndEndEndEndEndEndEndEndEndEndEndEndEndEndEndEndEnd

      
      

    参考链接:

    1. 深入浅出Yolo系列之Yolov3&Yolov4&Yolov5核心基础知识完整讲解
    2. Yolov4技巧学习
    3. Yolov4论文翻译与解析(二)

    有问题欢迎评论区指出,thanks!!!

    展开全文
  • 一、yolov4中的基础结构: 1.Dark layer 2.rCSP(普通结构without SPP): 3.rCSP(SPP) 4.CSPUP 二、三种yolov4结构对比: 三、yolov4-tiny的基础结构: 主要目的是分析一下各种yolov4结构,不解析原理,...
  • 睿智的目标检测30——Pytorch搭建YoloV4目标检测平台

    万次阅读 多人点赞 2020-05-24 14:14:13
    睿智的目标检测30——Pytorch搭建YoloV4目标检测平台学习前言什么是YOLOV4代码下载YOLOV4改进的部分(不完全)YOLOV4结构解析1、主干特征提取网络Backbone2、特征金字塔3、YoloHead利用获得到的特征进行预测4、预测...
  • yolov3和yolov4网络结构

    千次阅读 2020-06-22 19:38:15
    yolov4和yolov3网络结构对比yolov4网络结构架构图yolov4主干特征提取网络yolov3网络结构yolov3主干特征提取网络(Darknet53)效果图对比网络计算参数对比yolov4网络参数计算yolov3网络参数计算 yolov4网络结构 架构...
  • 可视化yolov4-tiny和yolov4网络结构

    千次阅读 热门讨论 2020-06-28 16:49:12
    参考这篇博客:netron。以下通过该工具显示了yolov4-tiny和yolov4的网络结构
  • YOLOv4网络结构

    千次阅读 2020-05-30 15:10:40
    YOLOv4的出现引起了一定的轰动,在保持快速检测的前提下(相...最近准备用YOLOv4,顺便学习一下网络结构(虽然YOLOv4的主要优势可能不在这里),这边作个笔记。 图1. yolov4完整网络结构(backbone + head) ...
  • 早上刷到YOLOv4之时,非常不敢相信这是真的!今明两天各大公众号肯定要炸锅了!论文:https://arxiv.org/pdf/2004.10934.pdf源码:https://github.com/AlexeyAB/darknet核心中的核心:作者将Weighted-Residual-...
  • Yolov4网络结构与源码分析 从2018年Yolov3年提出的两年后,在原作者声名放弃更新Yolo算法后,俄罗斯的Alexey大神扛起了Yolov4的大旗。 文章目录 论文汇总 Yolov3核心基础内容 2.1 网络结构可视化 2.2 网络结构...
  • Yolov4网络结构

    千次阅读 2020-04-26 00:53:35
    结构图 目前官方放出的cfg配置文件网络结构为CSPDarknet53+PAnet-SPP+Yolov3 head 结构,根据权重文件做出的网络结构图如下:
  • 最详细的YOLOv4网络结构解析

    万次阅读 多人点赞 2020-05-14 18:10:28
    这里写目录标题1. 概述2. 网络分块解析2.1 CSPDarknet53实现2.2 SPP实现2.3 PANet实现 1. 概述 现阶段的目标检测器主要由4部分组成: ...在官方给出的cfg文件中,我们可以看到YOLOv4网络每一层的输出,每一层l
  • 摘要YOLOV4在coco上面达到了43.5%AP ,在Tesla V100 上达到了65FPS。相比今年的其它模型,得分不算高,但是它不是通过提高输入图像的分辨率来提高得分的,而是改进网络结构。创新点主要有以下几个方面:(1)输入端:...
  • 最强目标检测算法YOLOv4论文解读本文仅为笔者个人浅显的理解,如各位发现有误的地方欢迎指正。一、概述YOLO v4中,作者做了很多实验,把近年比较火的一些方法加入YOLO中,最终取得了速度和精度的提升。通过了解YOLO ...
  • YOLOV4网络结构总结

    2020-12-28 15:00:58
    YOLO V4的论文链接在这里,名为《YOLOv4: Optimal Speed and Accuracy of Object Detection》,相信大家也是经常看到这几个词眼:大神接棒、YOLO V4来了、Tricks 万花筒等等。 阅读YOLO V4的原文,我觉得它更像一篇...
  • YOLOV4结构解析1,YOLOV4改进的部分(不完全)2、主干特征提取网络Backbone3、特征金字塔4、YoloHead利用获得到的特征进行预测5,补充5.1 yolov4可视化结构(很长)5.2 yolov3结构何yolov4结构对比5.4 yolov4 思维...
  • yolov4网络结构

    2020-07-30 08:54:58
  • Yolov3&Yolov4&Yolov5模型权重及网络结构图资源下载

    万次阅读 多人点赞 2020-08-09 10:27:27
    Yolov4的《深入浅出Yolo系列之Yolov3&Yolov4核心基础完整讲解》 (2)Yolov5的《深入浅出Yolo系列之Yolov5核心基础完整讲解》 其中提到很多网络模型的权重,由于不是国内资源,很多同学反馈不好下载。 而且文章...
  • 需要学习ubuntu系统上YOLOv4的同学请前往:《YOLOv4目标检测实战:原理与源码解析》 YOLOv4是最近推出的基于深度学习的端到端实时目标检测方法。 YOLOv4的实现darknet是使用C语言开发的轻型开源深度...
  • Yolov4核心知识梳理,分享给大家。文章较长,建议先码住。作者:江大白原文链接:https://zhuanlan.zhihu.com/p/143747206因为工作原因,项目中经常遇到目标检测的任务,因此对目标检测算法会经常使用和关注,比如...
  • 1.YOLOv4网络结构
  • PAN原理:a(FPN 结构) b(自下而上的路径扩充) 注意点:原PAN论文中是 add,yolov4论文中是 concate 4) Prediction:训练时的损失函数 CIOU_Loss,预测框筛选的nms变为 DIOU_nms CIOU Loss 考虑:重叠面积、中心...
  • 这篇文章讲解的很详细了,我也是在某天正在看yolov4作者论文的时候发现一个公众号推送这篇文章,打开一看,瞬间对yolov4的整个网络结构了解了,之前看论文,其实对整个网络结构只有一个大概的理解,但是看完这篇文章...
  • 结构图由netron工具打开制作而成,浏览器中输入链接:https://lutzroeder.github.io/netron/ 即可进入netron在线工具,打开yolov4.cfg即可画出网络结构
  • yolov4剪枝后网络结构配置文件

空空如也

空空如也

1 2 3 4 5 ... 17
收藏数 324
精华内容 129
关键字:

yolov4结构