精华内容
下载资源
问答
  • 图像标注的简介
    千次阅读
    2021-03-14 20:20:32

    本文从五个需要进行标注的计算机视觉任务(物体检测、线/边缘检测、分割、姿态预测、图像分类)给大家介绍图像标注的种类,应用场景,以及各种标注的优缺点。

    1. 介绍

    每个数据科学任务都需要数据。具体地说,是输入系统的干净易懂的数据。说到图像,计算机需要看到人类眼睛看到的东西。

    例如,人类有识别和分类物体的能力。同样,我们可以使用计算机视觉来解释它接收到的视觉数据。这就是图像标注的作用。

    图像标注在计算机视觉中起着至关重要的作用。图像标注的目标是为和任务相关的、特定于任务的标签。这可能包括基于文本的标签(类),绘制在图像上的标签(即边框),甚至是像素级的标签。我们将在下面探讨这一系列不同的标注技术。

    人工智能需要的人工干预比我们想象的要多。为了准备高精度的训练数据,我们必须对图像进行标注以得到正确的结果。数据注释通常需要较高水平的领域知识,只有来自特定领域的专家才能提供这些知识。

    需要标注的计算机视觉任务:

    • 物体检测

    • 线/边缘检测

    • 分割

    • 姿态预测/关键点识别

    • 图像分类

    2. 目标检测

    进行目标检测的技术主要有两种,即2D和3D包围框。

    对于多边形物体,可以使用多边形方法。让我们详细讨论一下。

    2.1 2D 包围框

    在这种方法中,只需要在被检测的物体周围绘制矩形框。它们用于定义对象在图像中的位置。边框可以由矩形左上角的x、y轴坐标和右下角的x、y轴坐标来确定。
    在这里插入图片描述
    优点和缺点:

    • 标注起来快速和容易。
    • 不能提供重要的信息,如物体的方向,这对许多应用来说是至关重要的。
    • 包括不属于物体一部分的背景像素。这可能会影响训练。

    2.2 3D 包围框或者立方体

    类似于2D边框,除了它们还可以显示目标的深度。这种标注是通过将二维图像平面上的边界框向后投影到三维长方体来实现的。它允许系统区分三维空间中的体积和位置等特征。

    **优点和缺点:**

    优点和缺点:

    • 解决了物体方向的问题。
    • 当物体被遮挡,这种标注可以想象包围框的维度,这可能会影响训练。
    • 这种标注也会包括背景像素,可能会影响训练。

    2.3 多边形

    有时,必须标记形状不规则的物体。在这种情况下,使用多边形。注释时只需标记物体的边缘,我们就能得到要检测的物体的完美轮廓。
    在这里插入图片描述
    优点和缺点:

    • 多边形标记的主要优点是它消除了背景像素,并捕获了物体的精确尺寸。
    • 非常耗时,如果物体的形状是复杂的,很难标注。

    3. 线/边缘检测(线和样条)

    在划分边界时,线和样条是有用的。将区分一个区域和另一个区域的像素进行标注。
    在这里插入图片描述
    优点和缺点:

    • 这种方法的优点是,连线上的像素不需要都是连续的。这样在检测有中断的线或部分遮挡的物体是非常有用的。
    • 手动标注图像中的线是非常累人和费时的,特别是图像中有很多的线的时候。
    • 当物体碰巧是对齐的时候,可能会给出误导的结果。

    4. 姿态预测 / 关键点识别

    在许多计算机视觉应用中,神经网络常常需要识别输入图像中重要的感兴趣的点。我们把这些点称为地标或关键点。在这种应用中,我们希望神经网络输出关键点的坐标(x, y)。
    在这里插入图片描述

    5. 分割

    图像分割是将一幅图像分割为多个部分的过程。图像分割通常用于在像素级定位图像中的物体和边界。图像分割方法有很多种。
    在这里插入图片描述
    语义分割: 语义分割是一项机器学习任务,它需要像素级标注,其中图像中的每个像素都被分配给一个类。每个像素都带有语义意义。这主要用于环境背景非常重要的情况。

    实例分割: 实例分割是图像分割的一种子类型,它在像素级别上标识图像中每个物体的每个实例。实例分割和语义分割是图像分割的两种粒度级别之一。

    全景分割: 全景分割结合了语义分割和实例分割,所有像素都被分配一个类标签,所有目标实例都被唯一地分割。

    6. 图像分类

    图像分类不同于目标检测。目标检测的目的是识别和定位目标,而图像分类的目的是识别和识别特定的目标类。这个用例的一个常见示例是对猫和狗的图片进行分类。标注者必须为一只狗的图像分配一个类标签“dog”,对猫的图像分配类标签“cat”。
    在这里插入图片描述

    7. 图像标注的用例

    下面,我们将讨论如何使用图像标注来帮助机器模型执行特定行业的任务:

    • 零售: 2D边框可以用于标注产品的图像,然后机器学习算法可以使用这些图像来预测成本和其他属性。图像分类在这方面也有帮助。
    • 医学: 多边形可用于在医用x射线中标记器官,以便将它们输入深度学习模型,以训练x射线中的畸形或缺陷。这是图像标注最重要的应用之一,需要医学专家具有较高的领域知识。
    • 自动驾驶汽车: 这是另一个重要的领域,图像标注可以应用。利用语义分割对图像中的每个像素进行标记,使车辆能够感知到道路上的障碍物。这一领域的研究仍在进行中。
    • 情绪检测: 这是里程碑,可以用来检测一个人的情绪(高兴,悲伤,或自然)。这可以应用于评估受试者对特定内容的情绪反应。
    • 制造行业: 线和样条可用于标注工厂的图像线跟随机器人工作。这可以帮助自动化生产过程,人力劳动可以最小化。

    8. 图像标注的一些挑战

    • 时间复杂度: 手工标注图像需要很多时间,机器学习需要大量的数据集,需要大量的时间来有效地标注这些基于图像的数据集。
    • 计算复杂度: 机器学习需要精确标注的数据来运行模型。如果标注者在给图像做标注的时候,注入任何一种错误,都可能会影响到训练,所有的努力都可能付诸东流。
    • 领域知识: 如前所述,图像标注通常需要特定领域的高级领域知识。因此,我们需要知道该标注什么的注解者,以及该领域的专家。

    9. 最后

    更多相关内容
  • 资源总共包含2257张火灾、烟雾图像标注仔细,质量是经过严格把控的,已经标注成voc和yolo两种格式,开箱即用。
  • 资源总共包含319张鸟窝图像,自己外出拍摄,标注仔细,质量是经过严格把控的,已经标注成voc和yolo两种格式,开箱即用
  • 资源总共包含2257张火灾、烟雾图像标注仔细,质量是经过严格把控的,已经标注成voc和yolo两种格式,开箱即用
  • 资源总共包含1998张挖掘机图像标注仔细,质量是经过严格把控的,已经标注成voc和yolo两种格式,开箱即用
  • 图像标注工具

    2018-05-21 15:43:07
    yolo训练图片标注工具,windows下使用,免安装,使用起来非常方便。
  • 资源总共包含2231张吊车图像标注仔细,质量是经过严格把控的,已经标注成voc和yolo两种格式,开箱即用
  • Qt C++版深度学习图像标注工具,安装版的文件,支持目标定位、图像分割,四点、多点标注,生成XML、Json文件,有问题、bug欢迎留言xuting193@163.com
  • labelme -图像标注工具window系统-支持win10
  • 资源总共包含806张俯视角度下的安全帽和人的视频抽帧图像,每隔30帧抽取1帧,防止图片重复,标注仔细,质量是经过严格把控的,已经标注成voc和yolo两种格式,开箱即用
  • Semi Automatic Image Annotation Toolbox:基于RetinaNet算法的半自动图像标注工具。该工具箱使用基于MS COCO数据集预训练的RetinaNet模型能建议80个类对象。
  • 深度学习图像标注工具支持目标定位、图像分割,四点、多点标注,本文件是直接可运行的文件,不需要安装,支持XML、Json格式
  • HyperLabelImg:开源图像标注工具(支持人脸关键点不规则四边形标注)
  • 图像标注工具,参考了VIA及labelme等标注软件,由C#编写,支持矩形及多边形的数据标定,为了制作数据集用来做实例分割等深度学习算法训练,特编写了次软件,本着开源精神,代码一起奉上。分享给需要的好朋友们。
  • 在深度学习的模型训练时,需要大量的带有标注的样本,人工标注是一样费时又费力的工作,LabelImg是为此而推出的一款便捷的标注工具,操作简单,效果良好。
  • YOLO快速图像标注工具

    2018-11-09 10:26:55
    YOLO快速图像标注工具,里面附有使用说明书。资源并非自己原创,如果造成侵权,请私信我(我会主动删除)。
  • 人工智能深度学习技术在辅助青光眼性眼底病变图像标注中的应用研究.pdf
  • Python实现对图像标注、训练、识别.zip
  • 针对半监督特征选择算法进行了研究,采用有标签图像和无标签图像的半监督特征选择方法来提升网络图像标注的性能。基于二阶Hessian 能提出一个新的半监督特征选择方法,该方法具有更好的局部拓扑结构保持特性和推断...
  • 图像标注程序和说明

    2018-11-30 19:59:01
    深度学习图像分割(FCN)训练自己的模型大致可以以下三步: 1.为自己的数据制作label; 2.将自己的数据分为train,val和test集; 3.仿照voc_lyaers.py编写自己的输入数据层。
  • 基于深度学习的图像标注.pdf
  • 图像自动标注技术是减少图像数据与内容之间“语义鸿沟”的其中一种最有效途径,对于帮助人类理解图像内容,从海量图像数据中检索感兴趣的...通过研究近20年公开发表的图像标注文献,总结了图像标注模型的一般性框架。
  • 做的一个小项目,图像标注说明系统,完整的源码。互相学习。
  • 基于深度学习的结构化图像标注研究.pdf
  • 一种新的基于语义聚类和图算法的自动图像标注方法.pdf
  • 一种基于结构学习的图像标注方法,崔超然,马军,图像标注工作对于当前的基于关键词的图像检索系统至关重要。本文中,我们将图像标注问题看作一个最优子集选择的问题,并通过结构
  • jquery图像标注式提示插件是一款根据图像位置偏移量,增加标注,当用户鼠标移动至标注时提示信息。
  • labelImg图像标注工具

    2018-10-19 09:14:25
    labelImg是一款开源的图片标注工具,可以在上面画框和标注对应的类别,由python和Qt编写而成,将标注信息存放在xml中

空空如也

空空如也

1 2 3 4 5 ... 20
收藏数 86,946
精华内容 34,778
关键字:

图像标注