精华内容
下载资源
问答
  • 论文前奏 线程微博数据标注平台。 去做:
  • TJU_NLU:数据标注平台
  • 数据标注平台

    千次阅读 2019-07-28 23:08:06
    因为我们这个项目比较关注数据安全,他们给过来数据隔离的方案,简单地说就是标注工具和语音数据资源都在我们的服务器,人员管理和答题流程等在众智的服务器。 百度众包 在贴吧上看到百度众测比较老牌了,标注...

    京东众智

    京东众智反馈速度比较快,在官网上提交需求后下午就有客户经理给我打电话,2天就完成标注工具开发和试标了。因为我们这个项目比较关注数据安全,他们给过来数据隔离的方案,简单地说就是标注工具和语音数据资源都在我们的服务器,人员管理和答题流程等在众智的服务器。

     

    百度众包

    在贴吧上看到百度众测比较老牌了,标注类型也非常全面。对于我们公司这种情况他们也能像京东众智那样提供私有化部署,但是人员管理、结算等等都是麻烦问题。

     

    阿里数据标注

    一开始以为这家标注平台是阿里的,毕竟京东百度都有,我想阿里也应该有吧?后来才发现在官网首页最下面有一行小字:【特别说明:阿里标注与阿里集团无任何直接关系】。哈哈哈哈哈哈哈差点...

     

    龙猫数据

    这家是个数据服务商,数据各方面的服务都有做,包括数据买卖、采集、标注等等。这家平台在百度搜索上做了SEM,估计是下了本钱的,报价也稍微高一些。最终没有选择这家平台的原因是安全性不太好保证,毕竟公司比较小,而且还做数据买卖,真的有点担心。

    展开全文
  • 数据标注平台-LabelStudio

    千次阅读 2021-01-29 12:04:00
    label-studio是一个开源的数据标注、注释工具 技术: 后端纯python编写,使用了flask 前端:React + MST 存储: 本地存储 json dir-jsons task-json completions-dir Amazon AWS 简单存储服务(S3) 读取 ...

    一、简介

    label-studio是一个开源的数据标注、注释工具

    技术:

    • 后端纯python编写,使用了flask
    • 前端:React + MST

    存储:

    • 本地存储
      • json
      • dir-jsons
      • task-json
      • completions-dir
    • Amazon AWS 简单存储服务(S3)
      • 读取
        • label-studio start my_project --init --source s3 --source-path my-s3-bucket
      • 写入:
        • label-studio start my_project --init --target s3-completions --target-path my-s3-bucket
    • 谷歌云存储(GCS)
      • 读取:
        • label-studio start my_project --init --source gcs --source-path my-gcs-bucket
      • 写入:
        • label-studio start my_project --init --target gcs-completions --source-path my-gcs-bucket

    其他:

    • 没有汉化,但页面简单
    • 没有用户权限功能,只支持一个简单的页面初始的登录
      • 启动时加上用户名密码参数即可 label-studio start my_project --username user --password pwd
      • docker中设置环境变量USERNAME、PASSWORD
    • 支持多会话模式:
      • 每个会话以会话ID作为名称
      • 创建项目 label-studio start-multi-session --root-dir ./session_projects

    二、标注平台的使用

    标注步骤:

    1.设置标注任务的配置
    2.导入任务
    3.开始标注
    4.导出任务

    三、架构

    主要分为三部分:

    • label studio前端:标注
    • label studio后端:建立项目、数据导入、任务管理、数据导出
    • 机器学习后端

    架构图:
    在这里插入图片描述

    • Tasks:表示一个单独的数据集(文字、图片、音频、视频、html、数字或者混合的)
    • Completions:json格式的数据结果。可导出,在机器学习中使用
      • 支持导出的格式:
        • JSON
        • CSV、TSV
        • CoNLL 2003
          • named entity recognition
        • COCO
          • image segmentation
          • semantic segmentation
        • Pascal VOC XML
          • image segmentation
          • semantic segmentation
        • Brush Labels to Numpy & PNG
          • image segmentation
          • semantic segmentation
    • Predictions:注释过程中预标记,或者用来验证模型
    • Machine learning backend:机器学习后端,使用机器学习模型,自动学习并且预测结果
    • Labeling config:标注配置,带有标签的xml

    四、启用一个label-studio项目

    1.快速启动一个label-studio项目

    # Requires >=Python3.5, Python 3.9 is not supported
    pip install -U label-studio
    
    # Initialize the project in test_project path
    label-studio init test_project
    
    # Start the server at http://localhost:8080
    label-studio start test_project
    

    2. 通过docker来部署

    docker run --rm -p 8080:8080 -v `pwd`/test_project:/label-studio/test_project --name label-studio heartexlabs/label-studio:latest label-studio start test_project --init
    
    # docker-compose
    INIT_COMMAND='--init' docker-compose up -d
    
    • 初次启动,需要加 INIT_COMMAND=’–init’
    • 也可把INIT_COMMAND=’–init’配置到.env
    • 启用已有项目,加–force

    3. 通过项目代码部署

    python label_studio/server.py start labeling_project --init
    

    五、机器学习后端

    • 利用label-studio-ml
      • 创建、初始化创建ML后端目录
    • 启动ML后端服务
      • 用label-studio,在启动标注平台时,将项目连接到ML后端
    • 可通过API:
      • 获取预测结果
        • curl -X POST -d ‘{“text”:“some text”}’ -H “Content-Type: application/json” http://localhost:8080/api/models/predictions
      • 模型训练
        • curl -X POST http://localhost:8080/api/models/train

    官方文档地址:https://labelstud.io/guide/

    github地址:https://github.com/heartexlabs/label-studio

    展开全文
  • 数据标注平台分析与使用经验

    万次阅读 2018-10-11 11:33:49
    最近在做语音类的深度学习项目,手上有1000小时的数据需要标注,公司内部雇人标注是不太现实的,人员管理起来太麻烦,再加上项目比较紧急,所以找了几家数据标注平台,下面简单介绍一下吧。 什么是数据标注平台 ...

    最近在做语音类的深度学习项目,手上有1000小时的数据需要标注,公司内部雇人标注是不太现实的,人员管理起来太麻烦,再加上项目比较紧急,所以找了几家数据标注平台,下面简单介绍一下吧。

    什么是数据标注平台

    众所周知,数据标注得越精准、对算法模型训练的效果就越好。大部分算法在拥有足够多普通标注数据的情况下,能够将准确率提升到 95%,但从 95% 再提升到 99% 甚至 99.9% ,就需要大量高质量的标注数据。可以说,高质量的数据是制约模型和算法突破瓶颈的关键指标。正是由于数据标注的重要性,在AI产业的上游已经形成了一条数据标注产业链。

    数据标注产业链主要由3方组成,1是标注需求方;2是数据标注平台,一般可以开发标注工具;3是标注团队、公会,活跃于各大标注平台。需求方向标注平台提出需求后,平台去开发工具,寻找合适的标注公会,标注完成后交付。

    几家数据标注平台

    1. 京东众智
      京东众智反馈速度比较快,在官网上提交需求后下午就有客户经理给我打电话,2天就完成标注工具开发和试标了。因为我们这个项目比较关注数据安全,他们给过来数据隔离的方案,简单地说就是标注工具和语音数据资源都在我们的服务器,人员管理和答题流程等在众智的服务器。
    2. 百度众包
      在贴吧上看到百度众测比较老牌了,标注类型也非常全面。对于我们公司这种情况他们也能像京东众智那样提供私有化部署,但是人员管理、结算等等都是麻烦问题。
    3. 阿里数据标注
      一开始以为这家标注平台是阿里的,毕竟京东百度都有,我想阿里也应该有吧?后来才发现在官网首页最下面有一行小字:【特别说明:阿里标注与阿里集团无任何直接关系】。哈哈哈哈哈哈哈差点被骗
    4. 龙猫数据
      这家是个数据服务商,数据各方面的服务都有做,包括数据买卖、采集、标注等等。这家平台在百度搜索上做了SEM,估计是下了本钱的,报价也稍微高一些。最终没有选择这家平台的原因是安全性不太好保证,毕竟公司比较小,而且还做数据买卖,真的有点担心。
    展开全文
  • 现在还有哪些数据标注平台价格优惠质量好 最近工作需要联系了几家数据标注平台,我把经历说下,你们自己评比。 京东众智 京东众智反馈速度比较快,在官网上提交需求后下午就有客户经理给我打电话,2天就完成标注工具...

    现在还有哪些数据标注平台价格优惠质量好

    最近工作需要联系了几家数据标注平台,我把经历说下,你们自己评比。

    京东众智

    京东众智反馈速度比较快,在官网上提交需求后下午就有客户经理给我打电话,2天就完成标注工具开发和试标了。因为我们这个项目比较关注数据安全,他们给过来数据隔离的方案,简单地说就是标注工具和语音数据资源都在我们的服务器,人员管理和答题流程等在众智的服务器

    龙猫数据标注平台

    给我的感觉就是响应不及时,来来回回三五天还没试表好,也就不说了。。。

    泛函 数据标注平台

    怎么讲呢,这家平台。。。不试表就报价。。。。这让我心里不安。。。

    智成长数据标注平台

    比较赞同的也就京东众智和智成长数据标注平台了,毕竟各方面来说都是比较完善的,包括采集方面做的也不错。

    展开全文
  • 人工智能数据标注平台推荐

    千次阅读 2020-05-18 11:39:49
    在做推荐之前,先做个简单的自我介绍吧。 本人是一家小公司的产品,公司之前一直是做金融业务的,从去年开始决定做人工智能+金融的智慧金融...同时,随着项目进展,训练数据量增大,也面临着标注人员紧缺的困境。 所
  • 浅谈数据标注平台运营模式

    千次阅读 2019-02-27 13:33:16
    现如今,AI行业发展火热各大巨头都投入巨资在此领域布局,智能驾驶、人脸识别以及近段时间正火的AI养猪都是AI技术应用在实际生活上...一、常见的数据标注平台 由于数据标注的重要性和高质量标注好数据的稀缺性在催生...
  • 数据采集任务有很多种,可以分为图片,语音,视频,文本等几大类图片类采集任务常见的有:人像采集,动作采集 ,生活场景采集,车辆采集,,商品采集。语音类采集任务常见的有:外文录音采集,普通话录音采集,通话...
  • 案例来源:@AI科技大本营案例地址:https://mp.weixin.qq.com/s/w1tbvFcDNxYjwkfL1in_Rw1. 目标:提供中立标注平台,对接标注方和需求方1)提高标注质量2)提高标注速度3)降低标注成本4)保证数据安全2. 提高标注...
  • OCR 数据标注是将图像信息转换成文本数据。标注人员使用普通数据标注工具进行OCR标注作业,需要将图像信息逐字转录,效率低,而BasicFinder SaaS...OCR预识别数据标注功能解析‖BasicFinder SaaS 数据标注平台 ...
  • 图片数据标注平台(标注外包公司) 数据标注公司的工作比较多样,图片标注是最普通的。视频标注、语音标注、3D点云标注…以及各种类型的数据采集,数据标注公司都能做。目前这个行业良莠不齐,有的平台技术实力强,...
  • 视频数据标注平台(标注外包公司) 数据标注公司的工作比较多样,但视频标注对工具要求稍高一些,能在线上做的平台不是特别多,主要还是语音、图片标注。目前这个行业良莠不齐,有的平台技术实力强,有品牌背景,...
  • 2020年最新数据标注公司及平台排名

    万次阅读 2020-04-09 11:14:52
    最近好多小伙伴私信我,关于数据标注公司或者数据标注平台有哪些是否适合合作的问题,主要原因是因为很多小伙伴想入行,一些规模相对小一些的公司有想找出路。是否好或者是否适合合作的问题实在太主观了,所以我最近...
  • 试用开源标注平台 Label Studio

    千次阅读 2020-03-15 16:50:02
    数据标注是人工智能背后的女人。—— 我说的 初探 在 reddit 上看到一个人提了一个问题:What is your favourite (free) labelling tool?,你最喜欢的(免费)标注工具是什么。由于我一直关注标注工具,而且没找到...
  • 小老弟跟我咨询数据标注平台创业前景和渠道切入点等一系列问题。我们聊了许多,其中非常有意思的是他对标注的描述——“数据标注不就是拉框啥的吗”。 我哭笑不得吧,也有点无奈。毕竟单就标注行业/职位的现状,"拉...
  • 文本标注平台(标注外包公司) 数据标注公司的工作比较多样,文本数据标注是最基础的,另外语音、图片、视频标注也都可以做。目前这个行业良莠不齐,有的平台技术实力强,有品牌背景,比如京东众智、百度众包,数据...
  • 大量复杂、乱序的图片依次标注效率极低,如果一次可以标注一大片的图片将极大地提升标注效率。自动分组识别并提取图像特征,通过ModelArts先进的聚类算法可以将所有图片分组:将特征相似的图片归为一类,将特征差别...
  • 2020年数据标注行业回顾及2021年展望

    千次阅读 2021-02-03 11:08:44
    2020年数据标注行业回顾总结 2021年数据行业的展望与机遇 一.个人的回顾 之所以要把个人的角度也放到一块内容来聊,有两个想法,第一在做公众号的将近一年的过程中,了解到很多小伙伴的有一些迷茫,希望...
  • 本文旨在收集整理开源的数据标注工具,方便使用,目前包括Image、Video、Text和Audio 4个方面。文中大部分工具,本人还未亲自测试过,标签或是归档不妥之处也会长期改进! Table of Contents 1. Image 2. Video ....
  • 知识图谱数据标注
  • 开源 人工智能 图片标注工具via,,解压三个压缩包后,运行via_face_demo.html via_demo.html 看人脸标注效果。
  • 语音数据标注工具与平台

    万次阅读 2018-10-12 14:49:07
    最近在做语音深度学习的项目,整理了一下语音数据标注工具和语音标注平台,供大家参考 语音标注工具–Praat Praat是目前已经成为比较流行也比较专业的语音处理的软件,可以进行语音数据标注、语音录制、语音合成、...
  • 免费AI数据标注工具-音频标注软件

    千次阅读 2020-03-22 11:03:38
    首先介绍一下Praat都可以做哪些事情,然后再结合数据标注本身来介绍一下其功能特点。不管是做语音识别的小伙伴还是做标注的小伙伴都可以学习一下,非常好用。 一.Praat可以做哪些事情? 1.频谱分析 2.基频分析 3....
  • 曼孚科技:7种常用的数据标注工具

    千次阅读 2019-12-06 19:50:39
    标注工具是数据标注行业的基础,一款好用的标注工具是提升标注效率与产出高质量标注数据的关键。 常用的数据标注工具主要有以下几种:2D框、语义分割、多边形分割、点标注、线标注、视频标注、3D立方体标注等。 1.2D...
  • 数据标注的作用及行业现状

    千次阅读 2019-02-12 15:48:51
    数据标注就是帮助机器去学习去认知数据中的特征。比如我们要让机器学习认知汽车,我们直接给机器一个汽车的图片它是无法识别的,我们必须对汽车图片进行标注打上标签注明“这是一个汽车”,当机器获得大量打上标签...
  • 数据标注软件labelme详解

    千次阅读 2020-10-28 14:51:30
    Labelme 是一个图形界面的图像标注软件。其的设计灵感来自于http://labelme.csail.mit.edu/。它是用 Python 语言编写的,图形界面使用的是 Qt(PyQt)。 实例分割样例(VOC) 其它样例(场景分割,目标检测,分类...
  • 什么是数据标注_数据标注的分类_如何进行数据标注_数据标注工程
  • 自己制作的DarknetYolo数据标注工具,可以快速对图片进行目标标注
  • 车辆数据集,已经标注完。车辆数据集,已经标注完。车辆数据集,已经标注完。车辆数据集,已经标注完。车辆数据集,已经标注完。车辆数据集,已经标注完。车辆数据集,已经标注完。车辆数据集,已经标注完。车辆数据...

空空如也

空空如也

1 2 3 4 5 ... 20
收藏数 283,409
精华内容 113,363
关键字:

数据标注平台