精华内容
下载资源
问答
  • mnist数据集标准的手写数字数据集,该资源包含了原本的ubyte格式,mat格式以及常用的CSV格式
  • iris鸢尾花标准数据集

    2019-03-14 03:10:11
    iris鸢尾花标准数据集Iris鸢尾花数据集是一个经典数据集,在统计学习和机器学习领域都经常被用作示例。数据集内包含3类共150条记录,每类各50个数据,每条记录都有4项特征:花萼长度,花萼宽度,花瓣长度,花瓣宽度...
  • 国家电子病例标准数据集,是整理出来的EXCEL版本,包含个元数据、子集等
  • 计算机视觉标准数据集整理—PASCAL VOC数据集 https://blog.csdn.net/xingwei_09/article/details/79142558

    计算机视觉标准数据集整理—PASCAL VOC数据集
    https://blog.csdn.net/xingwei_09/article/details/79142558

    展开全文
  • 资料集 Pipcook标准数据集 工作正在进行中 想象 去做 自然语言处理 去做
  • iris莺尾花标准数据集(Excel格式)iris莺尾花标准数据集(Excel格式)
  • 公开标准数据集 图像显著性检测MSRA1000,包含1000张原图,及对应的标注图。标注图与原图尺寸相一致。
  • 20newsgroup数据集是机器学习中的一个标准数据集。它包含18828个文档,来自于20个不同的新闻组。如果把每个新闻组看作是一个簇,那么很容易测试出我们寻找相关文档的方法是否有效。
  • LUBM标准数据集

    2014-10-14 11:46:34
    关于lubm数据集的详细文档资料,里面包括LUBM数据集开发缘由,实验和操作等信息。
  • 计算机视觉标准数据集整理 VOC2007 与 VOC2012 此数据集可以用于图像分类,目标检测,图像分割!!! 数据集下载镜像网站: http://pjreddie.com/projects/pascal-voc-dataset-mirror/ VOC2012: Train/...

    计算机视觉标准数据集整理

    VOC2007 与 VOC2012

    此数据集可以用于图像分类,目标检测,图像分割!!!

    数据集下载镜像网站: http://pjreddie.com/projects/pascal-voc-dataset-mirror/

    VOC2012: Train/Validation Data(1.9GB),Test Data(1.8GB),主页: http://host.robots.ox.ac.uk:8080/pascal/VOC/voc2012/

    VOC2007: Train/Validation Data(439MB),Test Data(431MB),主页: http://host.robots.ox.ac.uk:8080/pascal/VOC/voc2007/

    MNIST手写体数据集(用作10类图像分类)

    包含了60,000张28x28的二值(手写数字的)训练图像,10,000张28x28的二值(手写数字的)测试图像.用作分类任务,可以分成0-9这10个类别!

    引用:Y. LeCun, L. Bottou, Y. Bengio, and P. Haffner. "Gradient-based learning applied to document recognition." Proceedings of the IEEE, 86(11):2278-2324, November 1998.

    CIFAR-10(用作10类图像分类)

    此数据集包含了60,000张32x32的RGB图像,总共有10类图像,大约6000张图像/类,50,000张做训练,10,000张做测试!

    此数据集有三个版本的数据可供下载: Python版本(163MB), MATLAB版本(175MB), 二值版本(162MB)!

    CIFAR-100(用作100类图像分类)

    这个数据集和CIFAR-10相比,它具有100个类,大约600张/类,每类500张训练,500张测试.这100类又可以grouped成20个大类.

    此数据集也有三个版本的数据可供下载: Python版本(161MB), MATLAB版本(175MB), 二值版本(161MB)!

    引用: Learning Multiple Layers of Features from Tiny Images, Alex Krizhevsky, 2009

    CIFAR-10和CIFAR-100都是80 million tiny images dataset的子集!

    80 million tiny images dataset

    这个数据集包含了79,302,017张32x32的RGB图像,下载时包含了5个文件,网站上也提供了示例代码教你如何加载这些数据!

    1. Image binary (227GB)

    2. Metadata binary (57GB)

    3. Gist binary (114GB)

    4. Index data (7MB)

    5. Matlab Tiny Images toolbox (150kB)

    Caltech_101(用作101类图像分类)

    这个数据集包含了101类的图像,每类大约有40~800张图像,大部分是50张/类,在2003年由lifeifei收集,每张图像的大小大约是300x200.

    数据集下载: 101_ObjectCategories.tar.gz(131MB)

    Caltech_256(用作256类图像分类)

    此数据集和Caltech_101相似,包含了30,607张图像,数据集下载: 256_ObjectCategroies.tar(1.2GB)

    Imagenet

    IMAGENET Large Scale Visual Recognition Challenge(ILSVRC)

    从2010年开始,每年举办的ILSVRC图像分类和目标检测大赛,数据集下载: http://image-net.org/download-images

     

    展开全文
  • 标准数据集的MNIST手写数字数据包,由训练、交叉验证、测试三个集合组成,请解压后使用
  • 其对于图像的标注信息不仅有类别、位置信息,还有对图像的语义文本描述,COCO数据集的开源使得近两三年来图像分割语义理解取得了巨大的进展,也几乎成为了图像语义理解算法性能评价的“标准数据集。Google的开源...

    COCO数据集



    COCO数据集由微软赞助,其对于图像的标注信息不仅有类别、位置信息,还有对图像的语义文本描述,COCO数据集的开源使得近两三年来图像分割语义理解取得了巨大的进展,也几乎成为了图像语义理解算法性能评价的“标准”数据集。Google的开源show and tell生成模型就是在此数据集上测试的。 


    这个数据集以scene understanding为目标,主要从复杂的日常场景中截取,图像中的目标通过精确的segmentation进行位置的标定。图像包括91类目标,328,000影像和2,500,000个label。 


    该数据集主要解决3个问题:目标检测,目标之间的上下文关系,目标的2维上的精确定位。数据集的对比示意图:




    COCO数据集有91类,虽然比ImageNet和SUN类别少,但是每一类的图像多,这有利于获得更多的每类中位于某种特定场景的能力,对比PASCAL VOC,其有更多类和图像。


    COCO数据集分两部分发布,前部分于2014年发布,后部分于2015年,2014年版本:82,783 training, 40,504 validation, and 40,775 testing images,有270k的segmented people和886k的segmented object;2015年版本:165,482 train, 81,208 val, and81,434 test images。





    职责



    目标检测



    • 输出目标物的边框即可(using bounding box output),也就是我们常说的目标检测(object detection)了;

    • 要求把目标物从图像中分割出来(object segmentation output),即我们所说的图像语义分割(Semantic image segmentation);

        


    图像标注(COCOCaptioning Challenge)



    具体说来就是一句话准确描述图片上的信息(producingimage captions that are informative and accurate)。那这个怎么评分呢?目前是靠人工评分。





    人体关键点检测(COCOKeypoint Challenge)



    比赛要求是找到人在哪,然后定位到人体的一些关键点位置(Thekeypoint challenge involves simultaneously detecting people and localizingtheir keypoints)。















    展开全文
  • ImageNet数据集 IMAGENET Large Scale Visual Recognition Challenge(ILSVRC) 从2010年开始,每年举办的ILSVRC图像分类和目标检测大赛。 Imagenet数据集是目前深度学习图像领域应用得非常多的...

    ImageNet数据集



    IMAGENET Large Scale Visual Recognition Challenge(ILSVRC)


    从2010年开始,每年举办的ILSVRC图像分类和目标检测大赛。


    • Imagenet数据集是目前深度学习图像领域应用得非常多的一个领域,关于图像分类、定位、检测等研究工作大多基于此数据集展开。

    • Imagenet数据集文档详细,有专门的团队维护,使用非常方便,在计算机视觉领域研究论文中应用非常广,几乎成为了目前深度学习图像领域算法性能检验的“标准”数据集。

    • Imagenet数据集有1400多万幅图片,涵盖2万多个类别;

    • 其中有超过百万的图片有明确的类别标注和图像中物体位置的标注。

    具体信息如下:


    • Total number of non-empty synsets: 21841

    • Total number of images: 14,197,122

    • Number of images with bounding boxannotations: 1,034,908

    • Number of synsets with SIFT features: 1000

    • Number of images with SIFT features: 1.2million

    Imagenet数据集是一个非常优秀的数据集,但是标注难免会有错误,几乎每年都会对错误的数据进行修正或是删除,建议下载最新数据集并关注数据集更新。





    数据集下载



    数据集大小:~1TB(ILSVRC2016比赛全部数据);


    下载地址:http://image-net.org/download-images


    包含项目



    与Imagenet数据集对应的有一个享誉全球的“ImageNet国际计算机视觉挑战赛(ILSVRC)”,以往一般是google、MSRA等大公司夺得冠军,今年(2016)ILSVRC2016中国团队包揽全部项目的冠军。


    目前包含的比赛项目有:



    目标定位




    给定一幅图像,算法需要生成5个带有置信度的类别标签及其分别对应的目标物边框信息。算法准确率的评估是基于与标注的类别标签最匹配的预测标签,图片中可能存在多个物体及其对应的标注信息和与标注的边框信息重叠的预测边框图片中可能存在多个同类物体。为什么这样做呢?因为这样就允许算法识别图像中的多个目标物,并且当其中一个目标物确实存在于图像中但没有被标注出来时算法不会受到惩罚。可能说的有不清楚或不正确的地方,大家可以看下官方的评估规则



    目标检测




    给定一幅图像,算法需要生成多组(ci,si,bi)形式的预测信息,其中ci为类别标签、si为置信度、bi为边框信息。需要注意的是,算法必须检测出图像中出现的每一个训练过的目标物,漏检和重复检测都会受到惩罚。



    视频序列的目标检测




    这一项和上一项目标检测类似。



    场景分类




    这个比赛使用了Places2 dataset,比赛规则是对于给定图像,允许算法产生5个场景分类,并挑选匹配度最高的作为评估结果,详看他们的评估规则吧。为什么这么做呢?因为同一幅图片可以包含有多个场景类别,事实上同一幅图片本来就是用多个类别标注的。



    场景分析



    这个比赛的目标是将图像分割成与语义类别相关联的不同图像区域,如天空,道路,人和床。具体规则见官网吧。








    展开全文
  • 四种类型的标准数据集构件,分别是TTable、TQuery、TStoredProc和TclientDataSet 这些数据集构件都是从一个共同的基类TDataSet继承下来的. 这几个类之间的继承关系可以用图来表示 TDataSet是所有数据集的抽象基类...
  • 人脸识别标准数据集

    2018-05-22 17:18:33
    人工智能深度学习中进行人脸识别的标准数据库,这是一个晓得数据库,一共400张标准人脸pmg图片,分为40个人,分别放在40个文件夹中
  • Caltech数据集 Caltech数据集主要包括2类,一类是Caltech-101;另一类是Caltech-256。 Caltech-101数据集(用作101类图像分类) 这个数据集包含了101类的图像,每类大约有40...
  • 开源标准数据集 —— mnist(手写字符识别)
  • 3.sklearn库中的标准数据集及基本功能数据集总览 数据集大小 数据集名称 调用方式 适用算法 数据规模 小数据集 波士顿房价数据集 load_boston() 回归 506*13 – 鸢尾花数据集 load_iris() 分类 150*4 ...
  • 粒子群算法PSO和万有引力算法GSA结合优化FNN神经网络进行标准数据集的分类,可运行
  • 数据集包含了60000张28x28的二值(手写数字)训练图像;10000张28x28的二值(手写数字)测试图像; 主要用作分类任务,可以分成0-9这10个类别。 数字集下载 MNIST 数据集可在 ...
  • ... 作者:Jason Brownlee ...标准数据集 下面是本文将介绍的 10 个数据集的列表。每个数据集都不大,能够适应内存或使用电子表格查看。所有数据集都由表格数据组成,并且没有(显式的)缺失值
  • sklearn库中的标准数据集与基本功能 下面我们详细介绍几个有代表性的数据集: 当然同学们也可以用sklearn机器学习函数来挖掘这些数据,看看可不可以捕捉到一些有趣的想象或者是发现: 波士顿房价数据集: ...
  • CIFAR-100数据集(用作100类的图像分类) 这个数据集和CIFAR-10相比,它具有100个类,大约600张/类,每类500张训练,500张测试; 这100类又可以grouped成20个大类。 此数据集也有三个版本的...
  • CIFAR-10数据集(用作10类图像的分类) 此数据集包含了60,000张32x32的RGB图像,总共有10类图像; 有50,000个训练图像,10,000个测试图像; 数据集分为5个训练块和1个测试块,每个块有...
  • LFW人脸识别数据集   无约束自然场景人脸识别数据集,该数据集由13000多张全世界知名人士互联网自然场景不同朝向、表情和光照环境人脸图片组成, 共有5000多人,其中有1680人有2张或2张以上...
  • 数据集名称 调用方式 适用算法 数据规模 小 波士顿房价数据集 load_boston() 回归 506*13 数 鸢尾花数据集 load_iris() 分类 150*4 据 糖尿病数据集 load_diabet.....
  • Sklearn提供的常用标准数据集

    千次阅读 2018-09-14 22:28:26
    数据集名称 调用方式 适用算法 数据规模 小 波士顿房价数据集 load_boston() 回归 506*13 数 鸢尾花数据集 load_iris() 分类 150*4 据 糖尿病数据集 load_diabetes...

空空如也

空空如也

1 2 3 4 5 ... 20
收藏数 13,090
精华内容 5,236
关键字:

标准数据集