精华内容
下载资源
问答
  • categorical or nominal attribute:是只能归于某一类别的非数字型数据,...为了便于统计处理,对于分类数据可以用数字代码来表示各个类别,比如: 用1表示“男性”,0表示“女性”; 用1表示“医药企业”,2表示“...

    1. 分类数据(categorical or nominal data)

    是只能归于某一类别的非数字型数据,它是对事物进行分类的结果,数据表现为类别,是用文字来描述的。例如:
    (1)人口按性别分为男、女两类;
    (2)企业按行业属性分为医药企业、家电企业、纺织品企业等;

    为了便于统计处理,对于分类数据可以用数字代码来表示各个类别,比如:
    用1表示“男性”,0表示“女性”;
    用1表示“医药企业”,2表示“家电企业”,3表示“纺织品企业”

    2. 顺序数据(Ordinal data)

    是只能归于某一有序类别的非数字型数据。顺序数据虽然也是类别,但这些类别是有序的。比如:
    (1)将产品分为一等品、二等品、三等品、次品等;
    (2)考试成绩可以分为优、良、中、及格、不及格等;
    (3)一个人的受教育程度可以分为小学、初中、高中、大学及以上
    (4)一个人对某一事物的态度可以分为非常同意、同意、保持中立、不同意、非常不同意,等

    同样,顺序数据也可以用数字代码来表示,比如:

    1—非常同意、2—同意、3—保持中立、4—不同意、5—非常不同意,等;

    3.数值型数据(Numerical attribute)

    是按数字尺度测量的观察值,其结果表现为具体的数值。现实中所处理的大多数都是数值型数据。

    4.小结

    分类数据和顺序数据说明的是事物的品质特征,通常是用文字来表述的,其结果均表现为类别,因而也可统称为定性数据或品质数据(qualitative data);

    数值型数据说明的是现象的数量特征,通常是用数值来表现的,因此也可以称为定量数据或数量数据(quantitative data)

    展开全文
  • 垃圾分类数据集(垃圾图片数据集)

    万次阅读 多人点赞 2019-07-18 09:58:37
    为了响应垃圾分类的热点问题,抽空收集了一些垃圾的图片。进行垃圾分类的算法预测与分析(模型基本上大家可以尝试采用CNN) 图像的垃圾分类数据描述如下: 1.玻璃瓶 2.废纸箱 ...

    为了响应垃圾分类的热点问题,抽空收集了一些垃圾的图片。进行垃圾分类的算法预测与分析(模型基本上大家可以尝试采用CNN)

    图像的垃圾分类数据描述如下:

    1.玻璃瓶                                                                           2.废纸箱

                                                         

    3.易拉罐                                                                           4.废纸

                                                         

    5.塑料制品                                                                        6.不可回收垃圾

                                                        

    数据集链接:

    链接: https://pan.baidu.com/s/1kngfSVAV0NVDf-hi77GQxQ ,索要数据集可以联系525894654

     

    展开全文
  • 电影分类数据

    千次下载 热门讨论 2015-12-11 10:55:12
    康奈尔大学网站的2M影评数据集。 配合教程http://blog.csdn.net/lsldd/article/details/41542107
  • 遥感图像场景分类数据

    千次阅读 2019-06-26 21:04:03
    遥感图像场景分类数据集 1. 简介 数据集包含 45 个典型场景类别,训练集包含 177409 张图像,验证集包含 19712 张图像,初赛测试集包含 89233 张图像,详细的类别名称和对应的类别 id 见 ClsName2id.txt。 2. 数据集...

    遥感图像场景分类数据集

    1. 简介

    数据集包含 45 个典型场景类别,训练集包含 177409 张图像,验证集包含 19712 张图像,初赛测试集包含 89233 张图像,详细的类别名称和对应的类别 id 见 ClsName2id.txt。

    training set: 177409 jpgs
    validation set: 19712 jpgs
    class id: 45

    2. 数据集结构

    场景分类数据集的文件夹结构如下:

      - train
        - 旱地
            - dry-field_xxxxx.jpg
            - dry-field_xxxxx.jpg
            - ...
        - 水田
            - paddy-field_xxxxx.jpg
            - paddy-field_xxxxx.jpg
            - ...
            
      - val
        - 旱地
            - dry-field_xxxxx.jpg
            - dry-field_xxxxx.jpg
            - ...
        - 水田
            - paddy-field_xxxxx.jpg
            - paddy-field_xxxxx.jpg
            - ...
            
      - test
        - 00001.jpg
        - 00002.jpg
        - ...
        
      - ClsName2id.txt
    

    训练集 (train) 和验证集 (val) 中每个文件夹代表一类,分别存放对应类别的图像。初赛测试集 (test) 中为 89233 张测试图像。

    ClsName2id.txt 提供了场景类别中英文名称与 id 的对照,文件格式如下:

    中文名称:英文名称:id
    旱地:dry-field:1
    水田:paddy-field:2
    梯田:terraced-field:3
    草地:meadow:4
    林地:forest:5
    商业区:commercial-area:6
    油田:oil-field:7
    油罐区:storage-tank:8
    工厂:works:9
    矿区:mine:10
    太阳能发电厂:solar-power-plant:11
    风力发电站:wind-turbine:12
    公园:park:13
    游泳池:swimming-pool:14
    教堂:church:15
    墓地:cemetery:16
    棒球场:baseball-field:17
    篮球场:basketball-court:18
    高尔夫球场:golf-course:19
    足球场:soccer-field:20
    温室:greenhouse:21
    网球场:tennis-court:22
    居民区:residential-area:23
    岛屿:island:24
    河流:river:25
    停机坪:apron:26
    直升机场:helipad:27
    机场跑道:runway:28
    桥梁:bridge:29
    停车场:parking-lot:30
    公路:road:31
    路边停车区:roadside-parking-lot:32
    转盘:roundabout:33
    立交桥:viaduct:34
    港口:port:35
    铁路:railway:36
    火车站:train-station:37
    裸地:bare-land:38
    沙漠:desert:39
    冰岛:ice-land:40
    山地:mountain:41
    石质地:rock-land:42
    稀疏灌木地:sparse-shrub-land:43
    海滩:beach:44
    湖泊:lake:45
    

    3. 注意事项

    • 分类算法训练可以利用验证集、外部数据,测试集不能参与算法训练。
    • 训练集、验证集和测试集是随机分配的,质量一致。难免有标注问题和检查疏漏,可以对数据进行预处理,可以扩充训练数据,或者通过设计算法解决。
    • 初始版本训练集 residential-area_02938.jpg 图片损坏。
    展开全文
  • 视频分类数据集介绍

    万次阅读 2018-09-10 16:34:20
    视频分类数据集   在视频分类项目中,有很多经典的公开数据集,目前主要的数据集如列表所示:   重点介绍三个中等规模的数据集。 1. UCF101 动作识别数据集,从youtube收集而得,共包含101类动作。其中每...

    视频分类数据集

     

    在视频分类项目中,有很多经典的公开数据集,目前主要的数据集如列表所示:

     

    重点介绍三个中等规模的数据集。

    1. UCF101

    动作识别数据集,从youtube收集而得,共包含101类动作。其中每类动作由25个人做动作,每人做4-7组,共13320个视频,分辨率为320*240,共6.5G。

    UCF101在动作的采集上具有非常大的多样性,包括相机运行、外观变化、姿态变化、物体比例变化、背景变化、光纤变化等。

    101类动作可以分为5类:人与物体互动、人体动作、人与人互动、乐器演奏、体育运动。

    参考文档:http://crcv.ucf.edu/papers/UCF101_CRCV-TR-12-01.pdf

    每类动作视频数量:

    下载网址:http://crcv.ucf.edu/data/UCF101/UCF101.rar

     

     

    2. HMDB

    HMDB51包含51类动作,共有6849个视频,每个动作至少包含51个视频,分辨率320*240,。来自于YouTube,google视频等,共2G.

    动作主要包括:

    1) 一般面部动作微笑,大笑,咀嚼,交谈。

    2) 面部操作与对象操作:吸烟,吃,喝。

    3) 一般的身体动作:侧手翻,拍手,爬,爬楼梯,跳,落在地板上,反手翻转、倒立、跳、拉、推、跑,坐下来,坐起来,翻跟头,站起来,转身,走,波。

    4) 与对象交互动作:梳头,抓,抽出宝剑,运球、高尔夫、打东西,球、挑、倒、推东西,骑自行车,骑马,射球,射弓、枪、摆棒球棍、剑锻炼,扔。

    5) 人体动作:击剑,拥抱,踢某人,亲吻,拳打,握手,剑战。

     

     

    下载:http://serre-lab.clps.brown.edu/resource/hmdb-a-large-human-motion-database/#Downloads

     

    3.Kinetics

    Kinetics-600是一个大规模,高质量的YouTube视频网址数据集,其中包含各种人的动作。 还有一个2017年发布的初始数据集,现在称为Kinetics-400。
    该数据集由大约500,000个视频组成,涵盖600个人类动作,每个动作至少有600个视频。 每个视频持续大约10秒钟,并标有一个类。 这些动作涵盖了广泛的范围,包括人 - 物体交互,如演奏乐器,以及人与人之间的互动,如握手和拥抱。

    下载:https://deepmind.com/research/open-source/open-source-datasets/kinetics/

    或者https://github.com/activitynet/ActivityNet/blob/master/Crawler/Kinetics/README.md

    展开全文
  • 文本分类数据和评价指标

    万次阅读 多人点赞 2019-04-07 23:19:45
    1 中文文本分类数据集THUCNews 1.1 数据说明   THUCNews是根据新浪新闻RSS订阅频道2005~2011年间的历史数据筛选过滤生成,包含74万篇新闻文档(2.19 GB),均为UTF-8纯文本格式。我们在原始新浪新闻分类体系的基础...
  • 文本分类数据集合

    热门讨论 2012-07-19 15:16:18
    数据挖掘或机器学习,文本分类,聚类完整数据集合数据挖掘或机器学习,文本分类,聚类完整数据集合数据挖掘或机器学习,文本分类,聚类完整数据集合数据挖掘或机器学习,文本分类,聚类完整数据集合 有各种类别,...
  • PyTorch创建自己的图像分类数据

    千次阅读 多人点赞 2019-09-05 09:19:32
    制作个人图像分类数据集过程中,查阅资料发现几个问题,在解决的过程中总结! 个人认为这是很通俗易懂详细的过程了 制作个人分类用数据集具体步骤如下: 1、将个人收集的图片归到一个文件夹内如下图: 我个人做实验...
  • 搜狐新闻文本分类数据

    千次阅读 2019-05-19 23:54:39
    搜狐新闻文本分类数据集 数据集:https://pan.baidu.com/s/1V6o20temK2v3j-bo16x94g 提取码:fech
  • 处理分类数据 非数值型编码

    千次阅读 2018-06-06 19:19:28
    处理分类数据目前为止,我们处理的都是数值型变量。但是真实世界的数据集通常都含有分类型变量(categorical value)的特征。当我们讨论分类型数据时,我们不区分其取值是否有序。比如T恤尺寸是有序的,因为XL>...
  • 首先我们看一个包含分类数据的例子: import pandas as pd import matplotlib.pyplot as plt import numpy as np file=pd.read_csv('Churn_Modelling.csv') file=file.iloc[:,3:] file.head(10) 我们可以看到实例...
  • 垃圾分类数据

    千次阅读 多人点赞 2020-04-07 13:08:05
    训练集的制作是一件成本很高的事情,下面是一份包括4大类40个小类的垃圾数据集。
  • R语言 分类数据折线图绘制

    万次阅读 2015-04-29 13:03:18
    代码主要实现当x轴数据为分类数据时,如何指定数据按指定数据排序,以折线图方式展现数据 数据 library(ggplot2) data("D:\\rwork\\tiaocan_xielvbianhua.csv",header = T) #header = Falese的意思 data #绘制...
  • Keras之DNN::基于Keras(sigmoid+binary_crossentropy+predict_classes)利用DNN实现二分类——DIY二分类数据集&预测新数据点 目录 输出结果 实现代码 输出结果 实现代码 # coding...
  • 视频分类数据

    千次阅读 2017-10-08 18:24:19
    近年来为推动视频分类的研究,陆续发布了相关的视频数据集。小型标注良好的数据集如KTH,Hollywood2,Weizmann;中型的数据集如UCF101,Thumos’14和HMDB51,这些数据集超过了50类行为类别;大型数据集如Sports-1M,...
  • #Keras之DNN:基于Keras(sigmoid+binary_crossentropy+predict_proba)利用DNN实现分类预测概率——DIY二分类数据集&预测新数据点 目录 输出结果 实现代码 输出结果 实现代码 # coding:utf-...
  • ML之分类预测之ElasticNet之OPLiR:在二分类数据集上训练OPLiR模型(T1) 目录 输出结果 设计思路 核心代码 输出结果 设计思路 核心代码 #对属性程度进行排列 nzList = [] for iAlpha ...
  • 分类数据可视化 - 分类散点图 stripplot() / swarmplot() 加载模块,设置风格、尺度 import numpy as np import pandas as pd import matplotlib.pyplot as plt import seaborn as sns #设置风格、尺度 sns.set...
  • tushare 股票分类数据

    千次阅读 2017-04-08 22:09:30
    考虑到是一次性在线获取数据,调用接口时会有一定的延时,请在数据返回后自行将数据进行及时存储。sina财经提供的行业分类信息大致如下图所示: 返回值说明: code:股票代码 name:股票名称 c_name:行业名称 二...
  • python深度学习垃圾分类数据集目录

    千次阅读 多人点赞 2020-04-19 16:40:43
    文章底部有下载链接 加粗样式 垃圾分类(英文名为Garbage classification),一般是指按一定规定或标准将垃圾分类储存、分类投放和分类搬运,从而转变成公共资源的一系列活动的总称。分类的目的是提高垃圾的资源价值...
  • Keras之DNN:基于Keras(sigmoid+linear+mse+predict)利用DNN实现回归预测——DIY多分类数据集&预测新数据点 目录 输出结果 实现代码 输出结果 实现代码 # coding:utf-8 Xa=[] Xb=...
  • 数据结构:八大数据结构分类

    万次阅读 多人点赞 2018-09-05 18:23:28
    数据结构分类 数据结构是指相互之间存在着一种或多种关系的数据元素的集合和该集合中数据元素之间的关系组成 。 常用的数据结构有:数组,栈,链表,队列,树,图,堆,散列表等,如图所示: 每一种数据结构都...
  • 文本分类数据集汇总

    千次阅读 多人点赞 2020-07-02 15:06:24
    统计了下载到的文本分类数据集信息,汇总成表格如下(时间:2020.7.1): Dataset Classes Type Samples Best Method Performance AG News 4 Topic Train:120000 Test: 7600 XLNet Error: 4.45 Dbpedia 14 Topic Train...
  • 有大量的二分类和等级分类指标,需要进行降维处理以进行建模和拟合,lasso回归处理结果不理想,请问还有哪些方法可以用?最好是能R语言实现的。谢谢!
  • 垃圾分类数据集(根据垃圾分类标准划分)

    千次阅读 多人点赞 2020-03-02 16:59:39
    数据说明: 该数据集是图片数据数据来源: 百度云分享 提取码:1l4w 支持原创,盗版必究。
  • 场景分类数据

    千次阅读 2019-04-01 21:29:44
    其中前2个是最常用的遥感图像场景分类数据集,基本上每篇文章都用这2个数据集来验证分类精度。   最新的2个大数据集 6. AID Data Set 图像像素大小为600*600,总包含30类场景图像,每一类大概220-420张,...
  • 细粒度分类数据集汇总

    千次阅读 2020-01-05 19:52:17
    CUB-200-2011 鸟类数据集: 数据集地址:http://www.vision.caltech.edu/visipedia/CUB-200-2011.html Caltech-UCSD Birds-200-2011 (CUB-200-2011) 是 CUB-200 dataset 的一个扩充版本,每个类的图像数量大约增加两...

空空如也

空空如也

1 2 3 4 5 ... 20
收藏数 1,305,364
精华内容 522,145
关键字:

分类数据