-
2022-04-07 13:22:38
NAbirds细粒度数据集:链接:https://pan.baidu.com/s/1Q5t2CspcbHH7jfXLaiJ9gg
提取码:2022更多相关内容 -
细粒度识别、分类、检索数据集整理
2022-06-24 16:24:41细粒度相关研究中用到的主要数据集如下:Fine-grained visual classification (FGVC) 相关主要训练和测评数据集如下:CUB-200-2011、Standford Cars、FGVC-Aircraft🥇 版权: 本文由【墨理学AI】原创首发、各位读者大大、敬请查阅、感谢三连
🎉 声明: 作为全网 AI 领域 干货最多的博主之一,❤️ 不负光阴不负卿 ❤️文章目录
细粒度相关研究中用到的主要数据集如下
Fine-grained visual classification (FGVC) 相关主要训练和测评数据集如下:
- CUB-200-2011
- Standford Cars
- FGVC-Aircraft
弱监督 细粒度分类任务中,示例数据集结构如下
这里数据集结构:需要结合论文、代码,对下载的数据集图片和标签进行重整
dataset ├── train │ ├── class_001 | | ├── 1.jpg | | ├── 2.jpg | | └── ... │ ├── class_002 | | ├── 1.jpg | | ├── 2.jpg | | └── ... │ └── ... └── test ├── class_001 | ├── 1.jpg | ├── 2.jpg | └── ... ├── class_002 | ├── 1.jpg | ├── 2.jpg | └── ... └── ...
三个数据集下载链接如下
- https://www.robots.ox.ac.uk/~vgg/data/fgvc-aircraft/
- http://www.vision.caltech.edu/datasets/
- http://ai.stanford.edu/~jkrause/cars/car_dataset.html
FGVC-Aircraft 下载
CUB-200-2011 下载
数据集介绍
Caltech-UCSD Birds-200-2011 (CUB-200-2011) is an extended version of the CUB-200 dataset, with roughly double the number of images per class and new part location annotations.
- Number of categories: 200
- Number of images: 11,788
- Annotations per image: 15 Part Locations, 312 Binary Attributes, 1 Bounding Box
- For detailed information about the dataset, please see the technical report linked below.
下载
Standford Cars 下载
📙 精选专栏
计算机视觉领域 八大专栏、不少干货、有兴趣可了解一下
- ❤️ 图像风格转换 —— 代码环境搭建 实战教程【关注即可阅】!
- 💜 图像修复-代码环境搭建-知识总结 实战教程 【据说还行】
- 💙 超分重建-代码环境搭建-知识总结 解秘如何让白月光更清晰【脱单神器】
- 💛 YOLO专栏,只有实战,不讲道理 图像分类【建议收藏】!
-
🍊 深度学习:环境搭建,一文读懂
-
🍊 深度学习:趣学深度学习
-
🍊 落地部署应用:模型部署之转换-加速-封装
-
🍊 CV 和 语音数据集:数据集整理
-
🍊 点赞 👍 收藏 ⭐留言 📝 都是博主坚持写作、更新高质量博文的最大动力!
-
AI Challenger 2018 细粒度用户评论情感分析数据集
2022-05-04 21:15:30AI Challenger 2018 细粒度用户评论情感分析数据集 训练集: sentiment_analysis_trainingset.csv 为训练集数据文件,共105000条评论数据 sentiment_analysis_trainingset_annotations.docx 为数据标注说明文件 ... -
细粒度分类数据集汇总
2021-04-09 18:09:52医疗图像更多的是小样本学习,那么如何选择一个小样本数据集来针对各个算法进行比较,从而选择最好的算法,故整理了小样本学习相关的数据,也就是常用的细粒度分类数据 本文内容主要来自于:...医疗图像更多的是小样本学习,那么如何选择一个小样本数据集来针对各个算法进行比较,从而选择最好的算法,故整理了小样本学习相关的数据,也就是常用的细粒度分类数据
简单的小样本分类的每个类别的图片或者语料大致在100到600之间,很少有单类样本超过1000的情况。相对于传统的深度学习来说,传统的深度学习是“小任务,大数据”,小样本学习是“小任务,小数据”,相对来说小样本学习的挑战性还是很大的,达到商用的地步有很大的差距。
本文内容主要来自于: https://zhuanlan.zhihu.com/p/101158631
1、CUB-200-2011 鸟类数据集:
数据集地址:http://www.vision.caltech.edu/visipedia/CUB-200-2011.html
Caltech-UCSD Birds-200-2011 (CUB-200-2011) 是 CUB-200 dataset 的一个扩充版本,每个类的图像数量大约增加两倍和新的部位注释。
(1)类别数目: 200
(2)图像总数目: 11,788
(3)每张图片的标注信息: 15 Part Locations, 312 Binary Attributes, 1 Bounding Box该数据集是细粒度图像分类最广泛使用的基准。该数据集涵盖了 200 种鸟类,其中包括 5994 张训练图像和 5794 张测试图像。除类别标签外,每个图像都会用 1 个边界框、15 个零件关键点和 312 个属性进行进一步注释。
2、Stanford Dogs Dataset 狗类数据集
数据集地址:http://vision.stanford.edu/aditya86/ImageNetDogs/
斯坦福狗数据集:训练数据为 120 个品种狗狗的照片,共 10222 张。共 10357 张测试样本。它是 ImageNet 数据集的之类,可以用作细粒度分类。
相关竞赛:https://
3、Stanford Cars 汽车数据集
数据集地址:https://ai.stanford.edu/~jkrause/cars/car_dataset.html
数据集组成:包含 196 种车辆的 16,185 张照片;其中训练集 8144,测试集 8041;
关键特征包括:车辆制造商、款式、生产日期(比如:2012 Tesla Model S);相关论文:3D Object Representations for Fine-Grained Categorization,Jonathan Krause, Michael Stark, Jia Deng, Li Fei-Fei
4、102 Category Flower Dataset 花朵数据集:
数据集地址:http://www.robots.ox.ac.uk/~vgg/data/flowers/102/index.html
数据集由 102 类产自英国的花卉组成。每类由 40-258 张图片组成。总共 8189 张 jpg 图片
相关竞赛:https://www.kaggle.com/wassimseifed
5、FGVC-Aircraft Benchmark 飞机数据
数据集地址:http://www.robots.ox.ac.uk/~vgg/data/fgvc-aircraft/
数据集包含 10,200 架飞机的图像,其中 102 种不同飞机,每一种都具有 100 张图像。数据集按照四个层级结构进行划分,从细到粗分别是:
- Model
- Variant:102 个分类
- Family:70 个分类
- Manufacturer:41 个分类
相关论文:Fine-Grained Visual Classification of Aircraft https://arxiv.org/abs/1306.5151
6、DeepFashion 衣服服装数据集
DeepFashion 是香港中文大学开放的一个 large-scale 数据集。包含 80 万张图片,包含不同角度,不同场景,买家秀,买家秀等图片。
每张图片也有非常丰富的标注信息,包括 50 种类别,1000 种属性,Bbox,特征点。
还有约 30 万的不同姿势 / 不同场景的图片 pairs。
数据集地址:http://mmlab.ie.cuhk.edu.hk/pr
7、RPC 零售商品数据集:
数据集地址:https://rpc-dataset.github.io/
RPC 数据集是旷视南京研究院发布了一个新零售自动结算场景下的大型商品数据集,无论商品类别(达 200)还是图像总量(达 83k)均是目前该领域之最。
相关链接:https://zhuanlan.zhihu.com/p/55
实际是小样本评估集使用Omniglot和miniImageNet更多更基础,结果的可比较性会更好
8、Omniglot数据集
Omniglot数据集是由来自50种不同语言的1,623个手写字符构成的,每个字符都有20个不同的笔迹,这就构成了一个样本类别极多(1623种),但每种类别的样本数量极少(20个)的小样本手写字符数据集。使用中通常选择1200种字符作为训练集,剩余的423种字符作为验证集,并通过旋转90°,180°和270°进行数据集扩张,每张图片通过裁剪将尺寸统一为28*28。
参考文献:Lake B, Salakhutdinov R, Gross J, et al. One shot learning of simple visual concepts[C]//Proceedings of the annual meeting of the cognitive science society. 2011, 33(33).
9、miniImageNet数据集
miniImageNet数据集是从ImageNet数据集中选择了60,000张图像构成的,共100个类别,每个类别有600张图像,每幅图像的尺寸为84*84。使用中通常选择其中80个类别的图像作为训练集,剩余的20个类别的图像作为验证集。也有的文章将其分为基础集(Base Class,64种),验证集(Validation Class,16种)和新类别集(Novel Class,20种)。
参考文献:Vinyals O, Blundell C, Lillicrap T, et al. Matching networks for one shot learning[C]//Advances in neural information processing systems. 2016: 3630-3638.
10、tieredImageNet
tieredImageNet数据集也是从ImageNet数据集中选取的,包含34个大类(Categories),每个大类有包含10-30个小类(Classes),每个类别有数量不等的多个图像样本,共计608个类别,779,165张图像(平均每个类别包含1281张图片)。34个大类可划分为训练集(20大类),验证集(6大类)和测试集(8大类),数据集划分情况如下图。参考文献:Ren M, Triantafillou E, Ravi S, et al. Meta-learning for semi-supervised few-shot classification[J]. arXiv preprint arXiv:1803.00676, 2018.
附录
1、细粒度分类数据集汇总
https://zhuanlan.zhihu.com/p/101158631
2、常用小样本数据集介绍与下载汇总
https://blog.csdn.net/qq_36104364/article/details/107508592
3、揭秘AI 公司盈利“生意经”,竹间智能CEO简仁贤的AI产品化和工程化
https://blog.csdn.net/weixin_39640818/article/details/110944223
-
细粒度用户评论情感分析数据集(2018-AI-challenger)
2019-03-23 17:07:08数据集分为训练、验证、测试A与测试B四部分。数据集中的评价对象按照粒度不同划分为两个层次,层次一为粗粒度的评价对象,例如评论文本中涉及的服务、位置等要素;层次二为细粒度的情感对象,例如“服务”属性中的... -
Al_challenger细粒度情感分析数据集
2019-07-19 16:31:35Al_challenger细粒度情感分析数据集,包含ai_challenger_sentiment_analysis_testa_20180816、ai_challenger_sentiment_analysis_trainingset_20180816、ai_challenger_sentiment_analysis_validationset_20180816 -
用户评论情感分析数据集(细粒度)收集于(AI-challenger比赛)2018
2019-04-23 21:05:18数据集分为训练、验证、测试A与测试B四部分。数据集中的评价对象按照粒度不同划分为两个层次,层次一为粗粒度的评价对象,例如评论文本中涉及的服务、位置等要素;层次二为细粒度的情感对象,例如“服务”属性中的... -
细粒度数据集:CUB-200-2011 CUB,百度云下载
2021-08-12 11:24:55链接:https://pan.baidu.com/s/17cDJe-6BUmloFQ4q3krS4Q 提取码:u7o0链接:https://pan.baidu.com/s/17cDJe-6BUmloFQ4q3krS4Q
提取码:u7o0
-
部分细粒度分类数据集下载,包括CUB_200_2011,Stanford Cars等
2021-11-20 15:38:42偶尔会用细粒度分类的几个数据集,在此做一下记录,有需要的人也可自取,使用天翼云盘,可以满速下载。 CUB_200_2011:https://cloud.189.cn/t/NRnUV3aiQvAn (访问码:lmf9) Stanford Cars:... -
GoEmotions:一个细粒度情感分类数据集
2021-11-18 21:36:045、结论 GoEmotions数据集提供了一个大型的、手动注释的、用于细粒度情感预测的数据集。 我们的分析证明了注释的可靠性和Reddit评论中表达的情绪的高覆盖率。 我们希望GoEmotions将成为基于语言的情感研究人员的... -
美团细粒度用户评论情感分析数据集(2018-AI-challenger).zip
2019-12-31 15:10:18AI Challenger 细粒度用户评论情感分析;比赛资源,可放心使用 AI Challenger 细粒度用户评论情感分析;比赛资源,可放心使用 AI Challenger 细粒度用户评论情感分析;比赛资源,可放心使用AI Challenger 细粒度... -
CUB200-2011鸟类细粒度数据集训练集和测试集划分python代码
2019-10-22 12:24:33该数据集由加州理工学院再2010年提出的细粒度数据集,也是目前细粒度分类识别研究的基准图像数据集。 该数据集共有11788张鸟类图像,包含200类鸟类子类,其中训练数据集有5994张图像,测试集有5794张图像,每张... -
【数据集】LVIS:大规模细粒度词汇级标记数据集 ,出自FAIR ,连披萨里的菠萝粒都能完整标注…
2021-01-06 22:02:08最近,FAIR 开放了 LVIS,一个大规模细粒度词汇集标记数据集,该数据集针对超过 1000 类物体进行了约 200 万个高质量的实例分割标注,包含 164k 大小的图像。 LVIS 数据集概述 我们的目标就是通过设计和收集 LVIS,... -
细粒度情感方面情感数据集
2022-07-22 17:31:57豆瓣大众点评美团细粒度情感数据集方面情感数据集 -
细粒度的情感:SST-5数据集上五类情感分类的不同NLP方法的比较和讨论
2021-02-03 18:41:36细粒度情感分类 此仓库显示了对各种NLP方法的比较和讨论,这些方法可以在(SST-5)数据集上执行5级情感分类。 目标是使用多个基于规则,基于线性和神经网络的分类器来预测此数据集上的类,并查看它们之间的区别。 ... -
Pytorch框架下使用CUB200-2011细粒度数据集训练Bilinear CNN网络模型
2019-10-22 16:56:50代码如下: (1)config文件 # *_*coding: utf-8 *_* # author --liming-- import os CUB_PATH = '/media/lm/C3F680DFF08EB695/细粒度数据集/birds/CUB200/CUB_200_2011/dataset' PROJECT_ROOT = os.getcwd() PATH = ... -
Ai—challenger数据集细粒度情感分析
2020-12-29 11:30:01本次比赛我们提供了一个高质量的海量数据集,共包含6大类20个细粒度要素的情感倾向。参赛人员需根据标注的细粒度要素的情感倾向建立算法,对用户评论进行情感挖掘,组委将通过计算参赛者提交预测值和场景真实值之间... -
细粒度用户评论情感分析数据集(AI-challenge)
2020-03-03 17:30:38数据集分为训练、验证、测试A与测试B四部分。数据集中的评价对象按照粒度不同划分为两个层次,层次一为粗粒度的评价对象,例如评论文本中涉及的服务、位置等要素;层次二为细粒度的情感对象,例如“服务”属性中的... -
(二十七):CH-SIMS:基于情态细粒度注释的中文多模态情感分析数据集
2021-05-31 15:10:05文献阅读(二十七):CH-SIMS:基于情态细粒度注释的中文多情态情感分析数据集Abstract1 Introduction2 Related Work2.1 Multimodal Datasets2.2 Multimodal Sentiment Analysis2.3 Multi-task Learning3 CH-SIMS ... -
【NLP】文献翻译4——CH-SIMS:中文多模态情感分析数据集与细粒度的模态注释
2021-04-17 11:57:40相关工作2.1 多模态数据集2.2 多模态情感分析2.3 多任务学习3. CH-SIMS 数据集3.1 数据获取3.2 标注3.3 特征提取4. 多模式多任务学习框架4.1 单模态子网4.2 特征融合网络4.3 优化目标5. 实验5.1 基准5.2 实验的细节... -
细粒度图像分类的深度学习方法
2021-10-19 11:04:57细粒度图像分类旨在从某一类别的图像中区分出其子类别,通常细粒度数据集具有类间相似和类内差异大的特点,这使得细粒度图像分类任务更加具有挑战性。随着深度学习的不断发展,基于深度学习的细粒度图像分类方法表现... -
A Hierarchical Video Dataset for Fine-grained Action Understanding 分层视频高细粒度动作理解数据集-...
2021-03-11 22:07:50FineGym is provided by the Chinese University of Hong Kong.本数据集由香港中文大学提供。 finegym_categories.zip finegym_v1.0.zip -
情感分析:细粒度用户评论情感分析
2021-02-03 18:46:19依赖Python 3.5 PyTorch 0.4数据集使用AI Challenger 2018的细粒度用户评论情感分析数据集,共包含6大类20个细粒度要素的情感倾向。数据说明数据集中的评价对象按照粒度不同划分为两个层次,层次一为粗粒度的评价... -
细粒度情感分析中的lt, res, res15, res16数据集
2019-02-18 14:22:57公开数据集,包括lt,res,res15,res16等,其中每个数据集又分为训练集及测试集,又细分为sentence、label、term等文件。 -
细粒度用户评论情感分析数据集 AI Challenger 2018.rar
2021-12-07 09:46:39细粒度用户评论情感分析数据集 AI Challenger 2018.rar -
细粒度分类 数据集整理
2019-12-18 11:30:061. 数据集情况介绍(摘自魏秀参整理的细粒度分类网站) 2. 下载链接(有些事官方链接,有些是自己的百度云) 1. CUB200-2011:链接: [https://pan.baidu.com/s/1fJ-n0LQIlnxhhdGVYnn77w]...