精华内容
下载资源
问答
  • 手写汉字数据集(HWDB1.1),图片形式的各种汉字以经分别在各个文件夹内存储好。
  • 手写汉字数据集HWDB1.1文件转换代码-GNT2PNG,更多的内容请参见我的博客,里面有详细的介绍
  • 联机手写汉字数据集下载总结

    千次阅读 2019-10-24 20:27:42
    中科院CASIA数据集 CASIA-OLHWDB1.0 :手写单字,171 个英文数字符号,3866 个常用汉字(其中3740个属于GB2312 - -级汉字),420套,分别为420个人书写。总共1,694,741个有效样本,分别存在420个POT文件中。 CASIA-...

    中科院CASIA数据集

    CASIA-OLHWDB1.0 :手写单字,171 个英文数字符号,3866 个常用汉字(其中3740个属于GB2312 - -级汉字),420套,分别为420个人书写。总共1,694,741个有效样本,分别存在420个POT文件中。

    CASIA-OLHWDB1.1 :手写单字,171个英文数字符号,3755个GB2312级汉字,300套,分别为300个人书写。总共1,174,364个有效样本。分别存在300个POT文件中。

    下载地址

    其他的数据集需要申请。

    哈工大HIT-OR3C数据集

    HIT-OR3C由5个子集组成 (GB1, GB2, Digit, Letter, 和Document),GB1和GB2是汉字标注库GB2312-80内2个子集的简写。GB1, GB2, Digit, 和 Letter子集已采集完成122套,共832,650 个手写汉字。Document子集包括10个从新浪网收集的文档,每个文档采集2套,共收集了20套。文档子集共有77,168个字符, 覆盖2,442个字符,其中2,286个来自GB1,97个来自GB2,49个来自Letter, 10个来自 Digit。

    下载地址

    华南理工SCUTCOUCH-2009数据集

    SCUT-COUCH2009是一款包括12个子集的完整数据,它们分别是:中文词组、国标一级汉字、国标二级汉字、国标一级汉字对应的繁体字、汉语拼音、英文字母、阿拉伯数字、常用符号、Word8888、Word17366、Word44208和联机文本行数据。每套完整的SCUT-COUCH2009包括6,763个GB2312-80单汉字,5401个Big5繁体字,1384个和GB2312-80一级字库相对应的繁体字,8,888个常用的中文词组,17,366个常用中文词组,摘自《现代汉语大辞典》(第四版)的44,208个词组,2,010个汉语拼音,184个其他符号(包括字母、数字和常用符号)和8,809行联机文本行;现在版本的SCUT-COUCH2009使用PDA或手写屏进行采集,已完成了由190多人书写的完整的数据,字符总数超过3.6百万个。

    下载地址(需要申请)

    今天是1024哦!

     

    展开全文
  • 在上篇博客《如何使用CASIA-OLHWDB联机手写汉字数据集?》中,博主也在寻找解码pot文件的方式,都所求无果。后来,博主联系了中科院自动化研究所,终于得到了一份pot文件阅读器的C++源码,作为参考,成功解决了问题...

    在上篇博客《如何使用CASIA-OLHWDB联机手写汉字数据集?》中,博主也在寻找解码pot文件的方式,都所求无果。后来,博主联系了中科院自动化研究所,终于得到了一份pot文件阅读器的C++源码,作为参考,成功解决了问题。

    后来,发现有很多人也遇到了相同的问题,向博主询问解码方式,由于博主比较繁忙,没有及时回复。今天,博主把源码放到csdn上,有需要的可以下载。

    注:尊重劳动成果,下载需要积分;如果没有积分的同学可以联系博主,博主会通过邮件发给你。

    下载地址:pot文件解码器C++源码

    展开全文
  • 分享一个手写汉字数据集

    千次阅读 2020-08-13 18:23:38
    说明一下,这个数据集基于中科院自动化研究生HWDB上,修改加工而成的,把单字拼成了字符串,不过需要说明的是,这个数据集只有3755个字,并不算很全。 训练集有20万,测试集是1万。 图片大小是长280,高32。 百度...

    说明一下,这个数据集基于中科院自动化研究院的HWDB上,修改加工而成的,把单字拼成了字符串,不过需要说明的是,这个数据集只有3755个字,并不算很全。此外,语义信息是用的搜狗的新闻数据。

    训练集有20万,测试集是1万。

    图片大小是长280,高32。

    百度网盘

    提取码: i6km

    展开全文
  • 压缩包包含了gnt2png.py alz压缩包解压软件,以及HWDB解压数据集解压完成的PNG文件的下载地址。
  • 数据集下载地址:http://www.nlpr.ia.ac.cn/databases/handwriting/Online_database.html 下载得到的文件:.pot文件 官方给出了pot的数据格式: 但不知道如何提取其中的内容,在线求解。 (已解决) ...

    数据集下载地址:http://www.nlpr.ia.ac.cn/databases/handwriting/Online_database.html

    下载得到的文件:.pot文件

    官方给出了pot的数据格式:

    但不知道如何提取其中的内容,在线求解。

    (已解决)

    展开全文
  • 浏览最下方 HWDB1.1数据集 .gnt格式数据快速获取途径,后台回复,即可直接获取 gnt 文件 运行命令: python gnt2png.py gnt2png.py 文件代码 只需替换 train_data_dir 和 test_data_dir 的路径即可运行 import os ...
  • 手写汉字数据集下载网址,包含很多手写汉字的图片,此外也可以看我的csdn 加油 加油 加油 加油 加油
  • 手写汉字识别数据集的预处理

    千次阅读 2019-04-18 17:57:37
    手写汉字图片-HWDB的原始数据来自来自于中科院自动化研究所 下载地址为:分别是训练和测试 一共包含3000多个汉字 http://www.nlpr.ia.ac.cn/databases/download/feature_data/HWDB1.1trn_gnt...
  • 这是我修改的别人的代码,别人的代码有点问题,我修改了一下,代码的正确率很高,可达90%以上,这是一个5层卷积神经网络的代码,误差传递和梯度更新代码里都有,可自学。
  • 共包含3755类手写汉字,训练来自240人写的897758个汉字,测试来自60人写的223991个汉字。
  • TensorFlow手写汉字识别

    千次阅读 2017-08-11 09:47:19
    手写汉字数据集: CASIA-HWDB
  • 之前毕业设计用TensorFlow做了手写汉字识别,使用的中科院的数据集。 现在用Pytorch复现一下。 下载链接在文末
  • 数据集包含了100个汉字的图片见,每个汉字都标上了数字标签,具体的使用可参考博客中的代码(手写汉字的分类识别)
  • tf28: 手写汉字识别

    万次阅读 热门讨论 2016-12-26 13:36:29
    本帖就介绍一个和MNIST类似,同时又适合国人练习的数据集-手写汉字数据集,然后训练一个简单的Deep Convolutional Network识别手写汉字。 识别手写汉字要把识别手写洋文难上很多。首先,英文字符的分类少,总共10+...
  • 手写汉字数字识别(构建数据集+CNN神经网络) 期末,P老师布置了一个大作业,自己构建数据集实现手写汉字数字的识别。太捞了,记录一下过程。大概花了一个下午加半个晚上,主要是做数据集花时间。 一、构建数据集...
  • 本帖就介绍一个和MNIST类似,同时又适合国人练习的数据集-手写汉字数据集,然后训练一个简单的Deep Convolutional Network识别手写汉字。 识别手写汉字要把识别手写洋文难上很多。首先,英文字符的分类少,总共10+...
  • TensorFlow22: 手写汉字识别

    千次阅读 2017-06-05 16:34:45
    本帖就介绍一个和MNIST类似,同时又适合国人练习的数据集-手写汉字数据集,然后训练一个简单的Deep Convolutional Network识别手写汉字。 识别手写汉字要把识别手写洋文难上很多。首先,英文字符的分类少,...
  • 手写数字数据集,0-9。 28*28以及30*30两种,每种10000张。仅包含图片。支持定制汉字,以及字符,私聊。
  • # -*- coding=utf-8 -*- # top 1 accuracy 0.9249791286257038 top k accuracy 0.9747623788455786 import os import random import tensorflow.contrib.slim as slim import time import logging ...
  • 此数据集为自然场景下的特定场景下的汉字数据集,即,不包含自然场景下的手写体、过度扭曲图、以及艺术体,可以参考道路交通路标上的规范字体,数据集解压后,此数据集包含2602类汉字,32万张汉字图片,里面包括黑体...
  • keras+卷积神经网络HWDB手写汉字识别

    千次阅读 2018-08-31 10:34:19
    写在前面 HWDB手写汉字数据集来自于中科院自动化研究所,下载地址: http://www.nlpr.ia.ac.cn/databases/download/feature_data/HWDB1.1trn_gnt.zip ... 源码 在gith...

空空如也

空空如也

1 2 3 4 5 6
收藏数 109
精华内容 43
关键字:

手写汉字数据集