精华内容
下载资源
问答
  • 信息证吗
    千次阅读
    2020-07-18 23:12:55

    一、前言

           最近想要玩一个关于驾驶证和行驶证信息提取的小项目,于是就准备开始学习相关的知识。因为之前对身份证号码提取有过了解,所以一开始整体的概念还是有的,比如这种项目需要使用opencv、ocr或者深度学习模型等等。于是就带着这些仅存的印象开始了这个项目。

    二、搜集资料

           在搜索实际项目之前,我先看了关于驾驶证和行驶证识别的基本原理。基本上就是分成两部分:使用opencv获取驾驶证信息在图片中的区域,然后截取出来使用文字识别工具进行识别。参考的主要是下面这两篇文章:

           刚开始我习惯性的直接去百度搜索,想要搜索一些开源的项目,但是我发现并没有多少可以使用的资源。大多是一些只讲基本原理或者是身份证识别项目。于是我换了个方向,准备去Github上去找,真的找了好半天。虽然开源项目不少,但是还是刚才说的那个问题,很多都是基于国外驾驶证做的项目,又或者是一些python和C++之外的语言写的项目(因为我之前只深入学习过C++和python),其他不熟悉的语言如果需要修改的话很不方便。

    三、实现方式①(调用百度OCR API)

           最后我只找到了一个比较合适的,这是一个基于百度文字识别(OCR)服务的项目,它通过百度OCR服务提供的一系列API来实现各种场景的文字识别。主要有以下几种服务:

    • 通用文字识别
    • 卡证文字识别
    • 票据文字识别
    • 汽车场景文字识别
    • 教育场景文字识别

    该项目把这所有的服务整合到了一块,项目结构比较清晰,也比较合理。模块划分的也很好,使用起来方便,如果需要修改代码也比较方便。现在把该项目的Github链接放出来:BaiduTextApi

           然后我大致看了一下这个项目的结构,其实还是很清晰明了的,而且是用python写的。并且结合百度OCR提供的官方API技术文档,弄明白了百度OCR服务的使用方式,也弄明白了该项目是如何使用的。

           最后根据具体的需求,简单的修改了一下代码就可以使用了。但是有一点需要注意的是,既然是百度的OCR服务,正常来说是要收费的,也就是你需要花钱来获取API使用时所需的一些信息,这个你看了官方API文档之后就知道是啥意思了。至少我目前是这么理解的,就是当你的账号有使用这些服务的权限的时候,你就可以获得请求服务所必不可少的这几条信息。

    四、实现方式②(使用OpenCV和离线OCR脱机运行)

           其实上述第一种实现方式有一个局限性(是否局限取决于你自己的实际需求),那就是必须联网才能够工作。如果你想要脱机运行,那么该项目就不太合适了,这个时候就需要寻求其他的解决办法了。接下来就来简单的说一下我还在做的一个脱机运行的识别项目。

           该项目主要分为以下几个部分:

    • 原始图片的透视变换,为了方便后面使用固定位置法截取各部分的内容;
    • 使用固定位置法截取各部分信息,方便后续的字符分割;
    • 对截取后的每一部分的内容进行字符分割,其中字符分割中使用到了opencv中的各种形态学操作;
    • 对分割之后的每一个字符单独进行OCR识别

    目前前面三步都可以比较好的实现,虽然还有一些瑕疵和改进的空间。而存在的问题就是第四步效果不是太好。其影响因素主要有两个:

    • 原始图片清晰度不够,这个取决于你怎么采集图片或者说你的使用场景是什么;
    • 中文文字OCR识别精度低,训练不够充分

    针对以上两个问题,其中第一个要么你采集更加清晰的图片,要么对图片做一些图像增强的预处理使其更加清晰,这个暂且不讨论。下面主要来说一下第二个问题,主要有以下几种思路:

    • 第一种是,直接更换OCR工具,最开始使用的是tesseract,这个对于中文的识别率确实感人,尤其是清晰度不够的情况下。我们可以考虑使用EasyOCRcnocr或者是百度的PaddleOCR。这几种都是训练的比较好的,对中文更加的友好,识别率也更高。
    • 第二种思路就是我们自己去训练OCR,在Github也有不少支持训练自己的数据集的项目,PaddleOCR就是其中之一。下面把我找的几个支持训练的OCR项目的链接贴出来:
      cnocr
      chinese_ocr
      PaddleOCR
      crnn_ctc_ocr_tf
      CRNN_Chinese_Characters_Rec

    以上提供的项目仅供参考,我自己大致看了一下,都是支持训练的,但可能所需环境不同,训练的复杂程度也不同。那么我就另开一篇简单记录一下以上所说的各OCR项目训练时应该注意的一些东西。

    五、实现方式②的改进版

    在使用方式2实现的时候,发现效果一直不是很好,究其原因,是因为透视变换需要寻找驾驶证的轮廓,而在寻找轮廓的时候受到背景的干扰比较强。而且后面采取的是固定区域截取各部分信息的方法,一旦透视变换的结果不是特别理想,那么截取出的各部分信息的区域就会偏差很大。所以,后来没有去掉透视变换的步骤,而是在透视变换之后,将固定区域截取变成了相对位置截取。因为各部分的信息的相对位置是不变的,如果使用文本检测检测出一些比较容易检测的区域的位置,那么就可以根据相对位置获得其他区域的具体位置。改进方法的步骤如下:

    • 对传入的照片进行透视变换或者其他矫正操作,如旋转,以便于后续操作。
    • 在上述操作的基础上,对照片进行区域截取,也即截取出各部分信息,然后用于后续的识别操作。区域截取采取的是文本检测+相对位置结合的方式。之所以采取这种结合的方式,是为了减少文本检测的误差,但是如果文本检测效果非常好,也可以完全使用文本检测。
    • 在上述操作的基础上,对截取到的每部分区域进行字符分割,单个字符识别的话,有时候识别率会更高。
    • 对图像做一些增强操作,可能有助于识别率的提高。
    • 对获取到的每个字符单独进行识别或者每块区域整体识别。

    六、训练自己的OCR模型

    1、 PaddleOCR

    项目地址https://github.com/Alex-1997-Wzx/PaddleOCR

    这个项目兼顾了文字检测文字识别,所以如果你有足够的数据集,是可以训练的很好的,毕竟行驶证/驾驶证它们有一定自己的特点,比如照片颜色,字体等等,而且区域都是固定的。我对这个项目的理解主要分为以下几个部分:

    1)、如果你想直接使用 ,不想训练,那么你可以按照文档说明安装相应的环境,然后直接按照使用说明进行预测推理即可。如果你想要部署在端侧,比如树莓派上,文档中也提供了在端侧部署的例子,只需要类比其操作就可以一步一步的在端侧完成预测推理。其中使用到了Paddle Lite,它是轻量化的推理引擎,可以提升在端侧的推理速度。其中有几点需要注意的是:

    • 正常推理的时候,我们可以直接运行PaddleOCR / tools / infer路径下的几个文件,分别有文字检测程序,文字识别程序以及检测加识别的程序。这些程序使用的都是inference模型,该模型是预测推理时使用的非常重要的文件,当我们自己训练模型的时候,也需要先把训练好的模型转换成inference模型,然后才能开始预测推理。也就是说,它是预测推理所直接调用的文件,非常重要,具体使用看文档即可。

    • 当我们在端侧直接使用的时候,也需要使用inference模型,不过中间又多了一步,还需要将inference模型转换成opt模型。此外,使用的推理引擎也从PaddlePaddle变成了轻量化的Paddle Lite。不过提供的案例是C++版本的,我觉得使用起来不是太方便,如果你要将整个项目作为一个模块去实现一些逻辑比较麻烦。这个时候一个很重要的东西就派上用场了,那就是Paddle Lite,我们可以使用其提供的各种API(链接奉上:Welcome to Paddle-Lite’s documentation!),里面有多种语言多种使用方式可供选择。而我们只需要获取由PaddlePaddle深度学习框架产出的模型文件,就可以结合所提供的API一步一步的在端侧实现预测推理。

    2)、如果你想要自己训练模型,那么也可以,这个详细的步骤,以及数据集的组织形式在文档中都有说明。我们只需要对训练代码稍作修改,使其训练完成之后将模型保存起来就可以了,之后我们就可以直接使用该保存的已训练模型,结合Paddle Lite提供的API在端侧预测推理。当然也可以运行PaddleOCR / tools / infer路径下的几个文件,使用训练得到的inference模型直接进行预测推理。

    2、 CRNN_Chinese_Characters_Rec

    项目地址https://github.com/Alex-1997-Wzx/CRNN_Chinese_Characters_Rec

    这个项目只有文字识别的部分,具体的训练和测试方法可以参考该项目自己提供的教程。这里我只再简单的说一下需要注意的地方:

    1)、一共有四个需要我们自己提供的东西:

    • 含有多张训练图片的文件夹,这些图片里都包含文字
    • 包含大量字符的char.txt文件,也即字符库
    • 包含训练图片名称 图片中的字符对应的索引 信息的train.txt
    • 包含测试图片名称 图片中的字符对应的索引 信息的test.txt

    2)、在train.txttest.txt中,第一段内容是图片的名称,因为之前我们已经提供过训练图片所在的文件夹路径,所以这里直接提供图片名称即可;第二段内容是图片中的每一个字符(按顺序)对应的自己在字符库char.txt中的索引。

    3、 chinese_ocr

    项目地址https://github.com/YCG09/chinese_ocr

    这个项目有CTPN文字检测部分和DenseNet文字识别部分,这两部分都可以自己进行训练。

    • 先说CTPN文字检测,这部分提供的数据集链接失效了,我没有找到,所以就无法知道数据集如何组织的,所以这个暂且就不自己训练了。而且提高识别率主要是需要重新训练文字识别部分,所以文字检测我们可以直接使用作者已经训练好的模型。
    • DenseNet文字识别部分,如果我们想要训练自己的数据集,我们就下载教程中提供的数据集,看一下数据集组织形式,按照其所述方法进行训练即可。
    4、crnn_ctc_ocr_tf

    项目地址https://github.com/bai-shang/crnn_ctc_ocr_tf

    这个项目只有CRNN文字识别部分,并且支持训练。训练数据集的组织方式是如下的图片路径 文字内容的形式。可以使用自己的数据集按照这个形式进行组织,训练自己的数据集。还需要注意的是,训练时该项目会把数据集转变成tfrecord的形式。

    90kDICT32px/1/2/373_coley_14845.jpg coley
    90kDICT32px/17/5/176_Nevadans_51437.jpg nevadans
    
    更多相关内容
  • 教师资格 信息技术难考吗

    千次阅读 2021-07-23 04:03:38
    教师资格 信息技术难考吗信息技术教师资格被称为史上最难考的教师资格科目,你要不复习个一年半载的你都考不过。信息技术教师资格并没有那么简单,对于没有学过计算机方面的同学还是有一定难度的。在C语言和...

    教师资格证 信息技术难考吗

    信息技术教师资格证被称为史上最难考的教师资格证科目,你要不复习个一年半载的你都考不过。信息技术教师资格证并没有那么简单,对于没有学过计算机方面的同学还是有一定难度的。

    在C语言和C++这里,计算机本专业的学生都有很大一部分会望而却步。不过唯一好的一点就是C语言和C++在教师资格证考试内容中涉及较少。

    由于小学信息技术没有单独的学科知识,这里小编就不单拿出来分析了,想要考小学信息技术的小伙伴只要复习教学设计即可。

    大家可以看一下这是中学部分的科目三试卷试题结构组成。

    初中信息技术笔试试卷组成:

    f66f832abab4762c.png

    高中信息技术试卷组成:

    b07de2e4a78a0151.png

    其实大家通过以上这两张图可以看出,教师资格证考试中其实信息技术学科知识的占比不是很大,我们只要抓住要点认真复习即可。

    大家也可以看到其实信息技术并没有大家想得那么容易,因为信息技术他并不像语文数学那样,我们在平常学习中就能涉及到,怎么说毕竟语文和数学这两科大部分人都是从小学学到高中甚至是大学吧!所以还是建议大家慎重报考,尤其不是计算机本专业的考生。

    想了解更多教师资格证相关资讯,如教师资格证报名时间、考试时间以及报考条件、相关知识,敬请关注中国教育在线教师资格证频道!

    展开全文
  • 使用ADO控件出现的问题,该部件的许可证信息没有找到的解决方法
  • 小学有没有信息技术教师资格考试?教师资格是没有信息技术这个科目的。小学教师资格笔试的考试科目为:综合素质,保教知识与能力,是不分科的,面试进行分科,小学面试科目分语文、英语、社会、数学、科学、音乐...

    小学有没有信息技术教师资格证考试?教师资格证是没有信息技术这个科目的。小学教师资格笔试的考试科目为:综合素质,保教知识与能力,是不分科的,面试进行分科,小学面试科目分语文、英语、社会、数学、科学、音乐、体育、美术。初中科目、普通高级中学和中等职业学校文化课科目才有信息技术课。

    a4c26d1e5885305701be709a3d33442f.png

    (一)小学笔试考试是不分科的,笔试科目有:

    综合素质(小学)、教育教学知识与能力(小学)

    (二)小学面试考试有分科目,面试科目是:

    语文、数学、英语、社会、科学、体育、音乐和美术,共8个学科。

    只有初中科目、普通高级中学和中等职业学校文化课科目才有信息技术课。

    (三)中学教师资格证考试科目有:

    综合素质(中学)、教育知识与能力、学科知识与教学能力。

    其中,初级中学学科知识与教学能力包括语文、数学、英语、物理、化学、生物、思想品德、历史、地理、音乐、体育与健康、美术、信息技术、历史与社会、科学15个科目;高级中学学科知识与教学能力包括语文、数学、英语、物理、化学、生物、思想政治、历史、地理、音乐、体育与健康、美术、信息技术、通用技术14个科目。自2017年下半年开始,各试点省份的中小学教师资格考试初中、高中、中职文化课类别增设“心理健康教育”“日语”“俄语”学科。

    。。。

    阅读原文:http://www.shjszg.com/show-101-9331-1.html

    展开全文
  • CISP注册信息安全工程师证书及展示

    万次阅读 2021-07-07 10:25:43
    但实话讲,挺后悔考这个国产版本的信息安全资格认证的,因为资格认证的管理部门工作效率奇低呀! 大家看这个证书颁布时间是2021.4月,而我实际上是去年10月考的,时隔6个月发证,再过3个月才寄到我的手上。 公务员...

    原想我也没打算去外企服务,没必要直接上CISSP了。但实话讲,挺后悔考这个国产版本的信息安全资格认证的,因为资格认证的管理部门工作效率奇低呀!
    大家看这个证书颁布时间是2021.4月,而我实际上是去年10月考的,时隔6个月发证,再过3个月才寄到我的手上。
    公务员单位的工作节奏是不是太拖累经济发展了吧 : )

    在这里插入图片描述

    展开全文
  • 百度: 京公网安备11000002000001号 京ICP030173号 ©2021 Baidu 互联网药品信息服务资格证书 (京)-经营性-2017-0020 信息网络传播视听节目许可 0110516 淘宝: © 2003-现在 Taobao.com 版权所有 增值电信...
  • 信息系统项目管理师考试是否有必要考?证书有什么用处呢?对以后的工作有什么好处?2019年下半年的软考报名开始了要不要报?如果以后从事的工作不是it行业呢?相信有很多朋友都有存在这样或那样的疑问,那么今天在...
  • 2020年考信息技术教师资格,是考高中的还是初中的好呢?2020已过半,下半年报考时间即将来临,有小伙伴想考信息技术教师资格,但是很疑惑该选高中还是初中呢,大多数人都会建议能报考高中的,尽量考取高中教师...
  • 我报考的是中学的信息技术。所以这里主要说的是中学信息技术的备考过程。 建议: 这一科刚开始就没有看视频,直接刷的真题。买了一套某公的历年真题卷。但是发现选择题错的太多了,大题目考了编程,但都是一些简单...
  • 青岛房产证信息查询步骤

    千次阅读 2021-01-27 15:41:01
    1,登录青岛网上房地产网址:https://www.qdfd.com.cn/qdweb/realweb/wsbs.jsp 2,点击网上办事---证书证明验证服务 3,点击证书验证及状态查询,弹出弹窗后按要求填写即可
  • 通过创建许可,来显示线程的启动信息,便于了解线程情况。 511遇见易语言多线程大漠多线程 代码: .版本 2 .支持库 EThread .子程序 子程序1 .参数 参数 .局部变量 n 编辑框2.内容 = “正在启动线程” ...
  • http://www.ispl.cn/ispl/jsp/common/ProductList_Public.jsp
  • 下面我把暴露人员基本表信息的脚本提供出来,需要实施人员在用户的当前账套下运行该脚本 脚本:insert into Hr_BD_Dts_TableType(TableTypeId,TranMode,Parenttab ,Recfield,FlagField,ParentField,RefField,Table...
  • 为什么要报考信息系统项目管理师考试? 关注我的朋友因为都知道信息系统项目管理师这个考试在我文章中出现的此处比较多,相信大家也都知道是因为关注这个考试的考生比较多,最近很多朋友、同事问我什么要报考信息...
  • bootstrap做登录注册页面带验证

    千次下载 热门讨论 2015-12-15 18:26:05
    用bootstrap做的登录,注册页面,使用validate进行表单验证,是本人从空白页面搭建的,亲测可用,1积分算是我的辛苦费吧。 我会通过博客注明知识点:... 希望能帮到大家。没有积分的小伙伴可以私信我,我加qq发给你
  • 程序员可以考的挺多的,建议考“软考”,所谓的软考就是计算机技术与软件专业技术资格(水平)考试,是原中国计算机软件专业技术资格和水平考试的完善与发展。这是由国家人力资源和社会保障部...
  • 外地的驾驶证到期了人在上海可以上海本地更换驾驶证吗?外地驾驶证在上海换证流程是什么? 外地的驾驶证到期了人在上海可以上海本地更换驾驶证吗?外地驾驶证在上海换证流程是什么? 答案是可以的,外地驾照可以在...
  • ICP许可 [互联网信息服务业务]

    千次阅读 2020-11-06 23:20:37
    互联网信息服务(ICP许可)业务是指:通过信息采集、开发、处理和信息平台的建设,通过公用通信网或互联网向用户提供信息服务的业务。信息服务的类型按照信息组织、传递等技术服务方式,主要包括信息发布平台和...
  • 入网许可是加贴在已获得进网许可的电信设备上的质量标志,由信息产业部统一印制和核发,也是行货手机的真品凭证之一。入网许可上有水印,表面的颜色不均匀,有深有浅,有粗有细;而假的多为复印,表面颜色没有...
  • 网络安全人员必考的几本证书

    万次阅读 多人点赞 2021-11-15 17:44:09
    含金量次之的CISP——国家注册信息安全专业人员,包含CISE(工程师)、CISO(管理)、CISA(外审)三个不同的方向。 随着证书的兴起,很多人存在盲目跟风报考,这样可能会浪费你的钱包和时间,以下这些证书是对于...
  • 学校于2019年采购的版本即将过期,信息网络技术中心已于近期完成2020年7月至2021年6月MATLAB许可的更新升级,软件打开时可能会提醒许可即将到期,需要用户在MATLAB界面上更新,具体操作指南详见附件。...
  • OCX许可 用友U8产品使用了大量的OCX控件...在深入研究,就会知道,一般ocx控件都会需要个注册表文件,将许可证信息写入到如下位置,VB6编译的时候可以选择是否需要许可,需要时就会生成vbl文件,帮助分发给最终使...
  • 教师资格之中学信息技术面试心得

    千次阅读 热门讨论 2019-01-30 15:05:52
    准考上要求早上7点半就得到面试的考点。其实去迟了也没事,那些管事的老师会让你后面的先替补上。候考的时候可以看资料,可以玩手机(PS:老师说不能玩,但是我们玩了手机他也没说什么)。 2、...
  • 立足服务群众开展人脸比对技术应用,完成了对携带有效身份证件的旅客进行现场人像信息与身份证件内存储的人像信息识别比对,确保“人证合一”,并对未携带身份证件的旅客依托“无入住”系统,进行现场人像信息与...
  • 2019年12月14日就可以开始下载打印准考了,每年下载打印准考都会出现问题,准考打印会出现的问题有哪些?下面金程考研小编总结了准考打印30个常见问题和解决办法汇总,助你顺利考研。1、忘记用户名或密码...
  • 2、计算机二级:二级证书表明持有人具有计算机基础知识和基本应用能力,能够使用计算机高级语言编写程序,可以从事计算机程序的编制、初级计算机教学培训以及企业中与信息化有关的业务和营销服务工作。 参考资料...
  • ug许可卸载工具

    万次阅读 2021-08-01 07:53:54
    软件介绍一键清除UG许可工具能全自动清除NX许可和错误的NX许可注册表信息,一般来说,当你UG安装打不开或者提示NX许可错误的时候,很多UG新手都是卸载了UG,再重新来次,大家都知道安装UG很慢,卸...
  • 如何打印计算机准考

    千次阅读 2021-07-23 00:48:27
    最后查看报名信息界面,并点击打印准考即可。本文操作环境:windows7系统,DELL G3电脑。可以在电脑上打开全国计算机等级考试的官方网站,选择自己所在区域登陆进入以后进行打印。登录进入所属区域的全国计算机...
  • 互联网信息服务ICP许可有效期是五年,期满90前续期: 每年都要做年报:
  • 可以解决多方对身份查询记录的争议,以及对授权单位违规行为固,但不能从根本上解决公民信息被侵犯。 对于身份验证场景: step1.公安与其他需要验证供名身份的单位组成一个联盟链 step2.我向公安节点发出“请向...

空空如也

空空如也

1 2 3 4 5 ... 20
收藏数 1,920,744
精华内容 768,297
关键字:

信息证吗