精华内容
下载资源
问答
  • ------------word文档可编辑------------- 电子商务环境下企业物流配送问题研究 2011年03月14日19:03 中国电子...提出了我国电子商务环境下物流配送问题的解决策略 1基于电子商务下的物流配送发展现状分析 1.1电子商
  • 矿井通风作为矿井的“血液循环系统”,是矿井安全生产的基石,在智能化背景下发展智能通风技术装备是保障我国发展少人化、无人化煤矿的必由之路。从通风参数测定与监测、通风网络分析与决策、通风调控技术与装备3个...
  • 一线工程师告诉你嵌入式真实现状发展前景

    万次阅读 多人点赞 2018-10-02 18:49:59
    个人说明:本人并不是年薪百万的技术大牛,但总算是一名合格的嵌入式工程师,现在某企业担任嵌入式软件工程师开发一...百度搜索“嵌入式”、“嵌入式开发”、“嵌入式发展前景”等字眼,出来的都是一大堆培训机构,...

    个人说明:本人并不是年薪百万的技术大牛,但总算是一名合格的嵌入式工程师,现在某企业担任嵌入式软件工程师开发一职,以下观点可能会带有片面或者分析不全,但却是一名一线企业嵌入式软件开发者真实感受和所得,希望能帮助那些有需要的人,我明白年轻人出来打拼都不容易。

    为何要写这片文章?小生也是过来人,踩过你们踩过的坑

    百度搜索“嵌入式”、“嵌入式开发”、“嵌入式发展前景”等字眼,出来的都是一大堆培训机构,出来的都是一大片他们所谓的对嵌入式行业的“见解”,不否定其内容有一定的专业性,但其中“水份”我想大家比我更清楚,“卖瓜赞瓜”的道理谁都懂;或者出来的是几年前的“嵌入式状况”,与当今嵌入式环境相比,企业无论是在开发、用人、内容、市场上都发生了很大的改变。因此,作为一名一线企业嵌入式软件工程师的我,想通过自己的实际经历理性地评论当今嵌入式行业的真实状况。本文章写于2018年10月1日,小生不才,自认为可以反映当今嵌入式行业的一个真实状况,以及它的科学性和前沿性可以是2018-2020年期间嵌入式的定义。

    一.嵌入式的定义和举例分析

    官方定义:

    根据IEEE(国际电气和电子工程师协会)的定义,嵌入式系统是“控制、监控或者辅助设备、机器和车间运行的装置”。这主要是从应用上加以定义的,从中可以看出嵌入式系统是软件和硬件的综合体,还可以涵盖机械等附属装置。

    目前国内一个普片被认同的定义是:以应用为中心、以计算机技术为基础,软件硬件可裁剪,适应应用系统对功能、可靠性、成本、体积、功耗严格要求的专用计算机系统。

    说白了就是先设计硬件,然后根据需求编写能在该硬件上运行的软件,就成了所谓的“智能硬件”。

    或者说得还不够明白,那行,我们说一说具体的嵌入式产品有哪些,嵌入式是做什么的:

    传统嵌入式产品:空调主控模块、冰箱主控模块、家用遥控器、智能手机、教学投影仪、音响系统、雷达系统、路由器等等

    前沿嵌入式产品:无人机、智能音响、机器人控制、城市天眼系统、智能家具、自动驾驶汽车、扫地机器人、小米手环等等

    一起看一些前沿的嵌入式产品:

    下面是大疆无人机,可应用在高空拍摄、军事侦查、高空作业、自动巡逻、农业工作、矿业勘测、地形测绘等方面

    下面是天猫精灵智能音响,可进行语音识别、对话交互,应用与娱乐、生活、购物、智能家具控制等方面,属于新一代音箱

    下面是百度机器人,通过深度学习、神经网络等算法,实现“百度大脑”,具有自学习、自训练能力,如最强大脑的小度机器人

     下面是自动驾驶汽车,自动驾驶是一个前沿的科技,在我国还没本真正实施,不仅是技术方面,它还得得到政府支持和认同

    下面是海尔扫地机器人,能够自动巡逻,自动绘制室内地图,自动避障,自动清洁地面,还你一个干净的环境

    下面是小米手环3,可显示微信、来电等消息内容,振动闹钟,心率计算,步数统计,实时运动数据查询,睡眠质量监测等

    看完这些前沿科技产品后可发现,这些形形色色的“高端产品”都离不开嵌入式技术,离不开传感器技术,离不开软件程序。那么我现在可以告诉你,嵌入式开发的工作就是去开发以上等一系列产品 ,这就是嵌入式,相信此刻你对嵌入式行业已有“形而上学”的了解。

    二.嵌入式工程师在企业工作的真实内容

    嵌入式软件开发具体可以分三类:

    嵌入式驱动工程师:编写和移植各种芯片驱动(如音频芯片),优化硬件设备驱动(如温湿度传感器),得精通各种硬件接口协议(如I2C协议)、系统调度、信号量、锁机制等等,开发难度最大。该类开发者一般是软硬件综合型人才,一般的嵌入式驱动工程师指Linux上的驱动开发工程师,需要精通Linux驱动框架(platform框架、input子系统框架等),结合芯片本身去编写驱动,驱动的好坏很大程度上决定一个产品的好坏。业界对驱动人才的定义是三年才算入门,可见此门槛之高。

    嵌入式系统工程师:主要是编写固件,根据不同平台移植操作系统,根据应用场景来优化系统,需要熟悉整个操作系统组成与调度,对固件的稳定性高求很高,如果系统不稳定,驱动和应用也是白做的。

    嵌入式应用工程师:编写业务逻辑程序,调用驱动工程师提供的接口控制设备,软件开发过程所涉内容范围非常广,主要使用C语言开发,但经常会涉及C++、Java、python、JavaScript、PHP等各类语言以及各种脚本语言、数据库、前端后台、各种通讯协议、甚至一些从来没听过的协议或概念,需要很强的学习能力,该职位也是各大公司需量最大的,一般10人的开发小组,驱动开发与系统开发与应用开发的比例是1:2:7。

    根据我的经验,世界上可以分成两种嵌入式工程师,一种是大公司的嵌入式工程师,另一种是小公司的嵌入式工程师,我知道这样分类很不妥,但并非毫无道理,请听我一一下概述:

    大公司:大公司的特色是什么?答案:人多!

    人多导致的后果是什么?答案:项目分工非常细,都遵循“术业有专攻”这一哲学道理;

    例如职位是嵌入式驱动开发,那么大公司可能还会细分嵌入式显示屏驱动工程师、嵌入式音频驱动工程师、嵌入式电源驱动工程师等;这就是大公司一贯的作风,它希望去培养某一方面的人才;说白了就是如果你分配到的是一个显示屏驱动项目,那么有可能你这一年内都是在开发显示屏驱动,一年后你将是显示屏驱动方面的一个小专家;在大公司记住一点,你做的东西都是很“精”的;同时,大公司的薪资水平和福利也是相当可观的,有完善的晋升路线,离职率一般不高。

    小公司:小公司的特色是什么?答案:人少!

    人少导致的后果是什么?答案:项目分工不明确,什么都得干,它给你灌溉的思想是“小陈,我们培养的是综合性人才,在这里你就是全栈工程师”;

    估计很多人都没听明白,意思是说这里人少活多,你什么都得干。小公司才不会管你是嵌入式驱动工程师还是嵌入式应用工程师(有的公司还是区分的,的确不能以片盖全),反正是活你就得干,分分钟前端后台服务器你都得给我干,不要跟我说什么没学过,没学过就去学呗。小公司还有一个特色就是:“节奏快”,大公司里面可能开展一个项目会花上几个月的时间或者更长,在小公司是不存在的,领导都是指望着你几天或者两三周完成,那你也只能说呵呵了。的确,在小公司你可以得到飞速的进步,很强的综合性技能,前提是比人家花出更多的时间,把每一个项目理解清楚,而不是应付心态。坚持下来,两年后必能独当一面。小公司提供给应届生的薪资水平相对与到大公司来说要低,其福利不完善和晋升路线也一般比较模糊,所以小公司的离职率会比较高,经常出现两年三跳的情况。

    还有一个经验分享给年轻人:无论哪种语言,程序代码只是一个简单的工具,最后真正留下的只有原理、协议、框架、思维。

    三.嵌入式发展前景与当今状况

    目前的嵌入式开发更倾向于智能化,也就是我们所说的智能硬件(硬件+软件),从现在各种前沿的嵌入式产品来看的确如此,嵌入式产品的一个发展趋势是更倾向与自动化控制和人机交互,而不是强调“算法”这一块,要区分你仅仅是一名嵌入式工程师而不是算法工程师,什么一大堆“人工智能”、“阿尔法狗”、“深度学习”、“神经网络”都不需要深入理解,那是研究生、博士生做的,小生并不是说你的能力不足,而是“术业有专攻”,这并不是一名嵌入式工程师的工作量,你需要做的仅仅是与他们的“云端大脑”进行对接,调用他们API就完事了。

    由于人工智能、深度学习、神经网络、区块链、大数据等先进学科的崛起,很多人都产生质疑:“嵌入式还有发展前景吗”?这个问题我在这里可以很肯定地告诉你:“嵌入式有很好的发展前景,前沿嵌入式技术即将崛起,或者说已经崛起”。的确,人工智能、大数据这些学科会给嵌入式带来冲击,就目前来看,大学生更倾向与python编程语言、机器学习这一块,而嵌入式学者的确比往年有所下降,但学者少了并不代表他的需求就少了,并不代表他的薪资水平下降了,目前的一个嵌入式技术更倾向于与智能学科相结合的趋势,以百度机器人为例,机器人的核心是大脑,即是“数据和算法”,但机器人大脑想机器人身躯能够像人类一样活动,能说会道,行走自如,那么就必须得依靠嵌入式技术,这就是我所说的嵌入式+智能学科应用,从长久来看,嵌入式只会越来越火,智能学科的崛起必定带动新型的嵌入式技术发展。

    对于发展前景,有一项更重要的参数,那就是当今嵌入式软件工程师的薪资水平,我下面给出一些理性的数据,是从各大招聘平台调研而来:(数据只能作为参考,具体薪资还是得看个人修为,有的达不到该薪资水平,有的早已超过该薪资水平)

    非211、985院校应届毕业生平均月薪:8k

    是211、985院校应届毕业生平均月薪:12k

    一年工作经验者月薪:10k-15k

    二年工作经验者月薪:12k-18k

    三至五年工作经验者月薪:20k-30k

    上述数据只针对那些“真正努力”的嵌入式工程师,不适合应“应付式工作”的嵌入式工程师,同时声明不对该薪酬水平负任何责任。

    四.展望人工智能带动前沿嵌入式技术

    人工智能给嵌入式带来的冲击,是福也是祸,人工智能实现智能化无处不依赖嵌入式技术,人工智能学科在不知不觉中带动嵌入式技术革新,从一系列智能产品,包括无人机、智能音响、机器人控制、城市天眼系统、智能家具、自动驾驶汽车、扫地机器人、小米手环等等,有哪个不依靠嵌入式技术来实现,并没有,人工智能越是想向人类表达他的智能水平,越是要依靠嵌入式技术,所以前沿嵌入式技术更倾向于嵌入式+智能学科的发展,当智能学科真正崛起,嵌入式必定又是一次浪潮与技术革新。

    展开全文
  • 手写数字识别的现状

    2021-05-22 15:01:48
    其中,联机手写数字识别相对较简 单些,它利用实时监控数字输入终端将所数字笔划变为一维电信号、笔尖移动的轨迹变为 坐标点序列输入电脑,因此联机手写数字识别处理的是一维笔划串信息,这些信息涵盖了笔划走向、...

    1 .研究背景

    手写数字识这项技术是光学字符识别(Optical Character Recognition,简称OCR)的一个重要分支主要分为脱机手写数字识别和联机手写数字识别。其中,联机手写数字识别相对较简 单些,它利用实时监控数字输入终端将所写数字笔划变为一维电信号、笔尖移动的轨迹变为 坐标点序列输入电脑,因此联机手写数字识别处理的是一维笔划串信息,这些信息涵盖了笔划走向、笔划顺序、书写速度和笔划总数,具有一定的连续性和追溯性。而脱机手写数字识别则不同,其主要是由终端输入静止的、不可追溯的二维数字点阵图像,计算机处理起来对复杂。本文研究的是脱机手写数字识别。

    手写数字识别的基本原理是将输入样本数字与对应的标准样本数字进行模式匹配,将具有最大类似度的样本数字作为识别结果。在整个识别过程中,关键的是对样本特征提取方法的选择和分类器的设计,快速而全面的特征提取方法和高效而准确的分类器设计,决定着识别系统的分类效果和性能优劣。

    由于手写数字识别没有上下文,不存在语义相关性,而一些部门对数字的要求又相对较高,如银行报表、邮政编码、财务报表等,所以对其识别精度也需要达到更高的水平。因为数字识别有广阔 的应用前景和实用价值,并且在文献检索、办公自动化、邮政自动分拣、银行票据自动识别 等领域也有重要应用,因此国内外许多研究学者也在为进一步提高识别率和通用性而努力. 并且,现今越来越多的智能信息处理系统和终端配备了电子摄像或扫描设备,数字识别可广 泛地应用于这类设备的输入、电子商务系统的签名鉴别等领域中,为文字信息处理的自动化 及进一步提升计算机智能输入提供重要的理论意义及广阔的应用前景,因此手写数字识别有着重大的现实意义。

    2.国内外研究现状

    手写数字识别作为人工智能的一个重要组成部分,有着极其广泛地应用前景和发展

    首先就国外来讲,阿拉伯数字作为全球通用的数字语言,与各个国家、民族和地区的文化背景无关,是世界上统一使用的符号。数字的识别类别较小,可以方便评估研究方法的有效性和可行性,同时也为字符的识别提供借鉴。最后,数字识别的智能系统,可以应用于财税、金融、邮件分拣等领 域,减少了人工操作带来的不便性和出错率,方便人们生活,为人类向智能领域的发展提供 更大的实用价值。

    目前应用于实际生活中为人么所熟知,比如击败李世石的ALPHA GO以及后来青出于蓝而胜于蓝的ALPHA GO ZERO[1] 以及网络春晚大放异彩的钢琴机器人等。 数字识别的方法有MRFSE运动图像2SVM(3)BP[4]聚类分析问等,这些方法在识别之前,需要对样本图像进行统一的预处理,如归一化、平滑去噪、字符 切分、二值化、笔画细化、特征提取、重建模型等,再加上网络训练参数众多使得识别过程 更加耗时、复杂。在实验过程中,大量实践表明,没有一种方法可以获得各种字符特征的100% 识别率,每个研究方法都存在局限性。

    卷积神经网络的网络结构使其更接近于生物神经系统,从而可以快速学习并良好记忆。

    牛津大学提出的识别、人脸检测、物体形状等的识别,成为语音分析和图像识别领域的研究热点,并取得 —定研究成果具有良好的应用前景

    3.研究的目的和意义

     手写数字识别目前已经形成了比较成熟的处理流程,一般是扫描仪扫描原始手写数字转 换成二值图像并进行预处理,然后对数字进行特征提取。接下来是将提取到的特征作为识别 阶段的依据,在识别阶段,将提取的特征输入分类器模型,最后由模型计算得出识别结果。

     

    展开全文
  • 人工智能发展现状

    万次阅读 2018-11-04 22:29:21
    当前的人工智能可以总结为数据和...1.数据现状 什么是数据呢?它既包括宇宙中天体运动的速度、角度及天体的质量,也包括人类文明的留下的文字、建筑、诗画等。数据无处不在,但数据的价值在于如何被采集和利用。 ...

    当前的人工智能可以总结为数据和智能算法的结合,也就是通过对过往经验的分析得到实验模型,并且利用这种模型指导实际的业务。如果把人工智能看作人类大脑的话,里面的血液就是数据,而承载着数据的流转的血管可以看作是相关的机器学习算法。

    1.数据现状

    什么是数据呢?它既包括宇宙中天体运动的速度、角度及天体的质量,也包括人类文明的留下的文字、建筑、诗画等。数据无处不在,但数据的价值在于如何被采集和利用。

    根据存储市场调研的最新报告,目前世界全年的数据保存量约为50EB(EB=1024PB=1152921504606847000B),这些数据来源于各行各业,包括:互联网、医疗健康、通信、公共安全以及军工等。

    虽然诸如Facebook、Google和阿里巴巴这样的国际互联网巨头已经积累了大量的数据,并且将数据进行分析来促进自身业务发展。但是截止到今天,全世界每年保存下来的数据不足数据产生总量的百分之一,其中可以被标记并且分析的数据更少。这种现状造成了两方面的瓶颈,一是数据产生和数据收集的瓶颈,二是采集到的数据和能被分析的数据之间的瓶颈。

    出现数据产生和数据采集的瓶颈的原因是多方面的,一方面是硬件存储成本的限制,另一方面是数据的采集缺乏标准。虽然互联网公司在数据采集和标准制定方面已经形成了一套成熟的体系,但对于传统行业来说,数据的采集方式还处于摸索当中。

    数据采集方面固然还需要制定更多的标准以及更强技术的支持,但是数据的应用方面也存在很多的缺陷。目前可以供分析的数据还只占很小的比例,原因主要有两方面:一是目前比较主流的机器学习算法都是监督学习算法,它需要的数据源是打标过的数据,而打标数据很多时候依赖于人工标记,人工打标的成本太高;二是当前对于非结构化数据处理能力较低,非结构化数据指的是文本、图片、语音、视频这样的数据,目前的科技水平在大批量处理和特征提取方面依然处于相对基础的阶段。

    互联网在不断发展,数据生成的步伐也不会停止。在未来,数据就像是水电煤一样,会成为重要的基础资源。在大数据时代,数据一定会展现出更大的潜能,人类社会也会进入数据处理技术(Data Technology,DT)时代。

    2.机器学习算法现状

    传统的机器工作模式是这样的:程序员向机器输入一连串的指令(代码),然后机器按照这些指令一步一步执行下去,最终的结果通常是我们可以事先预料的。机器学习方法是计算机利用已有的数据(经验)得出了某种模型,并利用这些模型来预测未来的一种方法。这个过程与人的学习过程极为相似,如下图所示:

     

    如今生活在这样的大数据时代,随时随地都可以看到机器学习的影子,通过机器对大数据进行分析而带来的人工智能应用,正在一点一点地改变人们的生活方式和思维方式。机器学习的常见场景如下:

    1) 聚类场景:人群划分和产品种类划分等。

    2) 分类场景:广告投放预测和网站用户点击预测等。

    3) 回归场景:降雨量预测、商品购买量预测和股票成交额预测等。

    4) 文本分析场景:新闻的标签提取、文本自动分类和文本关键信息抽取等。

    5) 关系图算法:社交网络关系(Social Network Site,SNS)挖掘和金融风险控制等。

    6) 模式识别:语音识别、图像识别和手写字识别等。

    随着数据智能、数据驱动等思想的传播,机器学习算法正在成为一种普世的基础能力向外输出。我们可以大胆猜测,未来随着算法和计算能力的发展,机器学习会在金融、医疗、教育、安全等各个领域有更深层次的应用,到那个时候,机器学习算法将真正做到颠覆生活并改变人类的命运。

    展开全文
  • 手写汉字识别的发展综述

    万次阅读 2019-03-19 20:29:19
    一、手写汉字识别的研究背景与现状 在上个世纪60年代,美国IBM公司开始进行了对印刷体汉字的模式识别研究工作,1996年Casey和Nag用模板匹配法成功的识别出了1000个印刷体汉字,在全球范围内,汉字识别开始展开了。而...

    一、手写汉字识别的研究背景与现状

    在上个世纪60年代,美国IBM公司开始进行了对印刷体汉字的模式识别研究工作,1996年Casey和Nag用模板匹配法成功的识别出了1000个印刷体汉字,在全球范围内,汉字识别开始展开了。而就在这个时候,研究界对手写汉字识别也掀起了高潮。因为汉字在日语中占有一定的地位,手写体汉字识别(HCCR)在一开始是由日本率先尝试研究的,在80年代,国内开始了对手写汉字的研究,因为汉语作为我们的母语,汉字主要在我国广泛使用,对汉字的种类、内涵、造字原理国内的掌握情况较透彻,所以关于手写汉字识别的深入研究主要集中在国内。
    手写体汉字识别由于数据采集方式不同可以划分为脱机手写体汉字识别和联机手写体汉字识别两大类。联机手写汉字识别所处理的手写文字是书写者通过物理设备(如数字笔、数字手写板或者触摸屏) 在线书写获取的文字信号,书写的轨迹通过定时采样即时输入到计算机中。而脱机手写文字识别所处理的手写文字是通过扫描仪或摄像头等图像捕捉设备采集到的手写文字二维图片。由于识别的对象不同,使得这两类手写识别技术所采用的方法和策略也不尽相同。前者的识别对象是一系列的按时间先后排列的采样点信息,而后者则是丢失了书写笔顺信息的二维像素信息,由于没有笔顺信息,加之由于拍照扫描设备在不同光照、分辨率、书写纸张等条件下,数字化会带来一定的噪声干扰,一般来说,脱机手写文字识别比联机手写文字识别更加困难。
    手写汉字识别是一个极具挑战性的模式识别及机器学习问题,主要表现在:
    1)书写方式随意,不规正,无法达到印刷体要求;
    2)汉字字符级别比较繁杂,极具变化特点;
    3)诸多汉字在外形上相似,容易混淆;
    4)要求具备庞大的训练数据,但采集困难,特别是随意性、无约束性手写,对应数据库的构建显得力不从心。
    可见,手写汉字识别进步空间较大,需要综合各项技术,增加训练样本数
    据,提升识别率。
    一般而言,传统的手写中文单字识别系统主要包括数据预处理、特征提取和分类识别三部分。然而,近些年来,传统的手写汉字识别框架进展并不明显,原地踏步,急需寻找其它的解决方案。而深度学习正满足了手写汉字识别革新需求。实践证明,在深度学习技术协助下,联机HCCR、脱机HCCR的识别率都大为提升,同原有的识别技术相比进步非常明显。

    二、深度学习模型

    典型的深度学习结构包括:
    1.深度置信网络(DBN)[1],2006年,Hinton等人在长期研究后,推出了DBN。DBN极具创造性,囊括了无监督逐层训练理念,对神经网络隐藏层进行了丰富,壮大了训练方法。在DBN结构下,模型参数的初始解更加合理。利用无监督逐层训练,还能够进行层次性学习。
    2.CNN的最早雏形理念是由Fukushima 在1980年首次提出,LeCun 等将反向传播算法(Back-propagation,BP) 用于卷积结构,提出了层与层之间局部连接且具有多层结构的卷积神经网络模型[2]。作为前馈神经网络,CNN非常适用于处理大型图像。在CNN架构中,设计有特征提取层、映射层。LeCun在卷积结构中应用反向传播算法,使卷积神经网络模型结构层次不断增加。在新结构层中,可看到交替的卷积聚合层。2012年,Krizhevsky加深了CNN,在Dropout、ReLU技术下,取得了ImageNet比赛的胜利[3]。
    3.2007 年,Ranzato对深度学习结构进行了创新,得到层叠自动编码机架构。这样,原来的RBM由AE(自动编码机)取代,神经网络结构共2层,具有无监督特点。
    4.同SAE、CNN、DBN不同的是,RNN中的输出结果受到不同时期输入影响,此类神经网络具有存储记忆功能。也就是说,当前、过去输入,以及未来可能存在的输入都会对输出进行重建。在训练时,RNN也会生成反向传播算法,即BPTT。但是,在记忆时间上是短暂的,无法长期保存。
    近年来还涌现出不少别的深度学习模型,其中一类值得关注的模型是深度强化学习(DRN)[4],例如Google Deep Mind团队2015年提出的深度Q网络(DQN),其在模拟人的智能及在线强化学习方面表现出优异的性能。

    三、基于深度学习的手写汉字识别

    1.基于CNN的端到端的识别方法

    2012年,多列CNN模型(MCDNN)由IDSIA实验室推出,同样具有“端-端”特点。MCDNN中,需要对CNN网络进行GPU训练,并平均集成CNN输出;以图像的形式转换联机、脱机手写样本,并通过CNN训练。在训练时,拒绝特征选择、提取,识别结果便是CNN输出结果。MCDNN在脱机及联机中文识别均取得了当时最先进水平的识别结果。

    2.结合领域知识的CNN识别方法

    虽然以MCDNN为代表的端到端的CNN模型设计简单,也取得了优异的识别性能,但端到端的方法一个不足之处在于其没有很好地利用要手写文字的一些先验领域知识,例如联机时序信息、领域相关的数据生成技术、方向变换特征等,而这些领域信息是无法通过CNN网络自动学习而获取的。下面将介绍近年来传统领域知识和CNN相结合的手写汉字识别方法。

    1. 数据生成技术:为了避免在训练过程中出现过拟合以及提升CNN模型的识别性能,除了采用Dropout等一些经典的方法之外,获取充足的训练样本是保障CNN等模型获得高性能的前提。但很多时候我们获得的训练样本是十分有限的,因此,数据增加技术是一种非常重要的提升CNN系统鲁棒性及推广能力的技术。
      2)方向变换特征:Graham等人不仅对稀疏CNN模型进行了研究,也对CNN输入层开展了全新的知识路径积分特征分析[5]。经实践,新技术能够提取联机时序信息特征,准确度比较高。在知识路径中,还加入了特征图。为此,同MCDNN 法相比,识别CASIA-OLHWDB数据集的操作显得更为方便,速度更快,准确性更高。

    3.其他改进的CNN识别方法

    在手写汉字识别领域,为了进一步提升深度学习模型的性能,研究人员除了加大模型深度和宽度及将传统领域知识与深度模型相结合之外,还对深度学习的网络结构和训练方法进行了各种改进。
    例如,CNN中常见最大值聚合操作的大小和步长一般都是整数,Graham[6] 对此提出了更一般化的分数最大值聚合方法。除此之外,研究者对深度模型的样本训练方式也做出了改进。Yang等[7]从心理学对人的记忆遗忘规律的研究中受到启发,提出DropSample样本训练技术。另外,文献[8]提出了两种改进的CNN模型用于脱机手写汉字识别: Relaxation CNN(R-CNN)及Alternately training CNN(ART-CNN)。

    4.基于其他深度模型的识别方法

    拥有多个隐层的全连接神经网络一般可以统称为DNN,例如含有多个隐藏层的多层感知器神经网络,传统的多层神经网络的训练容易过拟合、容易陷入局部最优,而且随着层数加深会出现梯度弥散等问题。2014年,Du等[9]将传统方法和DBN方法结合,使用了三种分类器: 原型距离、DNN和Bottleneck特征分类器。原型分类器由聚类算法构建,使用基于最大样本分离边界的最小分类误差准则进一步改进,是一个小型且高效的分类器。
    两个主流的深度神经网络CNN和DBN相比较而言,CNN不需要预训练,则相比于DBN的逐层预训练要省时,同时CNN因为加入卷积操作,能够更好处理图像信息,DBN 则主要处理一维的数据,因此在手写体汉字识别中,CNN比DBN略胜一筹。此外,SAE 等其他深度模型在大类别手写中文文字识别中的成功应用报道尚不多见。

    5.基于RNN/LSTM的文本行识别方法

    如前文所述,采用深度学习等技术之后,目前手写单字符识别问题已经在某种程度上获得了较好的解决,但相对单字符识别而言,含序列信息的手写文本行识别仍然是此领域还未解决的难点问题之一。针对此问题,一个有极大潜力的解决办法是应用深度学习方法中回归神经网络(RNN)模型,特别是LSTM和BLSTM等模型,由于对序列数据有很好的建模能力,因此它们更适合于解决诸如包含时序先后顺序信息的文字行识别问题。

    四、总结、讨论与展望

    本文简要回顾了手写体汉字识别的研究背景,介绍了传统手写汉字识别系统中各个主要步骤所涉及到主要技术,指出当前研究的主要困难及所面临的挑战。然后介绍了CNN、RNN、LSTM、SAE、DBN等几种主要的深度学习模型。在此基础上,详细综述及分析了近年来采用基于深度学习的方法在联机及脱机手写体汉字识别的最新进展,总结了各种深度学习模型在手写体汉字识别的研究现状。
    手写体汉字识别经历了四十多年的长足发展,在单字和文本行识别性能上有了很大的提高,特别是以CNN为代表的一系列深度学习模型的出现,手写单字符中文识别问题已经基本上得到了很好解决,无论是联机还是脱机手写中文字符识别,目前基于CNN及其改进模型的方法均取得了接近甚至是超过人眼识别性能的高识别率。然而,在手写汉字识别领域,仍然很多值得研究的问题有待解决,例如:
    1)手写文本行识别问题: 目前基于深度学习模型的联机及脱机手写文本行识别的成功报道很少。对于联机中文手写文本行识别,目前最好的识别率指标均才达到95%左右,而脱机手写文本行识别最好的指标仅为90%左右[10],特别是以整行为单位来评价识别率,行级别的识别率将会很低,仍然有很大的提升空间。可以说联机及脱机手写文本行识别仍然是未解决的难题。
    2)无约束的手写文字识别问题: 其中一个值得关注的研究问题是旋转无关的手写识别问题,根据2010年发布的国家标准GB/T18790-2010“联机手写汉字识别系统技术要求与测试规程”,手写输入软件及设备必须要能识别±45度的手写样本,然而目前市场上的绝大部分主流输入法产品均无法满足此要求。尽管一些研究人员注意到此问题,并开展了不少前期探索工作,但总体而言,此问题仍然远未得到有效解决。相信深度学习新技术的出现,将为解决此问题提供崭新的思路及技术手段。
    另外,目前的研究工作绝大部分局限于解决简单的问题,例如单字符识别或简单的文本行识别,对于联机手写重叠文本行识别、混合手写单字/文本行/重叠以及来自整屏任意无约束书写的手写汉字识别的研究工作仍然鲜有报道,这是一个值得研究的课题。
    3)超大类别手写汉字识别问题: 目前手写汉字识别研究报道所能识别的文字类型基本上以国标一级字库3755类汉字为主,针对实际应用场景下要能识别10000个以上类别的实用化手写识别研究的报道还不多,且缺乏公开的超大类别(例如支持GB8010-2000标准的27533类)训练及测试数据集。在如此大类别的情况下,如何研究一个处理速度快、模型参数足够小的可实用化的基于深度学习的解决方案将变得极具挑战性。因此,超大规模数据集的构建、针对各种深度学习模型的快速算法、深度学习模型的参数压缩技术等问题仍然需要研究人员的继续探索及解决。此外,超大类别还有一个很大的应用是古籍文献及手稿的内容识别及检索,中国古籍的字符类别超过3万类,而且有更多的变体字和相似字,如何解决训练样本不足的问题以及如何设计超大类别分类器都是值得关注的问题。
    4)新的深度学习模型在手写汉字识别中的应用研究: 目前在手写汉字识别领域能取得比传统方法明显好的深度学习模型主要是基于CNN及其各种改进方法,其他的深度学习模型如DBN、RNN、LSTM/BLSTM/MDLSTM以及深度强化学习(DRN)模型在大类别手写汉字识别中的研究工作开展得还不多,各种深度学习模型之间的相互联系及融合应用的研究并不深入,我们十分期待其他的深度学习模型以及未来能有更新更好的针对文字识别的深度模型能提出来,并在手写汉字识别领域能取得突破性进展,从而促进此领域的研究及发展。
    5)自然场景中的文字检测与识别: 近年来,随着大量的互联网图片爆炸式增长,自然场景中的文字检测及识别成为文字识别乃至计算机视觉领域一个极其重要和广受关注的热点研究课题,深度学习理论及技术的出现和发展为解决这一极具挑战的难题提供了很好的解决方案,近年来已经出现了大量研究成果[11]。但与传统的MSER框架的方法相比,深度学习的方法处理速度慢、模型参数存储量大等也亟待解决。此外,目前绝大多数研究工作是针对英文语言,针对中文的自然场景文字检测及识别的研究报道还不多见,而自然场景图像中的手写汉字检测及识别方面的研究工作开展的还很少,要解决这些问题任重而道远。
    总体而言,深度学习为解决手写汉字识别提供了新的理念及技术,近几年来也在此领域诸多方面取得了大量的研究成果,但仍然有不少研究问题值得进一步研究。

    参考文献
    [1]Hinton G E,Salakhutdinov R R.Reducing the dimensionality of data with neural networks. Science,2006,313(5786):504-507
    [2]LeCun Y,Boser B,Denker J S,Henderson D,Howard R E,Hubbard W,Jackel L D.Backpr-
    opagation applied to hand-written zip code recognition.Neural Computation,1989,1(4): 541-551
    [3]Russakovsky O,Deng J,Su H,Krause J,Satheesh S,Ma S A,Huang Z H,Karpathy A,Khosla A,Bernstein M,Berg A C,Li F F.ImageNet large scale visual recognition challenge.International Journal of Computer Vision,2015,115(3): 211-252
    [4]Littman M L.Reinforcement learning improves behaviour from evaluative feedback.Nature,2015,521(7553):445-451
    [5]Graham B.Spatially-sparse convolutional neural networks.arXiv: 1409.6070,2014.
    [6]Graham B.Fractional max-pooling.arXiv: 1412.6071,2014.
    [7]YangWX,Jin L W,Tao D C,Xie Z C,Feng Z Y.DropSample: a new training method to enhance deep convolutional neural networks for large-scale unconstrained handwrittenChinese character recognition.arXiv: 1505.05354,2015.
    [8]Wu C P,Fan W,He Y,Sun J,Naoi S.Handwritten character recognition by alternately trained relaxation convolutional neural network.In: Proceedings of the 14th International Conference on Frontiers in Handwriting Recognition.Crete,Greece: IEEE,2014.291-296
    [9]Du J,Hu J S,Zhu B,Wei S,Dai L R.A study of designing compact classi¯ers using deep neural networks for online handwritten Chinese character recognition.In: Proceedings of the 22nd International Conference on Pattern Recognition.Stockholm,Sweden: IEEE,2014.2950-2955
    [10]Messina R, Louradour J. Segmentation-free handwritten Chinese text recognition with LSTM-RNN. In: Proceedings of the 13th International Conference on Document Analysis and Recognition. Tunis: IEEE, 2015. 171-175
    [11]Jaderberg M, Vedaldi A, Zisserman A. Deep features for text spotting. In: Proceedings of the 13th European Conference Computer Vision. Zurich, Switzerland: Springer, 2014.512-528

    展开全文
  • UI设计在中国的现状发展前景如何 目前在国内UI还是一个相对陌生的词即便是一些设计人员也对这个词不太了解我们经常看到一些招聘广告着招聘界面美工界面美术设计师等等这表明在国内对UI的理解还停留在美术设计...
  • https://blog.csdn.net/u013063099/article/details/91950755
  • 浅析消费金融的发展现状及趋势

    千次阅读 2020-04-03 10:45:19
    随着经济与科技的不断进步,网络购物和提前消费已经成为人们的主要消费方式,互联网消费金融的发展也成为当前最受重视的问题之一。互联网消费金融是依托于支付、云计算、社交网络以及搜索引擎等互联网工具基础上,...
  • java 个人职业发展方向规划范文 java 个人应该制定好一份职业发展方向规划书 规划好自身职业 发展的方向以下是精心推荐的一些 java 个人职业发展方向规划范 文希望你能有所感触 ! java 个人职业发展方向规划范文 (一...
  • 小度范文高等教育内涵式发展文献综述国内外对成人高等教育研究现状的文献综述模板.pdf
  • 20世纪90年代中期,PHM (故 障 预 测 与 健 康 管 理)技术应运而生...通过对比国内外 PHM 技术的发展应用现状,总结分析了目前国内 PHM 技术发展现状与国外先进水平之间的差距以及未来发展的借鉴启示。
  • 论文用的,ok,对于网上书店的发展与研究的论文来书是好东西。
  • 人工智能诗歌写作现状发展前景.pdf
  • 大数据时代下跨境电商物流发展存在的问题与对策.pdf
  • IPv6协议是下一代互联网(NGI)中的...本文以NGI业务为核心内容,主要讨论了IPv6业务及应用的发展现状、IPv6协议在支持新业务方面的优势、IPv6与下一代网络业务系统/平台之间的关系、在业务系统中部署IPv6的总体策略等。
  • 我国是世界上最大的网络使用国家我国的网络科技发展已经跃居世界前列这样的情况决定了我国的网络充满了无限的机会和挑战对于网络赚钱很多人十分感兴趣我也过很多这样的文章大家有时间可以点我的昵称进行查看 网络...
  • 此文档有关于人脸检测的分类介绍、现状发展趋势,论文的参考文献
  • JAVA技术的现状发展方向浅论 JAVA技术的现状发展方向浅论
  • | 文章版权所有,未经授权请勿转载或使用微信公众号“5G行业应用”《智能网联(车联网)示范区发展现状分析—华东篇(上)》和《智能网联(车联网)示范区发展现状分析—华东篇(下)》文章介绍了...
  • 2.Windows 界面技术发展现状

    千次阅读 2018-07-28 20:59:47
    本文就简单梳理下整个Windows界面库的发展历程和现状。 Win32 Windows 整个系统的图形界面是建立在Win32图形界面接口上的,它提供了Windows界面编程的基本模型——显示管理窗口和消息循环分发事件。W...
  • 国产数据库发展现状分析

    万次阅读 多人点赞 2018-06-04 19:00:25
    其实,数据库技术发展到今天,国人并非不知道数据库底层该怎么开发,而是自己的代码在市场上磨练比较少,对稳定性信心不足,而这种信心的不足同样来自客户方面。所以,引进Informix的源代码,一个核心的作用就是...
  • 国外信息技术发展现状与展望

    千次阅读 2017-07-04 18:44:00
    2016年1月16日,由企业网D1Net和中国信息化发展战略与创新联盟联合举办的2016年北京部委央企及大型企业CIO年会在北京隆重举行,大咖云集,干货爆棚,围绕新IT架构和信息安全,CIO们碰撞思想火花,最前沿的技术厂商...
  •  要看软件测试的目前现状,首先还要看软件的发展史。  第一个软件的人是Ada(Augusta Ada Lovelace),在1860年代她尝试为 Babbage(Charles Babbage)的机械式计算机软件。尽管他们的努力失败了,但他们的...
  • 一文分析 Android现状发展前景

    千次阅读 2021-11-17 19:11:31
    “低头干活,还要抬头看路”,一篇文章简要审视一下Android的发展现状、展望一下Android的发展前景。 Android 诞生背景 Android 发展现状 Android 前景趋势 从Android的诞生背景开始说起,举例一些数据看一下...
  • Spark发展现状与战线

    千次阅读 2014-11-27 20:15:46
    前言现今Spark正是风头正劲时,Spark本是UCBerkeley的AMPLab诞生的项目,后来捐赠给了Apache来管理源码和后续发展。今年从Apache孵化器终于孵化出了1.0版本。其对大数据的支持从内存计算和流处理,到交互式查询,...
  • 我感觉前端发展有个很大的缺陷----晋升问题. 正如第三点所言,作为领导必须对项目有足够的了解,显然是要重点包括业务逻辑,这点上,后端开发者需要涉及数据库逻辑,是必须要跟业务逻辑打交道的(重中之重),因此,大部分的...
  • 神经网络概述,简介和发展现状,神经网络概述,简介和发展现状,神经网络概述,简介和发展现状
  • EDA发展历史及现状

    千次阅读 2020-03-03 09:58:07
    当笔者动手这篇文章时,想起了上世纪1994年2月某一天的北京人民大会堂,在这里有一场重要的商业活动即将开始,这就是Cadence进入中国的开幕式。主席台上一条大红标语通栏的是:”Cadence Come to China”,宣布...
  • UI设计现状发展趋势是什么

    千次阅读 2019-12-13 13:59:06
    我们经常看到一些招聘广告着:招聘界面美工、界面美术设计师等等。这表明在国内对UI的理解还停留在美术设计方面,认为UI设计的工作只是描边画线,缺乏对用户交互的重要性的理解;许多商家认为软件产品的核心是技术...

空空如也

空空如也

1 2 3 4 5 ... 20
收藏数 101,582
精华内容 40,632
关键字:

发展现状怎么写