精华内容
下载资源
问答
  • 8月28日,华为将走进千年官城——成都,这是“AI有信仰的——华为中国行2018”系列活动的第七站。成都素有“天府之国”之称,是国家重要的高新技术产业基地、商贸物流中心和综合交通枢纽,西部地区重要的...

    8月28日,华为云将走进千年锦官城——成都,这是“AI上有信仰的云——华为云中国行2018”系列活动的第七站。

    成都素有“天府之国”之称,是国家重要的高新技术产业基地、商贸物流中心和综合交通枢纽,西部地区重要的中心城市。此次华为云将与成都碰撞出怎样的火花呢?让我们共同期待吧。

    AI上有信仰的云,华为云走进千年锦官城

    展开全文
  • 抖音平台20个相关话题,17个联合直播平台,i舞APP全程VR直播(5天),初步统计关注度高达8.5个亿!这就是万众瞩目的CBDF...今年,在这种特殊的环境背景下,第34届全赛不仅成功举办,而且在世界的舞台也是大秀了一把

    抖音平台20个相关话题,17个联合直播平台,i舞APP全程VR直播(5天),初步统计关注度高达8.5个亿!这就是万众瞩目的CBDF全国锦标赛!

    5G+VR直播看CBDF全国锦标赛,国际权威评审云打分

    (第34届CBDF全国锦标赛)

    近日,第34届CBDF全国锦标赛在深圳盛大开幕,为期5天的赛事于12月6日圆满结束。作为国内历史最悠久,拥有最权威评审阵容的全锦赛,被视为中国地区国标舞赛事的至高圣地,一路走来全锦赛已经连续举办34届,展示了中国国际标准舞三十多年的发展历程。

    今年,在这种特殊的环境背景下,第34届全锦赛不仅成功举办,而且在世界的舞台上也是大秀了一把“黑科技”。此次全锦赛首次使用酷雷曼VR全景直播系统,利用5G+VR直播技术,为参赛者、观众以及国外评审呈现一个全新的赛场,带来一场身临其境的视觉盛宴。

    5G+VR直播看CBDF全国锦标赛,国际权威评审云打分

    (“黑科技”为你带来全景观赛体验)

    一、5G+VR直播,舞动奇迹舞出新姿态!

    疫情尚未结束,能够在深圳举办一场“年度大赛”属实不易。在满足高标准疫情防控要求的同时,为给大家带来一场精彩且没有遗憾的赛事。VR直播以前所未有的5G+8K/4K、多机位、多视角、沉浸式感官体验赢得了本次全锦赛的青睐。

    对于四面赛场、多队同时比拼、转场跳跃度大的赛场来讲,传统直播无法做到视角转移。本次全锦赛使用VR直播的主要目的与价值在于,通过VR直播滑动屏幕转移视角,观众可以一直追随某一舞者的舞步,全场看谁由观众自己来决定,为因场地受控人数来不了现场的嘉宾观众,带来一场身临其境的视觉体验。

    5G+VR直播看CBDF全国锦标赛,国际权威评审云打分

    主办方表示:“国标舞四面赛场的形式,其实是非常适合VR全景直播的。试想,不管你要看哪个方向,想追看哪对喜欢的舞者,都可以自己随心控制。5天比赛全程VR直播。虽说疫情防控赛场控制观众人数,但没关系,打开手机即迈进赛场,这感觉,很硬核!”

    在赛场上,我们也看到了一些熟悉的面孔。曾在短视频走红的“墨茉组合”怎能不到。

    5G+VR直播看CBDF全国锦标赛,国际权威评审云打分

    还有这阵子,在网上迅速走红的mini版辣目洋子。

    5G+VR直播看CBDF全国锦标赛,国际权威评审云打分

    二、万众瞩目,国外评审云相聚云打分!

    本次全锦赛将VR直播接入到i舞APP上,观众通过APP就能观看VR直播,如此震撼的视觉展现方式,也为平台获得了一大波流量,吸引上万人在线观看。直播窗口采用传统直播和VR直播自由切换方式,让观众随心所欲地自由选择。切换VR模式,戴上VR眼镜,又是一番令人震撼的精彩视界。

    5G+VR直播看CBDF全国锦标赛,国际权威评审云打分

    (i舞APP VR直播)

    此外,全锦赛的首次VR直播秀,也让世界看到了中国舞台的科技创新。作为一场国际规格的赛事,每年全锦赛,国外大咖舞者、大咖评审的莅临,都是吸睛亮点。今年,现实原因我们无法与国际友人们相聚一堂,国际权威评审通过云打分、云点评等,为参赛者们提供了专业、宝贵的点评。当国际评委Karen Hardy激动地说出那句“感谢中国,中国延续了舞蹈的生命”的时候,民族自豪感油然而生!

    5G+VR直播看CBDF全国锦标赛,国际权威评审云打分

    (国外评审云相聚)

    三、与时代为舞,与科技同行

    5G时代,大宽带、低时延等优势为流畅的VR直播提供了保障,与此同时常态化的疫情防控,促使云生活蓬勃发展。在这样的双驱动力下,VR直播不仅成为各大赛事、综艺节目、重要会议的新兴视觉展现方式,并且为安全防疫下的“云举办”提供了有效的解决方案。

    这次为期5天的全锦赛,通过全程VR直播的稳定流畅,让观众领略了中国舞蹈水平和现代黑科技的实力所在。站在5G时代的风口,挥手相迎,与时代为舞,用科技的力量向世界展示着中国舞者的魅力。

    5G+VR直播看CBDF全国锦标赛,国际权威评审云打分

    ——以上部分图片素材来源于i舞平台公众号

    展开全文
  • 金鸡报捷去,犬送春来。 从踏回家的火车、飞机、大巴、自驾的那一刻开始,年味便开始浓郁。家人团聚、朋友道喜、同学聚会,都因为有互联网的加入而变得更快捷和生动。 “日常服务不能停,春节还要更出彩”几乎...

    868be17289d29f10e8090bbb320d191afa97d767

    能不能过好春节,

    和云计算的关系越来越大。

    今年的春节高峰流量创下历史新高,

    春节反而成网络服务旺季。

    c7425d680dc84aa6afe3e348a77b1edc899fc483

    金鸡报捷去,锦犬送春来。

    从踏上回家的火车、飞机、大巴、自驾的那一刻开始,年味便开始浓郁。家人团聚、朋友道喜、同学聚会,都因为有互联网的加入而变得更快捷和生动。

    “日常服务不能停,春节还要更出彩”几乎成为每个人手机上、每一个小小方块及其背后千万从业者的共同追求,也是服务着100多万客户的阿里云的春节追求。

    c7425d680dc84aa6afe3e348a77b1edc899fc483

    你买到火车票,也许不会意识到一张火车票经过多少环节才能变成回家的喜悦。狗年春运,火车互联网售票高峰日网络页面浏览量超1500亿次,高峰时每秒售票700张,火车票正越来越方便老百姓购买。

    e3bbfd05a882aad61e25f8d7eceeb6b3701e9f63

    当你开车回家,导航地图还在努力计算,从变化多端的路况中抓住那条让你最快到家的路。早一秒到家,多一秒和家人团圆的时间。

    74fb75c5069d0762ea28e20c0f465139c93ac1bc

    当你打开电视机播放春晚,还有数千万人用随身的手机在观看,“海上升明月,天涯共此时”,千年前张九龄的美好愿望,现在几乎每个人都能实现。

    442eb58d9447d9270f24c3be150d3770d0638560

    当家人朋友围在一起畅聊,还多了在线直播、在线答题、语音抢红包、VR扫五福等新玩法。除夕夜,超1亿家庭瓜分了淘宝6亿春晚红包,超2.5亿人分享支付宝五福红包,福气来到更多人家中。

    传统的年味也许是家里热腾腾的年夜饭、家家户户的“福到了”、街坊邻居跨年时一起放的烟花,而现在,年味还是手机上APP默契的红色新装、此起彼伏的线上抢红包、热闹有趣的在线直播、好友分享的异域日出……

    c7425d680dc84aa6afe3e348a77b1edc899fc483

    在阿里云上,这样“春节不打烊”全年无休的客户还有百万。

    买车票、开车导航、视频直播、在线答题、天气预报、运动健身、购物外卖、在线教育……这些与日常生活密切相关的一起都还在正常运行。

    和线下安静的街道相比,线上的热闹一如往常。

    2017年8月阿里云付费云计算用户已达101.1万,涉及衣食住行的方方面面。与此同时,还有越来越多的行业正要上云。

    e526a1f4bc3eb9bac40e333e22886fe3e3028671

    最新财报显示,在2018财年第三季度,阿里云连续第11个季度保持规模翻番,季度内同比增长104%。

     c7425d680dc84aa6afe3e348a77b1edc899fc483

    云计算有自助服务的特点,阿里云也积极贡献技术力量,为客户提供多种深度服务。

    护航服务是其中一种。当在线直播客户遇到流量高峰、在线答题客户遇到网络恶意攻击时,阿里云工程师就可以在线及时提供服务,保障客户业务不中断。

    某春晚直播平台技术负责人表示:

    昨晚我们成功地完成了春晚任务,在保障过程中与阿里云一起提前解决了可能出现的问题,紧急协调突增的带宽资源,最终保障了服务平稳运行。

    阿里云拥有丰富的大型活动护航经验,曾为双11、G20峰会、乌镇世界互联网大会、罗振宇跨年演讲之夜得到APP等提供服务。目前,每天帮助全国40%的网站,防御16亿次攻击。

    身经百战、响应及时、定制贴心、全方位防护的阿里云护航服务为行业树立了新标准,100%零事故的出色表现也使阿里云成为许多客户眼中关键时刻能够依靠的暖男“大白”。

    c7425d680dc84aa6afe3e348a77b1edc899fc483

    自从有了自来水,断水几乎成了历史。

    出现云计算之后,宕机才能成为新闻。

    现在的春节成了互联网服务的旺季,这与发展迅速的互联网基础服务密切有关。

    Synergy Research Group指出,2017年第四季度,全球云基础设施服务支出同比增长46%,云计算正在成为互联网世界的基础。

    8dffda5e7c8d183b0fa308efcde89a41c1bfb980

    从自建服务器到采用云计算支持,这背后既是服务模式的发展趋势,也带来了百姓生活娱乐的便捷丰富。

    早些年,一到春节大家忙碌囤积各种日用品,以防各种线下服务停摆。

    互联网的出现打开了网上娱乐的大门。

    网络拜年成为时髦,此时这个新生事物还是生活的调剂品,和街边小店一样,遇到春节,一些网站可能还会停服。

    当互联网提供了生活中大部分供需,网络服务变成人们日常的一部分,甚至是日常本身。

    “可以不吃饭,但不能没wifi”。“春节不打烊”成为了老百姓对网络服务的内在需求。

    c7425d680dc84aa6afe3e348a77b1edc899fc483

    现在的春节比历史上任何一个时候都要变得快。

    阿里巴巴集团技术委员会主席王坚博士有一句话:

    你在网上买到火车票是应用了云计算服务,甚至你吃到的白菜,都是依靠云计算服务匹配销售、物流等信息最终到你手中的,这些是真实发生的事情。

    当下几乎所有的生产生活都已经构建于互联网及其基础——云计算之上。

    因参与、促成、成就更好的生活变化,阿里云为改变历史的客户感到骄傲。

    未来,我们一起来。

    4ee33688e7300ec87af205e5512077d8e2f1c0c4

    展开全文
  •  山楂树之恋观后感 山楂树,花儿开了,远远望去,仿佛绯红的轻,开得如火如荼,灿若朝霞。花儿落了,无声无息,如同划破夜色的流星,不留一丝痕迹。那棵山楂树,承载了怎样的美好记忆,又承载了谁的悲伤,谁的...
  • 欢迎大家前往腾讯+社区,获取更多腾讯海量技术实践干货哦~ 本文由云加社区技术沙龙 发表于云+社区专栏 ...分享腾讯在OCR做的一些工作,以及腾讯目前在上面开放的OCR的一些服务。...

    欢迎大家前往腾讯云+社区,获取更多腾讯海量技术实践干货哦~

    本文由云加社区技术沙龙 发表于云+社区专栏

    演讲嘉宾:冀永楠,现为腾讯云大数据AI产品中心高级研究员。负责了腾讯云与华星光电等多个图像AI项目。

    img7.28冀永楠OCR的应用集锦及背后技术-01.jpg

    今天分享的主要是OCR的部分。分享腾讯云在OCR上做的一些工作,以及腾讯云目前在云上面开放的OCR的一些服务。OCR简单来说就是让机器能看懂写的文字。我们手写的文字比较复杂,什么样子的都有。印刷的文字稍微简单一点,但也同样具有复杂性。今天主要讲的就是这种复杂性,这种服务在日常生活或者工程中遇到不同情况所产生如何处理这些复杂性的能力。

    img7.28冀永楠OCR的应用集锦及背后技术-04.jpg

    这里分享两个做过的例子。身份证相对来讲很格式化、比较简单东西,可以明确知晓在哪里找到怎样的文字信息。后一个是医院的检查报告,医院的检查报告相对而言复杂一点,它的复杂度在于不只是处理一个医院的一种检查报告,而是需要把不同的医院的检查报告全部做统一处理。这就增加了很大的难度。

    img7.28冀永楠OCR的应用集锦及背后技术-05.jpg

    在做正式的介绍之前,先说一说关于OCR的历史。OCR历史回溯起来还是很久远的,最早在六七十年代就有过实际的应用。大家都写过信,邮编号码在信封的左上角。这就是最早的OCR的应用。这种技术被使用在了一个非常窄的场景里面,只是要求把填在空格里的数字稳定的有效的检索、识别出来。当时的识别概率能达到92%-93%。这解决一个很大的问题,当时邮寄信都是通过识别码来进行投递的。

    这个应用场景后来直接导致了2013年MINST的一个诞生。所有的框架都将它作为例子。它就是来源于这种最早的应用。一些复印机,扫描仪厂商,例如,东芝,佳能、富士通等希望将这项技术应用于扫描仪里面的文字转化成电子文字,便于客户存档。在PDF里面也用到这种技术。

    时间到了2015年的时候,谷歌云盘里所有的文件免费提供OCR的服务。即便是提供免费服务仍是一种窄场景,只能使用在Google Doc存储的文件。到今年的5月23日,腾讯云公布了OCR免费接入,以及其它很多AI类的图像应用免费接入。这就意味着可以用手机移动终端或者任何的终端设备采集一些文字的图片后上传到云进行解析。

    img7.28冀永楠OCR的应用集锦及背后技术-06.jpg

    我用两个维度来描述OCR的应用。一个维度是标明它是一种表格式的OCR还是通用式的OCR。所谓表格式的OCR比较好理解,就是说要识别的这个东西里面是一种表格制式的,它有特定的规格,什么位置写在什么内容。通用OCR的话就没有这种要求,随便拍一张照片里任何的文字都需要提取出来,并且告知那个文字或者那段文字在哪里。这是一个维度。另外一个维度是印刷体维度和手写体维度。这个比较好理解,但是有很多的应用里面也是处于交界的位置上。手写为和印刷体还有一个交界是因为很多印刷体本身并不是一个非常常用的印刷体。而且可以设计成类似于花体字或者写得比较随意一点。比如说招牌,王老吉或者天津狗不理包子。本身的字体并不是常见的字体,可以算是手写体偏印刷体一点。

    OCR难度肯定是表格式的会要容易一些。通用式的是要困难一些。同样手写体要困难一些,印刷体要简单一些,那么这个坐标系里面右下角的就是比较难的应用,左上角就是会稍微简单一点。有任何的OCR实际场景应用的时候,我们经常拜访客户。客户提出要解决某个问题的需求的时候,如果这个落到右下角的话就会比较难。如果落在左上角的话会比较容易解决一些。

    img7.28冀永楠OCR的应用集锦及背后技术-07.jpg

    我们现在腾讯云提供的印刷体的服务基本上都是这些,常用的是通用OCR。往腾讯云里面发一张图片,他会把这个图片里面所有可识别的印刷体的文字全返回出来,并告诉你这个印刷体的文字在这个图片里的位置。除此之外还有一些证件类的,比如驾照、车牌、银行卡、名片等等这些,稍后会逐一的介绍这方面的应用。现在用这四个特征来描述我们的服务,第一我们要求服务是准确的;另外要求我们的服务是完备的,就是说能识别英文也能识别中文,也能识别字符。我们现在可以识别一部分的少数民族文字。英文也是没有问题,其他的文字现在也逐渐的往外拓展一个一个的加到我们的范围里面。

    img7.28冀永楠OCR的应用集锦及背后技术-08.jpg

    快速这个特性是很多的应用场景中所要求的,我们的OCR在GPU运行是毫秒级的。在CPU的话时间要长一点。还有就是鲁棒性的问题。在手写体的识别方面我们主要的应用比如手写的备忘,像早期诺基亚有一款可以写字并识别出来。现在所有的手机里面都有这种功能。还有一些业务量较大的单据,如运单。这类业务我们是第一家将手写体应用在实际场景中的。数字的识别率高达90%以上。单字的识别率在15毫秒以内,复杂汉字超过80%。

    img7.28冀永楠OCR的应用集锦及背后技术-09.jpg

    手写OCR强调;数字的准确率主要原因是因为手写体识别大部分都用在银行业和数字相关的行业。无论你写的地址还是写一张支票,那么数字都是最重要的部分。所以我们非常强调这个数字的准确率。腾讯云的OCR服务在权威测评中也得到了非常好的成绩。在2015年的时候取得了排名第一。ICDAR是一个国际文档与识别大会,它是一个比较权威的在OCR方面的一个会议,每两年举办一次。大家如果有兴趣做一些OCR的实验或者做一些OCR的这种技术性的开发,可以去ICDAR上面找一些对比的方法。

    OCR技术本身的挑战有这样几点:一个指拍出来的图像。众所周知所有的图像类的AI第一步都是获取图像。要不然的话怎么分析呢?那么图像拿过来的时候就会产生很多的问题,比如说你所用数据的采集,摄像头等成像的仪器不一样,成像的场景不一样。还有要求可能也不一样。

    img7.28冀永楠OCR的应用集锦及背后技术-10.jpg

    OCR是应用很广泛的一项技术,实际场景中会遇到一种文字倾斜、模糊等等的情况。这是一个技术上的挑战。还有一个就是说语言文字本身,最简单是英文OCR。一般来讲中文稍微简单一点。中文繁体字、手写字,国内少数民族文字等使用场景因为数据来源少,场景复杂难度有所增加。

    文字大小不一以及文本背景复杂。主要是取决于场景,基本上所有常用的OCR识别步骤都是这样子的:先做一个版面分析,即确定场景。根据版面分析大概明确了正在分析的是什么(驾照、行驶证或发票等)。进而将下一步的步骤简化到比较简单的环境里,这样有助于提高分析的结果,并且能够快速的分析出答案。

    下面是文字检测,以及文字识别。在此之后会有后处理,后处理根据一些语义和环境来把识别出来的错误纠正过来。例如:咖灰,咖后面不可能加一个灰,一般都是咖啡。在使用深度学习网络技术做OCR时,并不是一步一步进行,而是一个网络里面的一个模块和一个模块对应的这种功能。但是整个的流程仍然是这样逻辑的流程。

    img7.28冀永楠OCR的应用集锦及背后技术-11.jpg

    OCR技术本身的发展可以说是分为了三个阶段。最早的时候不用检测,就像上文讲的信封上数字的识别,不需要做检测。直接使用分类器就可以。早期的技术就是对图像做一些特征提取,后面加上分类器,比较成熟的比如有SVM,能直接得到的分类结果。但在当时应用场景很窄。之后场景扩展:先识别文字的位置然后再把这些文字进行一块一块的切。切到小图像之后再回归原来的过程进行识别。

    这种方法存在一个很大的问题就是你前面切的话,后面的误差会累积。再后来有了深度学习这项技术,就开始有端到端的模型。现在大部分学术界里面研究发表的论文都是基于CNN和RNN网络结构的。CNN的作用是图像特征提取,RNN做文字序列的识别。尽管网络结构有很多的变形,但它背后的逻辑仍然和原来的没有太大的变化:都是先从图像上面提取一部分特征,再将图像上的特征对应到文字上。CNN是最常用的一种提取图像的特征的方式所以CNN+RNN这种网络结构处理图像,最后图像产生一系列文字的特征,最后形成文字的过程。

    Attention机制最大的优点在于识别当前的字或词的时候,会考虑到它前后哪些字对这个字有影响。那么在原来没有这个之前一般认为,所有的影响都是一样的。因为存在一定连贯性,每个字(词)都与其上下文存在联系。考虑到这种关系就要对整体的模型和识别率进行提升。同时不同语言里面的联系也有不同,这也为语言的研究也提供了一定的信息。

    img7.28冀永楠OCR的应用集锦及背后技术-12.jpg

    这张PPT对应了刚才所讲传统的OCR的流程,先将图片获取进行二制化,来提出可能是文字的部分。再去分割这些字,把这些字分割成一块一块,再将这些一块一块小的图片放到分类器里面来识别这些文字是什么字符。进行字符串汇总之后还会进行自然语言处理的修正,最后反馈正确的结果。目前腾讯云基本上已经不采用这种传统的方式,而是以端到端的方式为主,那么除了端到端的方式根据不同的场景应用,已经产生了一套类似工具集的方法。对于不同的应用场景,只需从工具集里找出最为适配这个场景的工具或者模块,再将它们串起来进行调优,最后形成了整体识别的模型。

    接下来先给大家介绍一下腾讯云上的服务,再介绍一下我们做过的一些综合类应用。这两者的差别在于云服务本身具有一定的通用性,基本上每个人都可以在腾讯云申请一个账号,通过标准的API发送图片等等。项目更多是定制化解决一个具体问题的。我们就会根据具体的问题和它产生的流程来开发一套系统或者流程来配合它的实际业务,来提高他们的生产效率。

    img7.28冀永楠OCR的应用集锦及背后技术-14.jpg

    身份证识可以说是目前最火的识别项目。很早在我们去酒店住店的时候就有一个叫做人证合一的认证过程,在没有人工智能之前就有这种过程。去酒店住店,前台将身份证号输入到电脑发送至公安授权的某数据库的远程服务器上,之后服务器会返回一张身份证照片,服务员会看这个照片跟你本人是不是一个人,验证完毕你就可以住店了。

    现在的技术发展到顾客把自己的身份证插到一个读卡器里,它会把这个身份证信息发到身份数据库里面把照片返还回来,并通过摄像头拍摄脸部信息,将拍摄信息与身份证直接对比。目前这项技术不只是用于住店,包括乘坐高铁等,安保人证票合一等场景里已经应用得越来越多。

    img7.28冀永楠OCR的应用集锦及背后技术-15.jpg

    名片识别是介于格式化和非格式化通用之间的一种。因为名片它所包含的信息是一定的,总会包含姓名包含工作地点,包括电话号码这些。其所采用的字体各方面也比较恒定,所以说是格式化的。偏向通用是因为各部分内容的位置是不一定的。比如一些特别有创意的名片,经常会用一些符号代替本来应使用的一些字。

    img7.28冀永楠OCR的应用集锦及背后技术-16.jpg

    车牌识别服务应用范围也比较广。一方面是停车,还有在高速进出口以及交通管理车辆的识别也采用了车牌OCR的识别。车牌OCR的识别主要的难点在于场景多样化以及前端采集设备的不可控。如果设备不是高清的设备放大之后会出现模糊的情况。

    img7.28冀永楠OCR的应用集锦及背后技术-17.jpg

    驾驶证、行驶证两个证件的识别一般用于租车以及车辆维修等领域的服务。共享汽车、滴滴都会用类似的服务。OCR在这类证件服务领域最大的难点在于证件的反光。这类证件本身它会有一层膜,拍照的时候可能会有反光。预处理会成为OCR识别重要的模块,这种预处理方式一般都是为这种问题单独开发的,它需要产生什么呢?高动态,就是说这种会非常亮的。需要高动态、标准的归一化过程,需要将识别部分归一成比较一致的图像。

    img7.28冀永楠OCR的应用集锦及背后技术-18.jpg

    银行卡是这个领域比较常见的服务,银行卡的字体相对比较简单,位置也相对固定,但有的时候字体会变得不好识别,尤其在不同的磨损条件下。发票OCR相对格式比较固定,问题在于发票种类多、发票的字体有时会打印的非常的不清楚。

    img7.28冀永楠OCR的应用集锦及背后技术-21.jpg

    通用印刷体OCR是比较常见OCR的产品,对OCR的使用相当一部分都是来自于通用的印刷体。广告识别占比较大。这类OCR最大的难度在于很难预料它的背景是什么样子,字体也是各种各样。在归类方面会认为是一种介于印刷体和手写之间的应用方式。对这类识别首先需要有足够大的字体库,如果还不足以解决问题就需要将手写体的技术也放在里面以保证比较高的准确识别率。

    img7.28冀永楠OCR的应用集锦及背后技术-22.jpg

    针对这一场景产生的方案可以使准确率达到90%以上。随手拍其实也是通用印刷体常见的应用方式。他的问题也是场景变化比较大,会涉及到光线变化的问题。广告类的话光线变化不会有太多的问题,这类光线角度是一个问题,同时还有拍照手抖带来的图像模糊,以及摆放时产生的文字遮挡……这些都会产生影响。

    img7.28冀永楠OCR的应用集锦及背后技术-23.jpg

    血液的检查单也是我们在做项目中的一部分,医院里打出来的血检单,文字间距非常小,字也小,同时识别的时候还会产生透视畸变。对于这种情况有两种处理方式:第采用超解析度做预处理,我把我的图像先进行一个,可以理解成一个采用了人工智能技术的一个非性能差值,使解析度更高、文字看上去更可识别,在进行识别器识别。第二种方式把刚才那部分集成到网络设计里,最大的好处在于针对这种情况会有比较高的识别准确率,并且识别速度会比较快。它的缺点在于遇到其他的类似的问题的时候还会需要较大的调整才会适用新的场景。

    img7.28冀永楠OCR的应用集锦及背后技术-24.jpg

    手写体的识别就是比较困难的事情。我们是第一家把手写体识别应用在实际场景中的。应用的场景以快递运单、银行的支票为主。

    以上这些服务在腾讯云上都可以找到相应的服务接口,可以免费使用这些服务来自己搭建一个应用。当你实际需要开发的一个软件,或者需要做一个手写体的识别或者做一个通用的OCR识别的时候都可以直接去调用这些服务来完成应用。

    下面都是有明确目标客户的实际OCR应用场景。物流运单的挑战:大概在2010年前后快递业发展得非常迅猛。在当时他们的运单就是必须手写之后录入数据库才能进行投递。

    img7.28冀永楠OCR的应用集锦及背后技术-27.jpg

    早期采取的都是人工录入的方式,开玩笑的说这可能是是继传呼机之后另外一个打字市场。我们与顺丰共同用手写体的OCR来完成他们的运单录入的过程。这种OCR的方式可以持续工作、准确率高达91%而且保密性更高。

    img7.28冀永楠OCR的应用集锦及背后技术-28.jpg

    现在做的OCR系统,可以日处理一千万单,相当于三千多人三班倒的工作量。泰康认知核保项目,是我们现在在做的,我们也在不断的寻找OCR所能达到的业务和应用的边界。泰康核保复项目:以前需要人工确认一个人当前的身体状况是否能够买这一份健康保险。

    img7.28冀永楠OCR的应用集锦及背后技术-29.jpg

    我们的主要目的是开发一种代替原有核保方式的系统,降低对医生或者说有医疗经验的核保人员的需求。通过OCR分析,把这些保单进行格式化、结构化输出。之后进行个人患病风险特征的提取。再通过特征建立预测模型,最终得到核保的结论,这个项目对于OCR来讲最大的难度在于单据格式的种类是众多,来源不一。

    第二个难度在于扫描件所产生的图像质量差别非常大,第三设计系统需要对医疗知识有一定的了解。我们采用的方式是除了本身的OCR的设计能力,我们也请到了泰康的医疗专家来共同参与设计,并将知识尽量的加入到系统里面。一方面通过医疗字库来提供OCR字的转化能力;另外一方面在做预测回归时把判断通过机器学习的方式固化、标准化。

    img7.28冀永楠OCR的应用集锦及背后技术-30.jpg

    未来我们仍会不断的去探索AI特别是OCR的实际前沿应用。对纠错库多丰富一些场景信息,以使系统能够适用更多不同的场景。

    Q&A

    **Q:**OCR比如说高考识别的过程中,跟快递的扫描单有什么区别吗?高考卷这些OCR的扫描您那边做过吗?谢谢

    A:我们做过但不是高考试卷,是教育的。教育的话其实并不是做只是针对高考一个场景的。其实高考的时候你写得字往往是比运单写的字还要清晰一些的,相对来讲还是要容易一些。比较麻烦的是里面有很多公式,这是比较头疼的一点。还有一点不太一样的,运单的话它的,你想输入的这个东西是有一个比较窄的范围的,你输得无非是地址,地址你可以假设穷尽所有的地址选项。但是高考的话相对来讲发散一点,它并没有这么一个全集在里面。所以总体来讲其实高考那个难度是要比运单的难度稍微大一些。但我们也有一些教育方面的应用,那个方面的话其实我们主要的工作是在公式上面。

    Q:我问一下我现在有一个问题,我如果是PDF大量的文件上传上去,因为PDF是扫描的图片,它的文字就可深可浅,当我上传一个PDF扫描实现的时候,我很大的数据量进去的时候这块是怎么做处理的?

    A:这个有点难住我了。其实关于P处理的问题刚才那位同事回答更为合适一点。因为我是做算法应用的。

    Q:比如说图片的深浅不是切割了很多块,切割了很多块之后块与块之间的顺序有一个拼接,这一块是怎么做到的?

    A:现在来讲有很多种方式。我们现在基本上不太建议这种分成小块的方式。至少你可以分成行,分成行的话如果你要做一个RNN的话要比分成块效果好一些。我的建议是说第一先通过一个最熟悉的方法把基本流程搭建起来,之后你会发现其中有一些步骤,那么这些步骤在进行逐渐的优化和合并。因为有的步骤如果是两个步骤,你没有必要用两个步骤,用一个网络可以更好的解决。可能用一个网络效果会更好,所以我基本建议开发思路是这么一个开发思路。

    Q:我刚才看到您做泰康项目的时候有很多先验的信息,我想问一下先验的信息对应于模型当中是加在哪些部分的?

    A:我们刚开始的时候肯定还是要用后处理或者前处理的方法分开来做。第一实现起来比较简单一点,你可以验证你加的这个先验知识是否真正的对你有帮助。当你确定它有帮助的时候,你把它先独立的分块,之后再进一步的优化形成一个整体的功能。实际的情况可能那种都会遇到,有的会分开两部分,当然这个分开的就有一点技术含量了,这确实是会有一些面向应用场景的设计。

    问答

    AI开发的语言要求?

    相关阅读

    安全报告 | 2018上半年互联网恶意爬虫分析:从全景视角看爬虫与反爬虫

    安全报告 | SSH 暴力破解趋势:从云平台向物联网设备迁移

    给你的CVM安装一个面板吧!

    此文已由作者授权腾讯云+社区发布,原文链接:https://cloud.tencent.com/developer/article/1182593?fromSource=waitui

    欢迎大家前往腾讯云+社区或关注云加社区微信公众号(QcloudCommunity),第一时间获取更多海量技术实践干货哦~

    海量技术实践经验,尽在云加社区

    展开全文
  • 的作文高二范文5篇汇总 浩瀚广袤的天幕,那洁白的云朵就像是大片大片的棉花糖一样柔软簇,每一朵云都像是一个个调皮可爱的小精灵一样。这里给大家分享一些写的高中作文,希望对大家有所帮助。 写的高中...
  • 分享腾讯在OCR做的一些工作,以及腾讯目前在上面开放的OCR的一些服务。OCR简单来说就是让机器能看懂写的文字。我们手写的文字比较复杂,什么样子的都有。印刷的文字稍微简单一点,但也同样具有复杂性。今天...
  • 史记中有一段描述西楚霸王项羽的话“富贵不归故乡,如锦衣夜行”。... 熊猫矿池,是新三板挂牌企业成都指南针联网科技股份有限公司研发团队根据IPFS的技术特点,以及分析了市场各种矿机的不足,而...
  • 2018年4月25日,由中国软件行业协会指导,中国软件网主办,中关村软件园联合主办的“2018中国软件...本届大会吸引了来自国内主流平台、ISV、SaaS厂商和渠道商的千名业内人士齐聚一堂,就生态运营、AI对生...
  • 相信不少网友都渴望得到锦鲤万千宠爱于一身瞬间过了神仙般的生活就在传统的1024程序员节日百度要怎么搞事情啊会不会有超豪华的礼物打折的力度会不会很大优惠券也好想要啊要是有很多优惠可...
  • 外天都的最新悬疑爱情小说《画堂》正是从一幅瓶中画开始,这幅被放入瓶中的画作记录着一段充满预言的文字,而从这段文字中,将引出一个曲折离奇的谋杀故事,一段不为人知的往事……(外天都作品《画堂》)...
  • 完全基于Google构建的MERN网络应用程序: 数据库:Dev和Prod的MongoDb实例由MLab管理(现在已由MongoDb Atlas收购),并托管在Google Cloud,并且仅对来自Google Cloud项目的IP流量可见。 多媒体存储:开发...
  • 然而,也有一些积极开动脑筋转型的实体企业,从远程直播卖货到云上参展,不但在疫情期间活了下来,反而得到了增速发展。 线上业务的快速发展,让这些第一次尝试数字化转型的企业有了“甜蜜的烦恼”,突如其
  • 回顾大数据技术领域大事件,最早可追溯到06年Hadoop的正式...在云栖社区2017在线技术峰会大数据技术峰会,阿里大数据计算平台架构师钱正平做了题为《大规模流式增量计算及应用》的分享,钱正平结合阿里巴巴真实的业
  • 杜甫写的有关风雨的古诗有哪些

    千次阅读 2010-08-30 00:45:00
    野径俱黑, 江船火独明. 晓看红湿处, 花重官城. <br />唐 杜甫《风雨看舟前落花绝句》 满树和娇烂漫红,万枝丹彩灼春融。 何当结作千年实,将示人间造化工 <br />茅屋为...
  • 阿里云动手实验室Hands-on Labs,挑战10000名开发者云上Hello World 即日起至9月18日,Hands-on Labs发起万人云上Hello World挑战!挑战成功,即可领取官方证书;进钉群,每天18:00抽取一枚程序员锦鲤,Airpods、...
  • 文本切分

    2020-02-19 23:03:01
    先来个喜欢的名字,平时累的时候常仰望天空,琢磨着孙悟空在筋斗云上翻个筋斗去到十万八千里,那是多么自由哇!如果码代码能有那境界,真是要飞仙了。所以就叫“筋斗云上”吧。 第一篇 文本切分 文本切分包含 两个...
  • 在劳力劳心,是一切发明之母。事事在劳力劳心,变可得事物之真理。——陶行知 中国软件网每日精选文集中国软件网 每日新闻播报 第01-15期1趋 势 洞 察■ 富旗杨...
  • 上海滨江健走有感

    2019-03-12 14:11:21
    2019年3月8日 一轮明月升云端,两行足印向远方。 车马喧嚣夜正酣,漕舫争流为谁忙? 几度寒暑离爹娘,谁人锦衣归故乡? 岁月更新上海滩,碧水长流黄浦江。 ...
  •  那是一天下午,阳光明媚,蔚蓝的天空像一块蓝色的锻,洁白的云朵点缀了蓝色的锻。我和爸爸准备去紫阳公园滑冰,一路我欢蹦乱跳的,好不快活。终于到了溜冰场,放眼望去,有的人在学步,有的在做花样动作。我...
  • 月亮在白莲花般的云朵里穿行,往事便插了美丽的翅膀开始追逐着一轮明月在云端放牧。月光如锦缎般的清凉华丽,静静的月华如水般流泻而下,洒满了曾有桂花飘落的窗台。 今夜,就让我陪着月亮静静地睡在云朵儿清凉...
  •  初三毕业留言励志1 1、要毕业了,不想道离别,因为不舍,不想说再见,因为不忍,不想写留言,因为难分,唯有送祝福,愿你一切都好,心中默默祈祷,愿你前程似,常联系哟。 2、就要中学了,老师觉得你如果...
  • 2020夏天的黄昏初中作文五篇 夏日的黄昏,来得有点晚,...偏西的太阳倾吐着火红的余晖,使悠然的云朵想了一道金边儿,它像彩绸,又像锦缎。草木,小路,房屋,还有远处的人影,都被涂了一层扑朔迷离的色彩。 ....
  • 十月你好国旗下讲话五篇 金秋十月,树那稀稀拉拉的叶子,干得像... 诗人们为我们的家乡成都留下了珍贵的诗篇,李白诗:"九天开出一成都,千门万户入画图." 杜甫诗:"晓看红湿处,花重官城."还有"窗含西岭千秋雪,?..
  •  那人侧卧在榻中,发簪墨梅,眼尾迤逦,半阖半张,脸容清艳绝伦,虽是惨白羸弱却难掩眉宇间风流仪态,堪堪让人难以逼视。白雾般的月光洒落在她微微蹙起的眉尖。  突然,她的呼吸急促起来,喘息间...
  • 摘要:回顾大数据技术领域大事件,最早可追溯到06年Hadoop的正式启动,而...在云栖社区2017在线技术峰会大数据技术峰会,阿里大数据计算平台架构师林伟做了题为《MaxCompute的大脑:基于代价的优化器》的分享,为
  • 来2019华为开发者大赛,站在属于开发者的舞台,演绎你自己的别样年华。48W奖金等你豪夺。 软件开发赛道已经铺好,即日起开放报名,2019年7月31日前完成作品,参与评选。 “+智能,见未来”,拥有可靠承诺的华为...

空空如也

空空如也

1 2 3 4
收藏数 66
精华内容 26
关键字:

云上锦