-
2021-06-14 02:39:57
技术特征:
1.一种将图片转成HTML文档的方法,其特征在于:所述的方法是利用OCR图片识别技术和OCR识别的PHP接口API,对需要识别的内容进行设置和结果获取;将获得的背景色、大小、位置等参数进行优化、层次区分和CSS转储,从而实现图片转HTML。
2.根据权利要求1所述的方法,其特征在于:所述的方法主要包括背景色遍历扫描区分、背景色识别录入背景库、背景库层次迭代OCR识别、文字/非文字识别、相邻/非相邻DIV识别、CSS属性优化、已确定div边框识别;
所述背景色遍历扫描区分,利用OCR图片识别的PHP识别接口,进行横向、纵向像素点颜色值识别,获得第一背景色区域大小和背景色值;然后,遍历整个图片;得到N个第一背景色区域,全部录入背景库,得到第一包络DIV;
所述背景色识别录入背景库,利用WEB前端技术和PHP技术;首先记录每个背景色不同的第一包络DIV的属性,创建一个缓存数组对象JSON,内含多个缓存变量属性;将第一包络DIV属性遍历进这个JSON;
所述背景库层次迭代OCR识别,更新并改进JSON;利用迭代和遍历函数,分析每个第一包络DIV内的组成;将这些组成部分组合为该第一包络DIV的内部子对象;每个内部子对象都有其各自的属性;每个子对象也可能包含子对象,如此遍历下去,获得N个级别的对象合集;
所述文字/非文字识别,定义一个判断,判断是否为文字;若是,则获取到文字内容块的属性后进行自动文字识别;若否,则进入图片处理方式;
所述相邻/非相邻DIV识别,遍历每个相同级别的包络DIV的位置;若处于同一行/列,则进行相邻识别;
所述CSS属性优化,优化内容包括尽量减少/排除绝对定位属性信息,将绝对定位转换成普通定位,通过外边距进行排版;对属性值进行去零取整操作,规范属性值的数字;所有CSS属性被安排存储在一个外在的CSS文件中;HTML文件通过外链调用这个CSS文件;
所述已确定div边框识别,对非文字包络DIV;通过OCR技术扫描并判断DIV目标的包围背景和包围背景与内部背景的距离,同时获得包围背景的颜色值;再次截取边框内的包络DIV,替换掉最初的图片文件,完成图片裁剪边框的操作。
3.根据权利要求2所述的方法,其特征在于:背景色遍历扫描区分时,只识别沿图片纵向方向横向第一位的像素点的颜色值;当遇到不同的像素点颜色时,退回到上一像素点,得到纵向的相同颜色(第一背景色)的高度;然后开始转换识别方向,只识别沿图片横向方向的像素点的颜色值;当遇到不同的像素点颜色时,退回到上一像素点,得到横向的相同颜色(第一背景色)的宽度;从而确定第一背景色区域大小和背景色值;依次遍历整个图片;得到N个第一背景色区域,全部录入背景库,得到第一包络DIV。
4.根据权利要求2所述的方法,其特征在于:所述第一包络DIV的属性,重要属性包括宽度、高度、位置(以左上方第一个像素点为基准);
为每个包络DIV对象都创建一个独有的ID属性并赋值。
5.根据权利要求2所述的方法,其特征在于:所述第一包络DIV的属性,重要属性包括宽度、高度、位置(以左上方第一个像素点为基准);
为每个包络DIV对象都创建一个独有的ID属性并赋值。
6.根据权利要求2至5任一项所述的方法,其特征在于:所述的文字/非文字识别的文字内容块的属性包括宽度、高度、相对/绝对位置、文字大小、字体、字体颜色;
图片处理方式是:首先得到区域的范围,即同样得到宽度、高度、位置属性,其次利用PHP的图片截取函数自定义出一个图片截取方法;所截取的内容就是包括边框的图片DIV的内容;所截图片只能是矩形;且得到最终图片格式为最佳大小的JPG格式。
7.根据权利要求2至5任一项所述的方法,其特征在于:所述相邻/非相邻DIV识别中,算出DIV块之间的像素点的合,即像素距离;此距离作为外边距属性存至属性JSON内,后期可以方便进行CSS优化。
8.根据权利要求2至5任一项所述的方法,其特征在于:所述CSS属性优化中所有元素的CSS定位标签都是ID定位。
9.根据权利要求7所述的方法,其特征在于:所述CSS属性优化中所有元素的CSS定位标签都是ID定位。
更多相关内容 -
python将文本转换成图片输出的方法
2020-09-22 04:20:37主要介绍了python将文本转换成图片输出的方法,涉及Python操作文本及图片的相关技巧,非常具有实用价值,需要的朋友可以参考下 -
图片转文本
2018-01-09 16:11:20简单的图片转文本工具,能够百分之95正确识别图片中的文字 -
如何把图片的文字转成可编辑文档
2012-05-15 10:20:50如何把图片的文字转成可编辑文档 pdf word 可编辑文档 图片上的文字 -
如何把图片上文字转换成word文字的图文步骤
2021-07-06 08:37:21大 家好,我们可能常常会碰到将图片文字转换成word的难题,通常...很多工作上的各种需求,需要把图片文字 转换成word,可编辑的文本,一般人都会想到依着图片手打,可能一两张图片的时候还可以接受,但如果一本实物...大 家好,我们可能常常会碰到将图片文字转换成word的难题,通常要将图片文字转换成word的图片,有些是扫描的,有些是用相机拍下来的,但不能在电脑上 编辑,如果图片文字转换成word后就可以在电脑上编辑了!图片上的文字是不能复制,这是一件令人非常郁闷的事情。很多工作上的各种需求,需要把图片文字 转换成word,可编辑的文本,一般人都会想到依着图片手打,可能一两张图片的时候还可以接受,但如果一本实物书要转换成可以编辑的word,那就不是手 打那么简单了,光靠手打根本完成不了整本书的图片文字转换成word,工程量太大了!图片文字如何转换成word?图片文字用什么方法可以转换成 word?如果掌握了将图片转换为word的方法,那么将会省力许多!
问题总有解决的办法,经过我的多次尝试和摸索,总算找到了一个将图片文字转换成word的方法,下面,我教大家操作一下!
步骤/方法
首先在电脑上打开我们要转换成word的文字图片,对图片格式没有要求,任何格式的都可以;
然后启动图像word转换工具,双击软件运行后软件的工具条会出现在屏幕的上方,默认是自动隐藏的,也可以进行锁定,操作起来非常简单,就像截图一样,选取图片上要转换的文字区域,操作方法如下图:
然后软件会自动识别我们选择区域中的文字,过1秒钟就将文字识别出来了,如上图记事本。
接下来再来演示一下用相机拍摄的书本文字图片如何将图片转换成word,操作方法和上面的类似,先选取图片上的文字区域,然后软件会进行自动识别,操作方法如下图:
然后会弹出一个对话框,直接点击“确认”按钮,软件会自动弹出转换结果,如下图:
对带表格的图片文字转换成word也是可以的,操作方法和上面的相同,如下图操作:
选取要转换的区域,点击“确定”按钮,然后工具会进行自动识别,转换结果如下:
对用相机拍摄的外文书本图片文字转换成word也是可以的,下面我就来给大家介绍一下具体的操作步骤,先打开一张日文的文字图片,具体操作如下图:
选取要转换的日文文字区域,然后软件按会自动弹出一个框,然后在语种一栏选择“日文”就可以,然后点击“确定”按钮,就可以了;
转换结果如下:
-
把固定格式的文本文档转换为Excel电子表格的方法
2021-06-10 08:19:41本文图文讲解把固定格式的文本文档转换为Excel电子表格的方法。比如,有一个文本文件,它的名字是“通讯录.txt”,它里面有标题行和内容行,每一行都由一个“竖线”字符(也就是英文字符“|”)分隔。整个文件的内容如...有时候,需要把一些拥有固定格式的文本文件导入电子表格。微软的Excel 电子表格程序有一个文本文件转换向导,将这种格式转换变得非常快捷方便。本文图文讲解把固定格式的文本文档转换为Excel电子表格的方法。
比如,有一个文本文件,它的名字是“通讯录.txt”,它里面有标题行和内容行,每一行都由一个“竖线”字符(也就是英文字符“|”)分隔。整个文件的内容如图所示。
1、打开Excel,按Ctrl + o 组合键,调出“打开”对话框,把对话框中的“文件类型”设置为“文本文件”,在“查找范围”里导航到第 1 步骤中文本文件所在的位置,点击“通讯录.txt”文件——打开。
2、Excel 弹出“文本导入向导”对话框。由于“通讯录”文本文件是以“竖线”字符这一分隔符号分隔的,因此在“选择最合适的文件类型”中,我们保持选中“分隔符号”不变,单击“下一步”。
3、在“分隔符号”里,去掉“Tab键”、“分号”、“逗号”、“空格”前面的对勾,选中“其他”,然后在“其他”后面的文本框里,输入“竖线”字符,也就是“|”这个符号。注意这个符号必须是在英文状态下输入。另外,在“文本识别符号”中选择“无”。
4、接下来,设定 Excel 如何识别文本文件中的数字。点击“手机号码”那一列,在“列数据格式”中选择“文本”。这样做的目的是,防止 Excel 把数字前面的“零”给去掉。用同样的方法,设置一下“固定电话”那一列。
另外可以看到,如果文本文件中存储了日期,在这一步骤中还可以将其指定为“日期”格式,方便转换完成之后,对这一列进行日期有关的计算。
5、点击“完成”按钮,就完成了固定格式文本文件导入 Excel 的操作。
更多相关阅读
-
友益ocr提取图片文字转文本工具1.0.2.rar
2019-07-06 18:06:36友益ocr提取图片文字转文本工具 当对一个纸质文件进行扫描后,以图片形式保存,如果需要对进行修改编辑,则需要重新输入或把图片格式转换为文本格式。这时就需要用OCR技术,提取图片上的文字。"友益ocr提取图片文字... -
怎么利用微信小程序把图片上的文字转到word文本中?
2021-01-14 14:08:37“传图识字”:步骤5:一般精确搜索后的第一个结果就是你要找的小程序了,点击这个小程序即可:步骤6:打开传图识字小程序后,选择“拍照/选图”按钮点击步骤7:在手机相册中选择你要转文字的照片,或者直...步骤1:在手机中打开已安装的微信
步骤2:点击微信最下面的菜单栏中的“发现”按钮,见下图:
步骤3:打开的新界面见下图,找到列表中的“小程序”:
步骤4:在打开的小程序界面,有一个搜索框,在框内输入小程序的名称:“传图识字”:
步骤5:一般精确搜索后的第一个结果就是你要找的小程序了,点击这个小程序即可:
步骤6:打开传图识字小程序后,选择“拍照/选图”按钮点击
步骤7:在手机相册中选择你要转文字的照片,或者直接使用手机相机拍照也可以,选择好或拍照好之后, 小程序会自动分辨和解析你刚刚上传的图片:
步骤8:当小程序将图片识别完成后,会有有一个提示弹出来,提示你可以对已识别的文字进行复制和粘贴的操作,按确定即可。
步骤9:接下来就可以对已经识别的文字进行复制了,在最下方有三个按钮,最左边那个是复制整页文字的按钮 ,中间那个是可以选择复制部分文字:
步骤10:选择之后,点击最右边的对勾按钮完成复制,点击后会提示复制成功:
11. 复制之后就可以将文字粘贴到指定位置了。
以上就是使用微信中的小程序将图片上的文字识别出来的方法,识别出来之后, 可以通过微信等工具将文字复制到电脑中,存到word文本中,或者如果手机安装了手机版的word,也可以直接粘贴到手机word中存储起来。
-
VB将二进制图片文件转换为Base64字符串文本
2018-11-29 09:44:29VB将二进制图片文件转换为Base64字符串文本,可直接将字符串加密,也可直接读取数据库或图片文件加密为Base64字符串! -
Spire.doc(jar包),实现wode文档转换成图片
2020-11-17 16:59:44引入jar包可以在java中把word文档转化成图片,实现在线预览即可,引入图片文件分页预览即可,还可以实现其他转换更能,具体情况参考官网 -
图片进行base64编码转换
2020-12-07 13:10:36此软件功能是对图片进行base64编码转换,可以进行图片的文本化,用于纯文本编辑器中添加图片内容,如markdown编辑器可以不引用外部图片,直接把图片的base64文本粘贴到编辑器上,直接可预览到图片 -
如何把用Word文档转换成PNG图片
2022-02-20 21:14:59一、把word转成pdf文档: 1. 打开word,选择 File > Options > Advanced,确保勾选如下: 2. 将 word 文件另存为pdf,并勾选: 二、把pdf转换成png图片: 1. 用Photoshop打开pdf文件,并进行设置: ... -
java利用openoffice,把word,execl,ppt转成图片,
2014-09-22 11:37:22Entry.java这个类的原理是先通过OfficeToPDF.java把文档转成pdf,然后再通过Pdf2Jpg.java这个类把PDF转成JPG或者PNG,想转成什么格式图片在Pdf2Jpg.java这个类当中设置一下,代码经过测试,完全没有问题,如果碰到... -
网页中超长图片转成pdf文档
2021-03-30 10:09:39网上有些超长照片,直接复制到word中,会堆积在一张文档中。 解决方法: 1)在图片上右击鼠标。 2、在弹出菜单中选择“捕捉片段” 3、按“编辑”按钮。 4、完成。 5、按 下拉按钮,选择“SAVE AS ... -
夕风OCR图片转文本识别工具V2.2.zip
2019-06-20 16:38:59夕风OCR图片转文本识别工具是利用搜狗OCR/百度OCR接口开发而成的一款OCR识别工具,可上传图片识别文字,可截图识别文字(截图识别快捷键F1),可导出为TXT文本。 -
易语言-文本变图片易语言
2021-06-29 12:47:21源码实现了将文本转换到字节集数据,再取出每个字节数值进行计算后画到画板上。 -
易语言-RTF文本转图片 - WMF图片转BMP、JPG
2021-06-25 15:45:13RTF文本转图片 - WMF图片转BMP、JPG -
易语言文本转黑色图片
2020-07-22 19:57:14易语言文本转黑色图片源码,文本转黑色图片,加密,文本到十六进制封包,十到十六,wvsprintfA -
Python实现图片转ASCII文本图形(含PPT)
2018-06-08 17:20:07Python实现图片转ASCII文本图形 - CSDN博客 https://blog.csdn.net/lly1122334/article/details/80625874 -
怎样快速把jpg图片转换成word文档?
2019-06-11 18:05:51在日常的生活或者是工作中我们经常见到的图片就是jpg格式的了,无论是在哪个方面,我们都会多多少少的遇到将图片转换成文字的情况发生。在高中的时候,就经常有些jpg图片需要转化的。可是一直没有找到好的转换方法。... -
C# HtmlToWord 将HTML文件转换成word文档
2018-05-10 13:00:32批量的把html 文件转换成word,不需要电脑上有word软件!并且支持本地图片,html链接的图片必须在本地,可以把图片转换到word里! -
QPainter绘制文本转BMP32位深的图片
2020-03-10 14:37:32QPainter文本转BMP32,QImage已经保存BMP图片已经不支持32位深的了,自动降到24位深,自己组织BMP信息保存成bmp32的图片 -
图片表格如何转换成excel表格
2022-01-22 22:06:29比如在看书或学习的时候,想把书中的表格弄成Excel,便于做笔记。 处理的时候,先进行截图,只要处理表格。如果整张图的话,会生成word文件,看个人需要。 目录 截图: 打开QQ对话框 右击图片选择提取文字... -
将图片文件转换为Base64字符串文本.zip
2019-10-31 03:54:18VB6将二进制图片文件转换为Base64字符串文本,可直接将字符串加密,也可直接读取数据库或图片文件加密为Base64字符串! -
手机图片怎么转文本?
2022-01-19 18:16:29即可以使用手机自带的图片转文本功能,也能使用第三方工具实现文本转换。下面给大家分享几个手机图片转文本技巧,赶紧学起来吧。 华为手机——图片转文本 找到转换文本的图片,双指长按,等待自动将图片转换成文字。... -
Python3,2行代码,多种方法,直接把网页内容转换成PDF文档和图片。
2022-06-12 14:34:112、代码实战 关于网页的内容转换成PDF,通常思路: 爬取网页内容 保存到本地 转换成PDF文档 这种方法, 确实可以实现,但是,很麻烦,需要转两次。 而今天,小鱼给大家分享的方法,就3行代码,一次搞定。 2.1 模块... -
OCR图片转文本识别工具
2018-09-26 15:05:20OCR图片转文本识别工具,可快速将文字识别,节省大量码字的时间 -
JPG图片中的文字或表格怎么转成Word文档?
2020-06-16 17:04:25由于图片修改起来不方便,有时又需要用到图片中的文字或表格内容,将它转换成Word文档后就比较好方便了。那么怎样才能将JPG转成Word呢? 1、我们可以使用一些转换工具。首先下载极速玩转后打开软件,选择图片转换中... -
【电脑知识】怎样将图片转换成word文档
2021-07-28 08:25:55软件介绍:汉王 PDF OCR 8.0是汉王 OCR 6.0 和尚书七号的升级版,新增PDF文件的处理功能,可以把PDF文件(包括文本型和图片型)转化为可编辑的各种文档,如(PDFTOWORD、 PDF2WORD)或(PDFTOTXT、PDF2TXT)。本软件对个人... -
java文本文件转化为图片文件怎么弄?
2021-02-12 19:49:06展开全部文件在计算机中都是以二62616964757a...按照你说想的,可以这么来做:1、读取txt文本的每一行2、创建BufferedImage图片,然后在图片上画读取到的文本下面给出示例程序:测试类 TextToImageExample.jav...