-
2020-09-28 09:59:08
#!/usr/bin/env python # coding: utf-8 import zipfile #压缩包 import os #文件库 import shutil import pytesseract import PIL from PIL import Image from docx import Document ##需要安装第三方库,python-docx from docx.shared import Pt #用于设置字体样式 from docx.oxml.ns import qn # 中文格式 class get_result: def __init__(self,dir_str,file_list,b) self.dir_str=dir_str self.file_list=file_list self.b=b def get_image(self): file_list=self.file_list dir_str=self.dir_str b=self.b # 提取word文档中的图片 for s in file_list: #print (s) file_path=dir_str.format(s) try: doc=zipfile.ZipFile(file_path)#压缩文件 r_path=b+"\\image\\{0}".format(s) if os.path.exists(r_path)!=0: shutil.rmtree(r_path) #os.removedirs,如果目录下不为空则不能删除,shutil.rmtree可强制删除文件夹 os.mkdir(r_path) for info in doc.infolist(): if info.filename.endswith((".jpeg",'.jpg','.png','.gif')):#判断文件类型 doc.extract(info.filename,r_path) except Exception as e: print (e) finally: pass print ("图片提取完成") def insert_word(self): file_list=self.file_list b=self.b ####提取图片中的文字,并写入word/txt文档 for s in file_list: #print (s) try: r_path=b+"\\image\\{0}\\word\\media".format(s)#图片路径 #txt_path=b+"\\{0}.txt".format(s)#写入文件路径 docx_path=b+"\\{0}.docx".format(s) t="" if os.path.exists(r_path)!=0: for filename in os.listdir(r_path): t=t+"\n"+str(pytesseract.image_to_string(Image.open(r_path+"\\"+filename),lang="chi_sim")) ''' 写入txt文件 fd=open(txt_path,'w')#w 将覆盖原文件内容,a,向原文件追加内容 fd.write(t) fd.close() ''' '''写入word文档''' doc=Document() doc.styles["Normal"].font.name = u"微软雅黑"#设置字体样式 doc.styles["Normal"].font.size = Pt(14)#设置字体大小 doc.styles['Normal']._element.rPr.rFonts.set(qn('w:eastAsia'), u'微软雅黑')#设置文档的基础样式 doc.add_paragraph(t)#增加一个paragraph,写入内容 doc.save(docx_path)#保存文档 except Exception as e: print (e) finally: pass print ('数据写入完成') def r(dir_str,file_list,b): getResult=get_result(dir_str,file_list,b) getResult.get_image() getResult.insert_word() if __name__=="__main__":: dir_str='{0}.docx'#文件名称 file_list={ '201310', '201410', '201510' } b=os.getcwd()#当前文件地址,可传入固定字符串,格式为:C:\\Test\\a r(dir_str,file_list,b)
更多相关内容 -
易语言-易语言图片文字识别 可将图片内文字识别转换为文本
2021-06-25 17:54:10基本上挂着图3 程序 生成一俩小时 常用的字都能入库 并支持识别了。 缺点: 1 .不同字体 不同大小 特征会不一样 因此不同字体大小字需相应重新取特征入库 2 .暂时不支持多字识别,仅支持单字识别 (QvQ 这个俺弄了... -
自动识别图片上文字转化为word.rar
2020-01-17 09:56:31自动识别图片上文字并转化为word文档自动识别图片上文字并转化为word文档自动识别图片上文字并转化为word文档自动识别图片上文字并转化为word文档自动识别图片上文字并转化为word文档自动识别图片上文字并转化为word... -
使用MATLAB的最新的app功能开发的一个带界面的图片文字识别,将识别的结果保存到word文档中
2022-05-05 08:40:35使用MATLAB的最新的app功能开发的一个带界面的图片文字识别,将识别的结果保存到word文档中。使用matlab2021a或者以上版本测试 -
用Word把图片文字识别出来.docx
2021-09-27 09:37:47用Word把图片文字识别出来.docx -
如何用Word把图片文字识别出来.docx
2021-09-27 07:13:26如何用Word把图片文字识别出来.docx -
PHP读取word文档(图片+文字)
2018-10-14 02:14:14PHP读取word docx文件中图片和 文字 -
批量文字识别_Python图片识别_批量_文字识别api_文字识别_
2021-10-02 12:21:38利用百度api 批量识别图片中的文字 并将执行结果生成word文件 -
图片文字识别软件
2018-08-31 15:11:33图片识别文字,PDF识别文字,强大的文字识别工具,可以将图片识别成文字保存至word -
baidu_orc_word:百度文字识别jpg图片
2021-07-21 22:48:59baidu_orc_word 百度文字识别jpg图片 #链接地址 http://../orcword.php?apikey= ####一定要填写apikey ####识别的图片放在根目录 #作者 suntengfei -
CoCo图像转换成word文字识别工具.zip
2021-06-08 11:33:48运行VBS,调用程序,CTRL+F5快速选择区域识别 -
python的文字识别库easyocr所需中文识别的模型.zip
2021-12-08 12:28:38python的文字识别库easyocr所需中文识别的模型 -
天若OCR文字识别V4.48-pdf/视频/图片上的文字识别软件
2020-11-23 17:10:12天若OCR文字识别V4.48-pdf/视频/图片上的文字识别软件,可以直接转换成TXT,word文字格式,方便快捷,还嵌入了谷歌翻译,自动朗读功能, -
自动识别office 图片 文字 pdf有一定的兼容性.rar
2021-10-08 21:20:22适合需要检查关键词的人群,有关键词则返回文字...里面有专门的配置文件且关键词支持正则表达式,其中有pdf,图片识别开关以前关键词配置。这个版本适合不联网的使用,如果需要连外网则是另外一个版本,以后再写一个。 -
识别率很高的java文字识别技术
2020-09-01 18:15:43主要为大家详细介绍了识别率很高的java文字识别技术,亲测,希望对大家有帮助,感兴趣的小伙伴们可以参考一下 -
php读取word文件解析图片公式及文字,目前仅支持docx后缀格式
2021-01-12 16:11:39php读取word文件解析图片公式及文字,目前仅支持docx后缀格式 -
图片转word转文字
2019-11-18 13:26:31公式识别图片转文字的 软件 -
mlfviewer军用浏览器可PDF图片文字识别生成word外加pdf转word等工具
2017-11-28 18:06:04mlfviewer军用浏览器,可用于pdf图片的文字识别,亲测可用,但是工具毕竟是工具,请认真对待生成结果!工具均是网络搜集而来,分享给有需要的朋友们,若有不便,见谅 -
Python3使用腾讯云文字识别(腾讯OCR)提取图片中的文字内容实例详解
2020-09-17 22:10:24主要介绍了Python3使用腾讯云文字识别(腾讯OCR)提取图片中的文字内容方法详解,需要的朋友可以参考下 -
C# SDK实现百度云OCR的文字识别功能
2020-12-31 08:11:21最近项目要用到文字识别功能,所以花了几天时间整理了一下。今天就记录一下用C#实现文字识别的过程。 一、登录百度云进入控制台界面,创建应用获取秘钥 1、在百度云的产品里找到文字识别 2、找到通用文字识别点击... -
ocr文字识别 迅捷ocr文字识别软件 v6.6
2020-12-15 07:27:24迅捷ocr文字识别软件支持图片文字识别、图片文字转换成word、扫描文件转换成word等多种文字识别技术,是一款多功能的ocr识别软件! 使用方法:优质步:下载安装迅捷ocr文字识别软件 -
ABBYY_FineReader_12可识别PFD转WORD
2021-04-16 11:23:00ABBYY FineReader 12 安装完就可用,文字识别利器,可识别PFD转WORD ,图片上的文字也可以识别转成WORD -
pdf word 读取文字 图片例子
2018-06-12 17:24:21maven 读取pdf 例子 java 读取pdf 文字 图片 poi 读取word 文字 图片 -
天若OCR图片截图并识别出文字工具
2020-10-16 12:44:42一款强大的图片识别文字工具,轻松简单截取图片文字拷贝下来,用于word文档与PPT演示文稿的编写。方便快速提取文字。 -
文字识别软件 捷速ocr文字识别软件 v3.0
2020-10-17 13:22:47捷速OCR文字识别软件是将你的图片转换成word及可编辑的文字。该软件具备一键转换功能,是OCR识别软件中包含格式较多、识别率较高、速度较快的一款识别软件。本软件支持识别前对页 -
文字识别word转存
2018-08-15 10:49:55图片转文字,超好用的,可以把图片转存为word文字 ,操作简单 -
英文字母单词识别(word-recognition)
2022-05-25 21:34:22英文字母单词识别,压缩包解压后市word-recognition文件夹,进入之后包含一个图片文件夹 imageSet 和标注文件 image_label.txt。标注文件中一行一个图片文件名和标注,用 tab 键隔开。 -
CoCo图像转换成word文字识别工具-截图转文字识别器
2012-08-28 11:29:41CoCo图像转换成word文字识别工具-一键截图转文字识别器。绝对好用! CoCo图像转换成word文字识别工具 功能详解: 核心功能:快速截取图像,把图像里的文字转换成文本文字(txt、doc等文本格式)。 重点1:“直接截取... -
文字识别工具
2018-02-28 15:24:05相信大家在经常使用Office时,常要将图片文字转换成word的图片,有些是扫描的,有些是用相机拍下来的,但不能在电脑上编辑,如果图片文字转换成word后就可以在电脑上编辑了!图片上的文字是不能复制,这是一件令人...
收藏数
18,300
精华内容
7,320