精华内容
下载资源
问答
  • 2020-09-28 09:59:08
    #!/usr/bin/env python
    # coding: utf-8
    import zipfile #压缩包
    import os #文件库
    import shutil
    import pytesseract
    import PIL
    from PIL import Image
    from docx import Document ##需要安装第三方库,python-docx
    from docx.shared import Pt #用于设置字体样式
    from docx.oxml.ns import qn # 中文格式
    class get_result:
    	def __init__(self,dir_str,file_list,b)
    		self.dir_str=dir_str
    		self.file_list=file_list
    		self.b=b		
    	def get_image(self):
    		file_list=self.file_list
    		dir_str=self.dir_str
    		b=self.b
    		# 提取word文档中的图片
    		for s in file_list:
    		    #print (s)
    		    file_path=dir_str.format(s)
    		    try:
    		        doc=zipfile.ZipFile(file_path)#压缩文件
    		        r_path=b+"\\image\\{0}".format(s)
    		        if os.path.exists(r_path)!=0:
    		            shutil.rmtree(r_path) #os.removedirs,如果目录下不为空则不能删除,shutil.rmtree可强制删除文件夹
    		        os.mkdir(r_path)
    		        for info in doc.infolist():
    		            if info.filename.endswith((".jpeg",'.jpg','.png','.gif')):#判断文件类型
    		                doc.extract(info.filename,r_path)        
    		    except Exception as e:
    		        print (e)
    		    finally:
    		        pass
    		print ("图片提取完成")
    		
    	def insert_word(self):
    		file_list=self.file_list	
    		b=self.b
    		####提取图片中的文字,并写入word/txt文档
    		for s in file_list:
    		    #print (s)
    		    try:
    		        r_path=b+"\\image\\{0}\\word\\media".format(s)#图片路径
    				#txt_path=b+"\\{0}.txt".format(s)#写入文件路径
    		        docx_path=b+"\\{0}.docx".format(s)
    		        t=""
    		        if os.path.exists(r_path)!=0:
    		            for filename in os.listdir(r_path):
    		                t=t+"\n"+str(pytesseract.image_to_string(Image.open(r_path+"\\"+filename),lang="chi_sim"))
    		            '''
    		            写入txt文件
    		            fd=open(txt_path,'w')#w 将覆盖原文件内容,a,向原文件追加内容
    		            fd.write(t)
    		            fd.close()  
    		            '''           
    		            '''写入word文档'''
    		            doc=Document()
    		            doc.styles["Normal"].font.name = u"微软雅黑"#设置字体样式
    		            doc.styles["Normal"].font.size = Pt(14)#设置字体大小
    		            doc.styles['Normal']._element.rPr.rFonts.set(qn('w:eastAsia'), u'微软雅黑')#设置文档的基础样式
    		            doc.add_paragraph(t)#增加一个paragraph,写入内容
    		            doc.save(docx_path)#保存文档    
    		    except Exception as e:
    		        print (e)
    		    finally:
    		        pass
    		print ('数据写入完成')
    def r(dir_str,file_list,b):
    	getResult=get_result(dir_str,file_list,b)
    	getResult.get_image()
    	getResult.insert_word()
    if __name__=="__main__"::
    	dir_str='{0}.docx'#文件名称
    	file_list={
    	'201310',
    	'201410',
    	'201510'
    	}	
    	b=os.getcwd()#当前文件地址,可传入固定字符串,格式为:C:\\Test\\a
    	r(dir_str,file_list,b)
    
    更多相关内容
  • 基本上挂着图3 程序 生成一俩小时 常用的字都入库 并支持识别了。 缺点: 1 .不同字体 不同大小 特征会一样 因此不同字体大小字需相应重新取特征入库 2 .暂时支持多字识别,仅支持单字识别 (QvQ 这个俺弄了...
  • 自动识别图片文字并转化为word文档自动识别图片文字并转化为word文档自动识别图片文字并转化为word文档自动识别图片文字并转化为word文档自动识别图片文字并转化为word文档自动识别图片文字并转化为word...
  • 使用MATLAB的最新的app功能开发的一个带界面的图片文字识别,将识别的结果保存到word文档中。使用matlab2021a或者以上版本测试
  • Word图片文字识别出来.docx
  • 如何用Word图片文字识别出来.docx
  • PHP读取word docx文件中图片文字
  • 利用百度api 批量识别图片中的文字 并将执行结果生成word文件
  • 图片文字识别软件

    2018-08-31 15:11:33
    图片识别文字,PDF识别文字,强大的文字识别工具,可以将图片识别文字保存至word
  • baidu_orc_word 百度文字识别jpg图片 #链接地址 http://../orcword.php?apikey= ####一定要填写apikey ####识别图片放在根目录 #作者 suntengfei
  • 运行VBS,调用程序,CTRL+F5快速选择区域识别
  • python的文字识别库easyocr所需中文识别的模型
  • 天若OCR文字识别V4.48-pdf/视频/图片上的文字识别软件,可以直接转换成TXT,word文字格式,方便快捷,还嵌入了谷歌翻译,自动朗读功能,
  • 适合需要检查关键词的人群,有关键词则返回文字...里面有专门的配置文件且关键词支持正则表达式,其中有pdf,图片识别开关以前关键词配置。这个版本适合联网的使用,如果需要连外网则是另外一个版本,以后再写一个。
  • 主要为大家详细介绍了识别率很高的java文字识别技术,亲测,希望对大家有帮助,感兴趣的小伙伴们可以参考一下
  • php读取word文件解析图片公式及文字,目前仅支持docx后缀格式
  • 图片word文字

    2019-11-18 13:26:31
    公式识别图片文字的 软件
  • mlfviewer军用浏览器,可用于pdf图片文字识别,亲测可用,但是工具毕竟是工具,请认真对待生成结果!工具均是网络搜集而来,分享给有需要的朋友们,若有不便,见谅
  • 主要介绍了Python3使用腾讯云文字识别(腾讯OCR)提取图片中的文字内容方法详解,需要的朋友可以参考下
  • 最近项目要用到文字识别功能,所以花了几天时间整理了一下。今天就记录一下用C#实现文字识别的过程。 一、登录百度云进入控制台界面,创建应用获取秘钥 1、在百度云的产品里找到文字识别 2、找到通用文字识别点击...
  • 迅捷ocr文字识别软件支持图片文字识别图片文字转换成word、扫描文件转换成word等多种文字识别技术,是一款多功能的ocr识别软件! 使用方法:优质步:下载安装迅捷ocr文字识别软件
  • ABBYY FineReader 12 安装完就可用,文字识别利器,可识别PFD转WORD图片上的文字也可以识别转成WORD
  • maven 读取pdf 例子 java 读取pdf 文字 图片 poi 读取word 文字 图片
  • 一款强大的图片识别文字工具,轻松简单截取图片文字拷贝下来,用于word文档与PPT演示文稿的编写。方便快速提取文字。
  • 捷速OCR文字识别软件是将你的图片转换成word及可编辑的文字。该软件具备一键转换功能,是OCR识别软件中包含格式较多、识别率较高、速度较快的一款识别软件。本软件支持识别前对页
  • 文字识别word转存

    2018-08-15 10:49:55
    图片文字,超好用的,可以把图片转存为word文字 ,操作简单
  • 英文字母单词识别,压缩包解压后市word-recognition文件夹,进入之后包含一个图片文件夹 imageSet 和标注文件 image_label.txt。标注文件中一行一个图片文件名和标注,用 tab 键隔开。
  • CoCo图像转换成word文字识别工具-一键截图转文字识别器。绝对好用! CoCo图像转换成word文字识别工具 功能详解: 核心功能:快速截取图像,把图像里的文字转换成文本文字(txt、doc等文本格式)。 重点1:“直接截取...
  • 文字识别工具

    2018-02-28 15:24:05
    相信大家在经常使用Office时,常要将图片文字转换成word的图片,有些是扫描的,有些是用相机拍下来的,但不能在电脑上编辑,如果图片文字转换成word后就可以在电脑上编辑了!图片上的文字是不能复制,这是一件令人...

空空如也

空空如也

1 2 3 4 5 ... 20
收藏数 18,300
精华内容 7,320
关键字:

word能不能识别图片文字