-
2020-12-04 13:01:34
实现逻辑
1. 批量获取图片的路径
2. 通过调用百度OCR接口批量识别图片
3. 将返回值写入txt
实现过程
1. 安装百度的Python SDK
pip install baidu-aip
2. 具体代码
from aip import AipOcr
import time
import os
#获取开始时间
start = time.time()
""" 你的 APPID AK SK """
APP_ID = '您的appid'
API_KEY = '您的AK'
SECRET_KEY = '您的SK'
client = AipOcr(APP_ID, API_KEY, SECRET_KEY)
""" 读取图片 """
def get_file_content(filePath):
print(filePath)
with open(filePath, 'rb') as fp:
return fp.read()
""" 写入文本 """
def write_on_txt(content,filePath,linefeed = "1"):
"""
content:要写入的内容
filePath:要写入文件的路径
linefeed :判断是否换行
- 1 为不换行
- 其他 为换行
"""
#只需要将之前的”w"改为“a"即可,代表追加内容
with open(filePath,"a") as file:
try:
file.write(content)
except:
print("写入错误")
else:
if linefeed != "1":
file.write("\n")
#图片路径
img_path = r"D:\图片" # 也可采用 r" D:\Test_path" 或者是"D:/Test_path"
#文本路径
txt_path = r"C:\Users\User29\Desktop\OCR\图片.txt"
options = {}
#遍历所有文件(使用 os.walk 方法)
for root,dirs,files in os.walk(img_path):
for file in files:
# 使用join函数将文件名称和文件所在根目录连接起来
file_dir = os.path.join(root, file)
print(file_dir)
write_on_txt("=============================",txt_path,"0")
write_on_txt("文件名:"+ file_dir,txt_path,"0")
#判断是否是图片
if file_dir[-4:]==".png"or file_dir[-4:]==".jpg":
#传入图片
image = get_file_content(file_dir)
""" 调用通用文字识别, 图片参数为本地图片 """
a = client.basicGeneral(image, options)
# 查看返回的结果
# print(a['words_result'])
print()
for dic in a['words_result']:
print(dic['words'])
write_on_txt(dic['words'],txt_path,"0")
end = time.time()
print('Running time: %1.2f Seconds'%(end-start))
更多相关内容 -
批量图片文字提取、文字识别、OCR
2019-12-06 21:19:35部署环境后,将extraction.exe 放置到需要提取文字的图片文件夹并打开,识别后会将图片文字以图片文字为命名放置到桌面。 -
python批量识别图片指定区域文字内容
2021-01-20 06:30:27Python批量识别图片指定区域文字内容,供大家参考,具体内容如下 简介 对于一张图片,需求识别指定区域的内容 1.截取原始图上的指定图片当做模板 2.根据模板相似度去再原始图片上识别准确坐标 3.根据坐标剪切出指定... -
批量文字识别
2019-04-29 22:57:34识别结果可直接存为EXCEL,或导入到MSSQL,MYSQL等数据格式,方便存储查询.表格文字识别,程序经人工智能深度学习,有效解决传统OCR对表格识别率低的问题. -
图片文字识别
2018-06-04 17:37:24图片文字识别,并显示在前端。。。。。。。。。。。。。。。。。。。。。。 -
python 利用百度API批量识别图片文字【1】
2020-12-13 19:05:14/usr/bin/env python3#-*- coding: utf-8 -*-"""Created on Tue Jun 12 09:37:38 2018利用百度api实现图片文本识别@author: XnCSD"""importglobfrom os importpathimportosfrom aip importAipOcrfrom PIL ...#!/usr/bin/env python3#-*- coding: utf-8 -*-
"""Created on Tue Jun 12 09:37:38 2018
利用百度api实现图片文本识别
@author: XnCSD"""
importglobfrom os importpathimportosfrom aip importAipOcrfrom PIL importImagedefconvertimg(picfile, outdir):'''调整图片大小,对于过大的图片进行压缩
picfile: 图片路径
outdir: 图片输出路径'''img=Image.open(picfile)
width, height=img.sizewhile (width * height > 4000000): #该数值压缩后的图片大约 两百多k
width = width // 2height= height // 2new_img=img.resize((width, height), Image.BILINEAR)
new_img.save(path.join(outdir, os.path.basename(picfile)))defbaiduOCR(picfile, outfile):"""利用百度api识别文本,并保存提取的文字
picfile: 图片文件名
outfile: 输出文件"""filename=path.basename(picfile)
APP_ID= '自己的' #刚才获取的 ID,下同
API_KEY = '自己的'SECRECT_KEY= '自己的'client=AipOcr(APP_ID, API_KEY, SECRECT_KEY)
i= open(picfile, 'rb')
img=i.read()print("正在识别图片:\t" +filename)
message= client.basicGeneral(img) #通用文字识别,每天 50 000 次免费
#message = client.basicAccurate(img) # 通用文字高精度识别,每天 800 次免费
print("识别成功!")
i.close()try:
filename1= filename.split('.')[0]
filename1= ''.join(filename1)
with open(outfile,'a+') as fo:for text in message.get('words_result'):
fo.writelines('\'' + filename1 + '\'' + ':' + text.get('words') + ',')
fo.writelines('\n')#fo.writelines("+" * 60 + '\n')
#fo.writelines("识别图片:\t" + filename + "\n" * 2)
#fo.writelines("文本内容:\n")
## 输出文本内容
#for text in message.get('words_result'):
#fo.writelines(text.get('words') + '\n')
#fo.writelines('\n' * 2)
except:print('识别失败')print("文本导出成功!")print()if __name__ == "__main__":
outfile= 'port_zidian.txt'outdir= 'tmp'
ifpath.exists(outfile):
os.remove(outfile)if notpath.exists(outdir):
os.mkdir(outdir)print("压缩过大的图片...")#首先对过大的图片进行压缩,以提高识别速度,将压缩的图片保存与临时文件夹中
try:for picfile in glob.glob("端口/*"):
convertimg(picfile, outdir)print("图片识别...")for picfile in glob.glob("tmp/*"):
baiduOCR(picfile, outfile)
os.remove(picfile)print('图片文本提取结束!文本输出结果位于 %s 文件中。' %outfile)
os.removedirs(outdir)except:print('失败')
-
Umi-OCR 批量图片转文字工具离线批量文字识别(图片转文字)软件.rar
2022-04-18 15:44:12本软件用于批量导入本地图片,识别图片中的文本,输出到软件面板或本地txt文件/md文件。除了能批量识别普通图片,本软件还有忽略指定区域的特殊功能。本软件使用离线OCR模块 PaddleOCR-json 图片转文字程序 ,使用... -
python实现批量识别图片文字,生成对应的txt文件
2022-03-02 22:52:04# print(picture_path) # print(picture_path.split('\\')[-1].split('.')[0] ) def get_file_content(filePath): with open(filePath, 'rb') as fp: return fp.read() time.sleep(1) # 调用通用文字识别接口 ...目录
百度api
第一步:打开网站
https://ai.baidu.com/
第二步:注册登录
第三步:登录成功,直接输入这个
https://console.bce.baidu.com/ai/?fromai=1#/ai/ocr/overview/index
不用一个一个点击进入这个页面,直接输入上面的地址,只要登录成功,就可以进入
以上准备好之后,直接上代码import os import time import uuid from aip import AipOcr # 定义常量 换成你网站的 APP_ID = '' API_KEY = '' SECRET_KEY = '' # 初始化AipFace对象 aipOcr = AipOcr(APP_ID, API_KEY, SECRET_KEY) # 定义参数变量 options = { 'detect_direction': 'true', 'language_type': 'CHN_ENG', } filePath = os.path.join(os.path.dirname(os.path.abspath(__file__)), 'word') filePath1 = os.path.join(os.path.dirname(os.path.abspath(__file__)), 'text') pictures = os.listdir(filePath) class MetaPicture(object): def read_picture(self): for picture in pictures: picture_path = os.path.join(filePath, picture) # print(picture_path) # print(picture_path.split('\\')[-1].split('.')[0] ) def get_file_content(filePath): with open(filePath, 'rb') as fp: return fp.read() time.sleep(1) # 调用通用文字识别接口 result = aipOcr.basicGeneral(get_file_content(picture_path), options) print(result) if len(result) > 2 : words_result = result['words_result'] word = "" for i in range(len(words_result)): word += words_result[i]['words'] word += "\n" word += "\n\n\n" with open(filePath1+'\\'+str(picture_path.split('\\')[-1].split('.')[0])+'.txt', 'w') as text: text.write(word) def main(): metaPicture = MetaPicture() metaPicture.read_picture() if __name__ == '__main__': main()
-
【教程】如何批量图片文字识别软件,批量图片文字识别OCR软件系统,批量图片压缩,PDF批量转文字转图片
2019-07-31 14:16:51可以支持单页图片识别、打开一个文件夹图片批量识别(后期正计划一个文件夹内的多个文件夹分组识别,没需求就没做) PDF文件文字识别怎么弄,现将PDF拆成图片,做了个功能批量PDF拆成图片后批量导入图片再识别 ...软件不需要安装,直接双击打开就可以用,废话不多说直接上图好了,方便说明问题
前段时间有人跟我讲说要批量图片(批量名片识别、批量照片识别等)识别,然后就下来研究了一下
可以支持单页图片识别、打开一个文件夹图片批量识别(后期正计划一个文件夹内的多个文件夹分组识别,没需求就没做)
PDF文件文字识别怎么弄,现将PDF拆成图片,做了个功能批量PDF拆成图片后批量导入图片再识别
基于Net4.5框架做的,软件支持win7以上系统,苹果的文字识别就先暂时不开发
说说有哪些功能吧
第一、支持语言:中英文、法语、俄语、葡萄牙、俄语、德语、韩语、日语这些需要更多的还可以加;
第二、PDF拆图:可以将多个PDF拆成图,分组存放指定文件夹、便于按文件夹批量导入图片等;
第三、图片压缩:图片太大影响识别,所以我们做了一个图片压缩的工具,可以将图片的范围控制在可识别范围;
PS:建议图片在4M的范围内,像素也不易过高4096X4096太高了就不支持了
第四、一键复制:可以将识别出来的文字一键复制出来,方便粘贴到指定位置;
第五、一键导出:可以将文字导出至记事本txt保存起来,为什么不是word,比较难控制格式哈不在这上面多花精力了
第六、识别过程中可中途暂停,没有写继续,用的时候发现错误了,就再来一遍,或者把识别的删掉,从没识别的开始
速度嘛2-3秒一页,看图片大小,软件识别需要联网使用,基于人工智能文字识别做的,也有单机版本的准确率不是很高
有些国际友人问:有没有英语翻译版本的哈,英文的需要自己翻译,或者找个你自己找个翻译我跟你对应翻译上去
欢迎大家下方提出好的功能和建议,我再来完善完善
百度网盘链接:https://pan.baidu.com/s/1zIzGB55PO9h5_xECs4U5YQ 提取码:fvjc
-
python进行批量图片文字识别
2021-07-27 13:50:53一、概述 ocr技术是当下比较热门的技术,利用它可以方便的对图片上的文字进行扫描识别,本文使用python+百度api实现图片的文字识别。 二、环境准备: 1. python环境的准备 1.1 首先需要到python官网下载最新版本的... -
批量识别图片中文字(python、百度开发者工具)
2018-06-02 14:24:30就想着如果我能把他们截图下来,然后批量转换成文字该多好呢?笔者决定通过python程序,调用百度api完成这项功能。认证百度开发者首先要在百度开发者平台认证成为百度开发者,创建应用后即会获得ID、API Key、Secret... -
一款非常优秀的文字识别工具,可以批量图片识别文字
2021-01-14 12:51:32前段时间有人跟我讲说要批量图片(批量名片识别、批量照片识别等)识别,然后就下来研究了一下可以支持单页图片识别、打开一个文件夹图片批量识别(后期正计划一个文件夹内的多个文件夹分组识别,没需求就没做)开发语言... -
【步步为赢】批量图片识别文字来命名文件名,很多网友想看批量图片识别成文字,用图片上的文字来修改文件名...
2019-08-09 14:02:22很多网友想看批量图片识别成文字,用图片上的文字来修改文件名,今天他来了 因为不解决就得手动挨个挨个输入然后把文件命名好 今天又一个文件需求是这样的 图上有姓名文字,要识别出来改成每一张图跟这个一样,有... -
python实现批量图片文字识别(ocr)
2021-07-30 07:52:47最近有ocr方面的需求,而且是批量的,python能不能干这么件事呢,肯定是可以的,基于百度智能云和python结合,实现了我们的需求,今天分享出来,做个备份 import glob from os import path import os from aip ... -
Python批量识别目录中所有图片中的所有文字
2020-11-25 23:22:15Python批量识别目录中所有图片中的所有文字并保存到txt文档中第一步安装所需要的库(我使用的是python 3.6)12pip install Pillowpip install pytesseract第二步下载tesseract.exe文件12源码:... -
php百度批量图片文字识别应用Ocr,获取需要的文字改文件名
2021-11-30 16:18:21应用百度Ocr -
批量图片识别文字-page3.zip
2019-06-07 06:29:36第一、支持语言:中英文、法语、俄语、葡萄牙、俄语、德语、韩语、日语这些需要更多的还可以加;... 第三、图片压缩:图片太大影响识别,所以我们做了一个图片压缩的工具,可以将图片的范围控制在可识别范围; -
【批量图片识别文字命名】如何批量图片识别文字并将识别的文字重命名该图片,怎么弄?下面叫你方法
2019-06-07 09:16:09前段时间接到一个棘手的难题(识别图片文字,将图片文件名改成该文字)因为不解决就得手动挨个挨个输入然后把文件命名好今天又一个文件需求是这样的,图上有姓名文字,要识别出来改成每一张图跟这个一样,有的人说了... -
图像文字识别:Python批量识别图片中的文字并自动改名
2021-03-20 14:20:24说明:最近学校要求班委收集每个同学青年大学习的学习完成截图,并核实学习情况,故此次想开发一套自动识别图片中的文字,并对其进行改名的程序,从而将人力解放出来去干些更有意义的事情。 任务目标 1.自动识别图像... -
批量文字识别_Python图片识别_批量_文字识别api_文字识别_
2021-10-02 12:21:38利用百度api 批量识别图片中的文字 并将执行结果生成word文件 -
批量识别图中文字自动命名,让你1秒找到骚图
2020-12-24 01:03:58自从上次批量的保存了半佛老师的各种骚图之后:我用Python一键保存了半佛老师所有的骚气表情包,每次做视频,找图就相当的...所以我得找到能够识别图片中文字的方法。基础的方法的话,那就需要安装图像处理相关的库... -
身份证批量识别 OCR身份证识别
2021-06-03 12:39:48身份证批量识别 免费 身份证OCR 使用的是腾讯的识别引擎 百度盘链接:https://pan.baidu.com/s/1uTnkYXh8jBcaeda-JoQDuQ 提取码:jbkv -
Umi-OCR 批量图片转文字 OCR批量文字识别软件
2022-05-06 14:12:41Umi-OCR批量图片转文字是一款小巧易用的OCR批量文字识别软件。该软件界面美观,支持用户在没有网络的时候使用,帮助用户识别图 -
单张、批量识别图片中文字(写入txt文件、窗口视图创建、打包.exe文件)(百度文字识别SDK+Python的GUI之...
2020-12-21 18:24:20昨天我姐问我有没有软件可以批量识别图片上的文字,她在帮客户做资料整理,但是用的方法只能一张一张上传识别,不仅效率低还浪费时间。 我就找了找批量识别的软件,下载下来觉得:嗯?不错,界面也挺好,小东西做... -
用python调用百度ocr批量识别图片上的文字
2020-06-17 18:09:39用python调用百度ocr批量识别图片上的文字,需要先注册获得相应的APP_ID、API_KEY、SECRET_KEY import glob from os import path import os from aip import AipOcr from PIL import Image def baiduOCR(outfile): ... -
文字识别软件哪个好?批量识别图片文字用清描就够了
2021-07-26 16:29:35其实,随着科技的不断发展,OCR识别技术已经广泛应用于各大领域,当我们需要录入图片文字内容、保存电子档、扫描证件、发票时,只需要通过文字识别软件简单一扫,就可以轻松的将图片内容整理成文本,并且保持原有... -
批量OCR识别图片中的文字
2022-03-21 21:41:22双击第一个窗口,导入需要批量识别的图片,再点击开始即可批量识别图片中的文字, 并根据实际需要,提取特定的文字内容。 本次应用场景是提取身份证号码,用于跟数据库中的做比对。 实际上,这个软件一般只会用于... -
OCR离线批量图片文字识别 Umi-OCR 1.1(基于百度PaddleOCR).exe
2022-03-31 19:35:07本软件用于批量导入本地图片,识别图片中的文本,输出到软件面板或本地txt文件。 除了能批量识别普通图片,本软件还有忽略指定区域的特殊功能。 类似含水印的视频截图、含有UI/按钮的游戏截图等,往往只需要提取...