精华内容
下载资源
问答
  • 主要介绍了Python3使用腾讯云文字识别(腾讯OCR)提取图片中的文字内容方法详解,需要的朋友可以参考下
  • 两行代码搞定python OCR图像文字识别

    千次阅读 2019-03-22 14:39:32
    目前OCR主要依赖几个低层库,本博客采用Tesseract,Tesseract是由Google维护的开源OCR。本博客在windows环境进行,linux环境同理。 1、安装Tesseract: windows下Tesseract的安装比较简单,下载exe然后一直next...

    目前OCR主要依赖几个低层库,本博客采用Tesseract,Tesseract是由Google维护的开源OCR。本博客在windows环境进行,linux环境同理。

    1、安装Tesseract:

    windows下Tesseract的安装比较简单,下载exe然后一直next下去就行了。但是由于要做中文的识别,所以一定在安装的时候要勾选相应的中文库,这个安装时是默认不下载的。

    2、安装pytesseract

    pytesseract是对tesseract做的一层Python API封装。

    pip3 install pytesseract

    3、编写py代码:

    import pytesseract
    from PIL import Image
    
    pytesseract.pytesseract.tesseract_cmd = 'D://ocr/Tesseract-OCR/tesseract.exe'
    text = pytesseract.image_to_string(Image.open('D://ocr/qximg/test1.png'),lang='chi_sim')

    首先导入相应的库。第一行代码从正确的位置引入tesseract运行文件。第二行代码选择要识别的图片,设置简体中文识别。text即为图片中中文的内容。

    展开全文
  • 主要介绍了Python基于百度AI实现OCR文字识别,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友可以参考下
  • 基于windows平台的简单实用的中文OCR识别代码,基于python实现。内附安装包。教程参考:https://mp.csdn.net/postedit/82892805
  • ocr文字识别源码.zip

    2019-07-10 13:07:20
    ocr文字识别源码是一个基于安卓的ocr(文字识别)的例子源码。与传统的在安卓手机上直接拍照识别不同,本项目的实现思路是先由客户端拍照,然后画出照片的指定区域上传到服务端,服务端调用文字识别引擎进行识别然后把...
  • 大家可能听说过使用Python进行OCR识别操作。在Python中,最出名的库便是Google所资助的tesseract。利用tesseract可以很轻松地对图像进行识别。现在问题来了,如果想对一个PDF文档进行OCR识别,该怎么做呢?下面一...
  • 阿里云OCR一、通用文字识别1、开通2、PY3代码3、测试结果二、自定义模板识别1、开通2、进行自定义模板3、代码三、最后 一、通用文字识别 1、开通 开通链接:...

    一、通用文字识别

    1、开通

    开通链接:https://market.aliyun.com/products/57124001/cmapi028554.html?spm=5176.2020520132.101.3.33a17218E04n4g#sku=yuncode2255400000
    图1
    开通完转到工作台(管理页面)
    在这里插入图片描述
    请注意图中的AppCode,在代码中需要用到。
    点击图中的接口,(还是进入刚才购买开通的页面),注意一下我们的调用地址,等下也要在代码中用到。我们是用post的方式调用,返回的是json(虽然代码可以不需要了解)
    在这里插入图片描述

    2、PY3代码

    # -*- coding: utf-8 -*-
    #python3
    import urllib.request
    import urllib.parse
    import json
    import time
    import base64
    
    # 本地图片
    image_path = '改成自己图片存放的地方,如C:\\Users\\...\\xxx.jpg'
    
    with open(image_path, 'rb') as f:  # 以二进制读取本地图片
        data = f.read()
        encodestr = str(base64.b64encode(data), 'utf-8') # base64编码图片
    
    # 请求头
    headers = {
             'Authorization': 'APPCODE 9c*******************5e',  # APPCODE +你的appcode,一定要有空格!
             'Content-Type': 'application/json; charset=UTF-8'         # 根据接口的格式来
        }
    
    def posturl(url, data={}):
        try:
            params=json.dumps(data).encode(encoding='UTF8')
            req = urllib.request.Request(url, params, headers)
            r = urllib.request.urlopen(req)
            html =r.read()
            r.close()
            return html.decode("utf8")
        except urllib.error.HTTPError as e:
            print(e.code)
            print(e.read().decode("utf8"))
        time.sleep(1)
    
    if __name__=="__main__":
        url_request="https://ocrapi-advanced.taobao.com/ocrservice/advanced"   # 就是上述的调用地址
        dict = {'img': encodestr}
        html = posturl(url_request, data=dict)
    
        print(html, type(html))  #<class 'str'>
        jos = json.loads(html)    # str转json对象,<class 'dict'>
        print(jos, type(jos))
        result = jos['content']  # 可以按key取值了
        print('识别的结果:', result)
    

    3、测试结果

    在这里插入图片描述
    随便找了一张好久前的电脑截图,在python中运行结果还行:

    识别的结果: 
    default默认值 中国大学MOO C switch-case if ( type==1) printf("你好") ; else if(type==2) switch( type ){ printf("早上好") ; case 1: printf("你好") ; else if(type==3) break; printf("晚上好") ; case 2: else if(type== 4 ) printf("早上好") ; printf("再见") ; break; else case 3: printf("啊, 什么啊?") ; printf("晚上好") ; break; case 4: printf("再见") ; break; default: printf("啊, 什么啊?") ;
    

    这样看容易点:
    在这里插入图片描述

    但是对于手写的话,识别率就很低hh

    二、自定义模板识别

    个人认为自定义模板识别,有点像前两天刚学的爬虫中正则表达式re.compile一下,然后再re.findall一下,把正则表达式中我们想要获取的内容给截取出来(只关注我们需要的部分)
    官方自定义模板识别开始页

    1、开通

    首先也是服务的开通
    开通页面
    在这里插入图片描述
    也是差不多的
    在这里插入图片描述
    也是注意AppCode
    在这里插入图片描述

    2、进行自定义模板

    自定义模板地址

    官方文档对这方面介绍还挺详细的:
    自定义模板官方使用文档

    在这里插入图片描述
    这里以血压计基本参数为例
    在这里插入图片描述
    在这里插入图片描述
    完成后点击发布,注意提示中的模板ID,在代码中需要用到。
    在这里插入图片描述

    3、代码

    官方只提供了py2!大无语事件,我还得自己改一下…

    # -*- coding: utf-8 -*-
    """
    -------------------------------------------------------------------------------
        Project : OCR
        File Name : 自定义ocr
        Description : 阿里云自定义OCR python3代码
        Author : lrh
        Data : 2021-07-17
    -------------------------------------------------------------------------------
    """
    import urllib.request
    import urllib.parse
    import json
    import time
    import base64
    
    # 本地图片
    image_path = 'C:\\Users\\lrh\\Pictures\\Screenshots\\test.png'
    
    with open(image_path, 'rb') as f:  # 以二进制读取本地图片
        data = f.read()
        encodestr = str(base64.b64encode(data), 'utf-8') # base64编码图片
    
    bodys = {
       "image": encodestr,
       "configure": {"template_list": [
                    "daec2576-6148-4142-8e42-5c0a78e4d0fa1626528669" # 自定义模板ID
                    ]
                }
    }
    
    # 请求头
    headers = {
             'Authorization': 'APPCODE 9c68cf90de3941b1b4364bd713c0725e',  # APPCODE +你的appcod,一定要有空格!
             'Content-Type': 'application/json; charset=UTF-8'         # 根据接口的格式来
        }
    
    def posturl(url, data={}):
        try:
            params=json.dumps(data).encode(encoding='UTF8')
            req = urllib.request.Request(url, params, headers)
            r = urllib.request.urlopen(req)
            html =r.read()
            r.close()
            return html.decode("utf8")
        except urllib.error.HTTPError as e:
            print(e.code)
            print(e.read().decode("utf8"))
        time.sleep(1)
    
    if __name__=="__main__":
        url_request="https://ocrdiy.market.alicloudapi.com/api/predict/ocr_sdt"   # 对照官网API改
        dict = bodys
        html = posturl(url_request, data=dict)
    
        # print(html, type(html))  #<class 'str'>
        jos = json.loads(html)    # str转json对象,<class 'dict'>
        print(jos, type(jos))
        # result = jos['content']  # 就可以按key取值了
        # print('识别的结果:', result)
    

    我的测试图片:
    在这里插入图片描述

    打印结果如下:

    {'config_str': '{"template_list":["daec2576-6148-4142-8e42-5c0a78e4d0fa1626528669"]}', 'items': {'低压': '8933', '脉搏': '863d', '高压': '1392'}, 'request_id': '20210717223035_67d3799215782d18b052beefd92ea139', 'success': True, 'template_id': 'daec2576-6148-4142-8e42-5c0a78e4d0fa1626528669'} <class 'dict'>
    

    划重点就是:
    在这里插入图片描述
    如果使用含有其他内容的图片,如下。自定义OCR识别还是只会识别上面我们想要的内容(就像上面说的只关注我的自己画出来的重点)
    在这里插入图片描述

    其实还可以对输出进行筛选,例如这个血压计就只拿中间的数字,然后对数字进行整理保存,然后又可以把数据上传到阿里云,然后又可以可视化了。不难,有手就行,这个后续在搞。

    三、最后

    另外,怎么看到有一个官方文档又另外有一个自定义OCR的方法。链接在此

    我看不懂这个是干嘛的,虽然我也照着搞了,但是不知道是要用在哪的…也贴出来一下吧
    在这里插入图片描述
    点击测试模板也是一直error,不解

    最后,官网的一些资料:
    官方参考文档1
    通用文字识别官方调试页面

    展开全文
  • 从零开始OCR字符识别 出发目的: 期末快到了,各种各样的水课都布置了写文章写报告的作业,这对于我来说简直就是噩梦,上网参考文章想要引用但是又受限于图片格式和复制限制,所以我就想着使用ocr... 通用文字识别 应...

    从零开始OCR字符识别

    出发目的:

    期末快到了,各种各样的水课都布置了写文章写报告的作业,这对于我来说简直就是噩梦,上网参考文章想要引用但是又受限于图片格式和复制限制,所以我就想着使用ocr识别。

    本文就来讲讲如何使用python和ocr将图片转化为文本。

    本文参考wzgg的一篇博客,欢迎看wzgg博客

    当然也欢迎来我自己搭建的博客玩

    调用百度的OCR接口进行字符之别

    注册账号点击跳转并创建 图像识别 > 通用文字识别 应用。
    在这里插入图片描述
    在这里插入图片描述

    下载

    pip3 install baidu-aip
    

    pip和pip3没有本质区别,只是为了区别python2和python3.

    在这里插入图片描述

    解释器from aip import AipOcr,没有报错就可以了(这里wzgg的博客里有点问题)

    在这里插入图片描述

    因为暂时还没有系统学过python 这里就直接在wzgg的代码基础上进行修改了 也算是一种学习吧

    from aip import AipOcr
    import sys,os
    from urllib.request import  urlopen
    
    APP_ID = '输入你的'
    API_KEY = '输入你的'
    SECRET_KEY = '输入你的'
    
    client = AipOcr(APP_ID, API_KEY, SECRET_KEY)
    length = len(sys.argv)
    
    
    """ 读取图片 """
    def get_file_content(filePath):
    
        with open(filePath, 'rb') as fp:
            return fp.read()
    
    """ 调用通用文字识别, 图片为本地图片 """
    filename = input()
    if not os.path.exists(filename):
        print('Target couldn\'t be accessed')
        exit(1)
    #print(filename)
    image = get_file_content(filename)
    res=client.general(image)
    
    
    for item in res['words_result']:
        print(item['words'])
    

    我实现的是本地的ocr识别只需要在运行时输入图片地址即可。

    下面给出我的成功示例。

    在这里插入图片描述
    在这里插入图片描述

    展开全文
  • 百度AI提供了一天50000次的免费文字识别额度,可以愉快的免费使用!下面直接上方法: 首先在百度AI创建一个应用,按照下图创建即可,创建后会获得如下: 创建后会获得如下信息: APP_ID = '******' API_KEY = '**...
  • 本项目基于进行接口封装 环境 pytorch python3 运行 python app.py 访问 说明 调用ocr.result()可进行文本预测 若pse.pyd报错则需要参考配置文章 配置 参考
  • [python3.6] 运用tf实现自然场景文字检测,keras/pytorch实现ctpn crnn ctc实现不定长场景文字OCR识别
  • 创建应用二、安装接口模型三、编写python代码四、识别结果 版权声明 本文原创作者:jyd0124 本文原创博客地址:https://blog.csdn.net/jyd0124/article/details/105868562 一、接入指南 若想利用百度AI开放平台...
  • Python构建快速高效的中文文字识别OCR

    万次阅读 多人点赞 2020-03-20 15:55:17
    Windows操作系统,使用开源项目chineseocr_lite,超详细到每一步编译过程,OCR识别效果非常好

    感谢李奥诃弗斯基的悉心教导完成编译部分工作,万分感谢!





    本文使用开源项目chineseocr_lite,已上传百度网盘(2020/3/16),提取码:oade

    以下适合Windows系统,需要使用VS进行简单编译,若用Linux系统可直接参考原项目,应该更简单。

    在这里插入图片描述

    在这里插入图片描述




    安装

    1. PyTorch

    进入PyTorch官网,选择合适自己的版本。

    如笔者使用pip且仅CPU环境,执行命令安装:pip install torch==1.4.0+cpu torchvision==0.5.0+cpu -f https://download.pytorch.org/whl/torch_stable.html
    在这里插入图片描述

    2. Python库

    pip install web.py==0.40.dev0
    

    3. VS2015及以上

    必须装上VC++模块,用于后面编译。




    编译PSENET

    本人编译好的pse.pyd已上传CSDN,在Win7和Win10的Python3.6版本下测试通过,需要的亲自取。

    这步是重头戏

    1.打开VS2015→新建项目→Visual C++→项目命名为pse
    在这里插入图片描述
    2.勾上空项目
    在这里插入图片描述
    3.配置属性(常规):右键项目pse→属性→配置Release→平台x64→目标文件扩展名.pyd→配置类型动态库(.dll)
    在这里插入图片描述
    4.配置属性(VC++目录):包含目录添加C:\chineseocr_lite-master\psenet\pse\include(项目文件)和C:\Users\Administrator\AppData\Local\Programs\Python\Python36\include(你的Python),库目录添加C:\Users\Administrator\AppData\Local\Programs\Python\Python36\libs(注意,是libs不是Lib)
    在这里插入图片描述
    5.附加依赖项:添加python3.lib;python36.lib;
    在这里插入图片描述
    4.配置管理器→活动解决方案配置Release→活动解决方案平台x64
    在这里插入图片描述
    5.把项目\psenet\pse\pse.cpp复制到源文件里→右键项目pse→重新生成
    在这里插入图片描述
    6.在VS项目pse\x64\Release就编译好了我们要的库文件pse.pyd
    在这里插入图片描述
    7.将pse.pyd复制到与项目\psenet\pse\pse.cpp同一文件夹下




    运行app.py

    访问http://127.0.0.1:8080/ocr


    1.报错RuntimeError: Cannot compile pse: C:\chineseocr_lite-master\psenet\pse
    注释掉psenet\pse\__init__.py的两行代码
    在这里插入图片描述
    2.报错UnicodeDecodeError: ‘gbk’ codec can’t decode byte 0xab in position 551: illegal multibyte sequence
    点进报错所在代码,添加编码, encoding='UTF-8'
    在这里插入图片描述
    3.报错UnicodeDecodeError: ‘gbk’ codec can’t decode byte 0xa7 in position 982: illegal multibyte sequence
    同上,添加编码, encoding='UTF-8'
    在这里插入图片描述

    封装接口

    原项目使用和未使用的文件较多,本人封装好了接口
    GitHub自取:vba34520/chineseocr_lite: Python构建快速高效的中文文字识别OCR

    调用ocr.result()即可进行文本预测

    在这里插入图片描述




    GPU版本

    1. 安装CUDA+cuDNN
    2. GPU版本PyTorch
    3. 执行命令nvidia-smi查看GPU的ID
    4. 修改config.py的GPU_ID




    参考文献

    1. ouyanghuiyu/chineseocr_lite: 超轻量级中文ocr,支持竖排文字识别, 支持ncnn推理 , psenet(8.5M) + crnn(6.3M) + anglenet(1.5M) 总模型仅17M
    2. pybind/pybind11: Seamless operability between C++11 and Python
    3. 根据显卡型号选择CUDA和cuDNN进行TensorFlow GPU版本安装
    4. python如何编译py文件生成pyc、pyo、pyd以及如何和C语言结合使用
    展开全文
  • Python提取图片中的文字,用到的工具包有PIL,pytesseract,tesseract-ocr 注意: 库的安装相对麻烦一点,一般都是不能直接安装成功的,这里总结了安装过程中的一些坑给大家参考。 (1)首先是PIL库安装,有的电脑...
  • Python调用百度OCR实现图片文字识别

    千次阅读 2020-07-15 16:43:30
    百度AI提供了一天50000次的免费文字识别额度,可以愉快的免费使用!下面直接上方法: 首先在百度AI创建一个应用,按照下图创建即可,创建后会获得如下: 创建后会获得如下信息: APP_ID = '******' API_KEY ...
  • ocr文字识别源码

    2021-03-16 16:20:23
    ocr文字识别源码是一个基于安卓的ocr(文字识别)的例子源码。与传统的在安卓手机上直接拍照识别不同,本项目的实现思路是先由客户端拍照,然后画出照片的指定区域上传到服务端,服务端调用文字识别引擎进行识别然后把...
  • 最近研究OCR技术实现较多,各种OCR实现方式做了一些测试和对比,针对不同的业务需要采用不同的实现方式,今天写的这个案例是利用百度AI来实现的通用OCR文字识别。实现方式非常简单,十几行代码就能搞定,但识别率...
  • 主要介绍了使用Python进行OCR识别图片中的文字 ,本文通过实例代码文字说明的形式给大家介绍的非常详细,具有一定的参考借鉴价值,需要的朋友可以参考下
  • python实现OCR识别

    千次阅读 2020-07-27 17:48:41
    OCR英文全称是Optical Character Recognition,中文叫做光学字符识别。它是利用光学技术和计算机技术把印在或写在纸上的文字读取出来,并转换成一种计算机能够接受、人又可以理解的格式。 下面调用百度API进行识别:...
  • 进入百度识图网站百度识图 记住这两个Key 将要处理的图片转码 import base64 f=open("填写你的图片完整...类似于python的字典,可以直接通过key来获取value access_token=(response.json()['access_token']) host = f'...
  • OCR识别-python版(一)

    千次阅读 2020-11-25 23:22:24
    需求:识别图片中的文字信息环境:windows系统开发语言:python使用工具类:1.pyocr2.PIL3.tesseract-ocr步骤:1.pyocr网络通直接使用命令:pip install pyocr网络不通,转至...下载安装2.安装pil网络通直接使用命令:...
  • 我的想法是用python编程的方式调用 百度ocr_文字识别 ,上传一幅图片,识别图片上的文字 整个过程不难,这里将一些关键点记录下来。 第一步 注册或登陆百度云账号,创建百度应用 进入“百度云”的控制台,如下...
  • python使用pyautogui截图并进行文字识别.py
  • 一、你心目中的OCR 在你心目中,OCR是多大(…, 厉害,好厉害,非常厉害,…)呢?...看了下OCR文字识别的API接口,有道提供了多种OCR识别的不同接口,有手写体、印刷体、表格、整题识别、购物小票识别、身份.
  • Python图像处理之图片文字识别OCR

    万次阅读 多人点赞 2018-06-09 08:15:15
      将图片翻译成文字一般被称为光学文字识别(Optical Character Recognition,OCR)。可以实现OCR 的底层库并不多,目前很多库都是使用共同的几个底层OCR 库,或者是在上面进行定制。   Tesseract 是一个OCR 库...
  • 【python ocr】简单的ocr识别python包cnocr

    千次阅读 热门讨论 2019-07-03 11:04:01
    cnocr是用来做中文OCRPython 3 包。cnocr自带了训练好的识别模型,所以安装后即可直接使用。目前使用的识别模型是 crnn ,识别准确度约为 98.7% 。 1、安装: pip install cnocr 2、主函数模块: # -*- ...
  • 所以说,OCR作用是对文本资料的图像文件进行分析识别处理,获取文字及版面信息。OCR的全称叫作“Optical Character Recognition”,即光学字符识别。这算是生活里最常见、最有用的AI应用技术之一。 细心观察便可发现...

空空如也

空空如也

1 2 3 4 5 ... 20
收藏数 5,236
精华内容 2,094
关键字:

ocr文字识别python代码

python 订阅