精华内容
下载资源
问答
  • 识别图片中的文字

    2017-11-02 16:32:33
    tesseract-ocr 4.00可以识别图片(.png文件)中的 文字 Windows环境安装tesseract-ocr 4.00并配置环境变量http://www.cnblogs.com/jianqingwang/p/6978724.htmlTesseract-OCR识别中文与训练字库实例...

    tesseract-ocr 4.00可以识别图片(.png文件)中的 文字
    Windows环境安装tesseract-ocr 4.00并配置环境变量

    http://www.cnblogs.com/jianqingwang/p/6978724.html

    Tesseract-OCR识别中文与训练字库实例

    http://www.cnblogs.com/wzben/p/5930538.html
    展开全文
  • Python读取电脑指定目录文件夹下的所有图片,并且调用百度图片转文字api提取出图片中的手机号保存到记事本 """ 2020年6月6日 Niu """ import os import json from aip import AipOcr import re """ 你的 APPID ...

     Python读取电脑指定目录文件夹下的所有图片,并且调用百度图片转文字api提取出图片中的手机号保存到记事本

    """ 2020年6月6日    Niu """
    
    import os
    import json
    from aip import AipOcr
    import re
    
    """ 你的 APPID AK SK """
    APP_ID = ''
    API_KEY = ''
    SECRET_KEY = ''
    
    def get_file_content(filePath):
        with open(filePath, 'rb') as fp:
            content = fp.read()
            fp.close()
            return content
    
    # 把文本保存到记事本
    def saveCon(con, root):
        # with open(root, mode='w') as f:
        with open(root, mode='a') as f:
            f.write(con)
            f.close()
    
    # 图片路径
    def BaiDuApi(filePath):
        con = []
        try:
            client = AipOcr(APP_ID, API_KEY, SECRET_KEY)
            image = get_file_content(filePath)
            """ 如果有可选参数 """
            options = {}
            options["recognize_granularity"] = "big"  # 是否定位单字符位置,big:不定位单字符位置,默认值;small:定位单字符位置
            options["vertexes_location"] = "false"  # 是否返回文字外接多边形顶点位置,不支持单字位置。默认为false
            options["probability"] = "false"  # 是否返回识别结果中每一行的置信度
            """ 带参数调用通用文字识别(含位置信息版), 图片参数为本地图片 """
            # content = client.general(image, options)
            #  通用文字识别
            content = client.basicGeneral(image, options)
            jcon = json.dumps(content, ensure_ascii=False, sort_keys=True, indent=4, separators=(',', ': '))
            jcontent = json.loads(jcon)
            print(jcontent)
            for i in jcontent['words_result']:
                con.append(json.loads(json.dumps(i))['words'])
        except:
            print("错误")
        return con
    
    # 处理字符串
    def strpd(str):
        try:
            pattern = re.compile(r'(13\d{9}|14[5|7]\d{8}|15\d{9}|166{\d{8}|17[3|6|7]{\d{8}|18\d{9})')
            index = 0
            matchResult = pattern.search(str, index)  # 从指定位置开始匹配
            # print(matchResult.group(0))
            str = matchResult.group(0) + "\n"
        except:
            print("错误")
            str = ""
    
        return str
    
    def PictureToText(file_path):  # 图片转文字和公式 path图片地址
        str = ""
        con = BaiDuApi(file_path)
        # print(con)
        if con == []:
            return file_path + "\n"
        for co in con:
            str = str + co + ","
        # 提取手机号
        str = strpd(str)
        print("手机号:"+str)
        if str == "":
            str = file_path + "\n"
        # print("图已转文字")
        return str
    
    # file_path 要遍历的文件夹路径
    # phones    提取的手机号
    def List_file_path(file_path):
        phones = ""
        print("文件夹路径:"+file_path)
        path = file_path + ".txt"
        for root,dirs,files in os.walk(file_path):
            for file in files:
                #获取文件路径
                print(os.path.join(root,file))
                saveCon(PictureToText(os.path.join(root,file)), path)  # str 文本内容,path记事本位置,保存到记事本
                # phones = phones + PictureToText(os.path.join(root,file))
        # print(phones)
        # pathfile = file_path.split('.')[0:-1][0]
    
        # saveCon(phones, path)  # str 文本内容,path记事本位置,保存到记事本
        os.system("start explorer %s" % path)  # 打开这个文件
        return path
    
    if __name__ == '__main__':
        # 文件夹路径
        file_path = "F:\";
        path = List_file_path(file_path)
        print("文本地址:" + path)
        a = input("结束!")
    

     

    展开全文
  • 使用tesseract来识别图片中的文字 windows安装 地址:https://digi.bib.uni-mannheim.de/tesseract/ 下载exe文件后,点击运行。 如果是64位系统。安装目录最好如下所示: 安装好后,使用管理员权限打开cmd,执行 ...

    使用tesseract来识别图片中的文字

    windows安装

    地址:https://digi.bib.uni-mannheim.de/tesseract/

    下载exe文件后,点击运行。

    如果是64位系统。安装目录最好如下所示:

    在这里插入图片描述

    安装好后,使用管理员权限打开cmd,执行

    SET TESSDATA_PREFIX=C:\Program Files\Tesseract-OCR
    

    并把 C:\Program Files\Tesseract-OCR加入PATH环境变量。

    安装以下第三方库:

    pip install pytesseract
    pip install pillow
    
    

    如果想提取中文字符,需要下载中文包,地址:

    https://github.com/tesseract-ocr/tessdata

    下载chi_sim.traineddata就可以了,然后把下载的文件放到

    目录C:\Program Files\Tesseract-OCR\tessdata

    代码:

    import pytesseract
    from PIL import Image
    
    # 打开一张图片
    image = Image.open(r'image\望岳.png')
    pytesseract.pytesseract.tesseract_cmd = r'C:\Program Files\Tesseract-OCR\tesseract.exe'
    tessdata_dir_config = r'--tessdata-dir "C:\Program Files\Tesseract-OCR\tessdata"'
    code = pytesseract.image_to_string(image, lang='chi_sim', config=tessdata_dir_config)
    print(code)
    

    在这里插入图片描述

    linux(ubuntu)安装

    1.安装软件源

    sudo add-apt-repository ppa:alex-p/tesseract-ocr
    

    可能会遇到一个问题:

    Fix ‘add-apt-repository command not found’ Error on Ubuntu and Debian //想新添加一个ppa的库,但是没有这个命令存在
    

    执行下面的命令在重新来一遍就可以啦

    执行这个命令

    sudo apt-get install software-properties-common
    

    2.更新软件

    sudo apt update
    

    3.下载tesseract 4.0

    sudo apt install tesseract-ocr
    

    4.测试安装,测试安装是否成功:

     tesseract --version 
    

    出现4.00或以上就可以了

    5.测试

    tesseract 望岳.png result -l chi_sim
    

    是要识别的图片, result是识别后的文字存放的txt, -l 是选项 用那个语言,eng是英语语言.chi_sim是中文, 需要下字体库

    6.字体库下载
    https://github.com/tesseract-ocr/tessdata

    7.字体库放在哪

    字体库要放在 tessdata文件夹里面:

    /usr/share/tesseract-ocr/4.00/tessdata/
    

    8.也可以通过Python代码来获取文字:

    先安装第三方库:

    sudo apt-get install python-dev python-setuptools
    sudo apt-get install libjpeg8 libjpeg62-dev libfreetype6 libfreetype6-dev
    sudo pip install pillow
    pip3 install pytesseract
    
    
    import pytesseract
    from PIL import Image
    
    image = Image.open('imags/望岳.png')
    
    code = pytesseract.image_to_string(image, lang='chi_sim')
    print(code)
    

    效果:
    在这里插入图片描述

    后记

    【后记】为了让大家能够轻松学编程,我创建了一个公众号【轻松学编程】,里面有让你快速学会编程的文章,当然也有一些干货提高你的编程水平,也有一些编程项目适合做一些课程设计等课题。

    也可加我微信【1257309054】,拉你进群,大家一起交流学习。
    如果文章对您有帮助,请我喝杯咖啡吧!

    公众号

    公众号

    关注我,我们一起成长~~

    展开全文
  • python识别图片中的文字处理方法

    千次阅读 2017-12-15 14:59:54
    一、准备工作与代码实例 1、python2.7,PIL、pytesser ...下载后是一个exe,直接双击安装,它会自动安装到C:\Python27\Lib\site-packages去, (2)pytesser:下载地址:http://code.google.com/p/

    一、准备工作与代码实例

    1、python2.7,PIL、pytesser

    (1)安装PIL:下载地址:http://www.pythonware.com/products/pil/

    下载后是一个exe,直接双击安装,它会自动安装到C:\Python27\Lib\site-packages中去,

    (2)pytesser:下载地址:http://code.google.com/p/pytesser/,(CSDN下载

    下载解压后直接放C:\Python27\Lib\site-packages(根据你安装的Python路径而不同),同时,新建一个pytesser.pth,内容就写pytesser,注意这里的内容一定要和pytesser这个文件夹同名,意思就是pytesser文件夹,pytesser.pth,及内容都要一样!



    (3)将 'C:\Python27\Lib\site-packages\pytesser\pytesser.py' 里面的 tesseract_exe_name='tesseract' 里面是相对路径,改成绝对路径就好了:tesseract_exe_name='F:\\Python\\Lib\\site-packages\\pytesser\\tesseract', 将 import Image 改为 from PIL import Image

    (4):

    然后当安装好后运行:

    from PIL import Image
    from pytesser import * 
    
    
    image = Image.open('captcha3.png') 
    print image_to_string(image)


    问题一、WindowsError: [Error 2] 

    问题详细提示,如下:


    产生原因: 调用tesseract.exe失败

    解决:把tesseract.exe加入当前工程,如图:



    说明:这个tesseract.exe就相当于在linux下的 tesseract-orc


    问题二、IOError: [Errno 2] No such file or directory: 'tesseract.log'

    问题详细提示,如下:


    产生原因: 不是因为缺少tesseract.log而是因为缺少tessdata文件夹

    解决:把tessdata文件夹从pytesser文件夹下拷贝到工程下,如图:



    如果仍旧出现问题二,则试试换个tesseract.exe试试。



    
    

    展开全文
  • 图片中有一个乱码,是这个原因吗?</p> <p>Traceback (most recent call last): File "E:/PycharmProjects/mhxy/main.py", line 9, in ocr = CnOcr() File "C:\Users\63110\AppData...
  • /// pdf 转图片 /// </summary> public static void Turnpicture() { string str = "C:\\Users\\Administrator\\Desktop\\802302424201915622.pdf"; //实例化PdfDocument类,并加载测试文档 ...
  • 思路非常简单:<p>创建window,设置窗口大小,创建label1,导入图片,创建label2,导入文字,show,结束!</p> import sys from PyQt5 import QtWidgets,QtGui #定义窗口函数window def window(): #我事实上不太...
  • https://blog.csdn.net/weixin_41988628/article/details/80653245?utm_source=blogxgwz0 转载于:https://www.cnblogs.com/eustoma/p/9826661.html
  • HTML怎样在图片的右边显示文字

    万次阅读 2018-04-24 01:50:10
    html xmlns="http://www.w3.org/1999/xhtml"> head> meta http-equiv="Content-Type" content="text/html; charset=utf-8" /> title>无标题文档title> ...ul,p{margin:0;padding:0;} li{list-style
  • 无需下载软件,你就可以在线提取PDF中图片文字,http://www.extractpdf.com/不仅可以获取本地PDF文档的图片文字,还能获取远程PDF文档的图片文字。如下图所示:结果本人测试,该工具非常好用,能够轻松提取pdf...
  • Qt5环境,使用QPixmap展示一些图片,要求在展示的图片上添加一些文字。 因为图片最终是用来制作动画效果,所以需要将文字写入到图片QPixmap,在进行动画处理。 直接上代码: QString name = QString("/wlcm/...
  • html中,在图片文字对齐的时候,一直没有达到想要的对齐效果,发现使用position中的相对定位+绝对定位+padding+margin可以达到需要的效果。 转载于:https://www.cnblogs.com/TheoryDance/p/5424456.html...
  • 图片上添加中文字

    2021-03-06 16:18:19
    import cv2 from PIL import ImageFont, ImageDraw, Image import numpy as np bk_img = cv2.imread(“0.jpg”) #设置需要显示字体 fontpath = “font/simsun.ttc” ...draw = ImageDraw.Draw(img_p
  • http://code.google.com/p/tesseract-ocr/downloads/list?can=2&q= 使用说明 http://www.cnblogs.com/brooks-dotnet/archive/2010/10/05/1844203.html 转载于:...
  • 方法: 1、通过添加css属性 vertical-align:middle; 2、把文字图片分别放入不同div,就...2.图片文字不在一行情况下(如文字p/label标签包裹),将他们分别放入不同div。 处理方式一:在左边div设置cs
  • 首先创建一个父div,即图片文字这两个子div父节点,我们可以看到上方div内部是段落文字,下方是图片。 <div> <div> <p class="content"> The top six countries by internet u
  • Android TextView显示图片的4种方式 转载于:https://www.cnblogs.com/qlky/p/7282658.html
  • 根据现成开源项目 http://code.google.com/p/pytesser/改写 在window上用easy_install...添加支持网络图片的直接解析   #coding:utf-8 #import sys #reload(sys) #sys.setdefaultencoding('utf-8'...
  • 经过探索,将Visio保存为pdf格式是最完美解决方式,因为pdf文件保存...如果包含Visio多余信息,就会在一些低版本Latex编译环境下出现文字显示空白情况。 转载于:https://www.cnblogs.com/lidyan/p/6529626.html...
  • 如果添加p标签加入就会打破所有样式体验,文字的p都要有两个汉字缩进,但图片并不希望缩进,所以去掉图片的p标签是最好办法。可以通过下面代码解决。 //去掉wordpress正文图片的p标签 function img_unautop($...
  • 复制网页中的文字

    2020-07-14 18:30:55
    作为一名不合格的前端工程师,我最近才发现不是网页中的所有字体都可以使用鼠标选中复制的,只有像P标签、pre标签、标题等标签包含的文字才可以直接在网页中进行复制。如div标签、a标签等包含的文字都无法直接复制。...
  • <p style="text-align:center"><img alt="" height="1404" src="https://img-ask.csdnimg.cn/upload/1607783070170.jpg" width="1125" /></p> <p> </p>
  • 具体步骤如下: 1、选择“修补工具”;...4、一块一块地圈选图片的文字,拖动到与选择的文字块背景图相似的没文字图块处,松开鼠标。 转载于:https://www.cnblogs.com/yuohoo/p/4278933.html...
  • 1、使用仿制图章工具去除文字。  这是比较常用方法。具体操作是,选取仿制图章工具,按住Alt键,在无文字区域点击相似色彩或图案采样,然后在文字区域拖动鼠标复制以复盖文字。... 如果图片的背景色
  • Python图片文字提取

    千次阅读 2019-08-11 11:50:01
    图片信息现在越来越广泛的存在于我们的日常生活中,获取图片的文字信息也渐渐的成为当今生活中的需求,在学习完Python的基础知识后,本小白以此语言为工具,使用百度提供的图像识别接口来实现简单的图片文字提取...
  • 转自知乎:https://zhuanlan.zhihu.com/p/54156009 ...拷贝结果(Ctrl+C),只需要几秒钟,就可以快速识别并得到图片中的文字,体验行云流水、指哪打哪的感觉,这就是识文精灵(OcrWiz)给大家带来的体验,希望能给大...
  • 运行环境: python3.9 | Pycharm """ 前提环境: 1、安装Pillow包:pip install Pillow (安装py包两种方法[pip命令行与...2、用python简单处理图片:https://www.cnblogs.com/denny402/p/5096001.html """..
  • 今天意外的看到一个可以提取图片中文字的网站,自己试了下,提取效果还不错网址为:https://zhcn.109876543210.com/现在有图片如下我想从中提取的文字1.打开网址,上传图片2.选择语言与输出格式3.开始转换4.转换结果...

空空如也

空空如也

1 2 3 4 5 ... 20
收藏数 867
精华内容 346
关键字:

p图片中的文字