精华内容
下载资源
问答
  • 说明:最近学校要求班委收集每个同学青年大学习的学习完成截图,核实学习情况,故此次想开发一套自动识别图片中文字对其进行改名的程序,从而将人力解放出来去干些更有意义的事情。 任务目标 1.自动识别图像...

    说明:最近学校要求班委收集每个同学青年大学习的学习完成截图,并核实学习情况,故此次想开发一套自动识别图片中的文字,并对其进行改名的程序,从而将人力解放出来去干些更有意义的事情。

    任务目标

    1.自动识别图像中特殊字段信息
    2.批量读入图片
    3.自动批量对图片进行命名

    开发准备

    Tesseract-OCR介绍
    开源的OCR识别引擎,高版本识别基于LSTM,其整个处理流程如下:
    在这里插入图片描述
    以上图片来源于小白学视觉 的博客

    安装Tesseract-OCR Python SDK支持

    pip install pytesseract
    

    附:网上找到的Tesseract-OCR下载链接

    http://digi.bib.uni-mannheim.de/tesseract/tesseract-ocr-setup-4.00.00dev.exe
    

    下载Tesseract-OCR 5.0.0-alpha.20201127安装包并安装,然后在系统的环境变量中添加对于的安装路径,默认为:

    C:\Program Files\Tesseract-OCR
    

    若自定义安装,换为对应路径即可。

    验证与测试

    安装与配置好OpenCV-Python与Tesseract-OCR之后,需要进一步通过代码验证正确性。打开Pycharm IDE,新建一个python项目与python文件,输入以下代码:

    import pytesseract as tess
    print(tess.get_tesseract_version())
    print(tess.get_languages())
    

    运行结果如下:
    在这里插入图片描述
    第一行是版本信息,第二行是支持的语言信息,默认只支持英文。'eng’表示支持英文,'chi_sim’表示支持简体中文。若要想也支持中文的识别,需要自行下载对应的语言包,并将其放在Tesseract OCR安装目录的tessdata文件夹下
    在这里插入图片描述

    Tesseract OCR中英文语言包的下载地址

    https://github.com/tesseract-ocr/tessdata
    

    在这里插入图片描述

    下载chi_sim.traineddata文件,并把们放到tessdata文件夹中。此时,环境基本配置完成。

    正式开发

    1.利用python调用Tesseract进行图片中的文字识别提取

    	image=cv2.imread("C:/Users/dell/Desktop/test")
        text = tess.image_to_string(image_rgb, lang="chi_sim")
        print(text)
        h, w, c = image.shape
        boxes = tess.image_to_boxes(image)
        for b in boxes.splitlines():
            b = b.split(' ')
            image = cv2.rectangle(image, (int(b[1]), h - int(b[2])), (int(b[3]), h - int(b[4])), (0, 255, 0), 2);
        cv2.imshow('text detect', image)
        cv2.waitKey(0)
        cv2.destroyAllWindows()
    

    在这里插入图片描述

    在这里插入图片描述
    2.对于识别到的文字信息进行提取过滤

    def get_str_btw(s, f, b):
        par = s.partition(f)
        return (par[2].partition(b))[0][:];
    
     nameInfo = get_str_btw(text, "专 硕", "用 户 ")
    
    #除去字符中的无用信息,例如空格等
    def remove(string):
         string = string.replace(" ", "")
         string = string.replace("|", "")
         return string.replace("\n", "");
    

    3.文件重命名

      ext = os.path.splitext(child)[1]
        new_name = nameInfo + ext
        print(new_name)
        NewInfo = os.path.join('%s/%s' % (filePathC, new_name))
        try:
            os.rename(child, NewInfo)
        except:
            print("have the same name")
    

    小结

    本项目是本人第一次做图片中的文字识别提取,主要是通过调用了Tesseract实现。
    本项目实际使用体验还算不错,但还是有很大的改进空间,例如:若图像中的字体特殊,则识别准确率会大幅下降。
    本项目后续有空还会继续开发优化,争取做成一款智能通用化的文字识别提取工具。
    本项目参考借鉴了小白学视觉的相关内容,以及部分网上的内容,在此向以上大佬表示感谢!
    相关博客详情
    说明:若有侵权请联系删除!

    展开全文
  • 自从上次批量的保存了半佛老师的各种骚图之后:我用Python一键保存了半佛老师所有的骚气表情包,每次做视频,找图就相当的费劲,因为图片太多,每次想要找到固定的图的话。就像大海捞针一样。因为上个版本的代码保存...

    自从上次批量的保存了半佛老师的各种骚图之后:我用Python一键保存了半佛老师所有的骚气表情包,每次做视频,找图就相当的费劲,因为图片太多,每次想要找到固定的图的话。就像大海捞针一样。因为上个版本的代码保存图片是截取部分图片链接进行命名的,所以名称是随机的。

    所以今天我准备对这些图片重新命名。按照表情包中的文字来命名。所以我得找到能够识别图片中文字的方法。基础的方法的话,那就需要安装图像处理相关的库,像 pillow、pytesser3、Tesseract-OCR 等等库。用这些库识别图片中的文字的成功率不是很高,所有我准备调用一下第三方的一些库。我看了一下百度有个文字识别的API接口。我们需要在下面地址注册应用。

    Python

    https://ai.baidu.com/tech/ocr

    1

    2

    https://ai.baidu.com/tech/ocr

    我们在文字识别里面去创建一个应用,选择图片文字识别。

    通用文字识别接口一天有5万次免费调用次数,对我们保存的几千多张的图片来说,绰绰有余了。

    创建成功之后返回应用列表,我们可以看到刚刚创建的应用,有三个重要的参数,我们等下会用到 AppID、API Key、Secret Key。

    我们就可以调用百度的这个识别图片文字的API接口库。我们首先需要安装这个baidu-aip库。

    Python

    pip install baidu-aip

    1

    2

    pipinstallbaidu-aip

    使用这个文字识别接口挑了几张图测试下效果:

    总结下:

    1、gif图片不识别,只能识别静态图,jpg、png、jpeg等。

    2、识别成功率并不是100%,比如「人」会被识别成「入」。

    3、图片中文字有换行的,都会分开以字典形式保存在 words_result 列表中。

    我对有多行的文字全部加起来,组成一行文字。

    图片中有时会存在无法保存为名称的符号。

    我用 replace 方法对它进行替换去除。

    Python

    title = t.replace('/', '').replace('\\', '').replace(':', '').replace('*', '').replace('?', '').replace('<', '')\

    .replace('>', '').replace('|', '').replace('.', '')

    1

    2

    3

    title=t.replace('/','').replace('\\','').replace(':','').replace('*','').replace('?','').replace('<','')\

    .replace('>','').replace('|','').replace('.','')

    gif 动态图无法识别,我们对它按照时间戳重命名。

    表情包中没有文字的,我们也以时间戳命名。

    给出我们需要批量改名称的文件夹目录,使用 rename 方法就可以批量改名字。

    当然,我们也可以对上个版本的代码进行优化,就是边保存图片的时候边重命名。在下载图片的 download 方法后面加下根据表情包中文字重命名的方法即可。

    效果如下:

    这样,大部分的图片名称就是根据图中文字命名的,搜索起来更加方便了。比如,我要搜索「川 人类之光 普 老师」的素材的时候,输入「人类之光」就可以找到了。

    最后,原创视频昨天已发到 B 站,很魔性,一起来欣赏下吧!

    本文两个版本的代码(边保存变改名和对一个目录下的所有图片批量改名)全部发在 GitHub 上了,在本公众号「Python知识圈」后台输入框回复「重命名」即可。

    展开全文
  • 昨天我姐问我有没有软件可以批量识别图片上的文字,她在帮客户做资料整理,但是用的方法只能一张一张上传识别,不仅效率低还浪费时间。 ​我就找了找批量识别的软件,下载下来觉得:嗯?不错,界面也挺好,小东西做...

    昨天我姐问我有没有软件可以批量识别图片上的文字,她在帮客户做资料整理,但是用的方法只能一张一张上传识别,不仅效率低还浪费时间。

    ​我就找了找批量识别的软件,下载下来觉得:嗯?不错,界面也挺好,小东西做的还挺别致。但是,识别三张就停止了,提示非最新版本要联系客服升级之类的,妥妥的套路,果断删除。又找了一个,嗯?界面更加好看一点儿,人家就很直接,三张之后提示购买会员,还显示了几种VIP的费用,很“人性”嘛。

    ​但是,在这个万物开源的互联网时代,让程序员掏腰包买软件是不可能滴,反正我是不会,啊哈哈。我首想到了反编译,把三张的限制取消,之前看过一些ios逆向工程的东西,这些应该都是通的。搜索了一番之后,有这么个方法,下载一个软件,把exe拖进去,就能显示源码了。又让我下东西,我就觉得很烦了,毕竟还是占空间的嘛。

    ​so,我写写就好了嘛,毕竟也是一名程序员,怎么能忘了呢。16年公司项目中身份证识别用到了OCR做身份证扫描,当时还在做iOS开发,好像用的一个第三方,细节嘛忘得差不多了(而且做app的话,我姐又不是iOS系统)。这次就用python的GUI然后打包成exe吧,翻翻我的笔记,对的19年12月份学习到的python打包那些刚好用上。要考虑到客户需求以及易用性,哈哈,然后就开始了。


    一、关键需求点分析:

    批量、图片文字识别、导出文本、操作便捷、图形化界面



    二、用到的技术:

    1、百度AI开放平台的通用文字识别SDK(没有广告成分,搜到什么用什么,免费调用量足够了),我的代码中用的是“网络图片文字识别”,可根据需求,自行调整;

    在这里插入图片描述

    2、python的tklinker模块、打包工具pyinstaller;
    3、也可以直接写入txt;



    三、踩到的坑:

    前一天的代码,第二天优化改改改之后,再用新图片来识别发现不行了,一度以为是哪里写错了,各种找原因,以为是获取文件夹路径方式不对,就自己复制了路径进来,发现报错了。

    坑1:图片路径——转义

    运行报错:SyntaxError: (unicode error) ‘unicodeescape’ codec can’t decode bytes in position 2-3: tr

    我文件夹中复制来的路径:C:\Users\78755\Desktop\test\1.png
    
    filePath = 'C:\Users\78755\Desktop\test\1.png'
    
    报错原因:在windows系统当中读取文件路径可以使用\,但是在python字符串中\有转义的含义,如\t可代表TAB,\n代表换行,所以我们需要采取一些方式使得\不被解读为转义字符。
    
    解决方案:
    1、在路径前面加r,保持字符原始值的意思。
    filePath = r'C:\Users\78755\Desktop\test\1.png’
    2、替换为双反斜杠
    filePath = 'C:\\Users\\78755\\Desktop\\test\\1.png’
    3、替换为正斜杠
    filePath = ‘C:/Users/78755/Desktop/test/1.png’

    坑2:后缀——python批量修改指定文件夹下图片后缀

    import os
    
    # 此处我是将test文件夹下全部.jpg后缀修改了成了.png并给图片重新命名
    os.chdir(r'C:\Users\78755\Desktop\test');  # 指定文件夹路径
    count = 1;  # 初始序号
    # os.listdir(path) 方法用于返回指定的文件夹(path)包含的文件或文件夹的名字的列表,如果path=None,则使用path="."
    for item in [x for x in os.listdir(".")]:
        # os.path.isfile( )判断某一对象(需提供绝对路径)是否为文件
        # 并且后缀以.jpg结尾
        if os.path.isfile(item) and os.path.splitext(item)[1] == '.jpg':
            os.rename(item, '%s.png' % (count));
            count += 1;
        print(item);


    四、实现:

    1、安装OCR Python SDK

    OCR Python SDK目录结构
    ├── README.md
    ├── aip                   //SDK目录
    │   ├── __init__.py       //导出类
    │   ├── base.py           //aip基类
    │   ├── http.py           //http请求
    │   └── ocr.py //OCR
    └── setup.py              //setuptools安装

    支持Python版本:2.7.+ ,3.+
    安装使用Python SDK有如下方式:

    • 如果已安装pip,执行pip install baidu-aip即可。
    • 如果已安装setuptools,执行python setup.py install即可。

    2、新建AipOcr

    AipOcr是OCR的Python SDK客户端,为使用OCR的开发人员提供了一系列的交互方法。

    参考如下代码新建一个AipOcr:

    from aip import AipOcr
    
    """ 你的 APPID AK SK """
    APP_ID = '你的 App ID'
    API_KEY = '你的 Api Key'
    SECRET_KEY = '你的 Secret Key'
    client = AipOcr(APP_ID, API_KEY, SECRET_KEY)

    在上面代码中,常量APP_ID在百度智能云控制台中创建,常量API_KEY与SECRET_KEY是在创建完毕应用后,系统分配给用户的,均为字符串,用于标识用户,为访问做签名验证,可在AI服务控制台中的应用列表中查看。

    3、单张识别:

    # 单张图片识别
    i=open(r'C:\Users\78755\Desktop\test\1.png','rb')
    image = i.read()
    
    result=client.basicGeneral(image)
    
    #将所有的文字都合并到一起
    for item in result['words_result']:
        print(item['words'])

    4、批量识别:

    # 图片批量识别
    filePath = r'C:\Users\78755\Desktop\test'
    def get_file_content(filePath):
        with open(filePath, 'rb') as fp:
            return fp.read()
    
    for root, dirs, files in os.walk(".", topdown=False):
        for name in files:
            if 'png' in name:
                filePath = os.path.join(root, name)[2:]
                options = {
                    'detect_direction': 'true',
                    'language_type': 'CHN_ENG',
                }
                result = aipOcr.webImage(get_file_content(filePath), options)
                print(result)
                for i in result['words_result']:
                    print(i['words'])

    5、写入txt文件:

       # 写入txt
        f = open("文件名.txt", "a") #a 打开一个文件用于追加。如果该文件已存在,文件指针将会放在文件的结尾。也就是说,新的内容将会被写入到已有内容之后。如果该文件不存在,创建新文件进行写入。
        f.write('要写入的内容')
        f.close()

    6、Python GUI之tkinter窗口视窗的创建,并实现选择文件夹路径并展示路径的功能:

    import tkinter as tk  # 使用Tkinter前需要先导入
    from tkinter import *
    from tkinter.filedialog import askdirectory
    
    # GUI
    # 第1步,实例化object,建立窗口window
    window = tk.Tk()
    # 第2步,给窗口的可视化起名字
    window.title('批量识别图片文字')
    # 第3步,设定窗口的大小(*)
    window.geometry('1000x700')  # 这里的乘是小x
    
    
    # 选择文件夹路径方法
    def selectPath():
        path_ = askdirectory()
        path.set(path_)
    path = StringVar()
    
    # 第4步,在窗口界面设置放置Button按键
    selectedButton = tk.Button(window, text='选择文件夹', font=('Arial', 12), width=10, height=1, command=selectPath).place(x=50, y=20)
    
    
    # 第5步,在图形界面上设定标签展示选择好的文件夹路径
    var = tk.StringVar()  # 将label标签的内容设置为字符类型,用var来接收hit_me函数的传出内容用以显示在标签上
    pathLabel = tk.Label(window, textvariable=path, bg='gray', fg='white', font=('Arial', 12), width=30, height=2).place(x=180,y=20)
    # 说明: bg为背景,fg为字体颜色,font为字体,width为长,height为高,这里的长和高是字符的长和高,比如height=2,就是标签有2个字符这么高
    
    
    # 第6步,主窗口循环显示
    window.mainloop()

    7、完整代码:

    (1)、融合图片识别和图形化界面,可自定通过窗口进行选择图片文件夹进行识别(将要识别的图片放到同一文件夹下即可,此处以.png后缀为例);
    (2)、识别结果的展示用到了tklinker的scrolledtext;
    (3)、窗口大小及各控件样式可调整;

    # encoding:utf-8
    # author:笑胖仔
    
    from aip import AipOcr
    import os
    import tkinter as tk  # 使用Tkinter前需要先导入
    from tkinter import *
    from tkinter.filedialog import askdirectory
    from tkinter import scrolledtext
    
    
    """ 你的 APPID AK SK """
    APP_ID = '你的 App ID'
    API_KEY = '你的 Api Key'
    SECRET_KEY = '你的 Secret Key'
    client = AipOcr(APP_ID, API_KEY, SECRET_KEY)
    
    
    # GUI
    # 第1步,实例化object,建立窗口window
    window = tk.Tk()
    # 第2步,给窗口的可视化起名字
    window.title('批量识别图片文字')
    # 第3步,设定窗口的大小(*)
    window.geometry('1000x700')  # 这里的乘是小x
    
    
    # 选择文件夹路径方法
    def selectPath():
        path_ = askdirectory()
        path.set(path_)
    path = StringVar()
    
    # 第4步,在窗口界面设置放置Button按键
    selectedButton = tk.Button(window, text='选择文件夹', font=('Arial', 12), width=10, height=1, command=selectPath).place(x=50, y=20)
    # selectedButton.pack()
    
    
    # 第5步,在图形界面上设定标签
    var = tk.StringVar()  # 将label标签的内容设置为字符类型,用var来接收hit_me函数的传出内容用以显示在标签上
    pathLabel = tk.Label(window, textvariable=path, bg='gray', fg='white', font=('Arial', 12), width=30, height=2).place(x=180,y=20)
    # 说明: bg为背景,fg为字体颜色,font为字体,width为长,height为高,这里的长和高是字符的长和高,比如height=2,就是标签有2个字符这么高
    # pathLabel.pack()
    
    
    # 第6步,展示识别结果
    resourceScrolledtext = scrolledtext.ScrolledText(window, width=80, height=23,font=("隶书",18))  #滚动文本框(宽,高(这里的高应该是以行数为单位),字体样式)
    resourceScrolledtext.place(x=20, y=100) #滚动文本框在页面的位置
    
    
    # 识别文字方法
    def scanPics():
        filePath = path.get()
        # 读取图片
        def get_file_content(filePath):
            with open(filePath, 'rb') as fp:
                return fp.read()
    
        for root, dirs, files in os.walk(".", topdown=False):
            for name in files:
                if 'png' in name:
                    filePath = os.path.join(root, name)[2:]
                    options = {
                        'detect_direction': 'true',
                        'language_type': 'CHN_ENG',
                    }
                    result = client.webImage(get_file_content(filePath), options)
                    print(result)
                    
                    resourceScrolledtext.insert("insert", '\n\n')# 在scrolledtext插入间隔,使每张图片识别内容中间有间隔
                    
                    for i in result['words_result']:
                        print(i['words'])
    
                        # # 如果需要写入txt,将此段解注释即可
                        # f = open("文件名.txt", "a") #a 打开一个文件用于追加。如果该文件已存在,文件指针将会放在文件的结尾。也就是说,新的内容将会被写入到已有内容之后。如果该文件不存在,创建新文件进行写入。
                        # f.write(i['words'] + '\n')
                        # f.close()
    
                        # 将识别结果插入scrolledtext,在窗口试图中显示
                        resourceScrolledtext.insert("insert", i['words'] + '\n')
    
    # 第7步,识别文字按钮
    scanButton = tk.Button(window, text='开始识别', font=('Arial', 12), command=scanPics).place(x=800,y=20)
    # scanButton.pack()
    
    
    # 第8步,主窗口循环显示
    window.mainloop()

    8、将python打包成.exe文件:

    (1)、安装pyinstaller:pip install pyinstaller

    (2)、打包:cd 到文件目录下,如test.py文件,pyinstaller -F test.py

    (3)、执行完之后,会多出一个.spec文件以及build、dist两个目录,dist中的.exe文件直接运行即可;


    9、测试:

    在这里插入图片描述
    在这里插入图片描述
    在这里插入图片描述
    在这里插入图片描述


    10、后续测试:

    按之前步骤进行打包成exe后,反复测试都识别不成功,且命令行没有返回任何结果,而程序内运行正常。开始寻找可能的原因,并进行测试。

    预测原因:“打包后exe程序不能发送网络请求”

    测试1(无果):

    以为是打包后的exe程序没有进行网络请求,网上有说是使用了第三方库的话,用pyinstaller打包前,需要把\Lib\site-packages下相应的包复制到同要打包的.py文件同一目录,经反复测试无用。

    测试2(成功):

    新建一文件requestTest.py,用request做单张图片识别请求并打印结果,测试打包成exe之后能否成功调用接口。运行打包后的exe,报错:FileNotFoundError:
    [Errno 2] No such file or directory: ‘呢呢呢.png’
    在这里插入图片描述
    尝试将资源图片复制到打包好的exe程序同目录下,即为dist目录下。此时再打开exe程序,点击识别,成功打印出结果(但是,此时已不关乎GUI中选择路径的功能,直接点击识别即可识别,不知其中缘由,但是解除了我“打包后exe程序不能发送网络请求”的猜测)。

    测试3(成功):

    仍然换回ocr.py进行打包,打包成功后,选择文件夹,开始识别,果然还是无打印结果。把要识别的文件夹放入dist文件夹下,再打开exe,直接点击开始识别,识别成功。

    在这里插入图片描述

    11、补充:

    pyinstaller打包,一些可选参数:

    使用顺序:pyinstall -i 图标名称.ico -n 打包后程序名称 -w -F 要打包的文件名.py

    先图标路径,再程序路径

    (1)、打包单文件模式:-F
    (2)、打包成文件夹:-D
    (3)、修改icon(图标后缀.ico,不可自行修改,网上有转.ico格式的方法):-i xxx.ico
    (4)、修改打包后的程序名称:-n
    (5)、不弹出命令行行:-w

    如我的程序:pyinstaller -i 笑胖仔.ico -n 批量识别图片中文字 -w -F ocr.py

    在这里插入图片描述
    在这里插入图片描述

    展开全文
  • 教你用python截屏APP,将截取到的图片进行文字识别并将信息保存在EXCEL。(附源码) 代码展示: 提取数据展示: 实现步骤: 1、通过ADB连接雷电模拟器、截屏、裁剪 2、通过百度文字识别功能将裁剪的图片识别...

    教你用python截屏APP,将截取到的图片进行文字识别并将信息保存在EXCEL中。(附源码)
    代码展示:
    请添加图片描述
    提取数据展示:
    在这里插入图片描述

    实现步骤:
    1、通过ADB连接雷电模拟器、并截屏、并裁剪
    2、通过百度文字识别功能将裁剪的图片识别成文字
    3、将识别到的文字进行处理导入到EXCEL中

    让我们开始开始操作实现
    开发环境
    windows 10
    python3.6
    安装ADB模块 可以搜索相关教程
    利用百度文字识别接口注册账号获取ID和KEY

    引用库存
    import time
    import os
    from PIL import Image
    from aip import AipOcr
    import xlrd
    from xlutils.copy import copy
    import re

    源码如下:

    import time
    import os
    from PIL import Image
    from aip import AipOcr
    import xlrd
    from xlutils.copy import copy
    import re
    
    def jieping():  #截屏
        os.system(f'adb shell screencap -p /sdcard/01.png')    #截屏到手机上 sdcard/01.png 中的sdcard/ 为默认地址不用修改
        os.system(f'adb pull /sdcard/01.png')                  #将截屏保存到电脑上
        time.sleep(2)
        img = Image.open('01.png').convert('RGB')
        img1 = img.crop((138, 870, 933, 1752))      #裁剪图片   Image.crop(left, up, right, below) 与左边界的距离 与上边界的距离 3右边与左边界的距离 4下边离上边的距离
    
        img1.save('02.png')                         #保存图片
    
        print('裁剪成功')
        wenzishibie()
    
    
    
    def wenzishibie():   #文字识别
    
        APP_ID = '填入你的ID'
        API_KEY = '填入你的KEY'
        SECRET_KEY = '填入你的KEY'
    
        client = AipOcr(APP_ID, API_KEY, SECRET_KEY)
    
        image = get_file_content('02.png') #第一张图
        i=client.basicAccurate(image)
    
    
    
        i=i['words_result']
    
        old_excel = xlrd.open_workbook('OK.xls')  # 打开ecxel表 # 将操作文件对象拷贝,变成可写的workbook对象
        sheets = old_excel.sheet_names()  # 获取工作簿中的所有工作表名字,形成列表元素
        worksheet = old_excel.sheet_by_name(sheets[0])
        nrows = worksheet.nrows
        new_excel = copy(old_excel)   # 将操作文件对象拷贝,变成可写的workbook对象
        ws = new_excel.get_sheet(0)   # 获得第一个sheet的对象
    
    
    
        NON=nrows
        val=0
        bb=''
        AA=len(i)  #列表长度
    
        for abc in range(0,AA):
            dd=i[abc]['words']
            bb +=dd
            print(dd)
            ee='相似人物'
            if ee in dd:    #判断字符串中包含特定字符
                bb += '#####'  #字符串中加入指定字符便于分割
        print(bb)
    
        cc = re.split('主音色:|辅音色:|声音评级:|音色评价:|最佳CP:|音色相似人物:|#####', bb)  # re.split('分割符1|分割符2',objects)
    
    
        for list1 in cc:
            newlist=re.sub(r'[0-9]+%', '', list1)   # re.sub() 该函数主要用于替换字符串中的匹配项。
            ws.write(NON, val, newlist)
            val += 1
    
        new_excel.save('OK.xls')   #保存
    
    def get_file_content(filePath):
        with open(filePath, 'rb') as fp:
            return fp.read()
    
    if __name__== '__main__':
        jieping()
    
    
    
    
    
    
    展开全文
  • https://www.xin3721.com/eschool/pythonxin3721/自从上次批量的保存了半佛老师的各种骚图之后:我用Python一键保存了半佛老师所有的骚气表情包,每次做视频,找图就相当的费劲,因为图片太多,每次想要找到固定的图...
  • 故事的开始 今天去财务拿上个月的工资条核对!发现女神一脸闷闷不乐!好像天要塌下来一样!我对完工资就问:女神,你咋不开心,不是马上就要发工资了嘛!...这里有以四张发票为例,将发票图片放到pic文件夹下
  • python+selenium 识别二维码...1、搭建环境:识别验证码图片,需要安装以下三个小部件:一、安装Pillowcmd命令行cd python安装目录下的Scripts用命令pip install Pillow二、pytesseract方法如同安装Pillow ,pip in...
  • python3.7环境实现给图片添加图片水印以及文字水印。另附python读取excel单元格内容。利用本程序修改后可以实现,给商品sku图片批量添加水印的功能。excel操作仅测试了读取单元格内容的代码。#from PIL import ...
  • 先看看文件夹组成 可以直接套用一下代码,不难理解 # -*- coding: utf-8 -*- """ Created on Mon May 25 09:27:27 2020 @author: 吴 """ # -*- coding: utf-8 -*- ...PATH = r'D:\百步梯\图像识别\垃圾目录\有害垃圾'
  • Python:对图片批量进行重命名 参考链接:https://www.cnblogs.com/znh8/p/11809737.html 将视频转化为图片,以帧的形式进行命名, 如 0.jpg、1.jpg 、2.jpg、…、800.jpg的形式。 但是因为只想要中间的一部分,比如...
  • 参考:Python批量读取文件名保存至txt_废话少说99的博客_CSDN博客 我只需要把所有图片的文件名保存在创建的列表即可,所以将参考博主的代码稍加修改了一下,仅供自己学习记录 代码如下: # P01 批量读取文件名,...
  • 主要是为了批量获取图片中的快递单号,我想到了两个解决办法: 用python识别条形码来直接获得准确快递单号 用python调用ocr,识别截图的快递单号文字 大家觉得哪个更简单更准确呢? 今天我先聊聊第一种方法的流程...
  • 3、识别验证码,识别文字重命令验证码 #!C:/Python27 #coding=utf-8 import pytesseract from pytesser import * from PIL import Image,ImageEnhance,ImageFilter import os import fnmatc
  • python批量更改文件名编号

    千次阅读 2019-03-18 22:27:49
    import os path = './horse' names = os.listdir(path) #读取原文件名 len = len(names) #获取文件个数 num = [0]*len # for i in range(int(len)): # print("%03d" % i) ...for i in range(int(len)): ...
  • 第一版,能实现,但最后发现...'.xml',str(file_number) + '.xml') file_number += 1 以上这篇python读取文件名并改名字的实例就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持脚本之家。
  • 这里演示下,怎样从文件夹里批量读取图片处理成我们想要的x,y 即特征和标签。输入维度理解以卷积神经网络为例子。我们知道卷积神经网络conv2d输入数据的形状为(batch_size,height,width,depth),其中第一维...
  • 1.制作字库1.截取需要的图片2.这里截取了“火狐主页”四个,接下来抓取文字的颜色3.颜色由是由三个部分组成,即R G B其中的R是由00-FF(16进制) 即0-255个数值表示。...用python结合字库识别文字1.加载dm.dl...

空空如也

空空如也

1 2 3 4 5 ... 20
收藏数 5,383
精华内容 2,153
关键字:

python批量识别图片中的文字并自动改名

python 订阅