精华内容
下载资源
问答
  • 脚本文字识别点击
    千次阅读
    2021-01-21 15:02:31

    我们都知道,部分电子版的书籍是以扫描图片的形式展现的,在阅读过程中无法选取文字。对于平时有记录习惯的人来说,无法复制黏贴真的很不爽! 为了解决这个问题,需要这样一个脚本,他有下面这些功能:

    1、能够实现自由截图
    2、能够识别含有文字的截图
    3、将识别出的文字输出到剪切板

    大致上需要的东西非常明确,那么,一个一个的来~

    截图
    截图作为一项非常实用的功能,自然是有各种各样的实现,在这里考虑使用python去完成这个任务,那么自然是先google一下,网上一搜,果然资料多到爆炸~
    不出所料,python对截图功能做了很好的基础支持~(本文基于windows平台下的python2实现,python3安装某些库真滴烦人)
    (1)全屏截图
    那么先从简单的做起(截图稍微麻烦一点,其他部分都超级简单 = =),首先实现python的“全屏截图”
    代码入下:

    from PIL import ImageGrab
    
    im = ImageGrab.grab()  # 截取全屏
    
    im.save(file)
    

    简单的三行代码搞定~(赞美一下前人的伟大_(:з)∠)_)
    其中的path表示文件截图文件的完整存放路径
    其中稍微要注意一下的是,安装库的时候,使用

    pip install pillow(而不是PIL)
    

    否则会显示找不到匹配的模块~
    (PS:这里其实有个问题,上述代码运行完成后,并没有截取全屏,最后生成的图片仅仅为部分图片,查看网上攻略后并没有找到比较好的解决方法,残念…)

    (2)自由截图
    好了,全屏截图完成,那么我们其实只想要截取需要的部分就行了,那么怎么去完成这个功能呢~
    看了一部分网上的做法,最常见的就是监听鼠标动作实现选择截图区域。其中,其中使用较多的是tkinter,以及pyHook(tkinter实现那个稍微复杂一点),我个人倾向于后者,因为实现起来非常简单,哈哈~
    那么先上部分代码

    # coding:utf-8
    
    import win32api
    import os
    from PIL
    import ImageGrab, Imageimport pyHook
    import pythoncom
    
    # 创建一个坐标列表(x1,y1,x2,y2)
    coordinate = [1, 1, 1, 1]
    # 监听键盘事件
    def on_mouse_event(event):
        file_path = 'xx//xx//read.jpg'
        # 监听鼠标事件
        if event.MessageName == 'mouse left down':
            coordinate[0:2] = event.Position   
        elif event.MessageName == 'mouse left up':
            coordinate[2:4] = event.Position
            win32api.PostQuitMessage()  # 退出监听循环
            # 截取坐标图片
            pic = ImageGrab.grab(coordinate)
            pic.save(file_path)
    

    唯一比较麻烦的就是各种库的安装,重点点名pywin32这个库 = =,真姬儿麻烦~
    那么在这里附上链接,防止安装过程中可能出现的问题:
    解决安装pywin32后仍然提示找不到模块的问题

    文字识别
    搞定了截图功能以后,剩下的工作就比较简单了。python的pytesseract为文字识别提供了很好的支持。整个实现只需要一行关键代码即可:

    from PIL import Image
    import pytesseract
    
    text=pytesseract.image_to_string(Image.open(file_path),lang='chi_sim')
    print(text)
    

    使用这个库之前,必须安装识别引擎tesseract-ocr,下载链接如下(下载完成后为exe安装包):
    tesseract-ocr识别引擎下载
    这里附上安装及配置环境变量的教程(摘自百度百科):
    图片文字OCR识别-tesseract-ocr4.00.00安装使用
    最后,在pytesseract库文件中进行配置,找到F:\XX\XX\XX\你的python安装路径\Lib\site-packages\pytesseract
    找到该路径下的pytesseract.py文件,打开后找到一下这句代码:

    tesseract_cmd = 'tesseract'
    

    将字符串’tesseract’替换成你的tesseract-ocr的安装路径(e.g.’F:\Program_File\Tesseract-OCR\tesseract.exe’)

    至此,文字识别引擎的全部配置就已经完成了。

    访问剪切板
    最后,将识别好的文字导入剪切板
    两步到位:
    (1)pip安装pyperclip库
    (2)同样一行代码:

    pyperclip.copy(text)  # 将识别内容导入系统剪切板
    

    大功告成~

    总结
    整个代码实现非常的简洁,总共也就几十行不到的代码,这也多亏了python强大的库支持。
    然而比较遗憾的是,截图功能的实现很是简陋,使用tkinter可以实现出类似QQ截图的效果(代码也相对复杂一些)~
    有了这个脚本之后,看扫描图片的PDF电子书就不需要打字记笔记了吼吼吼:)
    最后附上完整的代码

    # coding:utf-8
    
    import inspect
    import win32api
    import os
    from PIL import ImageGrab, Image
    import pyHook  # 钩子~
    import pythoncom
    import pytesseract  # 图像识别文字包
    import pyperclip
    
    # 创建一个坐标列表
    coordinate = [1, 1, 1, 1]
    # 监听键盘事件
    def on_mouse_event(event):
        # 获取当前文件路径
        file_ = inspect.getfile(inspect.currentframe())
        dir_path = os.path.abspath(os.path.dirname(file_))
        file_path = dir_path + '\\read.jpg'
        # 监听鼠标事件
        if event.MessageName == 'mouse left down':
            coordinate[0:2] = event.Position   
        elif event.MessageName == 'mouse left up':
            coordinate[2:4] = event.Position
            win32api.PostQuitMessage()  # 退出监听循环
            # 截取坐标图片
            pic = ImageGrab.grab(coordinate)
            pic.save(file_path)
            text = pytesseract.image_to_string(Image.open(file_path), lang='chi_sim')  # 识别并返回
            pyperclip.copy(text.replace(' ', ''))  # 将识别内容导入系统剪切板
       return True
        if __name__ == '__main__':
        hm = pyHook.HookManager()  # 创建一个钩子管理对象
        hm.MouseAll = on_mouse_event  # 监听所有鼠标事件
        hm.HookMouse()  # 设定鼠标钩子
        pythoncom.PumpMessages()  # 进入循环,程序一直监听
    

    首先,部分电子版的书籍是以扫描图片的形式展现的,在阅读过程中无法选取文字。对于平时有记录习惯的我来说,无法复制黏贴真的很不爽!
    为了解决这个问题,我需要这样一个脚本,他有下面这些功能:

    1、能够实现自由截图
    2、能够识别含有文字的截图
    3、将识别出的文字输出到剪切板

    大致上需要的东西非常明确,那么,一个一个的来~

    截图
    截图作为一项非常实用的功能,自然是有各种各样的实现,在这里考虑使用python去完成这个任务,那么自然是先google一下,网上一搜,果然资料多到爆炸~
    不出所料,python对截图功能做了很好的基础支持~(本文基于windows平台下的python2实现,python3安装某些库真滴烦人)
    (1)全屏截图
    那么先从简单的做起(截图稍微麻烦一点,其他部分都超级简单 = =),首先实现python的“全屏截图”
    代码入下:

    from PIL import ImageGrab
    
    im = ImageGrab.grab() # 截取全屏im.save(file)
    

    简单的三行代码搞定~(赞美一下前人的伟大_(:з)∠)_)
    其中的path表示文件截图文件的完整存放路径
    其中稍微要注意一下的是,安装库的时候,使用

    pip install pillow(而不是PIL)
    否则会显示找不到匹配的模块~
    (PS:这里其实有个问题,上述代码运行完成后,并没有截取全屏,最后生成的图片仅仅为部分图片,查看网上攻略后并没有找到比较好的解决方法,残念…)

    (2)自由截图
    好了,全屏截图完成,那么我们其实只想要截取需要的部分就行了,那么怎么去完成这个功能呢~
    看了一部分网上的做法,最常见的就是监听鼠标动作实现选择截图区域。其中,其中使用较多的是tkinter,以及pyHook(tkinter实现那个稍微复杂一点),我个人倾向于后者,因为实现起来非常简单,哈哈~
    那么先上部分代码

    # coding:utf-8
    import win32api
    import osfrom PIL 
    import ImageGrab, Imageimport pyHookimport pythoncom
    # 创建一个坐标列表(x1,y1,x2,y2)
    coordinate = [1, 1, 1, 1]
    # 监听键盘事件def on_mouse_event(event):
    file_path = 'xx//xx//read.jpg'
    # 监听鼠标事件
    if event.MessageName == 'mouse left down':
    coordinate[0:2] = event.Position elif event.MessageName == 'mouse left up':
    coordinate[2:4] = event.Position
    win32api.PostQuitMessage() # 退出监听循环
    # 截取坐标图片
    pic = ImageGrab.grab(coordinate)
    pic.save(file_path)
    

    唯一比较麻烦的就是各种库的安装,重点点名pywin32这个库 = =,真姬儿麻烦~
    那么在这里附上链接,防止安装过程中可能出现的问题:
    解决安装pywin32后仍然提示找不到模块的问题

    文字识别
    搞定了截图功能以后,剩下的工作就比较简单了。python的pytesseract为文字识别提供了很好的支持。整个实现只需要一行关键代码即可:

    from PIL import Imageimport pytesseract
    text=pytesseract.image_to_string(Image.open(file_path),lang='chi_sim')
    print(text)
    

    使用这个库之前,必须安装识别引擎tesseract-ocr,下载链接如下(下载完成后为exe安装包):
    tesseract-ocr识别引擎下载
    这里附上安装及配置环境变量的教程(摘自百度百科):
    图片文字OCR识别-tesseract-ocr4.00.00安装使用
    最后,在pytesseract库文件中进行配置,找到F:\XX\XX\XX\你的python安装路径\Lib\site-packages\pytesseract
    找到该路径下的pytesseract.py文件,打开后找到一下这句代码:

    tesseract_cmd = 'tesseract'
    

    将字符串’tesseract’替换成你的tesseract-ocr的安装路径(e.g.’F:\Program_File\Tesseract-OCR\tesseract.exe’)

    至此,文字识别引擎的全部配置就已经完成了。

    访问剪切板
    最后,将识别好的文字导入剪切板
    两步到位:
    (1)pip安装pyperclip库
    (2)同样一行代码:

    pyperclip.copy(text) # 将识别内容导入系统剪切板
    大功告成~

    总结
    整个代码实现非常的简洁,总共也就几十行不到的代码,这也多亏了python强大的库支持。
    然而比较遗憾的是,截图功能的实现很是简陋,使用tkinter可以实现出类似QQ截图的效果(代码也相对复杂一些)~
    有了这个脚本之后,看扫描图片的PDF电子书就不需要打字记笔记了吼吼吼:)
    最后附上完整的代码

    # coding:utf-8
    import inspectimport win32api
    import osfrom PIL import ImageGrab, Imageimport pyHook # 钩子~
    import pythoncom
    import pytesseract 
    # 图像识别文字包import pyperclip# 创建一个坐标列表coordinate = [1, 1, 1, 1]# 监听键盘事件def on_mouse_event(event):
    # 获取当前文件路径
    file_ = inspect.getfile(inspect.currentframe())
    dir_path = os.path.abspath(os.path.dirname(file_))
    file_path = dir_path + '\\read.jpg'
    # 监听鼠标事件
    if event.MessageName == 'mouse left down':
    coordinate[0:2] = event.Position elif event.MessageName == 'mouse left up':
    coordinate[2:4] = event.Position
    win32api.PostQuitMessage() # 退出监听循环
    # 截取坐标图片
    pic = ImageGrab.grab(coordinate)
    pic.save(file_path)
    text = pytesseract.image_to_string(Image.open(file_path), lang='chi_sim') # 识别并返回
    pyperclip.copy(text.replace(' ', '')) # 将识别内容导入系统剪切板
    return Trueif __name__ == '__main__':
    hm = pyHook.HookManager() # 创建一个钩子管理对象
    hm.MouseAll = on_mouse_event # 监听所有鼠标事件
    hm.HookMouse() # 设定鼠标钩子
    pythoncom.PumpMessages() # 进入循环,程序一直监听
    
    更多相关内容
  • 在你运行了脚本后(在此之前需要下载ocr脚本到本地),鼠标会变成一个十字叉叉,类似截图操作之后,文字会自动显示在命令行里,同时也复制到了剪切板中。以我自己为例:但是问题是,这样不方便,同时只能识别英文,...

    前言

    在mac上,常用的截图文本识别软件有TextScanner、iText等等,但是它们都是付费的。这次我无意发现了利用脚本和苹果快捷指令就可以使用的开源截图文本识别软件,推荐给大家!!!

    github地址为:schappim/macOCR: Get any text on your screen into your clipboard.

    具体效果如下图所示。在你运行了ocr脚本后(在此之前需要下载ocr脚本到本地),鼠标会变成一个十字叉叉,类似截图操作之后,文字会自动显示在命令行里,同时也复制到了剪切板中。

    在这里插入图片描述

    如何安装?

    以我自己为例:

    1. 使用brew install schappim/ocr/ocr命令,homebrew安装。mac会安装到/opt/homebrew/bin/brew/ocr路径下。此时你只要在命令行输入ocr就可以跑了。

    注意⚠️:你还需要在设置->安全性与隐私->屏幕录制,允许命令行的权限。

    在这里插入图片描述

    但是问题是,这样不方便,同时只能识别英文,所以有第二步。

    1. 源代码作者给你写好了快捷指令的操作,其实就是上面运行脚本方便一些。点击Select Text to OCR即可。

    但是后面,我们还要在尾部添加-l zh-Hans。这样才能同时识别中文和英文。

    具体如下所示:

    在这里插入图片描述

    如果想要把快捷指令放置在顶部,见下图。

    在这里插入图片描述

    结束!开心使用!!!😌

    展开全文
  • 自动点击器帮你自动点击屏幕,无需ROOT权限。可以方便添加点击位置,设置点击速度。 类似于按键精灵功能。 只支持Android7.0及以上系统
  • 按键精灵运用百度OCR接口2.1 通用文字识别(高精度版)文档3.1 接口描述3.2 请求说明3.3 获取access_token3.4 按键精灵代码实现四级标题五级标题六级标题 1. 申请百度OCR服务 1.1. 百度OCR登录 进入 百度智能云-...

    1. 申请百度OCR服务

    1.1. 百度OCR登录

    进入 百度智能云-登录 ,登入百度账号后,在产品应用里面选择文字识别服务。
    在这里插入图片描述
    点击进入后:
    在这里插入图片描述

    1.2 创建新应用

    应用的名称自己填
    在这里插入图片描述
    应用归属:这里我选择是的个人。应用描述自己填,
    在这里插入图片描述

    1.3 免费领取次数

    点击免费领取次数,进入后全选
    在这里插入图片描述
    在没有认证的情况下,免费次数就通用文字识别(高精度版)每个月200次。若是进行实名认证,每个月1000次。
    实名认证(根据需要自行决定)
    在这里插入图片描述

    1.3 查看是否创建成功

    点击应用列表自己查看
    在这里插入图片描述
    在应用列表中API KEY和Secret Key 之后会用到可以先记录下来。

    2. 按键精灵运用百度OCR接口

    2.1 通用文字识别(高精度版)文档

    2.1.1 接口描述

    在通用文字识别的基础上,提供更高精度的识别服务,支持更多语种识别(丹麦语、荷兰语、马来语、瑞典语、印尼语、波兰语、罗马尼亚语、土耳其语、希腊语、匈牙利语、泰语、越语、阿拉伯语、印地语及部分中国少数民族语言),并将字库从1w+扩展到2w+,能识别所有常用字和大部分生僻字。

    2.1.2 请求说明

    在这里插入图片描述
    这里看到在使用前需要先获得access_token 值。

    2.1.3 获取access_token

    在这里插入图片描述
    简单来说就是:就是向https://aip.baidubce.com/oauth/2.0/token发请求其中带上grant_type、client_id、client_secret三个参数值就行。

    2.2按键精灵代码实现获取access_token

    Sub 获取access_token
    	// 填写自己的API_KEY 和 SECRET_KEY
    	API_KEY = ""
    	SECRET_KEY = ""
    	// 获取access_token
    	Set tokenPost = CreateObject("Msxml2.ServerXMLHTTP.3.0")
    	tokenPost.Open "Post", "https://aip.baidubce.com/oauth/2.0/token?grant_type=client_credentials&client_id=" & API_KEY & "&client_secret=" & SECRET_KEY, False
    	tokenPost.Send 
    	If tokenPost.readyState = 4 Then 
    		TracePrint tokenPost.responsetext
    		Set obj = json.Decode(tokenPost.responsetext)
    		TracePrint obj("access_token")
    		access_token = obj("access_token")
    	End If
    	tokenPost.abort
    	Set tokenPost = Nothing
    End Sub
    

    这里我们就获取到了 access_token ,接下来我们就开始解决header和body的参数问题了

    2.3. header 和 body参数

    2.3.1 header 参数

    文档的部分内容如下:
    在这里插入图片描述
    大概就Header要发一个Content-Type,其值按照要求写就行了。

    2.3.2 body 参数

    在这里插入图片描述
    这有三选一的参数,一个是image和url、PDF的参数形式。这里因为图片是保存在本地,将选用的是image的参数。后边详细在详细分析下image参数的格式。其他参数都是非必选的,就是自行看文档了。
    在文档中还有一些代码的样例。不幸的是就按键精灵语言
    在这里插入图片描述

    2.3.3 image 参数

    在这里插入图片描述
    首先可以看到,图片需要进行base64编码,然后进行urlencode。两者区别具体可以看
    这里解释下:在按键精灵中用 Base64 转变后,你只要把其中的 “+” 号替换为 %2d 就行了。

    2.4 返回参数

    在这里插入图片描述
    这里就根据需求看那些返回值比较重要,其中word_result 无疑是十分重要,返回的是识别的结果,并保存在数组中。现在大致了解了参数设置和返回参数的问题。接下就实现代码了

    2.5 按键精灵代码实现图片base64转换

    代码主要参考网上图片转base64代码

    
    // 图片转Base64
    Function ImagesToBase64(FilePath)
    	Dim xml
    	Dim root
    	Dim fs
    	Dim objStream
    	Dim objXMLDoc
    	Dim Base64
    	Set objXMLDoc = CreateObject("Microsoft.XMLDOM") // 可以访问和操作XML文档
    	objXMLDoc.loadXML "<?xml version='1.0' ?><data></data>" // 导入指定字符串的XML文档
    	Set fs = createObject("Scripting.FileSystemObject") // 可以操作磁盘、文件夹或文本文件
    	If fs.FileExists(FilePath) Then // 判断文件是否存在
    		'用 stream 来读取数据
    		Set objStream = CreateObject("ADODB.Stream") // 可以存取二进制数据或者文本流
    		objStream.Type = 1 // 表示二进制数据
    		objStream.Open // 打开objStream
    		objStream.LoadFromFile FilePath // 加载文件数据(下载图片用SaveToFile)
    		
    		objXMLDoc.documentElement.dataType = "bin.base64" // 设置节点数据类型
    		objXMLDoc.documentElement.nodeTypedvalue = objStream.Read // 从objStream读取,再存储到根节点(objXMLDoc.documentElement代表XML文档的根节点)
    		
    		'数据流读取结束.得到了值 objXMLDoc
    		'创建XML文件
    		Set xml = CreateObject("Microsoft.XMLDOM")
    		xml.load objXMLDoc // 导入指定位置的XML文档
    		If xml.ReadyState > 2 Then // 0:未初始化;1:载入;2:载入完成;3:交互;4:完成
    			Set root = xml.getElementsByTagName("data")// 返回指定名字的节点集合(可能会有多个重名节点)
    			Base64 = root(0).Text
    			Base64 = Replace(Base64, vbLf, "") // 去除换行(vbLf相当于chr(10))(可以不去除)
    			Base64 = Replace(Base64,"+","%2B") // 替换加号(文档未说明,但需要此操作,而且不要进行urlencode)
    		Else
    			Base64 = ""
    		End If
    		Set xml = Nothing
    		Set objStream = Nothing
    	Else // 文件不存在
    		Base64 = ""
    	End If
    	Set fs = Nothing
    	Set objXMLDoc = Nothing
    	ImagesToBase64 = Base64
    //	//TracePrint ImagesToBase64
    End Function
    

    这里需要注意的是

    Base64 = Replace(Base64, vbLf, "") // 去除换行(vbLf相当于chr(10))(可以不去除)
    Base64 = Replace(Base64,"+","%2B") // 替换加号(文档未说明,但需要此操作,而且不要进行urlencode)
    

    网上部分图片转base64结果有出现换行情况。base64转变后只要把其中的 “+” 号替换为 %2d 就行了,而且不要进行urlencode。

    2.6 按键精灵代码实现获取word_result

    其中导入了vbsjson.vbs 辅助用于JSON转换,其实也可以不用。自己根据返回的结果进行解析取出关键信息也是ok的

    Import "F:\按键精灵\按键精灵商业版\按键精灵2014\plugin\vbsjson.vbs"
    Set json = New vbsJson
    Function full_contribution()
    	Call Plugin.Pic.PrintScreen(L_position_x,L_position_y,R_position_x,R_position_y, "F:\按键精灵\按键精灵商业版\数字识别截图.bmp")
    	//这里先截了一张图并保持。
    	Set xPost = CreateObject("Msxml2.ServerXMLHTTP.3.0")
    	xPost.Open "Post", "https://aip.baidubce.com/rest/2.0/ocr/v1/accurate_basic?access_token=" & access_token, False
    	// 这里将access_token进行拼接
    	xPost.setRequestHeader "CONTENT-TYPE", "application/x-www-form-urlencoded"
    	// 这里header中参数CONTENT-TYPE进行设置
    	base64Param = "image=" & ImagesToBase64("F:\按键精灵\按键精灵商业版\数字识别截图.bmp")
    	// 这里image参数进行设置,拼接上处理号的图片数据
    	xPost.Send (base64Param)
    	// 发送
    	If xPost.readyState=4 Then
    		// xPost.readyState成功获取返回值
        	TracePrint xPost.responsetext
        	// 打印下返回值进行查看
        	Set obj = json.Decode(xPost.responsetext)
        	wordsArray = obj("words_result")
        	//这里导入辅助了将str转变json类型的文件
        	full_contribution_true = 0
        	For i = 0 To UBound(wordsArray)
        		//读取数组中的目标值
        		TracePrint wordsArray(i)("words")
        		If wordsArray(i)("words") = "目标值" Then 
        			full_contribution_true = 1
        			Exit for
        		End If
        	Next
    	End If
    	xPost.abort
    	Set xPost = Nothing
        Delay 1000
    End Function
    

    2.7 一个小游戏截图效果图

    一个游戏的截图:
    在这里插入图片描述
    接下来我们就调用下按键精灵程序
    在这里插入图片描述
    可以看到识别的结果还是很准确的

    2.8 关键代码整合:

    代码整合与vbsJson.vbs

    3 OCRSpace文字识别

    Free OCR API这是一个免费的OCR的API
    在这里插入图片描述
    可以看到是免费25000次,但是亲测返回速度、识别正常率、成功访问率都不太行。里边的文档也有详细的API的配置,与百度OCR不同的就是不需要获取access_token,只需要在header中发送key就行,同时image的内容也有所不同base64Image=data:image/bmp;base64

    3.1 OCRSpace关键代码

    Function full_contribution()
    	mykey = ""
        Set xPost = CreateObject("Msxml2.ServerXMLHTTP.6.0")
        xPost.Open "Post", "https://api.ocr.space/parse/image", False
        xPost.setRequestHeader "apikey", mykey
        xPost.setRequestHeader "Content-Type", "application/x-www-form-urlencoded"
        lan = "language=chs"
        iso = "&isOverlayRequired=false"
        b644 = ImagesToBase64("F:\按键精灵\按键精灵商业版\数字识别截图.bmp")
        b64 = "&base64Image=data:image/bmp;base64,"& b644
        isc = "&iscreatesearchablepdf=false"
        iss = "&issearchablepdfhidetextlayer=false"
        date1 = lan &iso & b64 & isc & iss 
        xPost.Send (date1)
        If xPost.readyState=4 Then
            TracePrint xPost.responsetext
        End If
        xPost.abort
        Set xPost = Nothing
        Delay 1000
    End Function
    

    本文作者:九重!
    本文链接:https://blog.csdn.net/weixin_43798572/article/details/124075686
    关于博主:评论和私信会在第一时间回复。或者直接私信我。
    声援博主:如果您觉得文章对您有帮助,可以点击文章右下角【点赞】【收藏】一下。您的鼓励是博主的最大动力!

    展开全文
  • 按键精灵---调用百度AI进行文字识别脚本

    万次阅读 热门讨论 2018-11-30 14:50:13
    TracePrint "识别文字行数:" & retTable["words_result_num"] Dim words_results= retTable["words_result"] For i=0 to UBound(words_results) Dim oneUnit = words_results(i) Dim words = oneUnit["words"] ...
    Import "ShanHai.lua"
    Import "Cjson.lua"
    
    //Dim pic = File.Read("/storage/emulated/0/Pictures/1.jpg")
    //Dim pic = File.Read("/sdcard/Pictures/1.jpg")
    //Dim picBase64 = ShanHai.Base64En(pic)
    
    Dim picBase64 = ShanHai.ReadFileBase("/sdcard/Pictures/1.jpg")
    dim picUrlEncode =  ShanHai.CharToUrl(picBase64)
    Dim api_url = "https://aip.baidubce.com/rest/2.0/ocr/v1/general_basic?access_token=XXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXX"
    //用山海post,得不到结果,不知道为什么,可能是默认的包头不一样
    //dim RetJson2 = ShanHai.PostHttp(api_url, "image="&picUrlEncode)
    dim RetJson = Url.Post(api_url, "image="&picUrlEncode)
    Dim retTable = Cjson.Decode(RetJson)
    
    TracePrint RetJson
    TracePrint "识别文字行数:" & retTable["words_result_num"]
    
    Dim words_results= retTable["words_result"]
    For i=0 to UBound(words_results)
    	Dim oneUnit = words_results(i)
    	Dim words = oneUnit["words"]
    	TracePrint words
    Next
    
    

    不同地址-不同识别能力,一览表(后台地址:https://console.bce.baidu.com/ai/?fromai=1#/ai/ocr/app/detail~appId=665090

    展开全文
  • 迅捷ocr文字识别软件支持图片文字识别、图片文字转换成word、扫描文件转换成word等多种文字识别技术,是一款多功能的ocr识别软件,需要的朋友快来下载使用吧! 软件安装 1、在本站下载该软件解压后运行用用程序 ...
  • 这里我们需要用到两个库:pytesseract和PIL•同时我们还需要安装识别引擎tesseract-ocr下面就来讲讲这几个库的安装,因为只有这几个库安装好以后Python才能实现一行代码实现图片文字识别一,pytesseract和PIL的安装 ...
  • 利用截图软件 gnome-screenshot 进行截取需要被文字识别的图片; 利用文字识别OCR软件tesseract,进行识别; 将识别到的结果输出,复制到文件和剪切板。 2. 安装依赖 安装tesseract # 添加源 sudo add-apt-...
  • 1,安装第三方模块,baidu-aip 方法1:win+r>>>cmd打开命令指示器输入命令下载baidu-aip第三方模块 pip install baidu-aip ...点击左 上角加号,搜索baidu-aip下载。 个人建议使用方法二,
  • 蝴蝶识字ocr文字识别软件是一款十分不错的ocr文字识别工具,软件支持截图或导图图片都可以识别,速度快,识别率高,本站提供的是该软件的绿色版本,需要的朋友不妨前来本站下载使用。 功能介绍 1.绿色单文件版,...
  • 点击此处查看原文。大漠插件介绍因为使用的是Windows系统,所以好多工作之前已经有大佬完成了。几年前使用过按键精灵的同学一定对大漠插件不陌生,其功能之强大,可以用来完成很多操作。从文...
  • 文字识别的概念3.华为云文字识别服务一、初识OCR技术1.文字识别技术的概念2.文字识别技术的发展历程3.简要介绍文字定位与文字识别技术二、华为云OCR服务介绍1.简要介绍华为云OCR服务2.华为云OCR服务的应用场景3.华为...
  • 附: 其他语种的文字识别标注脚本: PaddleOCR也提供了文字标注工具,可以标注矩形框、四边形,同时也提供预标注信息节约标注时间。因此标注文字检测时我们完全可以使用这个工具,在标注汉语、英语的数据时,检测+...
  • 基于PaddleOCR开发Auto.js Pro文字识别插件

    千次阅读 热门讨论 2022-05-02 14:00:44
    文字识别方面它提供的有一款OCR识别插件,但是其中有识别速度慢,插件大的缺点,所以这里将讲解一下如何集成基于PaddleOCR文字识别开发的插件,阅读本篇文字需要对PaddleOCR有个基本的了解,还需要有一点Android...
  • 1、解压后,多开黑洞OCR文字识别小程序,点击下图所示图标,选定需要识别的区域内容 2、然后就能自动识别,点击下图所示按钮,可以查看识别的结果 GIF图片 常见问题 部分Win10系统用户,无法打开软
  • python图片中文字识别

    千次阅读 多人点赞 2020-10-12 15:25:42
    一、前言 ...文字识别是ORC的一部分内容,ORC的意思是光学字符识别,通俗讲就是文字识别。Tesseract是一个用于文字识别的工具,我们结合Python使用可以很快的实现文字识别。但是在此之前我们需要完成一个繁
  • 按键精灵使用百度文字识别(百度ocr)教程

    千次阅读 热门讨论 2021-06-27 13:13:31
    这一步非常简单,进入https://login.bce.baidu.com/,登入百度账号后,在产品应用里面选择文字识别服务 进入后,选择创建应用,相关参数选择默认的即可,最后会得到自己的APIKey 和SecretKey,这两个参数十分重要...
  • Python Opencv 之 简单文字识别 目录 Python Opencv 之 简单文字识别 一、简单介绍 二、pillow、pytesseract 的安装 1、pip install install 安装 pillow 2、pip install pytesseract 安装 pytesseract 三...
  • Python+ADB实现自动点赞和文字识别

    千次阅读 2019-05-22 11:02:40
    文本识别 字符串与子串 组装 实际测试 总结 为什么要做这个呢? 在各类直播平台,都有对主播点赞的功能,有一些直播平台(例如淘宝直播)的点赞按钮是可以无限点击的(为什么要双击666,明明可以无限击)。...
  • 文字识别在现实生活中有着非常重要的应用,主要由文字检测、内容识别两个关键步骤组成,在本博客之前的文章中已介绍了文字检测、内容识别的经典模型原理(见文章:大话文本检测经典模型:CTPN,大话文本识别经典模型...
  • 目录前言Step1:安装tesseractStep2: 制作Shell文件Step3:设置快捷键,一键调用shell脚本下面是Latex公式识别 前言 现在的工作重心慢慢往ubuntu上靠拢,所以在闲暇之余摸索一下ubuntu的小功能。如果在ubuntu上码字...
  • 1)首先下载按键精灵,新建一个脚本。 2)下载大漠插件,如下为安装目录 3)将dm.all,RegDll.dll拖到附件中,注册大漠插件 //释放“附件”中自己添加的文件到c:\dm目录中,释放Regdll.dll到plugin目录中 ...
  • 本篇先讲文字识别,喜欢的朋友可以关注下,后续会继续写图片识别等所有ai对接方式. 百度ai开放平台地址 前提你得会使用按键精灵电脑版的post,get请求,简单说明一下,get请求传递的参数封装太url后缀里,post请求参数...
  • 后台看见有朋友私信,说弄个点击助手,刚好自己也用过几款,挑一个分享给大家叭,这玩意还是很强大的,可以让你自动刷...我们进入软件后,文章看不明白可以先点击教程可以查看详细视频教程,点击应用市场可以查看云端脚本!.
  • 文字检测是文字识别过程中的一个非常重要的环节,文字检测的主要目标是将图片中的文字区域位置检测出来,以便于进行后面的文字识别,只有找到了文本所在区域,才能对其内容进行识别。 文字检测的场景主要分为两种,...
  • 顾名思义,运行程序时,可以实时把你截出来的图片中的文字识别出来。二、模块import keyboard # 用于监控键盘按下,触发事件(pip install keyboard)import timefrom aip import AipOcr # 调用百度接口(pip ...
  • 包含了抖音,快手自动刷视频,旅行世界自动合成,抖音自动养号,抖音自动私信,多多果林,蚂蚁森林等热门软件脚本源码
  • 最近需要在页面上实现一个点击元素(p、div等等)内文字文字自动选中的效果,找了一圈最后终于实现了,现总结如下: 1、如果是要选中输入框(input、textarea)内的文字,代码如下: <!DOCTYPE> <...
  • 今天给大家介绍一个超级简单且强大的OCR文本识别工具:easyocr. 这个模块支持70多种语言的即用型OCR,包括中文,日文,韩文和泰文等。Python学习资料点击免费领取 下面是这个模块的实战教程。 1.准备 ...

空空如也

空空如也

1 2 3 4 5 ... 20
收藏数 20,227
精华内容 8,090
关键字:

脚本文字识别点击