精华内容
下载资源
问答
  • 【delphi百度文字识别】支持 通用文字识别通用文字识别(高精度版)、通用文字识别(含位置信息版)、通用文字识别(高精度含位置版)、手写文字识别、身份证识别、银行卡识别、营业执照识别、护照识别、名片识别...

    下载链接:https://download.csdn.net/download/liushenglin123/12363729

    delphi百度文字识别 支持 通用文字识别、通用文字识别(高精度版)、通用文字识别(含位置信息版)、通用文字识别(高精度含位置版)、手写文字识别、身份证识别、银行卡识别、营业执照识别、护照识别、名片识别、户口本识别、出生医学证明识别、港澳通行证识别、台湾通行证识别、表格文字识别、通用票据识别、增值税发票识别、火车票识别、出租车票识别、定额发票识别、驾驶证识别、行驶证识别、车牌识别、机动车销售发票识别、车辆合格证识别、VIN码识别、二维码识别、数字识别、网络图片文字识别、彩票识别、保单识别、通用机打发票识别、行程单识别

     

    展开全文
  • 百度大脑之通用文字识别攻略

    千次阅读 2019-12-25 18:53:20
    通用文字识别攻略 作者:才能我浪费99 1.功能描述: 百度通用文字识别基于业界领先的深度学习技术,提供多场景、多语种、高精度的整图文字检测和识别服务,印刷体文字识别准确率高达99%,多项ICDAR指标居世界第一。...

    通用文字识别攻略
    作者:才能我浪费99

    1.功能描述:

    百度通用文字识别基于业界领先的深度学习技术,提供多场景、多语种、高精度的整图文字检测和识别服务,印刷体文字识别准确率高达99%,多项ICDAR指标居世界第一。有以下一些版本:
    通用文字识别
    对图片中的文字进行检测和识别,支持中、英、法、俄、西、葡、德、意、日、韩、中英混合等多语种识别,同时支持中、英、日、韩四语种的类型检测
    高精度版
    在通用文字识别的基础上,提供更高精度的识别服务,并将字库从1w+扩展到2w+,能识别所有常用字和大部分生僻字
    含位置信息版
    在通用文字识别的基础上,返回文字在图片中的位置信息,方便用户进行版式的二次处理
    高精度含位置版
    在通用文字识别(高精度版)的基础上,返回文字在图片中的位置信息,方便用户进行版式的二次处理

    2.平台接入

    具体接入方式比较简单,可以参考我的另一个帖子,这里就不重复了:
    http://ai.baidu.com/forum/topic/show/943327

    3.调用攻略(Python3)及评测

    3.1首先认证授权:

    在开始调用任何API之前需要先进行认证授权,具体的说明请参考:

    http://ai.baidu.com/docs#/Auth/top

    具体Python3代码如下:

    -- coding: utf-8 --

    #!/usr/bin/env python

    import urllib
    import base64
    import json
    #client_id 为官网获取的AK, client_secret 为官网获取的SK
    client_id =【百度云应用的AK】
    client_secret =【百度云应用的SK】

    #获取token
    def get_token():
    host = ‘https://aip.baidubce.com/oauth/2.0/token?grant_type=client_credentials&client_id=’ + client_id + ‘&client_secret=’ + client_secret
    request = urllib.request.Request(host)
    request.add_header(‘Content-Type’, ‘application/json; charset=UTF-8’)
    response = urllib.request.urlopen(request)
    token_content = response.read()
    #print (token_content)
    if token_content:
    token_info = json.loads(token_content)
    token_key = token_info[‘access_token’]
    return token_key
    3.2百度通用文字识别分析接口调用:

    详细说明请参考: https://ai.baidu.com/docs#/OCR-API-GeneralBasic/db0895e7

    说明的比较清晰,这里就不重复了。

    大家需要注意的是:
    API访问URL:https://aip.baidubce.com/rest/2.0/ocr/v1/general_basic
    图像数据,base64编码后进行urlencode,要求base64编码和urlencode后大小不超过4M,最短边至少15px,最长边最大4096px,支持jpg/jpeg/png/bmp格式

    返回示例:
    {
    “log_id”: 2471272194,
    “words_result_num”: 2,
    “words_result”:
    [
    {“words”: " TSINGTAO"},
    {“words”: “青島睥酒”}
    ]
    }

    Python3调用代码如下:

    def general_basic(filename):
    request_url = “https://aip.baidubce.com/rest/2.0/ocr/v1/general_basic”

    # 二进制方式打开图片文件
    f = open(filename, 'rb')
    img = base64.b64encode(f.read())
    
    params = dict()
    params['image'] = img
    params = urllib.parse.urlencode(params).encode("utf-8")
    
    access_token = get_token()
    
    begin = time.perf_counter()
    request_url = request_url + "?access_token=" + access_token
    request = urllib.request.Request(url=request_url, data=params)
    request.add_header('Content-Type', 'application/x-www-form-urlencoded')
    response = urllib.request.urlopen(request)
    content = response.read()
    end = time.perf_counter()
    
    print('处理时长:'+'%.2f'%(end-begin)+'秒')
    
    if content:
        #print(content)
        content=content.decode('utf-8')
        #print(content)
        data = json.loads(content)
        print(data)
        words_result=data['words_result']
        print ("识别结果")
        for item in words_result:
            print (item['words'])  
    

    general_basic(’…/img/general3.jpg’)
    4.功能评测:
    选用不同的数据对效果进行测试,具体效果如下(以下例子均来自网上):
    在这里插入图片描述

    处理时长:0.89秒
    利洗手间
    Toile
    在这里插入图片描述

    处理时长:0.63秒
    POSTCARD
    在这里插入图片描述

    处理时长:13.07秒
    识别结果:
    ACKNOWLEDGEMENTS
    We would like to thank all the designers and
    contributors who have been involved in the
    production of this book; their contributions
    have been indispensable to its creation. We
    would also like to express our gratitude to all
    the producers for their invaluable opinions
    and assistance throughout this project And to
    the many others whose names are not credited
    but have made specific input in this book, we
    thank you for your continuous support

    5.测试结论和建议

    测试下来,整体识别效果不错。百度通用文字识别的很准确,速度也很快,用起来非常的方便。可以应用于
    拍照/截图识别
    使用通用文字识别技术,实现拍照文字识别、相册图片文字识别和截图文字识别,可应用于搜索、书摘、笔记、翻译等移动应用中,方便用户进行文本的提取或录入,有效提升产品易用性和用户使用体验
    内容审核与监管
    使用通用文字识别技术,实现对图像中文字内容的提取,结合文本审核技术识别违规内容,提示相应风险,协助进行违规处理,可应用于电商广告审核、舆情监管等场景,帮助用户有效规避业务风险
    视频内容分析
    使用通用文字识别技术,实现对视频中的字幕、标题、弹幕等文字内容的检测和识别,并根据文字位置判断文字类型,可应用于视频分类和标签提取、视频内容审核、营销分析等场景,有效降低人力成本,控制业务风险
    纸质文档电子化
    使用通用文字识别技术,实现对各类医疗单据、金融财税票据、法律卷宗等纸质文档的识别,并返回文字在图片中的位置信息以便于进行比对、结构化等处理,可满足医疗、金融、政务、法务、教育等行业文档快速录入、存档和检索的需求,有效降低企业人力成本,提高信息录入效率

    展开全文
  • 百度AI攻略:通用文字识别

    千次阅读 2020-01-01 08:48:32
    百度通用文字识别基于业界领先的深度学习技术,提供多场景、多语种、高精度的整图文字检测和识别服务,印刷体文字识别准确率高达99%,多项ICDAR指标居世界第一。有以下一些版本: 通用文字识别 对图片中的文字进行...

    1.功能描述:

    百度通用文字识别基于业界领先的深度学习技术,提供多场景、多语种、高精度的整图文字检测和识别服务,印刷体文字识别准确率高达99%,多项ICDAR指标居世界第一。有以下一些版本:
    通用文字识别
    对图片中的文字进行检测和识别,支持中、英、法、俄、西、葡、德、意、日、韩、中英混合等多语种识别,同时支持中、英、日、韩四语种的类型检测
    高精度版
    在通用文字识别的基础上,提供更高精度的识别服务,并将字库从1w+扩展到2w+,能识别所有常用字和大部分生僻字
    含位置信息版
    在通用文字识别的基础上,返回文字在图片中的位置信息,方便用户进行版式的二次处理
    高精度含位置版
    在通用文字识别(高精度版)的基础上,返回文字在图片中的位置信息,方便用户进行版式的二次处理

    2.平台接入

    具体接入方式比较简单,可以参考我的另一个帖子,这里就不重复了:
    http://ai.baidu.com/forum/topic/show/943327

    3.调用攻略(Python3)及评测

    3.1首先认证授权:

    在开始调用任何API之前需要先进行认证授权,具体的说明请参考:

    http://ai.baidu.com/docs#/Auth/top

    具体Python3代码如下:

    # -*- coding: utf-8 -*-
    #!/usr/bin/env python
    
    import urllib
    import base64
    import json
    #client_id 为官网获取的AK, client_secret 为官网获取的SK
    client_id =【百度云应用的AK】
    client_secret =【百度云应用的SK】
    
    #获取token
    def get_token():
        host = 'https://aip.baidubce.com/oauth/2.0/token?grant_type=client_credentials&client_id=' + client_id + '&client_secret=' + client_secret
        request = urllib.request.Request(host)
        request.add_header('Content-Type', 'application/json; charset=UTF-8')
        response = urllib.request.urlopen(request)
        token_content = response.read()
        #print (token_content)
        if token_content:
            token_info = json.loads(token_content)
            token_key = token_info['access_token']
        return token_key

    3.2百度通用文字识别分析接口调用:

    详细说明请参考: https://ai.baidu.com/docs#/OCR-API-GeneralBasic/db0895e7

    说明的比较清晰,这里就不重复了。

    大家需要注意的是:
    API访问URL:https://aip.baidubce.com/rest/2.0/ocr/v1/general_basic
    图像数据,base64编码后进行urlencode,要求base64编码和urlencode后大小不超过4M,最短边至少15px,最长边最大4096px,支持jpg/jpeg/png/bmp格式

    返回示例:
    {
    "log_id": 2471272194,
    "words_result_num": 2,
    "words_result":
    [
    {"words": " TSINGTAO"},
    {"words": "青島睥酒"}
    ]
    }

    Python3调用代码如下:

    def general_basic(filename):
        request_url = "https://aip.baidubce.com/rest/2.0/ocr/v1/general_basic"
        
        # 二进制方式打开图片文件
        f = open(filename, 'rb')
        img = base64.b64encode(f.read())
        
        params = dict()
        params['image'] = img
        params = urllib.parse.urlencode(params).encode("utf-8")
        
        access_token = get_token()
        
        begin = time.perf_counter()
        request_url = request_url + "?access_token=" + access_token
        request = urllib.request.Request(url=request_url, data=params)
        request.add_header('Content-Type', 'application/x-www-form-urlencoded')
        response = urllib.request.urlopen(request)
        content = response.read()
        end = time.perf_counter()
    
        print('处理时长:'+'%.2f'%(end-begin)+'秒')
        
        if content:
            #print(content)
            content=content.decode('utf-8')
            #print(content)
            data = json.loads(content)
            print(data)
            words_result=data['words_result']
            print ("识别结果")
            for item in words_result:
                print (item['words'])  
    
    general_basic('../img/general3.jpg')

    4.功能评测:
    选用不同的数据对效果进行测试,具体效果如下(以下例子均来自网上):

    处理时长:0.89秒
    利洗手间
    Toile

    处理时长:0.63秒
    POSTCARD


    处理时长:13.07秒
    识别结果:
    ACKNOWLEDGEMENTS
    We would like to thank all the designers and
    contributors who have been involved in the
    production of this book; their contributions
    have been indispensable to its creation. We
    would also like to express our gratitude to all
    the producers for their invaluable opinions
    and assistance throughout this project And to
    the many others whose names are not credited
    but have made specific input in this book, we
    thank you for your continuous support

     


    5.测试结论和建议

    测试下来,整体识别效果不错。百度通用文字识别的很准确,速度也很快,用起来非常的方便。可以应用于
    拍照/截图识别
    使用通用文字识别技术,实现拍照文字识别、相册图片文字识别和截图文字识别,可应用于搜索、书摘、笔记、翻译等移动应用中,方便用户进行文本的提取或录入,有效提升产品易用性和用户使用体验
    内容审核与监管
    使用通用文字识别技术,实现对图像中文字内容的提取,结合文本审核技术识别违规内容,提示相应风险,协助进行违规处理,可应用于电商广告审核、舆情监管等场景,帮助用户有效规避业务风险
    视频内容分析
    使用通用文字识别技术,实现对视频中的字幕、标题、弹幕等文字内容的检测和识别,并根据文字位置判断文字类型,可应用于视频分类和标签提取、视频内容审核、营销分析等场景,有效降低人力成本,控制业务风险
    纸质文档电子化
    使用通用文字识别技术,实现对各类医疗单据、金融财税票据、法律卷宗等纸质文档的识别,并返回文字在图片中的位置信息以便于进行比对、结构化等处理,可满足医疗、金融、政务、法务、教育等行业文档快速录入、存档和检索的需求,有效降低企业人力成本,提高信息录入效率

     

    展开全文
  • 首先来看一下识别的效果:这里需要完整代码以及SDK的请点击此处下载:百度文字识别OCR-通用文字识别 首先需要注册百度账号并且创建对应的应用,这里具体方法如图: 访问:http://ai.baidu.com/ 点击控制台 ...

    首先来看一下识别的效果:这里需要完整代码以及SDK的请点击此处下载:百度文字识别OCR-通用文字识别

    首先需要注册百度账号并且创建对应的应用,这里具体方法如图:

    访问:http://ai.baidu.com/  点击控制台

    登录后创建应用:

     此处注意:图像处理中的各项功能共用的是一个SDK包,只是不同功能实现的时候使用的函数以及返回参数不同,点击完创建应用后就可以生成三个我们后期识别过程中必须使用的参数:AppID,API Key和secert key,这里我们可以点击查看应用详情来获取

     

     

     

     

    至此,前期的准备工作就完成了,这时我们通过Pip或者官网直接下载SDK包,pip下载指令为:

    这里支持Python版本:2.7.+ ,3.+

    如果已安装pip,执行pip install baidu-aip即可。
    如果已安装setuptools,执行python setup.py install即可。

    接下来,在下载的SDK文档下新建Python文件,当然你也可以使用导入包的模式:

    然后创建一个AipOcr(亦可以简单的理解为一个和百度的一个连接),这里代码为:

    from aip import AipOcr
    
    """ 你的 APPID AK SK """
    APP_ID = '你的 App ID'
    API_KEY = '你的 Api Key'
    SECRET_KEY = '你的 Secret Key'
    
    client = AipOcr(APP_ID, API_KEY, SECRET_KEY)

    完成上述工作后我们就可以正式进入到文字识别的实现过程了,具体的官方代码为:

    """ 读取图片 """
    def get_file_content(filePath):
        with open(filePath, 'rb') as fp:
            return fp.read()
    
    image = get_file_content('example.jpg')
    
    """ 调用通用文字识别, 图片参数为本地图片 """
    client.basicGeneral(image);
    
    """ 如果有可选参数 """
    options = {}
    options["language_type"] = "CHN_ENG"
    options["detect_direction"] = "true"
    options["detect_language"] = "true"
    options["probability"] = "true"
    
    """ 带参数调用通用文字识别, 图片参数为本地图片 """
    client.basicGeneral(image, options)
    
    url = "http//www.x.com/sample.jpg"
    
    """ 调用通用文字识别, 图片参数为远程url图片 """
    client.basicGeneralUrl(url);
    
    """ 如果有可选参数 """
    options = {}
    options["language_type"] = "CHN_ENG"
    options["detect_direction"] = "true"
    options["detect_language"] = "true"
    options["probability"] = "true"
    
    """ 带参数调用通用文字识别, 图片参数为远程url图片 """
    client.basicGeneralUrl(url, options)

    注意:这里的一些请求参数的具体含义为:

    参数名称 是否必选 类型 可选值范围 默认值 说明
    image string     图像数据,base64编码,要求base64编码后大小不超过4M,最短边至少15px,最长边最大4096px,支持jpg/png/bmp格式
    url string     图片完整URL,URL长度不超过1024字节,URL对应的图片base64编码后大小不超过4M,最短边至少15px,最长边最大4096px,支持jpg/png/bmp格式,当image字段存在时url字段失效
    language_type string CHN_ENG
    ENG
    POR
    FRE
    GER
    ITA
    SPA
    RUS
    JAP
    KOR
    CHN_ENG 识别语言类型,默认为CHN_ENG。可选值包括:
    - CHN_ENG:中英文混合;
    - ENG:英文;
    - POR:葡萄牙语;
    - FRE:法语;
    - GER:德语;
    - ITA:意大利语;
    - SPA:西班牙语;
    - RUS:俄语;
    - JAP:日语;
    - KOR:韩语;
    detect_direction string true
    false
    false 是否检测图像朝向,默认不检测,即:false。朝向是指输入图像是正常方向、逆时针旋转90/180/270度。可选值包括:
    - true:检测朝向;
    - false:不检测朝向。
    detect_language string true
    false
    false 是否检测语言,默认不检测。当前支持(中文、英语、日语、韩语)
    probability string true
    false
      是否返回识别结果中每一行的置信度

    在这里,博主在原有代码的基础上还将返回的具体数值写入文件以方便后期的处理,具体实现的完整代码为:

    from aip import AipOcr
    import json
    
    """ 你的 APPID AK SK """
    APP_ID = ''
    API_KEY = ''
    SECRET_KEY = ' '
    
    client = AipOcr(APP_ID, API_KEY, SECRET_KEY)
    
    """ 读取图片 """
    def get_file_content(filePath):
        with open(filePath, 'rb') as fp:
            return fp.read()
    image = get_file_content('ocr2.jpg')
    
    """ 如果有可选参数 """
    options = {}
    """ 识别语言类型 """
    options["language_type"] = "CHN_ENG"
    """ 检测图片朝向 """
    options["detect_direction"] = "false"
    """ 检测语言 """
    options["detect_language"] = "false"
    """ 置信度 """
    options["probability"] = "false"
    
    """ 带参数调用通用文字识别, 图片参数为本地图片 """
    result=client.basicGeneral(image, options)
    print(result)
    result_txt=json.dumps(result,ensure_ascii=False)
    file = open('result.ini', 'w')  # 打开文件
    file.write(result_txt)  # 写入
    file.close()

     

    展开全文
  • 百度通用文字识别——识别验证码

    千次阅读 2020-07-09 22:56:01
    百度ai提供了识别通用文字的API接口,可以利用该接口识别登陆网站时需要进行识别的验证码。 一、注册账号 登陆百度ai,打开控制台打开,并选择文字识别。 接口每天有5万次免费调用的权限,个人开发测试是足够的。 ...
  • 百度大脑AI小程序之通用文字识别

    千次阅读 2019-12-25 18:58:11
    AI小程序之通用文字识别 作者:wangwei8638 用户向服务请求识别某张图中的所有文字。本文主要介绍通用文字识别的小程序功能实现。 想了解微信小程序的开发过程,请参看我之前的帖子:《UNIT接入小程序》...
  • Android 使用百度云文字识别之实现通用文字识别

    千次阅读 多人点赞 2018-08-29 09:49:07
    今天给小伙伴们带来的是如何使用百度云api实现文字识别功能。 先上截图 首界面,demo比较简单 拍照 识别图片内容 这就是整个demo的运行效果。 接下来我们看下项目结构,比较简单整洁 接下来我大致...
  • 0、首先进入百度AI开放平台,选择通用文字识别,这个时候你需要登录,登录之后,选择创建应用。 创建一个新应用 创建好之后,进入新创建的应用中,你可以看到应用的AppID和API Key 识别有两种方法,方法...
  • escape() 常用于对js字符串进行编码 encodeURI() 常用于对URI跳转进行编码 ...在使用百度ai进行通用文字识别时,发送image=<base64编码>这种格式时,请求api可能会返回image format error的问题,很有可能是编...
  • 1.通用文字识别:http://api.wjsou.com/indexBASE.php?pictureurl=你的图片路径 示例 发送:http://api.wjsou.com/indexBASE.php?pictureurl=http://6.wjsou.com/uploads/1587797636418.jpeg 返回:{"log_id": ...
  • 由于公司的产品中用了百度AI开发平台中的一系列技术,所以我也尝试了一下百度的通用文字识别功能 我选择的图片 继承了百度提供的jar包之后,进行编码测试,我这里使用的是本地图片,百度还提供了远程图片的识别...
  • 三十行代码教你做个通用文字识别程序准备开始编程测试 准备 在开始敲代码前,我们先做一些准备。我们的这个通用文字识别程序的原理很简单,就是通过API调用百度智能云提供的免费的通用文字识别(标准版)。 如果你...
  • 1.百度云通用文字识别,首先注册百度云账号,创建应用  2.创建完应用后能够查看自己的 OK, 可以用我写的代码识别图片了   package com.teamdev.jxbrowser.chromium.demo.京东.根据店铺名称搜索商品数据; ...
  • 安装对应的库以及寻找技术文档的内容可以查看我的上一篇文章,这篇文章我们...通用文字识别调用给出的示例(从技术文档中可以找到): { "log_id": 2471272194, "words_result_num": 2, "words_result": [ {"words":
  • 通用文字识别另类使用】进行图像修复 作者:756665228 OCR的另类使用。你相信OCR可以进行图片修复吗?不管信不信。反正小帅是这样做了一个案例。 接下来就紧跟步伐看小帅是如何实现这样的功能吧 实现步骤 Step1:...
  • 首先对比一下各厂商开放接口免费额度: 阿里云OCR:自购买起500次/年,过期作废。超过另计算 腾讯云OCR:1000次/月。超过另计算 百度云OCR:各种场景几十到几万次/天。...-- 百度云OCR文字识别...
  • OCR文字识别 使用场景: 对于电商中的分销机制,是需要用户上传身份证或者银行卡的,由于身份证号码(18位/15位),银行卡(19位/17位/16位),位数较多,在用户输入时,有些繁琐。 以支付宝绑定银行卡为例,可以...
  • 之前用251张12306的关键字/question图片训练tesseract OCR,训练结果惨不忍睹,想进一步提高训练...百度通用文字识别可以先试用,就是可以从本地上传图片,检验是否真的能够识别成功。我用八张12306的关键字/quest...
  • 通用文字识别demo 打开DevEco->SDK & Dev Tools 搜索通用文字识别-》点击进去 下载demo 下载后的文件名为 HiAiOCR.zip ,解压后导入到Android Studio中 关闭当前项目 找到解压的demo, 选中...
  • 京东云OCR文字识别 在网上看的京东云人工智能挺多技术的,这里记录下,留作今后学习使用! 引入京东云人工智能的依赖 <dependency> <groupId>com.jdcloud.apigateway</groupId> <artifactId>...
  • 首先你需要登录百度AI,选择文字识别,创建一个应用,会生成 应用名称、AppID、API Key、Secret Key 这些东西,下面我们代码是需要用到API_Key 和 Secret_Key 生成access_token。 python代码: # encoding: utf-8 ...
  • 在管理中心页面中,找到文字识别的选项 找到创建应用的选项,进行ocr项目的创建 需要输入应用的名称 输入应用的描述,文字识别的报名选择不需要,然后点击立即创建 创建完成之后,返回到应用列表 查看相关...
  • 1.调用百度AI通用文字识别OCR接口 2.图像识别算法 二、实现方案与步骤: 1.得到验证码的图片的坐标:先将验证码截图,然后再对整个电脑屏幕截图,通过大图找小图的方法,计算出小图在大图中的坐标,从而得到验证码的...
  • """ 带参数调用通用文字识别, 图片参数为本地图片 """ client.basicGeneral(image, options) 远程通用文字识别,传入图片网络路径 url = "https//www.x.com/sample.jpg" """ 调用通用文字识别, 图片参数为远程...
  • 现在百度AI可以调用图像识别,有一些免费的可以玩一下。地址 1.需要的库 import base64 import urllib from typing import BinaryIO from urllib.parse import urlencode from urllib import request import ...
  • base64图片 资源 去掉 ‘data:image/jpg;base64,’; 且 本人使用的是jpg图片,不需要进行urlencode
  • 利用百度AI开放平台的API对于本地图片识别图片上的文字,首先在百度云-管理中心登录百度账号,创建应用获取API Key和Secret Key,因为调用API时必须在URL中带上accesss_token参数,这两个Key是要获取accesss_token的...

空空如也

空空如也

1 2 3 4 5 ... 20
收藏数 52,153
精华内容 20,861
关键字:

通用文字识别