精华内容
下载资源
问答
  • C#OCR图像识别技术

    2021-02-22 22:56:57
    C#OCR图像识别技术
  • MATLAB OCR图像识别技术的发票识别系统一、摘要本发明涉及了一种基于OCR图像识别技术的发票采集管理系统及方法,该系统的发票信息采集单元采集发票图片信息数据,OCR图像识别单元基于OCR图像识别技术并结合人工智能...

    MATLAB OCR图像识别技术的发票识别系统

    一、摘要

    本发明涉及了一种基于OCR图像识别技术的发票采集管理系统及方法,该系统的发票信息采集单元采集发票图片信息数据,OCR图像识别单元基于OCR图像识别技术并结合人工智能深度学习算法对发票图片信息数据进行识别读取以获得OCR图像识别结果,发票信息验证处理单元对OCR图像识别结果的发票类型进行鉴别并在鉴别结果为增值税发票时自动调用税务局增值税发票真伪查验平台进行真伪查验,发票信息存储管理单元存储鉴别结果为非增值税发票的OCR图像识别结果同时将查验结果为真的增值税发票的OCR图像识别结果进行重复归集核查后进行相应存储,发票信息分类展示单元对发票信息数据进行分类展示处理,综合地实现发票信息数据的采集、识别、查验、处理与存储的全过程。


    二、算法流程




    v2-2bc0e1a59608f824250c88bc14d02458_b.jpg

    展开全文
  • OCR图像识别技术源码内有说明
  • C#OCR图像识别技术.rar

    2021-08-06 18:37:32
    OCR,图像识别
  • OCR图像识别技术源码内有说明由于jar中无法包含libs本地so,所分开了。 直接导入jar包,并把libs目录拷进项目即可使用。
  • 一种基于OCR图像识别技术的发票采集管理系统及方法方法:MATLAB摘要本发明涉及了一种基于OCR图像识别技术的发票采集管理系统及方法,该系统的发票信息采集单元采集发票图片信息数据,OCR图像识别单元基于OCR图像识别...

    一种基于OCR图像识别技术的发票采集管理系统及方法

    方法:MATLAB


    v2-2bc0e1a59608f824250c88bc14d02458_b.jpg

    摘要

    本发明涉及了一种基于OCR图像识别技术的发票采集管理系统及方法,该系统的发票信息采集单元采集发票图片信息数据,OCR图像识别单元基于OCR图像识别技术并结合人工智能深度学习算法对发票图片信息数据进行识别读取以获得OCR图像识别结果,发票信息验证处理单元对OCR图像识别结果的发票类型进行鉴别并在鉴别结果为增值税发票时自动调用税务局增值税发票真伪查验平台进行真伪查验,发票信息存储管理单元存储鉴别结果为非增值税发票的OCR图像识别结果同时将查验结果为真的增值税发票的OCR图像识别结果进行重复归集核查后进行相应存储,发票信息分类展示单元对发票信息数据进行分类展示处理,综合地实现发票信息数据的采集、识别、查验、处理与存储的全过程。

    1 .一种基于OCR图像识别技术的发票采集管理系统,其特征在于,包括依次连接的发票信息采集单元、OCR图像识别单元、发票信息验证处理单元、发票信息存储管理单元和发票信息分类展示单元,所述发票信息采集单元采集发票图片信息数据,所述OCR图像识别单元基于OCR图像识别技术并结合人工智能深度学习算法对所述发票图片信息数据进行识别读取以获得OCR图像识别结果,所述发票信息验证处理单元对所述OCR图像识别结果的发票类型进行鉴别并在鉴别结果为增值税发票时自动调用税务局增值税发票真伪查验平台进行真伪查验,所述发票信息存储管理单元存储鉴别结果为非增值税发票的OCR图像识别结果同时将查验结果为真的增值税发票的OCR图像识别结果进行重复归集核查后进行相应存储,所述发票信息分类展示单元对所述发票信息存储管理单元存储的发票信息数据进行分类展示处理。

    1. .根据权利要求1所述的基于OCR图像识别技术的发票采集管理系统,其特征在于,所

    述发票信息验证处理单元包括互相连接的发票类型鉴定模块和发票信息查验模块,所述发票类型鉴定模块连接在所述OCR图像识别单元和所述发票信息存储管理单元之间,所述发票信息查验模块一端远程连接至税务局增值税发票真伪查验平台同时另一端与所述发票信息存储管理单元相连,所述发票类型鉴定模块对所述OCR图像识别结果的发票类型进行鉴别并在鉴别结果为非增值税发票时发送至发票信息存储管理单元存储,在鉴别为增值税发票时发送至发票信息查验模块,所述发票信息查验模块在所述发票类型鉴定模块的鉴别结果为增值税发票时自动调用税务局增值税发票真伪查验平台进行真伪查验并在查验为真时发送至发票信息存储管理单元进行重复归集核查和相应存储。

    1. .根据权利要求2所述的基于OCR图像识别技术的发票采集管理系统,其特征在于,所述发票信息存储管理单元包括相互连接的发票信息重复归集核查模块和发票信息数据库, 所述发票信息重复归集核查模块与发票信息查验模块相连,所述发票信息数据库连接于所述发票类型鉴定模块和所述发票信息分类展示单元之间,发票信息重复归集核查模块接收查验结果为真的增值税发票的OCR图像识别结果进行重复归集核查,所述发票信息数据库接收鉴别结果为非增值税发票的OCR图像识别结果直接进行存储同时接收重复归集核查结果为未重复的增值税发票的OCR图像识别结果进行存储。

    4 .根据权利要求1-3之一所述的基于OCR图像识别技术的发票采集管理系统,其特征在于,所述OCR图像识别单元结合卷积神经网络深度学习算法、循环神经网络深度学习算法以及时序分类算法对发票图片信息数据进行识别读取以获得OCR图像识别结果。

    1. .根据权利要求4所述的基于OCR图像识别技术的发票采集管理系统,其特征在于, 所述OCR图像识别结果为json格式的结构化信息数据。
    2. .根据权利要求5所述的基于OCR图像识别技术的发票采集管理系统,其特征在于, 所述发票类型鉴定模块基于发票代码和/或发票号码并结合税务局官方的发票类型判断规则对所述OCR图像识别结果的发票类型进行鉴别。

    7 .根据权利要求6所述的基于OCR图像识别技术的发票采集管理系统,其特征在于,所述发票信息采集单元包括但不限于基于移动端和/或PC端通过拍照上传、相册上传以及图库上传的方式进行发票信息采集。

    1. .一种基于OCR图像识别技术的发票采集管理方法,其特征在于,所述方法在采集发票图片信息数据后利用OCR图像识别技术结合人工智能深度学习算法对所述发票图片信息数


    据进行识别读取以获得OCR图像识别结果,再对所述OCR图像识别结果的发票类型进行鉴别,在鉴别结果为增值税发票时自动调用税务局增值税发票真伪查验平台进行真伪查验, 当查验结果为真时再对相应的增值税发票的OCR图像识别结果进行重复归集核查,并在核查结果为未重复时将OCR图像识别结果进行相应存储;或,在鉴别结果为非增值税发票时, 对非增值税发票的OCR图像识别结果直接进行存储;然后对发票信息数据进行分类展示处理。

    1. .根据权利要求8所述的基于OCR图像识别技术的发票采集管理方法,其特征在于, 所述方法在采集发票图片信息数据后利用OCR图像识别技术结合卷积神经网络深度学习算法、循环神经网络深度学习算法以及时序分类算法对发票图片信息数据进行识别读取以获得OCR图像识别结果。
    2. .根据权利要求8或9所述的基于OCR图像识别技术的发票采集管理方法,其特征在于,对所述OCR图像识别结果的发票类型进行鉴别具体为:基于发票代码和/或发票号码并结合税务局官方的发票类型判断规则对所述OCR图像识别结果的发票类型进行鉴别;

    和/或,所述采集发票图片信息数据包括但不限于基于移动端和/或PC端通过拍照上传、相册上传以及图库上传的方式。

    展开全文
  • Android高级应用源码-最全的OCR图像识别技术源码内有说明.zip
  • 最全的OCR图像识别技术源码内有说明,android源码,0分提供下载了
  • OCR图像识别技术的JAVA实现(一)

    万次阅读 2019-04-16 11:55:32
    OCR图像识别技术的JAVA实现 最近有个需求需要用图像识别,学习记录一下。 目前网络上的开源的图像识别技术有很多,例如 OCRE(OCR Easy)、Clara OCR、OCRAD、TESSERACT-OCR 等等,今天本blog将记录下tesseract-ocr的...

    转自:https://blog.csdn.net/weistin/article/details/78839804
     

    OCR图像识别技术的JAVA实现

    最近有个需求需要用图像识别,学习记录一下。
    目前网络上的开源的图像识别技术有很多,例如 OCRE(OCR Easy)Clara OCROCRADTESSERACT-OCR 等等,今天本blog将记录下tesseract-ocr的JAVA实现,后面会记录研究下Android的使用:

    • TESSERACT-OCR安装
    • 程序实现

    1、TESSERACT-OCR安装

    首先下载EXE安装包进行安装,我安装的版本是“tesseract-ocr-setup-3.05.01.exe”,建议直接安装在默认路径。安装完毕后,目录下:
    这里写图片描述

    其中,文件夹“tessdata”用于放置语言库。

    程序实现

    上一步已经安装好了TESSERACT-OCR,下面直接贴代码。

    核心代码 OCRHelper.java:

    package com.liping.test;
    
    
    import java.io.BufferedReader;
    import java.io.File;
    import java.io.FileInputStream;
    import java.io.InputStreamReader;
    import java.util.ArrayList;
    import java.util.List;
    
    /**
     * 图文识别帮助类
     *
     * @author Felix Li
     * @create 2017-12-19-9:12
     */
    public class OCRHelper {
    
        private final String LANG_OPTION = "-l";
        private final String EOL = System.getProperty("line.separator");
    
        /**
         *  Tesseract-OCR的安装路径
         */
        private String tessPath = "C://Program Files (x86)//Tesseract-OCR";
        //private String tessPath = new File("tesseract").getAbsolutePath();
    
        /**
         * @param imageFile   传入的图像文件
         * @param imageFormat 传入的图像格式
         * @return 识别后的字符串
         */
        public String recognizeText(File imageFile) throws Exception {
            /**
             * 设置输出文件的保存的文件目录
             */
            File outputFile = new File(imageFile.getParentFile(), "output");
    
            StringBuffer strB = new StringBuffer();
            List<String> cmd = new ArrayList<String>();
    
            cmd.add(tessPath + "\\tesseract");
    
            cmd.add("");
            cmd.add(outputFile.getName());
            cmd.add(LANG_OPTION);
            cmd.add("chi_sim");
            //cmd.add("eng");
    
            ProcessBuilder pb = new ProcessBuilder();
            /**
             *Sets this process builder's working directory.
             */
            pb.directory(imageFile.getParentFile());
            cmd.set(1, imageFile.getName());
            pb.command(cmd);
            pb.redirectErrorStream(true);
            long startTime = System.currentTimeMillis();
            System.out.println("开始时间:" + startTime);
            Process process = pb.start();
            // tesseract.exe 1.jpg 1 -l chi_sim
            //不习惯使用ProcessBuilder的,也可以使用Runtime,效果一致
            // Runtime.getRuntime().exec("tesseract.exe 1.jpg 1 -l chi_sim");
            /**
             * the exit value of the process. By convention, 0 indicates normal
             * termination.
             */
    //      System.out.println(cmd.toString());
            int w = process.waitFor();
            if (w == 0)// 0代表正常退出
            {
                BufferedReader in = new BufferedReader(new InputStreamReader(
                        new FileInputStream(outputFile.getAbsolutePath() + ".txt"),
                        "UTF-8"));
                String str;
    
                while ((str = in.readLine()) != null) {
                    strB.append(str).append(EOL);
                }
                in.close();
    
                long endTime = System.currentTimeMillis();
                System.out.println("结束时间:" + endTime);
                System.out.println("耗时:" + (endTime - startTime) + "毫秒");
            } else {
                String msg;
                switch (w) {
                    case 1:
                        msg = "Errors accessing files. There may be spaces in your image's filename.";
                        break;
                    case 29:
                        msg = "Cannot recognize the image or its selected region.";
                        break;
                    case 31:
                        msg = "Unsupported image format.";
                        break;
                    default:
                        msg = "Errors occurred.";
                }
                throw new RuntimeException(msg);
            }
            new File(outputFile.getAbsolutePath() + ".txt").delete();
            return strB.toString().replaceAll("\\s*", "");
        }
    }
    

    测试类Test.java:

    package com.liping.test;
    
    import java.io.File;
    import java.io.IOException;
    
    /**
     * 测试主类
     *
     * @author Felix Li
     * @create 2017-12-19-9:17
     */
    public class Test {
    
        public static void main(String[] args) {
            try {
                //图片文件:此图片是需要被识别的图片 
                File file = new File("C://Program Files (x86)//Tesseract-OCR//shouye.png");
                String recognizeText = new OCRHelper().recognizeText(file);
                System.out.print(recognizeText + "\t");
    
            } catch (IOException e) {
                e.printStackTrace();
            } catch (Exception e) {
                e.printStackTrace();
            }
        }
    
    
    }
    
    

    以上就是TESSERACT-OCR的JAVA使用。

    注意事项
    图片读出来有的字符可能会乱码,这是由于识别语言库的原因,可以训练语言库,来提升识别准确率与识别速度,这个以后再讲。
    有问题的欢迎留言讨论!

    展开全文
  • 上一篇blog介绍了JAVA使用OCR图像识别技术中TESSERACT-OCR。其本质就是用我们的Java使用cmd命令来调用TESSERACT-OCR的客户端,这里就必须在电脑上安装TESSERACT-OCR,但在实际使用上,感觉很不方便,接下来介绍的...

    上一篇blog介绍了JAVA使用OCR图像识别技术中TESSERACT-OCR。其本质就是用我们的Java使用cmd命令来调用TESSERACT-OCR的客户端,这里就必须在电脑上安装TESSERACT-OCR,但在实际使用上,感觉很不方便,接下来介绍的Tess4J就主要是针对Java封装的API,就不再需要安装TESSERACT-OCR。

    一. 下载Tess4J相关Jar包和源码

    http://download.csdn.net/download/weistin/10166503
    目前最新版本为Tess4J-3.4.2-src。
    下载完成后,解压:
    这里写图片描述
    二. Tess4j的使用
    1. 新建一个JAVA 项目,项目中新建lib文件夹,tessdata文件夹(用于存放OCR语言库文件,默认只有英文包,其他语言包或训练包需要自行下载)。
    2. 将上图中的lib文件夹的文件全部拷入到刚刚新建项目的lib文件夹里。
    3. 将Tess4J-3.4.2-src/Tess4J/dist下的tess4j-3.4.2.jar放入lib文件夹下。
    这里写图片描述
    4. 将添加进的jar加入到项目的build path中。jar包结果如下:
    这里写图片描述
    5. 项目结构:
    这里写图片描述

    1. tess4J的使用
      tess4J代码很简单,核心代码短短数句:
    package com.liping.test;
    
    import net.sourceforge.tess4j.ITesseract;
    import net.sourceforge.tess4j.Tesseract;
    import net.sourceforge.tess4j.TesseractException;
    import net.sourceforge.tess4j.util.LoadLibs;
    
    import java.io.File;
    import java.io.IOException;
    
    /**
     * Tess4J测试类
     *
     * @author Felix Li
     * @create 2017-12-20-11:38
     */
    public class Tess4JTest {
    
        public static void main(String[] args){
    
            File file = new File("C://Program Files (x86)//Tesseract-OCR//shouye.png");
            ITesseract instance = new Tesseract();
    
            /**
             *  获取项目根路径,例如: D:\IDEAWorkSpace\tess4J
             */
            File directory = new File("");// 参数为空
            String courseFile = null;
            try {
                courseFile = directory.getCanonicalPath();
            } catch (IOException e) {
                e.printStackTrace();
            }
    
            //Set the tessdata path
            instance.setDatapath(courseFile + "\\tessdata");
    
            instance.setLanguage("chi_sim");//chi_sim :简体中文, eng
            String result = null;
            try {
                long startTime = System.currentTimeMillis();
                 result =  instance.doOCR(file);
                long endTime = System.currentTimeMillis();
                System.out.println("Time is:" + (endTime - startTime) + " 毫秒");
            } catch (TesseractException e) {
                e.printStackTrace();
            }
            System.out.println("result: " + result);
        }
    
    }
    

    三. 异常处理
    1. Exception in thread “main” java.lang.UnsatisfiedLinkError: 找不到指定模块
    这个异常是 JNI load本地.dll文件时未找到而抛出的异常,
    处理方法:将gsdll64.dll和libtesseract3051.dll拷贝到 C:/WINDOWS/system32/下
    demo源码

    展开全文
  • 图像识别技术 用到的工具:tesseract-ocr-setup-3.02.02.exe 安装好使用该程序: 点击Console,进入如下页面: 不过试验了多次,发现下面的图片可以很容易的识别 类似下面的这种,识别却得不出结果 本人...
  • OCR图像识别

    2015-01-13 12:47:45
    图像字符识别(android OCR),最全的OCR图像识别技术源码内有说明
  • Java OCR 图像智能字符识别技术,可识别中文

    万次下载 热门讨论 2012-02-08 09:58:34
    Java OCR 图像智能字符识别技术,可识别中文。具体详见:http://blog.csdn.net/white__cat/article/details/38461449
  • 本文将结合笔者多次智能图像识别产品、OCR识别项目开发经历,从工程技术角度对这一流程进行总结和介绍 明确识别任务 在项目开发之前,要明确产品需求,即识别任务到底是什么。 例如在做身份证信息识别之前,需要沟通...
  • 比较全面的OCR图像识别技术 ,源码内有说明 。 可以拿过来直接用。
  • office的ocr图像识别文字,能解压出来相应代码,不过需要做技术的才能看懂,因为编译不过。保留备份。
  • OCR图像识别算法行业应用分析 胡丰 袋鼠云高级算法专家 AICUG人工智能技术沙龙杭州站 技术交流QQ群658928282 C 背景概述 O N T E 分析方法 N T 目S 行业应用场景分析 录 难点分析 袋鼠云案例-医院费用清单识别 AICUG...
  • OCR-图像识别

    千次阅读 2019-09-04 16:20:35
    人工智能---OCR图像识别OCR-图像识别 OCR-图像识别 图像识别,是指利用计算机对图像进行处理、分析和理解,以识别各种不同模式的目标和对像的技术。一般工业使用中,采用工业相机拍摄图片,然后再利用软件根据图片...
  • Tesseract——OCR图像识别 入门篇 最近给了我一个任务,让我研究图像识别,从我们项目的screenshot中识别文字信息,so我开始了学习,与大家分享下。 我看到目前OCR技术有很多,最主要的是Asprise OCR,Tesseract...
  • 随着市场的扩大,带给各大4S店和汽修厂的工作量也不断加大,人工成本不断上升,同时竞争不断加剧,在这种市场情况下,一种新技术的诞生,给广大汽车后市场的工作人员带来了福音,它就是OCR图像识别技术,衍生的车牌...

空空如也

空空如也

1 2 3 4 5 ... 20
收藏数 11,989
精华内容 4,795
关键字:

ocr图像识别技术