精华内容
下载资源
问答
  • 适合需要检查关键词的人群,有关键词则返回文字...里面有专门的配置文件且关键词支持正则表达式,其中有pdf,图片识别开关以前关键词配置。这个版本适合不联网的使用,如果需要连外网则是另外一个版本,以后再写一个。
  • 识别图片上的文字 相关依赖与工具类 识别效果 目标 根据给定的坐标,在屏幕上截图并保存到指定的目录下; 识别图片中的文字。 概述 利用JDK自带的方法实现截图功能; 利用百度SDK实现文字识别功能。 代码 ...

    目录

    目标

    概述

    代码

    根据坐标截图

    截图效果

    识别图片上的文字

    相关依赖与工具类

    识别效果


    目标

    1. 根据给定的坐标,在屏幕上截图并保存到指定的目录下;
    2. 识别图片中的文字。

    概述

    1. 利用JDK自带的方法实现截图功能;
    2. 利用百度SDK实现文字识别功能。

    代码

    根据坐标截图

    package com.ctx.utils;
    
    import javax.imageio.ImageIO;
    import java.awt.*;
    import java.awt.image.BufferedImage;
    import java.io.File;
    import java.io.IOException;
    
    /**
     * @describe 截图工具类
     */
    public class Img {
    
        //图片存放目录
        public static final String BUFFER_IMAGE_AREA="C:\\Users\\Administrator\\Desktop\\sw_image\\";
    
        public static void main(String[] args) throws IOException, AWTException {
            //{左上角的横坐标,左上角的纵坐标,右下角的横坐标,右下角的纵坐标}
            int[] area={0,0,200,200};
            createScreen(area,"test.png");
        }
    
        /**
         *
         * @param area 截图区域,即给定的截图范围:{左上角的横坐标,左上角的纵坐标,右下角的横坐标,右下角的纵坐标}
         * @param imageName 给截取的图片命名
         * @return
         * @throws AWTException
         * @throws IOException
         */
        public static String createScreen(int[] area,String imageName)throws AWTException, IOException {
            Dimension screen = null;    //电脑屏幕大小
            Rectangle screenRect = null;//截图的宽高
            BufferedImage image = null; //暂存图片的缓存
            Robot robot = null;         //负责截屏的操作者
            screen = Toolkit.getDefaultToolkit().getScreenSize();
            //截图尺寸
            screen.height=area[3]-area[1];
            screen.width=area[2]-area[0];
            screenRect = new Rectangle(screen);
            //左上角得坐标
            screenRect.x=area[0];
            screenRect.y=area[1];
            robot = new Robot();
            //将得到的屏幕信息存放在缓存里面
            image = robot.createScreenCapture(screenRect);
            //将缓存里面的屏幕信息以图片的格式存在制定的磁盘位置
            ImageIO.write(image, getFileSuffix(imageName), new File(BUFFER_IMAGE_AREA, imageName));
            return BUFFER_IMAGE_AREA+imageName;
        }
    
        public static String getFileSuffix(String path){
            String[] split = path.split("\\.");
            return split[split.length-1];
        }
    }
    

    截图效果


    识别图片上的文字

    相关依赖与工具类

            <dependency>
                <groupId>com.baidu.aip</groupId>
                <artifactId>java-sdk</artifactId>
                <version>4.8.0</version>
            </dependency>
    package com.ctx.utils;
    
    import com.baidu.aip.ocr.AipOcr;
    import org.json.JSONArray;
    import org.json.JSONObject;
    
    import java.awt.*;
    import java.io.IOException;
    import java.util.HashMap;
    
    /**
     * @describe 识别图片上的文字
     * 官方文档:https://ai.baidu.com/ai-doc/OCR/Ikibizxql
     */
    public class Word {
        // 设置APPID/AK/SK
        public static final String appId = "你的 App ID";
        public static final String apiKey = "你的 Api Key";
        public static final String secretKey = "你的 Api Key";
        public static final AipOcr client = new AipOcr(appId, apiKey, secretKey);
    
        /*
         * 文字识别方法
         */
        public static String imgOcr(String imgpath)
        {
            // 传入可选参数调用接口
            HashMap<String, String> options = new HashMap<String, String>();
            options.put("language_type", "CHN_ENG");
            options.put("detect_direction", "true");
            options.put("detect_language", "true");
            options.put("probability", "true");
            // 参数为本地路径
            JSONObject res = client.basicGeneral(imgpath, options);
            //解析json
            JSONArray wordsResult = (JSONArray)res.get("words_result");
            String ocrStr = "\n";
            StringBuffer sb=new StringBuffer();
            for(Object obj : wordsResult)
            {
                JSONObject jo = (JSONObject)obj;
                sb.append(jo.getString("words") + "\n");
            }
            return sb.toString();
        }
    
        public static void main(String[] args) throws AWTException, IOException {
            String s = Word.imgOcr("C:\\Users\\Administrator\\Desktop\\sw_image\\a.png");
            System.out.println(s);
        }
    }
    

    识别效果

     

    展开全文
  • PDF转为Word一直是实际生活中需要面对解决的问题,尝试过多种方法之后,自己进行总结分析 常见PDF分为两种,一种是Word转成PDF的,一种是扫描的PDF。 针对Word转成的pdf ,可使用的工具很多: 对于Word转的PDF,...

    PDF转为Word一直是实际生活中需要面对解决的问题,尝试过多种方法之后,自己进行总结分析

    常见PDF分为两种,一种是Word转成PDF的,一种是扫描的PDF。

    针对Word转成的pdf ,可使用的工具很多:

    对于Word转的PDF,进行Word转换:

    查询在线PDF转Word在知乎或者CSDN,会出现多种答案,常见的几个迅捷,超级PDF,small pdf等,很多在线的都可以实现,但有些缺点是明显,需要注册,手机号甚至有的还需要付费

    针对这种pdf ,一般可以考虑先使用Word或者Acrobat 的转Word功能,这种有时候可以事半功倍。

    对于扫描的PDF,进行Word转换:

    上述的绝大多数都是无法成功,转换出来的都是图片格式内容嵌在Word里,这种形式的Word没什么大用处

    针对这种形式的PDF可以考虑在线ORC功能的转换,在网上一顿操作猛如虎之后,发现有的需要注册,有的付费,不过总能发现可行的,免费,在线,直接下载

    亲自尝试可以实现如:https://web.baimiaoapp.com/pdf-to-word,识别结果还可以

    解决我的问题,如果有其他的好的ORC转换等工具,欢迎补充!

     

    展开全文
  • (给Python开发者加星标,提升Python技能)来源:ZackSock一、前言不知道大家有没有遇到过这样的问题,就是在某个软件或者某个网页...那么我们能不能直接识别图片中的文字呢?答案是肯定的。二、Tesseract文字识别是...

    (给Python开发者加星标,提升Python技能)

    来源:ZackSock

    一、前言

    不知道大家有没有遇到过这样的问题,就是在某个软件或者某个网页里面有一篇文章,你非常喜欢,但是不能复制。或者像百度文档一样,只能复制一部分,这个时候我们就会选择截图保存。但是当我们想用到里面的文字时,还是要一个字一个字打出来。那么我们能不能直接识别图片中的文字呢?答案是肯定的。

    二、Tesseract

    文字识别是ORC的一部分内容,ORC的意思是光学字符识别,通俗讲就是文字识别。Tesseract是一个用于文字识别的工具,我们结合Python使用可以很快的实现文字识别。但是在此之前我们需要完成一个繁琐的工作。

    (1)Tesseract的安装及配置

    Tesseract的安装我们可以移步到该网址 https://digi.bib.uni-mannheim.de/tesseract/,我们可以看到如下界面:

    0fdd47c0e77aa45885db6b5f4f3706dd.png

    有很多版本供大家选择,大家可以根据自己的需求选择。其中w32表示32位系统,w64表示64位系统,大家选择合适的版本即可,可能下载速度比较慢,大家可以选择链接:https://pan.baidu.com/s/1jKZe_ACLQCVXiCmvHj9adw 提取码:ayel下载。安装时我们需要知道我们安装的位置,将安装目录配置到系统path变量当中,我们路径是D:\CodeField\Tesseract-OCR

    14be0cd974d7c600022ee0032361055e.png

    我们右击我的电脑/此电脑->属性->高级系统设置->环境变量->Path->编辑->新建然后将我们的路径复制进去即可。添加好系统变量后后我们还需要依次点确定,这样才算配置好了。

    (2)下载语言包

    Tesseract默认是不支持中文的,如果想要识别中文或者其它语言需要下载相应的语言包,下载地址如下:https://tesseract-ocr.github.io/tessdoc/Data-Files ,进入网站后我们往下翻:

    74398555cd0dfbf381d19117ea084121.png

    其中有两个中文语言包,一个Chinese-Simplified和Chinese-Traditional,它们分别是简体中文和繁体中文,我们选择需要的下载即可。下载完成后我们需要放到Tesseract的路径下的tessdata目录下,我们路径是D:\CodeField\Tesseract-OCR\tessdata

    (3)其它模块下载

    除了上面的步骤,我们还需要下载两个模块:

    pip install pytesseract
    pip install pillow

    第一个是用于文字识别的,第二个是用于图片读取的。接下来我们就可以进行文字识别了。

    三、文字识别

    (1)单张图片识别

    接下来的操作就要简单的多,下面是我们要识别的图片:

    3a72d1f9c20ce26505411624d76721e9.png

    接下来就是我们文字识别的代码:

    import pytesseract

    识别结果如下:

    not go gentle into that good night!

    因为默认是支持英文的,所以我们可以直接识别,但是当我们要识别中文或其它语言时就需要做些修改:

    import pytesseract

    在识别时,我们设置lang='chi_sim',也就是把语言设置为简体中文,只有当你的tessdata目录下有简体中文包该设置才会生效。下面是我们用来识别的图片:

    1b0bbf16cda897fe81da1baf01cac3eb.png

    识别结果如下:

    不 要 温 顺 的 走 进 那 个 良 夜

    图片内容被准确识别出来了。有一点我们需要知道,在我们将语言设置为简体中文或其它语言后,Tesseract还是可以识别出英文字符。

    (2)批量图片识别

    既然我们把单张图片识别列出来了,就肯定还有批量图片识别这个功能,这就需要我们准备一个txt文件了,比如我有text.txt文件,内容如下:

    sentence1.jpg
    sentence2.jpg

    我们将代码修改为如下:

    import pytesseract

    但是这样自己写一个txt文件难免有些麻烦,因此我们又可以进行如下修改:

    import os

    这样我们只需要传入一个文字图片的根目录就可以批量进行识别了。在测试过程中发现,Tesseract对手写体、行楷等飘逸的字体识别不准确,对一些复杂的字识别也有待提升。但是宋体、印刷体等笔画严谨的字体识别准确率很高。另外如果图片的倾斜大于一定的角度,识别结果也会有很大差别。

    - EOF -

    推荐阅读   点击标题可跳转

    1、分分钟甩 Word 几条街,Python 编辑公式竟可以如此简单

    2、Python 为什么要有 pass 语句?

    3、Python 初学者进阶的九大技能

    觉得本文对你有帮助?请分享给更多人

    关注「Python开发者」加星标,提升Python技能

    042a4e16373cf970689497309be84e9e.png

    好文章,我在看❤️

    展开全文
  • pdfbox 提取 pdf 中图片文件以及读取pdf的文本信息,压缩包中包含必备jar包
  • java解析docx获取文字图片并识别图片准确位置需求简述功能模块版本1生成一个适合你的列表创建一个表格设定内容居中、居左、居右SmartyPants创建一个自定义列表如何创建一个注脚注释也是必不可少的KaTeX数学公式新的...
  • 经常需要识别图片文字的上班族都有方法,如何扫描识别图片中的文字?职场新手是不会的,上班族也可也学习一下,这里就教大家如何扫描识别文字。 1、首先要在百度或者下载站去搜索捷速OCR文字识别软件,熟悉操作后...
  • Java数组倒置 简单 Java图片加水印,支持旋转和透明度设置 摘要:Java源码,文件操作,图片水印 util实现Java图片水印添加功能,有添加图片水印和文字水印,可以设置水印位置,透明度、设置对线段锯齿状边缘处理、水印...
  • 调用百度云api,实现截图图片文字识别 相信大家在网上查找资料时都会遇到一些类似于pdf格式的文档,无法直接复制,手打太过于浪费时间。那么在这里我分享一个调用百度云api文字识别接口识别此类文字的python小程序。...
  • 是否有把图片上的文字转成可编辑的Word文字的方法呢? 目前OCR图片识别应用越来越广,很多转换工具都有了这个功能,我们可以根据日常使用习惯选择更合适的方法,一般常用的就是客户端转换器和在线网页转换,以下详细...
  • 解析如何把图片上面的文字转换成word 有没有小伙伴们为百度文库里面的资源下载需要下载券感到坑爹,特别是现下下载资源紧缺,各个网站配合网打的行动,导致很多优秀网站现在没法下载资源,尤其是新浪爱问共享资料,...
  • 基于 MATLAB 的图片文字的提取及识别摘要随着现代社会的发展,信息的形式和数量正在迅猛增长。其中很大一部分是图像,图像可以把事物生动地呈现在我们面前,让我们更直观地接受信息。同时,计算机已经作为一种人们...
  • Android 百度文字识别(详细步骤+源码)

    千次阅读 热门讨论 2020-11-20 17:58:43
    运行效果图 识别到的内容: {"words_result":[{"words":"突然间有想看书的冲动"},{"words":"eel"},{"words":"你...百度SDK文字识别一、创建平台应用二、创建及配置Android项目三、初始化四、UI模块导入五、UI模块使用
  • 本文将介绍通过Java来提取或读取Word文档中文本和图片的方法。这里提取文本和图片包括同时提取文档正文当中以及页眉、页脚中的的文本和图片。 使用工具:FreeSpire.Doc for Java (免费版) Jar文件导入方法(参考...
  • 下面就与大家分享一下有关图片文字识别并导出到Word中的方法。方法/步骤1对于图片文字内容的识别方法,我们可以借助OneNote等Office工具来实现,也可以通过如图所示的OCR文字识别工具来实现。通过百度搜索下...
  • 图片转公式再转到word或者wps里面

    千次阅读 2021-01-16 21:45:45
    第一步:将图片转为latex和mathml代码: ...进入之后,上传图片,转为相应的latex和mathml代码: 第二步:安装mathtype软件 软件下载链接: ...提取码:4nnv ...第四步:将公式复制到WPS或者Word中 第五步(转到w
  • 图片转为文字一般被称为光学文字识别(Optical Character Recognition,OCR),所谓 OCR 是图像识别领域中的一个子领域,该领域专注于对图片中的文字信息进行识别并转换成能被常规文本编辑器编辑的文本。...
  • 深度学习文字识别

    千次阅读 2019-09-29 17:16:18
    步骤: 文字识别是AI的一个重要应用场景,文字识别过程一般由...分类:文字识别可根据待识别文字特点采用不同的识别方法,一般分为定长文字、不定长文字两大类别。 定长文字(例如手写数字识别、验证码),由...
  • 关于中文的识别,效果比较好而且开源的应该就是Tesseract-OCR了,python 里面也有一个包去使用Tesseract-OCR。 这个包 叫pytesseract 。 安装pytesseract pip install pytesseract 除此之外还需要安装图像处理...
  • 今天,给大家分享橙子在实习的时候使用的利用Python和AIP对批量图片进行文字识别的小程序~ 我们有很多时候需要对批量的文件进行批量的操作。那么,问题来了。批量说简单很简单,重复性的动作嘛。说难,不如说烦,真...
  • ppt转word软件是全球首款可以将ppt里面文字图片放进word的软件,注意只能提取文字图片,如果是公式或者特殊文件比如声音,flash等是不支持的,由于ppt和word是完全不同的办公文档,所以转换不能保持PPT原来格式...
  • pytesser是谷歌OCR开源项目的一个模块,在python中导入这个模块即可将图片中的文字转换成文本。 链接:https://code.google.com/p/pytesser/ pytesser调用了tesseract。在python中调用pytesser模块...
  • OCR文字识别

    千次阅读 2019-05-29 21:28:31
    OCR定义和起源 OCR (Optical Character ...即,针对印刷体字符,采用光学的方式将纸质文档中的文字转换成为黑白点阵的图像文件,并通过识别软件将图像中的文字转换成文本格式,供文字处理软件进一步编辑加工的...
  • 由于文字具有高级语义特征,对图片内容的理解、索引、检索具有重要作用,因此,研究图片文字提取具有重要的实际意义。又由于静态图像文字提取是动态图像文字提取的基础,故着重介绍了静态图像文字提取技术。随着计算...
  • 文章目录1 混用的几个库1.1 模块一:rouge1.2 模块二:jieba_fast1.3 关键词查询组件:flashtext2 颜文字检测与识别2.1 颜文字检测2.2 颜文字实体分词3 新颜文字发现3.1 新颜文字发现3.2 颜文字属性识别
  • 图片文字识别的两种简便方法

    千次阅读 2014-07-10 23:30:33
    在日常工作中,经常会遇到想复制某段文字,但是却...怎么把ppt里面图片转成文字 为什么有的pdf文件没法复制 等等一些列类似的问题。 用 Adobe Acrobat Pro 和 CAJViewer 可以实现图片文字识别。 1.CAJView
  • 上一篇博客我实现了更新word模板里面文字内容,但是,产品经理又有了新的想法,觉得只有文字word文档看起来比较单调,需要穿插一些图片,师文字看起来更丰富多彩。 代码实现 模板的定义我们参考上一篇文章:...
  • Android端文字识别

    千次阅读 2019-11-11 13:46:20
    文字识别、网络图片文字识别、身份证识别、银行卡识别、驾驶证识别、行驶证识别、车牌识别、营业执照识别、护照识别、数字识别、二维码识别、名片识别、手写识别、速算识别。 其中速算识别是接入的讯飞开放平台的Web...

空空如也

空空如也

1 2 3 4 5 ... 20
收藏数 7,925
精华内容 3,170
关键字:

word识别图片里面文字