精华内容
下载资源
问答
  • 近日浏览网上一些图片提取文字的网站,觉得甚是有趣,花费半日也了个在线图片试别程序,完成了两个技术方案的选择,一是tesseract+python flask的方案实现,二是tesseract+spring web的技术解决方案,并简作论述,...

    摘要

           近日浏览网上一些图片提取文字的网站,觉得甚是有趣,花费半日也做了个在线图片识别程序,完成了两个技术方案的选择,一是tesseract+python flask的方案实现,二是tesseract+spring web的技术解决方案,并简作论述,与君共勉。

    一、tesseract-ocr介绍

           ocr含义是Optical Character Recognition,含义即视觉字符识别。而tesseract是该领域特别优秀开源的作品。官方的tesseract定义:OCR engine - libtesseract and a command line program - tesseract.
           即tesseract包括一个视觉字符识别引擎libtesseract和命令行程序tesseract。
    当前最新稳定版本是4.x.x基于LSTM,源码可从找到tesseract的GitHub: tesseract.找到。

    tesseract介绍

           关于tesseract的工作模式如上图所示。 假设现在有一个图片输入,整个执行流程为:
    1.输入(一张图片)
    2.有用信息提取(比如一个图片上只有一个字,那其他留白的是无用,这个字上每个色素是有效的并且相关)
    3.找出文字/线条
    4.字符分类集
    5.输入与分类集对比找出最接近的
    6.输出识别结果

    二、安装tesseract

           第一步下载
           下载合适的exe安装文件:
           网址:https://digi.bib.uni-mannheim.de/tesseract/,下载完成后后装即可

    tesseract安装
           第二步环境变量配置
           在path变量中加入tesseract-ocr的安装路径
    环境变量配置
           第三步安装成功检测
           使用tesseract指令,显示如下:
    命令行tesseract
           linux环境下载安装与上述类似

    在这里插入图片描述

           下载leptonica 和 tesseract两个包,解压安装,配置环境变量即可。网上很容易找到该安装包,或者留言找笔者。

    三、使用命令行

           1.tesseract + 图片路径 + 保存结果名 + -l 语言集
    示列: tesseract 1606150081.png 1606150081 -l chi_sim
           2.tesseract + 图片路径 +stdout -l +语言集
    示列: tesseract D:\company\ruigushop\spring-2s\test.png stdout -l chi_sim

    有了上述之后就可以完成web图片识别程序的开发啦,废话不多说,直接上代码。

    四、程序实现(Python)

    程序设计思路:


    上传图片 -> 保存 ->对上传的图片执行tesseract指令->获取识别结果


           只有二十多行代码就实现了,so easy,以后网上看到图片识别程序再也不会感觉神奇了吧!

    # coding=utf-8
    from flask import Flask, request
    import os
    import datetime
    import time
    
    app = Flask(__name__)
    
    
    def get_time_stamp():
        times = datetime.datetime.now().strftime('%Y-%m-%d %H:%M:%S')
        array = time.strptime(times, "%Y-%m-%d %H:%M:%S")
        time_stamp = int(time.mktime(array))
        return time_stamp
    
    
    @app.route('/image/extract', methods=['POST'])
    def pure_rec():
        file = request.files.get('file')
        ts = str(get_time_stamp())
        up_path = os.path.join(ts + file.filename)
        file.save(up_path)
        cmd = "tesseract "+up_path+" " + ts + " -l chi_sim"
        print(cmd)
        os.system(cmd)
        with open(ts+".txt", 'r+', encoding="utf-8") as f:
            result = f.read()
            return result
    
    
    if __name__ == '__main__':
        app.run(debug=True)
    

    五、程序实现(Java)

           不需要任何引入第三方jar包,搭建一个简单的springboot web项目就可以了,没有其他额外的依赖。

    Controller:

    package com.lbh.web.controller;
    
    /*
     * Copyright@lbhbinhao@163.com
     * Author:liubinhao
     * Date:2020/11/23
     * ++++ ______ @author       liubinhao   ______             ______
     * +++/     /|                         /     /|           /     /|
     * +/_____/  |                       /_____/  |         /_____/  |
     * |     |   |                      |     |   |        |     |   |
     * |     |   |                      |     |   |________|     |   |
     * |     |   |                      |     |  /         |     |   |
     * |     |   |                      |     |/___________|     |   |
     * |     |   |___________________   |     |____________|     |   |
     * |     |  /                  / |  |     |   |        |     |   |
     * |     |/ _________________/  /   |     |  /         |     |  /
     * |_________________________|/b    |_____|/           |_____|/
     */
    import org.springframework.web.bind.annotation.PostMapping;
    import org.springframework.web.bind.annotation.RequestParam;
    import org.springframework.web.bind.annotation.RestController;
    import org.springframework.web.multipart.MultipartFile;
    
    import java.io.BufferedReader;
    import java.io.File;
    import java.io.IOException;
    import java.io.InputStreamReader;
    
    @RestController
    public class LiteralExtractController {
    
        @PostMapping("/image/extract")
        public String reg(@RequestParam("file")MultipartFile file) throws IOException {
            String result = "";
            String filename = file.getOriginalFilename();
            File save = new File(System.getProperty("user.dir")+"\\"+filename);
            if (!save.exists()){
                save.createNewFile();
            }
            file.transferTo(save);
            String cmd = String.format("tesseract %s stdout -l %s",System.getProperty("user.dir")+"\\"+filename,"chi_sim");
            result = cmd(cmd);
            return result;
        }
    
        public static String cmd(String cmd) {
            BufferedReader br = null;
            try {
                Process p = Runtime.getRuntime().exec(cmd);
                br = new BufferedReader(new InputStreamReader(p.getInputStream()));
                String line = null;
                StringBuilder sb = new StringBuilder();
                while ((line = br.readLine()) != null) {
                    sb.append(line + "\n");
                }
                return sb.toString();
            } catch (Exception e) {
                e.printStackTrace();
            }
            finally
            {
                if (br != null)
                {
                    try {
                        br.close();
                    } catch (Exception e) {
                        e.printStackTrace();
                    }
                }
            }
            return null;
        }
    }
    

           哈哈哈,还有帅气的程序logo。

    六、实验测试

           很简单二十多行代码就完成了,看看效果怎么样吧。
    测试一图片:
    Postman上传的文件
    测试一结果:
    接口测试结果
           测试二图片:
    在这里插入图片描述
           测试二结果:
    在这里插入图片描述

           perfect,识别的很准确,第二个测试全部是英文字符的时候我们采用了中文训练的数据集,虽然也很好的识别了,但是速度会慢很多。

    七、总结

           图片识别在当今网络技术领域是非常热门的一块,而这次完成的这个程序完全是依赖别人开源框架来完成了这个技术实现,在应用层面这是成功的,但是本质上并没有实际算法,技术核心上的东西,如果只关心应用层开发上述解决了我们计算机在规则字符识别上的问题。

           上述代码中基本没有难点,直接复制即可使用。此外,tesseract作为一款优秀的开源字符识别软件,但它也不是万能的,tesseract只能识别规则的字符,对于一些艺术字,抽象字它是无能为力的。

    展开全文
  • 苹果手机识别图片文字app,小编推荐得力ocr文字识别。如何用苹果手机来识别图片文字?在众多可以识别图片软件中,得力ocr文字识别是适用于苹果手机的。其实有几个软件也支持在iphone里使用的,那为什么小编推荐了...

    苹果手机识别图片文字app,小编推荐得力ocr文字识别。如何用苹果手机来识别图片文字?在众多可以识别图片的软件中,得力ocr文字识别是适用于苹果手机的。其实有几个软件也支持在iphone里使用的,那为什么小编推荐了得力ocr文字识别呢?最重要的原因是这个软件运行速度很快,识别的文字准确率也相当高。而且这个软件是免费的,准确地说,它每天都有三次的免费机会。想试用软件或者您只需少次识别图片文字,可以毫无顾虑地下载使用软件。下面小编介绍一下如何使用这个软件识别苹果手机里的图片文字。

    操作方法:

    首先登入官网(http://www.deliocr.cn/) 下载苹果手机识别图片文字app——得力ocr文字识别软件。在软件上点击图片识别,导入要识别的现成图片,稍等几秒,就能将图片上的文字提取出来。

    在这里插入图片描述

    图1:图片识别

    点击拍照识别后,然后打开相机对准要识别的文字,拍摄下来,注意需要提取的文字要求清晰可辨。

    在这里插入图片描述
    图2:拍照识别

    适用于苹果手机识别图片文字app——得力ocr文字识别,它是专业的文字识别软件,支持各类证件、文书、手稿的文字识别。简单地说软件可以用简单的操作完成大量的录入工作,无论是图片还是其他类型,只要清晰可见,软件就可以为你识别。

    展开全文
  • 很多小伙伴在工作中经常需要将图片转换成文本文字,或者是将扫描文件转换成可编辑的文档。其实扫描软件有很多,今天yama就分享几款比较好用的ocr软件给大家,让工作游刃有余。如果身边网络环境不太好的话,可以选择...

    很多小伙伴在工作中经常需要将图片转换成文本文字,或者是将扫描文件转换成可编辑的文档。其实扫描软件有很多,今天yama就分享几款比较好用的ocr软件给大家,让工作游刃有余。如果身边网络环境不太好的话,可以选择在线OCR(文字识别),很多在线识别的或许只提供一次免费下载,后续都是需要钱的。

    在线网页OCR

    onlineOCR

    OnlineOCR.net提供免费的文本识别服务,未注册访客每小时可转换15个文件(15页转换为多页文件)。 注册后可以转换多页PDF文档以及使用更多功能。

    image.png

    ocrmaker

    支持识别的语言: 中文、英语、法语、德语、阿拉伯语、希腊语、日语、韩语、葡萄牙语、俄语、西班牙语

    image.png

    在线文字识别转换

    image.png

    诚华OCR

    转换格式很全面,第二次转换付费。

    image.png

    迅捷OCR

    本身就是一款软件,有在线版本。

    image.png

    convertio ocr

    image.png

    newocr

    上传没有数量无限制,图片文件大小不超过5MB,PDF文件大小不超过20MB。当上传一个文件进行字符识别的时候,为了优化识 别结果你需要先选择一种语言与旋转文档。这项服务也不须注册。

    image.png

    Free OCR

    接受2MB的图片和PDF文件。并且它只识别PDF文件的第一页。你可以选择识别文档的语言,优化识别的结果。此外你每小时只可以上传10张图片。虽然支 持多栏文字,然而识别的结果仍然是纯文本,也就是说所有的格式都将丢失。这项服务也不需要注册。

    image.png

     


    微信小程序ocr

    传图识字

    以图识字


    手机APP

    CamScanner(扫描全能王)

    将智能手机变成随身携带的扫描仪。方便快捷地记录管理您的各种文档,收据,笔记和白板讨论等。并通过精准的图像裁剪和图像增强演算法,保证您扫描的内容清晰可读。主要拥有高清扫描、智能管理批注、图片搜索、文档协同分享、云同步等特色功能。

    image.png

    白描(iOS+安卓)

    白描是一款准确高效的 OCR 文字识别软件与文件扫描软件,识别准确度高,速度快,文件扫描清晰,可生成PDF。

    image.png


    PC软件

    腾讯(优图)OCR+搜狗OCR+百度OCR+有道OCR,自行Google(百度)

    天若ocr

    这个是吾爱破解看到的,特点是比较轻便,总之就是很nice阿,平时用的很多。

    image.png

     

    天若ocr

    提取码:2n7z

     

    捷速OCR(收费)

    捷速OCR文字识别软件,采用了最先进的OCR文字识别技术,我们才可以如此迅速方便的把图片转换成文字。相信当各位使用这款软件之后,会发现它的更多惊喜,一定会成为你的好帮手。

    image.png

    ABBYY

    一款非常专业的ocr识别工具。abbyy finereader 12 破解版支持用户对文档以及表格进行扫描,可以完整将原文件色彩、格式等重要信息全部扫描出来,帮助用户快速识别各类文档信息。


    就这么多了嗷呜~如果对你有帮助,多多支持哈。å¯ç±

    展开全文
  • 文字创作类App分享-简书

    千次阅读 2019-04-02 19:11:50
    今天我用Mockplus了一套简书App的原型,这是一款文字创作类的App,用户通过写文、点赞等互动行为,提高自己在社区的影响力,打造个人品牌。我运用了Mockplus基础组件、交互组件、移动组件等多个组件库,简单拖拽,...

    今天我用Mockplus做了一套简书App的原型,这是一款文字创作类的App,用户通过写文、点赞等互动行为,提高自己在社区的影响力,打造个人品牌。我运用了Mockplus基础组件、交互组件、移动组件等多个组件库,简单拖拽,方便快捷~好了,下面请看我的成果吧!

    本原型由国产原型工具Mockplus制作完成。

     

    先简单看看动图:

    点击这里,可以立即在线预览:https://run.mockplus.cn/wiTBxiIV2p2bA8EJ/index.html

    再送上UI Flow大图:

    这个原型的主要页面有:首页-推荐、首页-专题、首页-连载、关注、简书钻、消息、搜索页面、我的等。

    以上设计的所有页面可以在这里下载分享。

    所有页面的图片集(10张), 在这里下载。

    Enjoy it!

    展开全文
  • APP软件测试总结

    千次阅读 2017-02-20 09:25:38
    3)对App的输入有效性校验、认证、授权、数据加密等方面进行检测 4)限制/允许使用手机功能接入互联网 5)限制/允许使用手机发送接收信息功能 6)限制或使用本地连接 7)限制/允许使用手机拍照或录音 8)限制/...
  • app软件测试经验分享

    万次阅读 多人点赞 2016-03-17 18:31:49
    App软件测试总结 首先不管什么测试,都需要对需求有一个很深的分析,一个操作会产生什么样的结果这个测试人员必须要去思考(很多测试人员对需求都停留在表面)。 下面对自己在app测试中的一些总结分享给大家: 1....
  • Python3.6实现图片文字识别和PDF转WORD图片文字提取- - 需求来源 - -- - 代码实现 - -PDF转WORD- - 需求来源 - -- - 代码实现 - -窗口实现- - 使用PyQt5创建 - -- - 使用tkinter 创建 - -最终实现- - 实现说明 - -- ...
  • 比如要把书上的文字复制下来, 需要照着书一个一个字打,但是如果通过ocr识别软件, 我们就可以直接通过拍照的形式把这些文字截取下来。举个例子: OCR识别之后 10每个人都听命于三个“长官”控制模式必须因时制宜,一药...
  • ps软件修改图片中的文字

    千次阅读 2020-02-20 19:52:18
    经常遇到图片中的文字需要修改,这里简单介绍使用PS软件图片中的文字进行修改 (1)打开软件,依次点击“文件”——“打开”,如图所示打开需要修改的图片 (2)点击左侧工具栏的“防制图章工具”, (3)下面是...
  • 近期在毕业设计,发现查看论文的时间太多了,然而百度文库或是PDF的文档要想复制真是费劲至极,于是准备一个个人使用的截图文字识别软件,可以提高工作效率。那下面就个简单介绍。 第一步:获取到你的APP_ID ...
  • 第一次写博客,主题是用百度接口实现...再用注册时得到的AppID、API Key、Secret Key初始化应用,并读取保存到的图片并打印识别的文字,还可以使用无限循环来多次识别文字;调用pyinstaller打包生成识别文字小程序。
  • 但是对于PDF文件来说,有些图片形式的PDF文件是不不能直接编辑和复制,若要提取PDF文件上的文字我们应该怎么呢?这就需要识别PDF文字软件。这类文字识别软件可以帮助我们一键识别文件,省去了手动输入文字的烦恼...
  • 1.微信平台没有提供分享多张图片的SDK,我们只能自己调用系统自带的分享功能实现。2.实际分享的时候因为是调用系统本地的分享功能,所以分享的图片也就必须要存到本地,不然就会提示获取资源失败而导致分享失败。3....
  • 如何手机软件图片转换为文字 今天一个朋友让我帮忙,说怎么转换为word格式,我糊涂了半天,才发现她想要的其实就是把word里的图片转换为文字,而不需要自己一个一个字的
  • 最近在从手机APP上采集数据的功能,因为小弟对手机通信机制还不是很了解,无法直接抓包,所以就采用比较笨的方法,抓取手机屏幕的截图,然后通过图片识别的功能,转换为文本再处理。 这里,我用的手机屏幕截图方法...
  • 通过源码可以发现,输出的图片有2个分支 如果你没有指定Intent里面的Extra参数,它就返回一个序列化(putExtra(“data”, bitmap))的Bitmap,从理论上来说,这样的代码写的很烂,属于Magic Number。 如果你指定了...
  • 为了与开发者一起更好地探索互动实时消息的更多可能性,我们基于声网云信令/ RTM(Real-time Messaging)SDK开源了一个实时文字互动 Demo——「Typing」。从体验来讲,「Typing」与音视频通话更为类似。对方打字时的...
  • 2 覆盖想要删除的文字 3 右击,选择,轮廓,无轮廓线 4 右击,选择,填充,纯色 5 文字被删除了 删除文字的另外一种快捷方法 1 主页,选择,矩形选择 2 右击,删除,可以删除所有的文字 添加...
  • 期货、股票资管分账户软件APP开发需要哪些技术?首先既然是APP,那么我们就可以很直接的明白了,安卓和ios,这两大操作技术,因此这两者是主要的,其他都是次要,那首先本文是针对开发小白用户对资管APP开发一个...
  • 软件测试之App测试-UI测试

    千次阅读 2017-07-09 22:34:46
    测试依照标准—UI设计,原型,需求文档测试要点:测试用户界面(如菜单、对话框、窗口和其它可规控件)布局、风格是否满足客户要求、文字是否正确、页面是否美观、文字图片组合是否完美、操作是否友好等。...
  • 现在,我们总能在手机上发现很多有趣好玩的手机APP,自己也有一些不错的想法,想通过手机APP实现。网站、论坛的访问量越来越小,APP越来越重要。那么如何不用学习安卓APP开发入门教程就能开发一款APP呢?通过咨询APP...
  • APP上架系列《软件著作权》软著篇 每次网上一搜,一大堆乱七八糟瞎写的,复制条令我用的着你?用我的经验,给大家一个完美的要点和避免坑指南。 废话不再多说,直接上干货。注意本篇要点,我们不需要制作多么...
  • 加油折扣系统 加油优惠软件 加油APP 加油小程序,加油APP是一款网上优惠卡加油充值软件,加油APP加油卡充值软件系统用户在软件中每天都能了解到自己的热门活动,让你在软件中提供更多的优惠充值服务,一秒充值极速...
  • iText for Mac 1.6.2 无限次识别版和大家见面啦!iText是一款OCR 识别、翻译图片中的文字工具。...下面小编给大家带来Text for Mac破解版的介绍,希望这款软件能给您带来方便和精准的文字识别体验。 iText for...
  • 这是抖音骗你买的第几个产品了?你不买几件抖音爆款,别说你是抖音的骨灰玩家了。从兔子耳朵帽子,社会人佩奇,再到现 在的拍照扫描文字识别App。 ...
  • 如何个安卓APP-纯小白

    千次阅读 2020-03-12 20:44:34
    1.提供网站在线制作,免费的话,只提供简单的显示文字图片的程序,其他需要付费。而且制作只是简单的拖拽组件。 2.通过Android stduio(goolge官方工具)首选它,Android stduio只是编译工具,推荐使用JAVA编程语言...
  • 在这之前,知道君推荐过,确实很好用,而且他的贴图功能不是...如何识别图片内的文字? 热键唤出截图功能,按住鼠标左键选择截图区域后,点击屏幕识图【文】图标,并选择【编辑】、【复制】或【下载】。  
  • 如何做APP界面设计

    千次阅读 2018-02-15 14:28:44
    如何做APP界面设计转载 2013年05月17日 18:01:143213航班管家创意设计总监向怡宁近日在一线下活动中分享移动应用界面设计的话题,很实用,在此与大家分享。用户心态用户在面对移动应用时,心态有三大特征:第一是微...

空空如也

空空如也

1 2 3 4 5 ... 20
收藏数 29,337
精华内容 11,734
关键字:

做文字图片的软件app