精华内容
下载资源
问答
  • 目前PIL的官方最新版本为1.1.7,支持的版本为python 2.5, 2.6, 2.7,并不支持python3,但有高手把它重新编译生成python3下可安装的exe了。这一非官方下载或者直接点下面:PIL-1.1.7.win32-py3.2.‌exe [994 KB] ...

    目前PIL的官方最新版本为1.1.7,支持的版本为python 2.5, 2.6, 2.7,并不支持python3,但有高手把它重新编译生成python3下可安装的exe了。这一非官方下载

    或者直接点下面:

    PIL-1.1.7.win32-py3.2.‌exe  [994 KB]  [Python 3.2]  [32 bit]  [Jul 03, 2012]

    PIL-1.1.7.win32-py3.3.‌exe  [988 KB]  [Python 3.3b1]  [32 bit]  [Jul 03, 2012]

    最近在做一件比较 evil 的事情——验证码识别,以此来学习一些新的技能。因为我是初学,对图像处理方面就不太了解了,欲要利吾事,必先利吾器,既然只是做一下实验,那用 Python 来作原型开发再好不过了。在 Python 中,比较常用的图像处理库是 PIL(Python Image Library),当前版本是 1.1.7 ,用起来非常方便。大家可以在 http://www.pythonware.com/products/pil/index.htm 下载和学习。

    在这里,我主要是介绍一下做图像识别时可能会用到的一些 PIL 提供的功能,比如图像增强、还有滤波之类的。最后给出使用 Python 做图像处理与识别的优势与劣势。

    基本图像处理

    使用 PIL 之前需要 import Image 模块

    注意:在python3中,请使用from PIL import Image,不要使用import Image

    import Image  #python2

    from PIL import Image #python3

    然后你就可以使用Image.open(‘xx.bmp’) 来打开一个位图文件进行处理了。打开文件你不用担心格式,也不用了解格式,无论什么格式,都只要把文件名丢给 Image.open 就可以了。真所谓 bmp、jpg、png、gif……,一个都不能少。

    img = Image.open(‘origin.png’)    # 得到一个图像的实例对象 img

    图 1原图

    图像处理中,最基本的就是色彩空间的转换。一般而言,我们的图像都是 RGB 色彩空间的,但在图像识别当中,我们可能需要转换图像到灰度图、二值图等不同的色彩空间。 PIL 在这方面也提供了极完备的支持,我们可以:

    new_img = img.convert(‘L’)

    把 img 转换为 256 级灰度图像, convert() 是图像实例对象的一个方法,接受一个 mode 参数,用以指定一种色彩模式,mode 的取值可以是如下几种:

    · 1 (1-bit pixels, black and white, stored with one pixel per byte)

    · L (8-bit pixels, black and white)

    · P (8-bit pixels, mapped to any other mode using a colour palette)

    · RGB (3x8-bit pixels, true colour)

    · RGBA (4x8-bit pixels, true colour with transparency mask)

    · CMYK (4x8-bit pixels, colour separation)

    · YCbCr (3x8-bit pixels, colour video format)

    · I (32-bit signed integer pixels)

    · F (32-bit floating point pixels)

    怎么样,够丰富吧?其实如此之处,PIL 还有限制地支持以下几种比较少见的色彩模式:LA (L with alpha), RGBX (true colour with padding) and RGBa (true colour with premultiplied alpha)。

    下面看一下 mode 为 ‘1’、’L’、’P’时转换出来的图像:

    图 2 mode = '1'

    图 3 mode = 'L'

    图 4 mode = 'P'

    convert() 函数也接受另一个隐含参数 matrix,转换矩阵 matrix 是一个长度为4 或者16 tuple。下例是一个转换 RGB 空间到 CIE XYZ 空间的例子:

    rgb2xyz = (

    0.412453, 0.357580, 0.180423, 0,

    0.212671, 0.715160, 0.072169, 0,

    0.019334, 0.119193, 0.950227, 0 )

    out = im.convert("RGB", rgb2xyz)

    除了完备的色彩空间转换能力外, PIL 还提供了resize()、rotate()等函数以获得改变大小,旋转图片等几何变换能力,在图像识别方面,图像实例提供了一个 histogram() 方法来计算直方图,非常方便实用。

    图像增强

    图像增强通常用以图像识别之前的预处理,适当的图像增强能够使得识别过程达到事半功倍的效果。 PIL 在这方面提供了一个名为 ImageEnhance 的模块,提供了几种常见的图像增强方案:

    import ImageEnhance

    enhancer = ImageEnhance.Sharpness(image)

    for i in range(8):

    factor = i / 4.0

    enhancer.enhance(factor).show("Sharpness %f" % factor)

    上面的代码即是一个典型的使用 ImageEnhance 模块的例子。 Sharpness 是 ImageEnhance 模块的一个类,用以锐化图片。这一模块主要包含如下几个类:Color、Brightness、Contrast和Sharpness。它们都有一个共同的接口 .enhance(factor) ,接受一个浮点参数 factor,标示增强的比例。下面看看这四个类在不同的 factor 下的效果

    图 5 使用Color 进行色彩增强,factor 取值 [0, 4],步进 0.5

    图 6 用 Birghtness 增强亮度,factor取值[0,4],步进0.5

    图 7用 Contrast 增强对比度, factor 取值 [0,4],步进0.5

    图 8用 Sharpness 锐化图像,factor取值 [0,4],步进0.5

    图像 Filter

    PIL 在 Filter 方面的支持是非常完备的,除常见的模糊、浮雕、轮廓、边缘增强和平滑,还有中值滤波、ModeFilter等,简直方便到可以做自己做一个Photoshop。这些 Filter 都放置在 ImageFilter 模块中,ImageFilter主要包括两部分内容,一是内置的 Filter,如 BLUR、DETAIL等,另一部分是 Filter 函数,可以指定不同的参数获得不同的效果。示例如下:

    import ImageFilter

    im1 = im.filter(ImageFilter.BLUR)

    im2 = im.filter(ImageFilter.MinFilter(3))

    im3 = im.filter(ImageFilter.MinFilter()) # same as MinFilter(3)

    可以看到 ImageFilter 模块的使用非常简单,每一个 Filter 都只需要一行代码就可调用,开发效率非常高。

    图 9使用 BLUR

    图 10使用 CONTOUR

    图 11使用 DETAIL

    图 12使用 EMBOSS

    图 13使用 EDGE_ENHANCE

    图 14使用 EDGE_ENHANCE_MORE

    图 15使用 FIND_EDGES

    图 16使用 SHARPEN

    图 17使用 SMOOTH

    图 18使用 SMOOTH_MORE

    以上是几种内置的 Filter 的效果图,除此之外, ImageFilter 还提供了一些 Filter 函数,下面我们来看看这些可以通过参数改变行为的 Filter 的效果:

    图 19使用 Kernel(),参数:size = (3, 3), kernel = (0.5, 0.5, 0.5, 0.5, 0.5, 0.5, 0.5, 0.5, 0.5)

    图 20使用 MaxFilter,默认参数

    图 21使用 MinFilter,默认参数

    图 22使用 MedianFilter,默认参数

    图 23使用 ModeFilter,参数 size = 3

    图 24使用 RankFilter,参数 size = 3, rank = 3

    小结

    到此,对 PIL 的介绍就告一段落了。总的来说,对于图像处理和识别,PIL 内建了强大的支持,从各种增强算法到 Filter ,都让人无法怀疑使用 Python 的可行性。 Python唯一的劣势在于执行时间过慢,特别是当实现一些计算量大的算法时候,需要极强的耐心。我曾用 Hough Transform(霍夫变换)来查找图像中的直线,纯 Python 的实现处理一个 340 * 100 的图片也要花去数秒时间(P4 3.0G + 1G memory)。但使用 PIL 无需关注图像格式、内建的图像增强算法和 Filter 算法,这些优点使 Python 适合用于构造原型和进行实验,在这两方面Python 比 matlab 更加方便。商业的图像识别产品开发,可以考虑已经被 boost accepted的来自 adobe 的开源 C++ 库 gil,可以兼顾执行性能和开发效率。

    原文:http://blog.csdn.net/lanphaday/article/details/1852726

    展开全文
  • 一、本节简述本节主要讲解图像的一些基础知识,以及图像的加载和获得属性,最后将会学到 OpenCV 摄像头的简单使用。二、图像基本知识1、图像是什么:图像是客观对象的一种相似性的、生动性的描述或写真,是人类社会...

    一、本节简述

    本节主要讲解图像的一些基础知识,以及图像的加载和获得属性,最后将会学到 OpenCV 摄像头的简单使用。

    二、图像基本知识

    1、图像是什么:

    图像是客观对象的一种相似性的、生动性的描述或写真,是人类社会活动中最常用的信息载体。或者说图像是客观对象的一种表示,它包含了被描述对象的有关信息。

    2、图像基本属性有哪些:

    通道数目、高与宽、像素数据、图像类型

    三、示例代码

    import cv2 as cv

    def video_demo():

    #打开0号摄像头,捕捉该摄像头实时信息

    #参数0代表摄像头的编号

    #有多个摄像头的情况下,可用编号打开摄像头

    #若是加载视频,则将参数改为视频路径,cv.VideoCapture加载视频是没有声音的,OpenCV只对视频的每一帧进行分析

    capture=cv.VideoCapture(0)

    while(True):

    #获取视频的返回值 ref 和视频中的每一帧 frame

    ref,frame=capture.read()

    #加入该段代码将使拍出来的画面呈现镜像效果

    #第二个参数为视频是否上下颠倒 0为上下颠倒 1为不进行上下颠倒

    frame= cv.flip(frame,1)

    #将每一帧在窗口中显示出来

    cv.imshow("video",frame)

    #设置视频刷新频率,单位为毫秒

    #返回值为键盘按键的值

    c=cv.waitKey(50)

    #27为 Esc 按键的返回值

    if c==27:

    break

    def get_image_info(image):

    #图像类别

    #图像类别为numpy.dnarray,即n维数组

    print(type(image))

    #获取图像通道数目

    #返回值如:(900, 640, 3)

    # 这三个数字代表图片纵向像素、横向像素和通道数目

    print(image.shape)

    #图像总大小,计算公式为:长*宽*通道数目

    print(image.size)

    #每个像素点所占字节位数

    print(image.dtype)

    #读入图片文件

    src=cv.imread('textImg.jpg')

    get_image_info(src)

    #将图片保存为 testSave.png

    cv.imwrite("testSave.png",src)

    video_demo()

    #等待用户操作

    cv.waitKey(0)

    #释放所有窗口

    cv.destroyAllWindows()

    展开全文
  • 颜色空间转换 转换颜色空间 要用到的函数是:cv2.cvtColor(input_image ,flag),其中 flag就是转换类型。 对于 BGR↔Gray 的转换,我们要使用的 flag 就是 cv2.COLOR_BGR2GRAY。 同样对于 BGR↔HSV 的转换,我们...

    颜色空间转换

    转换颜色空间

    要用到的函数是:cv2.cvtColor(input_image ,flag),其中 flag就是转换类型。
    对于 BGR↔Gray 的转换,我们要使用的 flag 就是 cv2.COLOR_BGR2GRAY。
    同样对于 BGR↔HSV 的转换,我们用的 flag 就是 cv2.COLOR_BGR2HSV。

    物体跟踪

    知道如何从BGR转换到HSV,可以用来提取带有某个特定颜色的物体,在 HSV 颜色空间中要比在 BGR 空间中更容易表示一个特定颜色。关于HSV的颜色范围

           • 从视频中获取每一帧图像
      • 将图像转换到 HSV 空间
      • 设置 HSV 阈值到某颜色范围。
      • 获取指定色物体,当然我们还可以做其他任何我们想做的事,比如:在蓝色物体周围画一个圈。

    import cv2
    import numpy as np
    
    cap = cv2.VideoCapture(r'shipin.mp4')
    
    while(1):
        ret, frame = cap.read()
        hsv = cv2.cvtColor(frame, cv2.COLOR_BGR2HSV)
     
        # 设置灰色的HSV颜色范围 
        lower_gray = np.array([0, 0, 46])
        upper_gray = np.array([180, 43, 220])
    
        mask = cv2.inRange(hsv, lower_gray, upper_gray)
    
        res = cv2.bitwise_and(frame, frame, mask=mask)
    
        cv2.imshow('frame', frame)
        cv2.imshow('mask', mask)
        cv2.imshow('res', res)
        k = cv2.waitKey(5) & 0xFF
        if k ==27:
            break
    
    cv2.destroyAllWindows()

    要同时提取多个颜色,将各mask相加就能同时显示了:

    mask_green = cv2.inRange(hsv, lower_green, upper_green)
    mask_yellow = cv2.inRange(hsv, lower_yellow, upper_yellow)
    mask = mask_yellow + mask_green
    res = cv2.bitwise_and(frame, frame, mask=mask)

    几何变换

    扩展缩放

    cv2.resize(src,dsize,dst=None,fx=None,fy=None,interpolation=None):图像的尺寸可以自己手动设置,你也可以指定缩放因子。我们可以选择使用不同的插值方法。在缩放时我们推荐使用 cv2.INTER_AREA,在扩展时我们推荐使用 v2.INTER_CUBIC(慢) 和 v2.INTER_LINEAR。默认情况下所有改变图像尺寸大小的操作使用的插值方法都是 cv2.INTER_LINEAR。

    scr:输入图片。  dsize:输出图像尺寸 。dst:输出图片。fx:沿水平轴的比例因子(缩放系数)。  fy:沿垂直轴的比例因子(缩放系数)。  interpolation:插值方法。

    img = cv2.imread('timg.jpg')
    res = cv2.resize(img, None, fx=0.25, fy=0.25, interpolation=cv2.INTER_CUBIC) # 缩放为原图的四分之一
    height, width = img.shape[:2]
    # res = cv2.resize(img,(2*width, 2*height), interpolation=cv2.INTER_CUBIC) #dsize=(2*width,2*height),图片扩大两倍
    while(1):
        cv2.imshow('res', res)
        #cv2.imshow('img', img)
        if cv2.waitKey(1) & 0xFF == 27:
            break

     

     

    展开全文
  • Python3图像处理之识别图像中的文字

    千次阅读 2019-02-12 15:32:55
    ②安装pytesser3:pip install pytesser3 ③安装pytesseract:pip install pytesseract ④安装autopy3: 先安装wheel:pip install wheel 下载autopy3-0.51.1-cp36-cp36m-win_amd64.whl【点击打...

    安装PIL:pip install Pillow(之前的博客中有写过)

    安装pytesser3:pip install pytesser3

    安装pytesseract:pip install pytesseract

    安装autopy3:

    先安装wheel:pip install wheel

    下载autopy3-0.51.1-cp36-cp36m-win_amd64.whl【点击打开链接

    执行命令:pip install E:\360安全浏览器下载\autopy3-0.51.1-cp36-cp36m-win_amd64.whl

    ##注意: 使用pip install autopy3时会报错如下:

    所以要下载本地安装

    ④安装Tesseract-OCR:百度直接搜索Tesseract-OCR下载即可

    这里要说明的是安装Tesseract-OCR, 选项时候使用语言库, 安装后,其不会被默认添加至环境变量path中,已导致如下报错:

    解决办法有两种:(先找到Tesseract-OCR安装文件夹,再找到tesseract.exe文件)

    我这里的绝对路径是:D:\python\Tesseract-OCR\tesseract.exe

    ①将此路径添加至环境变量path中(不过我是这么做的,但是PyCharm仍旧报错)

    ②找到pytesseract.py文件

    我这里是C:\Users\admin\AppData\Local\Programs\Python\Python36\Lib\site-packages\pytesseract\pytesseract.py

    将文件中的tesseract_cmd修改为上方的绝对路径

    进入正题,如何识别图像中文字

    上原图:(这句是海上钢琴师中的一句经典台词)

      

    接下来我们要通过python的pytesseract来识别图片中的字符了


    #   _*_ coding:utf-8 _*_
     
    import pytesseract
    from PIL import Image
     
    __author__ = 'admin'
     
    im = Image.open(r'C:\Users\admin\Desktop\example.png')
    print(pytesseract.image_to_string(im))

    效果图

    --------------------- 
    作者:FloatDreamed 
    来源:CSDN 
    原文:https://blog.csdn.net/FloatDreamed/article/details/79090741 
    版权声明:本文为博主原创文章,转载请附上博文链接!

    展开全文
  • ImageFilter模块包含预定义...这个库的3.3.x版本提供下面一组预定义图像的增强过滤器: 1.BLUR 2.CONTOUR 3.DETALL 4.EDGE_ENHANCE 5.EDGE_EHANCE_MORE 6.EMBOSS 7.FIND_EDGES 8.SMOOTH 9.SMOOTH_MORE 10....
  • Python数字图像处理

    千次阅读 2017-06-21 13:58:01
    转:宁静家园python数字图像处理(1):环境安装和配置python数字图像处理(2):图像的读取、显示与保存python数字图像处理3):图像像素的访问与裁剪python数字图像处理(4):图像数据类型及颜色空间转换python...
  • python数字图像处理

    千次阅读 2018-08-07 22:08:50
    这里博客是自己做的个系统整理,主要说的是python在数字图像处理方面的应用,主要用到的库有PIL和skimage PIL库 1、用python简单处理图片:打开、显示、保存图像 2、用python简单处理图片:图像通道、几何变换...
  • 看这个视频3Python 在图形学方面的应用,请看。本书主要讲授如何利用Python实现计算机图形学相关的绘制,包括基本元素的绘制、二维和三维坐标变换、透视、相交、删除隐藏线、着色、数据拟合及曲面绘制等,并通过两...
  • Python Imaging Library (PIL)是python下的图像处理模块,支持多种格式,并提供强大的图形与图像处理功能。目前PIL的官方最新版本为1.1.7,支持的版本为python 2.5, 2.6, 2.7,并不支持python3,但有高手把它重新...
  • 这篇文章主要介绍了python Pillow图像处理方法汇总,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友可以参考下安装:pip install pillow操作图像:#!/usr/bin/env python3#...
  • Python图像处理3

    千次阅读 2016-10-01 12:52:23
    cv2.fastNlMeansDenoisingMulti():适用于短时间的图像序列(灰度图像)。imgtoDenoiseIndex设置哪些帧需要去噪,需要传入一个帧的索引。temporaWindowSize设置用于去噪的相邻帧的数目(奇数)。在这种情况下...
  • 本文主要讲解图像傅里叶变换的相关内容,在数字图像处理中,有两个经典的变换被广泛应用——傅里叶变换和霍夫变换。其中,傅里叶变换主要是将时间域上的信号转变为频率域上的信号,用来进行图像除噪、图像增强等处理...
  • 使用python完成图像处理或者计算机视觉的任务时,常常需要一个封装好的图像读取和简单处理的库。很多朋友会使用opencv的python接口或者skimage等等模块,不过还有一个很不错的选择,那就是PIL(Python Image Library)...
  • Python Imaging Library ( PIL ) 给 Python 增加了图像处理能力。 这个库提供了广泛的文件格式支持,高效的内部展现,以及十分强大的图像处理能力。 由于PIL仅支持到Python 2.7,加上年久失修,于是一群志愿者在...
  • python PIL图像处理

    2020-11-04 22:26:40
    #RGB时长度为3 常用的模式: RGB、RGBA、1(二值图)、L(灰度图),当转换为二值图时,默认将128以下的转为黑色,128以上的像素转换为白色 img = Image.open("/home/czh/图片/win.jpg").convert('RGB') print(img.size...

空空如也

空空如也

1 2 3 4 5 ... 20
收藏数 2,827
精华内容 1,130
关键字:

python3图像处理

python 订阅