精华内容
下载资源
问答
  • 计算机视觉-基本的图像操作和处理
    千次阅读
    2022-03-02 14:25:31


    一、常用的库

    在这里插入图片描述

    二、读取图像及其直方图

    直方图原理:图像的直方图用来表征该图像像素值的分布情况。计算图像中的某种信息,例如像素值的多少,然后将数据分为若干个定义好的区间内。

    def func1():
        im = array(Image.open('D:\python\projects\计算机视觉\image\img1.jpg').convert('L'))  # 打开图像,并转成灰度图像
    
        gray()  # 设置为灰度
        subplot(121)
        imshow(im)
    
        subplot(122)
        hist(im.flatten(), 128)
        title(u'图像直方图', fontproperties=font)
        plt.xlim([0, 260])  # 限制x和y
        plt.ylim([0, 11000])
    
        show()
    

    在这里插入图片描述

    三、图像高斯模糊

    高斯模糊(高斯滤波):通过二维高斯函数和像素卷积得到模糊后的图像。
    在这里插入图片描述

    def func2():
        im = array(Image.open('D:\python\projects\计算机视觉\image\img1.jpg').convert('L'))  # 打开图像,并转成灰度图像
        gray()
        im2 = filters.gaussian_filter(im, 2)
        im3 = filters.gaussian_filter(im, 5)
        im4 = filters.gaussian_filter(im, 10)
        subplot(131)
        imshow(im2)
        title(u'σ=2', fontproperties=font)
        subplot(132)
        imshow(im3)
        title(u'σ=5', fontproperties=font)
        subplot(133)
        imshow(im4)
        title(u'σ=10', fontproperties=font)
    
        show()
    

    在这里插入图片描述

    四、图像和直方图均衡化

    图像和直方图均衡化的原理可以归纳为将某个灰度映射到另一个灰度。
    在这里插入图片描述

    def func3():
        im = array(Image.open('D:\python\projects\计算机视觉\image\img1.jpg').convert('L'))  # 打开图像,并转成灰度图像
        im2, cdf = imtools.histeq(im)
    
        figure()
        subplot(2, 2, 1)
        axis('off')
        gray()
        title(u'原始图像', fontproperties=font)
        imshow(im)
    
        subplot(2, 2, 2)
        axis('off')
        title(u'直方图均衡化后的图像', fontproperties=font)
        imshow(im2)
    
        subplot(2, 2, 3)
        axis('off')
        title(u'原始直方图', fontproperties=font)
        # hist(im.flatten(), 128, cumulative=True, normed=True)
        hist(im.flatten(), 128)
    
        subplot(2, 2, 4)
        axis('off')
        title(u'均衡化后的直方图', fontproperties=font)
        # hist(im2.flatten(), 128, cumulative=True, normed=True)
        hist(im2.flatten(), 128)
    
        show()
    

    在这里插入图片描述

    更多相关内容
  • 机器学习在计算机视觉处理中的应用.docx
  • 计算机视觉研究基础,基于opencv的图像处理基础技术讲解!!!!
  • 计算机视觉处理高级培训课程从CV基础到深度学习实战 第一讲:工欲善其事必先利器——图像处理基础 第二讲:初探计算机视觉 第三讲:空域图像处理的洪荒之力 第四讲:机器视觉中的特征提取与描述 第五讲:坐标变换与...
  • Matlab计算机视觉图像处理工具箱推荐 计算机视觉.pdf
  • MATLAB工具箱大全-计算机视觉与图像处理工具箱MatlabFns
  • 东北大学计算机视觉及图像处理课件。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。
  • 计算机视觉处理5】阈值处理

    千次阅读 多人点赞 2021-05-05 22:44:06
    计算机视觉处理5】阈值处理 1、阈值处理 阈值处理就是设定某个阈值,然后对大于阈值的像素或者小于阈值的像素统一处理的过程。比如下面这个简单的图像: 每个格子表示一个像素,格子中的数字表示图片的像素值。...

    【计算机视觉处理5】阈值处理

    1、阈值处理

    阈值处理就是设定某个阈值,然后对大于阈值的像素或者小于阈值的像素统一处理的过程。比如下面这个简单的图像:

    在这里插入图片描述

    每个格子表示一个像素,格子中的数字表示图片的像素值。如果设定阈值为8,那我们可以把图片分成两个区域,如下图:

    在这里插入图片描述

    然后我们统一对绿色区域或者蓝色区域进行操作,这就是阈值处理了。

    我们通常的操作是将高于某一阈值的像素值处理为255,或者低于某一阈值的像素值处理为0。或者两者同时进行。当我们两者同时进行时,我们可以把这个操作成为二值化,因为处理后的图片只有纯黑和纯白两个颜色。

    2、用numpy实现阈值处理

    numpyndarray数组中,提供了布尔索引的操作。通过布尔索引我们可以方便快速实现阈值处理,而不需要写大量的for循环。

    布尔索引的操作是基于布尔矩阵的,因此我们需要了解一下布尔矩阵。

    (1)布尔矩阵

    布尔矩阵其实就是一个元素类型为布尔的矩阵,使用布尔矩阵我们可以对实数矩阵进行布尔索引操作。

    我们使用下面代码生成一个布尔矩阵:

    import numpy as np
    m = np.array([False, True, False, False], dtype=np.bool_)
    print(m)
    

    输出结果如下:

    [False  True False False]
    

    不过这个矩阵好像没有什么作用。写出上面的代码只是为了让你知道,布尔矩阵就是一个布尔类型的ndarray数组。

    除了自己手动创建布尔矩阵,我们还可以通过比较运算符生成某个数组的布尔矩阵。如:

    import numpy as np
    # 生成一个二维矩阵
    x = np.array([
        [10, 13, 90],
        [80, 21, 34],
        [1, 4, 6]], dtype=np.uint8
    )
    # 通过比较生成布尔矩阵
    bool_x = x > 8
    print(bool_x)
    
    

    在代码中,我们创建了一个二维矩阵。然后通过x > 8来生成一个布尔矩阵,下面是输出结果:

    [[ True  True  True]
     [ True  True  True]
     [False False False]]
    

    可以看到bool_xx的形状是一样的,布尔矩阵和二维矩阵元素之间一一对应。当元素值大于8,在布尔矩阵中表现为True否则表现为False。图示如下:

    在这里插入图片描述

    (2)布尔索引

    有了布尔矩阵,我们就可以进行布尔索引了。布尔索引只会对矩阵中为True的部分进行操作。比如下面的代码:

    import numpy as np
    x = np.array([
        [10, 13, 90],
        [80, 21, 34],
        [1, 4, 6]], dtype=np.uint8
    )
    bool_x = x > 8
    # 将元素值大于8的元素赋值为255
    x[bool_x] = 255
    print(x)
    

    输出结果如下:

    [[255 255 255]
     [255 255 255]
     [  1   4   6]]
    

    这里需要明确,我们操作的是实数矩阵。布尔矩阵只是用来指引,告诉程序我们需要操作的元素。

    从结果可以看到,大于8的元素都被赋值为了255,其它元素没有改变。

    3、opencv实现阈值处理

    (1)阈值处理函数

    opencv中提供了阈值处理的函数,其函数定义为:

    thresh, dst = cv2.threshold(src, thresh, maxval, type)
    

    参数含义如下:

    在这里插入图片描述

    返回的两个值分别是阈值和处理后的结果图像。

    下面是阈处理类型可选的几个参数:

    在这里插入图片描述

    当我们阈值处理类型为二值处理时,maxval参数才起作用。

    (3)阈值处理的区别

    下面我们来说说各种阈值处理的区别。具体如下表:

    在这里插入图片描述

    我们用代码来实战一下:

    import cv2
    # 读取图片
    img = cv2.imread('beautiful.JPG', 0)
    # 进行二值化阈值处理
    _, result = cv2.threshold(img, 127, 255, cv2.THRESH_BINARY)
    # 显示图片
    cv2.imshow('result', result)
    cv2.waitKey()
    cv2.destroyAllWindows()
    

    下面是效果图和原图的对比:

    在这里插入图片描述

    可以看到,原图本事要偏暗。而我们的阈值设置为了127,导致得到的二值图像效果要差一些,这个我们后面会提到解决办法。

    我们再来尝试一下截断式阈值处理:

    import cv2
    img = cv2.imread('beautiful.JPG')
    _, result = cv2.threshold(img, 100, 255, cv2.THRESH_TRUNC)
    cv2.imshow('result', result)
    cv2.waitKey()
    cv2.destroyAllWindows()
    

    这次我们没有以灰度图的方式读取图片,因此最后的结果也是彩色图片,下面是效果图:

    在这里插入图片描述

    因为一些像素值高的点被抑制了,所以效果图偏暗,而且对比度也明显降低了。

    其余的大家可以自己尝试一下。

    4、Otsu处理

    在上面的例子中,我们都需要手动设置阈值。而且不同图像设置不同的阈值效果上会有很大区别,而Otsu算法就是一种自动确定阈值的算法。我们可以用cv2.threshold函数直接实现,使用如下:

    import cv2
    import numpy as np
    img = cv2.imread('beautiful.JPG', 0)
    _, result1 = cv2.threshold(img, 127, 255, cv2.THRESH_BINARY)
    # 使用Otsu算法
    thresh, result2 = cv2.threshold(img, 0, 255, cv2.THRESH_BINARY+cv2.THRESH_OTSU)
    # 将两张图片横向拼接
    result = np.hstack((result1, result2))
    # 输出Ostu算法得到的阈值
    print(thresh)
    cv2.imshow('result', result)
    cv2.waitKey()
    cv2.destroyAllWindows()
    

    我们分别使用了普通的二值化和Otsu算法,下面是效果图:

    在这里插入图片描述

    这次效果上背景看的更加清晰了。

    输出的阈值如下:

    99.0
    

    大家可以多尝试处理一些不同的图片。

    更多内容可以关注我的公众号“新建文件夹X”。

    展开全文
  • 《图像处理计算机视觉算法及应用(第2版)》介绍了最新的算法,包括基于内容搜索中的2D视觉方法和使用显卡作为图像处理计算工具等。对于软件工程师和开发人员、高级程序员、图形程序员、科学家,以及其他需要高度...
  • 计算机视觉图像处理Opencv基础知识(附详解代码)上 计算机视觉.pdf
  • 图像处理计算机视觉基础总结 很适合初学者了解与学习
  • 人工智能CV计算机视觉图像处理操作一、ROI(region of interest)相关操作1.截取部分图像数据2.颜色通道提取3.边界填充4.图像阈值5.图像平滑处理6.腐蚀操作7.膨胀操作8.开运算与闭运算9.梯度计算10.礼帽与黑帽11....

    图像处理相关操作

    作为笔记使用

    1.截取部分图像数据

    在这里插入图片描述

    2.颜色通道提取

    在这里插入图片描述

    3.边界填充

    4.图像阈值

    在这里插入图片描述

    5.图像平滑处理

    在这里插入图片描述

    6.腐蚀操作

    在这里插入图片描述

    7.膨胀操作

    在这里插入图片描述

    8.开运算与闭运算

    在这里插入图片描述

    9.梯度计算

    在这里插入图片描述

    10.礼帽与黑帽

    在这里插入图片描述

    11.图像梯度-Sobel算子

    在这里插入图片描述

    12.Canny边缘检测

    在这里插入图片描述

    展开全文
  • 一、计算机视觉和图像处理 从20世纪中期至今,计算机视觉不断发展,研究经历了从二维图像到三维到视频再到真实空间的探知,操作方法从构建三维向特征识别转变,算法由浅层神经网络到深度学习,数据的重要性逐渐被...

    目录

    一、计算机视觉和图像处理

    1.1 什么是计算机视觉?

    1.2 什么是图像处理?

    1.3 计算机视觉和图像处理的关系

    二、图像处理工具包

    2.1 PIL:Python图像处理类库

    2.1.1 Python安装PIL

    2.1.2 Image对象

    2.1.3  转换图像格式

    2.1.4 创建缩略图

    2.1.5 复制和粘贴图像区域

    2.1.6 调整尺寸和旋转

    2.2 Matplotlib类库

    2.2.1 绘制图像、点和线

    2.2.2 绘制图像的格式

    2.3 OpenCV视觉库

    2.3.1 基本操作

    3.2 OpenCV读取和PIL读取的差异

    三、图像直方图与直方图均衡化

    3.1  图像直方图

    3.1.1 图像直方图的定义

    3.1.2 图像直方图的性质

    3.1.3 绘制直方图

    3.2 直方图均衡化

    3.2.1 直方图均衡化的定义

    3.2.2 基本思想

    3.2.3 编程实现

    四、高斯滤波

    4.1 什么是高斯滤波?

    4.2 基本原理

    4.3 使用示例


    一、计算机视觉和图像处理

            从20世纪中期至今,计算机视觉不断发展,研究经历了从二维图像到三维到视频再到真实空间的探知,操作方法从构建三维向特征识别转变,算法由浅层神经网络到深度学习,数据的重要性逐渐被认知,伴随着计算机从理论到应用的速度加快,高质量的各种视觉数据不断沉淀,无论在社会经济农业还是工业领域,还是视频直播、游戏、电商不断发展,有计算机视觉应用层出不穷,为我们生活添加了丰富色彩,那么计算机视觉到底是什么?

    1.1 什么是计算机视觉?

            计算机视觉是一门研究如何使机器“看”的科学,更进一步的说,就是指用摄影机和电脑代替人眼对目标进行识别、跟踪和测量等机器视觉,并进一步做图形处理,使电脑处理成为更适合人眼观察或传送给仪器检测的图像。计算机视觉也可以看作是研究如何使人工系统从图像或多维数据中“感知”的科学。

            简单一点说,计算机视觉是人工智能的一个重要分支,它要解决的问题就是:看懂图像里的内容。给出一张二维图像,计算机视觉系统必须识别出图像中的对象及其特征,如形状、纹理、颜色、大小、空间排列等,从而尽可能完整地描述该图像。

    比如,如下图:

    • 图片里的有多少个人?
    • 图片里的人在干什么?
    • 这张照片的拍摄背景是什么?

             我们人类能够理解和描述图像中的场景。我们眼睛可以检测到图片里有两个人,且一男一女,他们在海边。除了这些基本信息,我们还能够看出图像中看到,女生穿着浅绿色衣服,男生穿的白色T恤,并且他们两都穿着黑色运动短裤,在沙滩上跑步。我们还可以理性地推断出图中人物是外国人,女生的头发是金色,男生的头发是褐色。我们从材质与纹理方面,还能描述出男生的裤子相较于女生的裤子比较宽松。

            以上,也是计算机视觉系统需要的技能。

    1.2 什么是图像处理?

           一幅图像可以定义成一个二维空间函数,即 I = f(x,y),I 是二维空间,x和y是空间中的坐标,f是位于二维空间中x和y坐标处的灰度值,即使在计算机中可以把图像看做一个矩阵。

            图像处理(狭义)是对输入图像进行某种变换得到输出图像,是一种图像到图像的过程。主要指对图像进行各种操作以改善图像的视觉效果,或对图像进行压缩编码以减少所需存储空间或传输时间、传输通路的要求,包括图像增强、图像恢复和重建,以及图像编码。

    1.3 计算机视觉和图像处理的关系

            图像处理旨在处理原始图像以应用某种变换,其目标通常是改进图像或将其作为某项特定任务的输入,而计算机视觉的目标是描述和解释图像。计算机视觉使用机器学习技术建模图像处理。计算机视觉应用机器学习来识别用于解释图像的模式。就像人类视觉的视觉推理过程一样;我们可以区分对象,对它们进行分类,根据它们的大小对它们进行排序等等。

    二、图像处理工具包

            深度学习领域,对图片视频样本的处理占了很大一部分比重。同样,对于计算机视觉来说,基本的图像处理操是重要的,对图像的处理结果的好与坏,可能会直接对研究结果产生影响,下面我将介绍一些关于图像处理的基本知识。

    2.1 PIL:Python图像处理类库

            PIL(Python Imaging Library,图像处理类库) 提供了通用的图像处理功能,以及大量有用的基本图像操作,比如:打开显示,灰度转换,图像缩放,旋转,裁剪等。PIL功能非常强大,但API却非常简单易用。

    2.1.1 Python安装PIL

            PIL仅支持到Python2.7以下的版本,加上年久失修,于是一群志愿者在PIL的基础上创建了兼容的版本,名字叫Pillow,支持最新Python 3.x,又加入了许多新特性,因此,如果我们python的版本比较高,我们可以直接安装使用Pillow。

      安装Pillow需要对应满足版本的pip,所以安装前最好更新一下pip,不然容易安装失败!

    python -m pip install --upgrade pip

      然后在命令行下直接通过pip安装:

    pip install pillow

     安装完成之后,我们就可以在命令行输入:

    pip list

     我们就可以看到安装好的pip和Pillow的版本了。 

     

    2.1.2 Image对象

             利用 PIL 中的函数,我们可以从大多数图像格式的文件中读取数据,然后写入最常 见的图像格式文件中。PIL 中最重要的模块为 Image,使用下列导包方式引入 Image 模块:

    from PIL import Image

    1)创建Image对象 

            使用 Image 类可以实例化一个 Image 对象,通过调用该对象的一系列属性和方法对图像进行处理。Pilow 提供了两种创建 Image 实例对象的方法,下面对它们进行简单的介绍。

    方法一:open()

      使用 Image 类的 open() 方法,可以创建一个 Image 对象,语法格式如下:

    img = Image.open(fp, mode="r")

      参数说明

    • fp:即 filepath 的缩写,表示文件路径,字符串格式;
    • mode:可选参数,若出现该参数,则必须设置为 "r",否则会引发 ValueError 异常。

      使用示例

    from PIL import Image
    # 读取图片,返回一个PIL图像对象
    img = Image.open('C:/Users/Administrator/Desktop/picture1.jpg')
    # 显示图片,调用 show()方法
    img.show()

      输出结果  

      

     方法二:new()

      使用 Image 类提供的 new() 方法可以创建一个新的 Image 对象,语法格式如下:

    img = Image.new(mode, size, color)

      参数说明

    • mode:图像模式,字符串参数,比如 RGB(真彩图像)、L(灰度图像)、CMYK(色彩图打印模式)等;
    • size:图像大小,元组参数(width, height)代表图像的像素大小;
    • color:图片颜色,默认值为 0 表示黑色,参数值支持(R,G,B)三元组数字格式、颜色的十六进制值以及颜色英文单词

      使用示例

    # 使用颜色的十六进制格式
    img2 = Image.new(mode='RGB', size=(500,500), color="#98e9e7")
    img2.show()

      输出结果

       

      文件目录下,读取多图片:

      在某一个文件夹里有多张图片,则我们可以写一个函数进行批处理:

    import os
    # 返回目录中所有JPG 图像的文件名列表
    def get_imlist(path):
        return [os.path.join(path,f) for f in os.listdir(path) if f.endswith('.jpg')]

      运行测试

    if __name__ == '__main__':
        img_list = get_imlist('C:\\Users\\Administrator\\Desktop\\Test1')
        for str in img_list:
            print(str)

       

      如下面这个文件夹,可以知道,上面运行结果是正确读取出了JPG图像,共六张。

      

    2) Image对象属性

      Image 对象有一些常用的基本属性,我们来了解一下这些图片的基本信息:

    属性说明
    size图像的尺寸
    format图片的格式
    readonly图片是否为只读
    info图片相关信息
    mode图像模式
    from PIL import Image
    # 读取图片
    img = Image.open('C:/Users/Administrator/Desktop/picture1.jpg')
    
    # 查看图片尺寸
    # 方式一: 直接打印
    print(img)
    # 方式二: 分别打印图片宽高
    print("图像的宽:", img.width, "; 图像的高:", img.height)
    # 方式三: 打印图片尺寸
    print("图像的大小:", img.size)
    
    # 查看图片的格式
    print("图像的格式:", img.format)
    
    # 查看图像是否为只读: 是返回为0, 否为1
    print("图像是否为只读:", img.readonly)
    
    # 查看图片相关信息: 返回值为字典格式
    print("图像信息:", img.info)
    
    # 查看图像模式
    print("图像模式信息:", img.mode)

       

    2.1.3  转换图像格式

            通过 save() 方法,PIL 可以将图像保存成多种格式的文件。save() 方法保存图像,当不指定文件格式时,它会以默认的图片格式来存储;如果指定图片格式,则会以指定的格式存储图片。save() 的语法格式如下:

    Image.save(fp, format=None)

      参数说明

    • fp:图片的存储路径,包含图片的名称,字符串格式;
    • format:可选参数,可以指定图片的格式。
    from PIL import Image
    # 读取图片
    img = Image.open('C:/Users/Administrator/Desktop/picture.jpg')
    # 把图像图片格式由jpg改成png
    img.save('C:/Users/Administrator/Desktop/picture.png', 'PNG')

      

       运行结束后,生成了一个格式为png的图片。

    2.1.4 创建缩略图

            缩略图(thumbnail image)指的是将原图缩小至一个指定大小(size)的图像。通过创建缩略图可以使图像更易于展示和浏览。

      Image 对象提供了一个 thumbnail() 方法用来生图像的缩略图,该函数的语法格式如下:

    thumbnail(size,resample)

      参数说明: 

    • size:元组参数,指的是缩小后的图像大小;
    • resample:可选参数,指图像重采样滤波器,有四种过滤方式,分别是 Image.BICUBIC(双立方插值法)、PIL.Image.NEAREST(最近邻插值法)、PIL.Image.BILINEAR(双线性插值法)、PIL.Image.LANCZOS(下采样过滤插值法),默认为 Image.BICUBIC。

      使用示例

    from PIL import Image
    # 读取图片
    img = Image.open('C:/Users/Administrator/Desktop/Test1/picture1.jpg')
    # 制定缩略尺寸
    img.thumbnail((500, 100))
    print("缩略图尺寸:", img.size)

       输出结果:

       

            有时候,缩略图的尺寸可能与我们指定的尺寸不一致,这是因为 Pillow 会对原图像的长、宽进行等比例缩小,当指定的尺寸不符合图像的尺寸规格时,缩略图就会创建失败, 比如指定的尺寸超出了原图像的尺寸规格。

    2.1.5 复制和粘贴图像区域

            拷贝、粘贴操作几乎是成对出现的,Image 类提供了 copy() 和 paste() 方法来实现图像的复制和粘贴。

    1)复制:copy()方法

      使用 crop()方法可以从一幅图像中裁剪指定区域:

    box = (left, top, right, bottom)
    img.crop(box)  # img是读取的图片对象

      参数说明

    • box 该图像中的一个矩形方块,是一个含有 4 个元素的元组:(left, top, right, bottom),表示矩形左上角与右下角的坐标。

    2)粘贴:paste()方法

            paste() 粘贴方法,该函数的作用是将一张图片粘贴至另一张图片中,粘贴后的图片模式将自动保持一致,不需要进行额外的转换。语法格式如下所示:

    paste(image, box=None, mask=None)

     参数说明 

    • image:指被粘贴的图片;
    • box:指定图片被粘贴的位置或者区域,其参数值是长度为 2 或者 4 的元组序列,长度为 2 时,表示具体的某一点 (x,y);长度为 4 则表示图片粘贴的区域,此时区域的大小必须要和被粘贴的图像大小保持一致。
    • mask:可选参数,为图片添加蒙版效果。

      使用示例

    from PIL import Image
    # 读取图片
    img = Image.open('C:/Users/Administrator/Desktop/Test1/picture1.jpg')
    
    # 复制原图片副本
    img_copy = img.copy()
    # 对副本进行裁剪
    box = (1000, 1000, 3000, 3000)
    region = img_copy.crop(box)
    # 旋转180°上面获取的区域
    region = region.transpose(Image.ROTATE_180)
    # 将裁剪后的副本粘贴至副本图像上
    img.paste(region, box)
    # 显示粘贴后的图像
    img.show()

      输出结果: 

      

    2.1.6 调整尺寸和旋转

    1)调整尺寸

             在图像处理过程中经常会遇到缩小或放大图像的情况,Image 类提供的 resize() 方法能够实现任意缩小和放大图像。

      resize() 函数的语法格式如下:

    resize(size, resample=image.BICUBIC, box=None, reducing_gap=None)

      参数说明

    • size:元组参数 (width,height),图片缩放后的尺寸;
    • resample:可选参数,指图像重采样滤波器,与 thumbnail() 的 resample 参数类似,默认为 Image.BICUBIC;
    • box:对指定图片区域进行缩放,box 的参数值是长度为 4 的像素坐标元组,即 (左,上,右,下)。注意,被指定的区域必须在原图的范围内,如果超出范围就会报错。当不传该参数时,默认对整个原图进行缩放;
    • reducing_gap:可选参数,浮点参数值,用于优化图片的缩放效果,常用参数值有 3.0 和 5.0

      使用示例

    from PIL import Image
    # 读取图片
    img = Image.open('C:/Users/Administrator/Desktop/Test1/picture1.jpg')
    # 调整尺寸
    img1 = img.resize((128, 128))
    # 输出图片
    img1.show()

      输出结果 

      

    注意:

    1. resize()方法可以缩小也可以放大,而thumbnail()方法只能缩小; 
    2. resize()方法不会改变对象的大小,只会返回一个新的Image对象,而thumbnail()方法会直接改变对象的大小,返回值为none; 

    2) 图片旋转

      Image 类提供了函数rotate(),可以任意角度旋转:

    Image.rotate(angle, resample=PIL.Image.NEAREST, expand=None, center=None, translate=None, fillcolor=None)

      参数说明

    • angle:表示任意旋转的角度;
    • resample:重采样滤波器,默认为 PIL.Image.NEAREST 最近邻插值方法;
    • expand:可选参数,表示是否对图像进行扩展,如果参数值为 True 则扩大输出图像,如果为 False 或者省略,则表示按原图像大小输出;
    • center:可选参数,指定旋转中心,参数值是长度为 2 的元组,默认以图像中心进行旋转;
    • translate:参数值为二元组,表示对旋转后的图像进行平移,以左上角为原点;
    • fillcolor:可选参数,填充颜色,图像旋转后,对图像之外的区域进行填充。

      使用示例

    from PIL import Image
    # 读取图片
    img = Image.open('C:/Users/Administrator/Desktop/Test1/picture1.jpg')
    # 旋转45°
    img1 = img.rotate(45)
    # 输出图片
    img1.show()
    

      输出结果

      

    2.2 Matplotlib类库

            我们处理数学运算、绘制图表,或者在图像上绘制点、直线和曲线时,Matplotlib是个很好的类库,具有比 PIL 更强大的绘图功能。Matplotlib可以绘制出高质量的 图表,就像本书中的许多插图一样。Matplotlib 中的 PyLab 接口包含很多方便用户创建图像的函数。

    2.2.1 绘制图像、点和线

            尽管 Matplotlib 可以绘制出较好的条形图、饼状图、散点图等,但是对于大多数计 算机视觉应用来说,仅仅需要用到几个绘图命令。最重要的是,我们想用点和线来表示一些事物,比如兴趣点、对应点以及检测出的物体。下面是用几个点和一条线绘制图像的例子:

    from PIL import Image
    from pylab import *
    # 读取图像到数组中
    img = array(Image.open('C:/Users/Administrator/Desktop/Test1/picture1.jpg'))
    # 绘制图像
    imshow(img)
    # 一些点
    x = [500, 500, 1000, 1000]
    y = [200, 900, 200, 900]
    # 使用红色星状标记绘制点
    plot(x, y, 'r*')
    # 绘制连接前两个点的线
    plot(x[:2], y[:2])
    # 添加标题,显示绘制的图像
    title('Plotting: "picture1.jpg"')
    show()
    # 坐标轴不显示
    axis('off')

      

    2.2.2 绘制图像的格式

    绘图时,有很多选项可以控制图像的颜色和样式,使用方法见下面的例子:

    • plot(x,y)         # 默认为蓝色实线
    • plot(x,y,'r*')    # 红色星状标记
    • plot(x,y,'go-')  # 带有圆圈标记的绿线
    • plot(x,y,'ks:')  # 带有正方形标记的黑色虚线

     用PyLab库绘图的基本颜色格式命令:

    • b'                 蓝色
    • 'g'                 绿色
    • 'r'                 红色
    • 'c'                 青色
    • 'm'                 品红
    • 'y'                 黄色
    • 'k'                 黑色
    • 'w'                 白色

     用PyLab库绘图的基本线型格式命令:

    • '-'                  实线
    • '--'                 虚线
    • ':'                  点线

    用PyLab库绘图的基本绘制标记格式命令:

    • '.'                  点
    • 'o'                 圆圈
    • 's'                 正方形
    • '*'                 星形
    • '+'                 加号
    • 'x'                 叉号

    2.3 OpenCV视觉库

            在计算机视觉项目的开发中,OpenCV作为较大众的开源库,拥有了丰富的常用图像处理函数库,采用C/C++语言编写,可以运行在Linux/Windows/Mac等操作系统上,能够快速的实现一些图像处理和识别的任务。

            此外,OpenCV还提供了Java、python、cuda等的使用接口、机器学习的基础算法调用,从而使得图像处理和图像分析变得更加易于上手,让开发人员更多的精力花在算法的设计上。OpenCV是用于快速处理图像处理、计算机视觉问题的工具,支持多种语言进行开发如c++、python、java等。我使用OpenCV-Python,使用python语言对图像进行处理和研究。

    2.3.1 基本操作

    注意,使用PyCharm开发,要先引入cv2库,若引入不成功就引入opencv-python。

    1)读入图像

    cv2.imread(filepath,flags)

      参数说明: 

    • filepath:要读入图片的完整路径;
    • flags:读入图片的标志 ;
    • cv2.IMREAD_COLOR:默认参数,读入一副彩色图片,忽略alpha通道 也可以以1指定
    • cv2.IMREAD_GRAYSCALE:读入灰度图片 也可以以0指定
    • cv2.IMREAD_UNCHANGED:顾名思义,读入完整图片,包括alpha通道
       

    2)显示图像

    cv2.imshow(wname, img)

      参数说明: 

    • 第一个参数是显示图像的窗口的名字;
    • 第二个参数是要显示的图像(imread读入的图像),窗口大小自动调整为图片大小;

        ps:显示图片时注意,让程序暂停cv2.waitKey(0),否则图片一闪而过,我们来不及观察图片 。

    3)保存图像

    cv2.imwrite(file,img,num)

       参数说明: 

    • 第一个参数是要保存的文件名;
    • 第二个参数是要保存的图像;
    • 可选的第三个参数,为写入图片的质量。

      使用示例

    import cv2
    # 读入图像
    # 1的话读取全彩图片 0读取灰度图片即黑白图片
    img1 = cv2.imread('C:/Users/Administrator/Desktop/Test1/picture1.jpg', 1)
    img2 = cv2.imread('C:/Users/Administrator/Desktop/Test1/picture1.jpg', 0)
    
    # 显示图像
    cv2.namedWindow('img1', cv2.WINDOW_NORMAL)
    cv2.namedWindow('img2', cv2.WINDOW_NORMAL)
    cv2.resizeWindow('img1', 600, 450)
    cv2.resizeWindow('img2', 600, 450)
    cv2.imshow('img1', img1)
    cv2.imshow('img2', img2)
    cv2.waitKey(0)
    
    # 保存图像
    # IMWRITE_JPEG_QUALITY的取值范围为0-100,下面写入jpg格式,数值越小,压缩比越高,图片失真严重
    cv2.imwrite('C:/Users/Administrator/Desktop/Test1/picture1_copy.jpg', img1, [cv2.IMWRITE_JPEG_QUALITY, 0])

      输出结果: 

      

       

    3.2 OpenCV读取和PIL读取的差异

    输出差异

            cv2.imread()读取的是图像的真实数据。lmage.open()函数只是保持了图像被读取的状态,但是图像的真实数据并未被读取态。

    通道差异

            Image.open()读取的通道顺序是RGB,cv2.imread()读取的通道顺序为BGR。

    import cv2
    from PIL import Image
    from matplotlib import pyplot as plt
    
    # 读入图像
    # OpenCV读取
    img1 = cv2.imread('C:/Users/Administrator/Desktop/Test1/picture1.jpg')
    # PIL读取
    img2 = Image.open('C:/Users/Administrator/Desktop/Test1/picture1.jpg')
    
    # 显示图像
    plt.figure(dpi=120)
    plt.subplot(121)    # 1代表行,2代表列,所以一共有2个图,1代表此时绘制第一个图。
    plt.axis('off')     # 取消坐标轴
    plt.title("OpenCV") # 标题
    plt.imshow(img1)    # 显示图片
    
    plt.subplot(122)    # 1代表行,2代表列,所以一共有2个图,2代表此时绘制第二个图。
    plt.axis('off')     # 取消坐标轴
    plt.title("PIL")    # 标题
    plt.imshow(img2)    # 显示图片
    plt.show()          # 显示窗口

             我们可以看到,两种方式输出的效果是不一样,用OpenCV读取的图片显示的颜色比较奇怪,用PIL读取图片就和实际原图是一致的,造成两个输出效果不一致的原因就是通道差异,PIL中Image.open()读取的通道顺序是RGB,OpenCV中cv2.imread()读取的通道顺序为BGR。

    三、图像直方图与直方图均衡化

    3.1  图像直方图

    3.1.1 图像直方图的定义

    ⼀幅数字图像在范围[0, G]内总共有L个灰度级,其直⽅图定义为离散函数:

    h(r_k)=n_k

    其中: r_k 是第 k 级亮度,n_k是灰度级为r_k的图像中的像素数,k=1,2,3,4,\cdot \cdot \cdot,L

            在实际处理中,图像直方图的x轴区间一般是[0, 255],对应的是8位位图的256个灰度级;y轴对应的是具有相应灰度级的像素点的个数。虽然8位的图像都具有256个灰度级(每一个像素可以有256个灰度值),但是属于不同灰度级的像素数量是很不一样的。有时为了便于表示,也会采用归一化直方图。在归一化直方图中,x轴仍然表示灰度级;y轴不再表示灰度级出现的次数,而是灰度级出现的频率。

    3.1.2 图像直方图的性质

    • 直方图反映了图像中的灰度分布规律。它描述每个灰度级具有的像元个数,但不包含这些像元在图像中的位置信息。
    • 任何一幅特定的图像都有唯一的直方图与之对应,但不同的图像可以有相同的直方图。
    • 如果一幅图像有两个不相连的区域组成,并且每个区域的直方图已知,则整幅图像的直方图是该两个区域的直方图之和。

            对于每幅图像都可做出其灰度直方图。根据直方图的形态可以大致推断图像质量的好坏。由于图像包含有大量的像元,其像元灰度值的分布应符合概率统计分布规律。假定像元的灰度值是随机分布的,那么其直方图应该是正态分布。
            图像的灰度值是离散变量,因此直方图表示的是离散的概率分布。若以各灰度级的像元数占总像元数的比例值为纵坐标轴做出图像的直方图,将直方图中各条形的最高点连成一条外轮廓线,纵坐标的比例值即为某灰度级出现的概率密度,轮廓线可近似看成图像相应的连续函数的概率分布曲线。  

    3.1.3 绘制直方图

            Python的模块matplotlib.pyplot中的hist()函数能够方便地绘制直方图,我们通常采用该函数直接绘制直方图。除此以外,OpenCV中的cv2.calcHist()函数能够计算统计直方图,还可以在此基础上绘制图像的直方图。

    1)使用Numpy绘制直方图

            模块matplotlib.pyplot提供了一个类似于MATLAB绘图方式的框架,可以使用其中的matplotlib.pyplot.hist()函数。

    matplotlib.pyplot.hist(X,BINS)

      参数说明 

    • X: 数据源,必须是一维的。图像通常是二维的,需要使用ravel()函数将图像处理为一维数据源以后,再作为参数使用。
    • BINS: BINS的具体值,表示灰度级的分组情况。

      使用示例

    import cv2
    import matplotlib.pyplot as plt
    img = cv2.imread('C:/Users/Administrator/Desktop/Test1/picture1.jpg')
    plt.hist(img.ravel(), 256)
    plt.show()

      输出结果 

      

    2)使用OpenCV绘制直方图

            OpenCV提供了函数cv2.calcHist()用来计算图像的统计直方图,该函数能统计各个灰度级的像素点个数。利用matplotlib.pyplot模块中的plot()函数,可以将函数cv2.calcHist()的统计结果绘制成直方图。

    hist = cv2.calcHist( images, channels, mask, histSize,ranges, accumulate)
    

      参数说明

    • hist:返回的统计直方图,是一个一维数组,数组内的元素是各个灰度级的像素个数。
    • images:原始图像,该图像需要使用“[ ]”括起来。
    • channels:指定通道编号。通道编号需要用“[ ]”括起来,如果输入图像是单通道灰度图像,该参数的值就是[0]。对于彩色图像,它的值可以是[0]、[1]、[2],分别对应通道B、G、R。
    • mask:掩模图像。当统计整幅图像的直方图时,将这个值设为None。当统计图像某一部分的直方图时,需要用到掩模图像。
    • histSize:BINS的值,该值需要用“[ ]”括起来。例如,BINS的值是256,需要使用“[256]”作为此参数值。
    • ranges:即像素值范围。例如,8位灰度图像的像素值范围是[0,255]。
    • accumulate:累计(累积、叠加)标识,默认值为False。如果被设置为True,则直方图在开始计算时不会被清零,计算的是多个直方图的累积结果,用于对一组图像计算直方图。该参数允许从多个对象中计算单个直方图,或者实时更新直方图。该参数是可选的,一般情况下不需要设置。

      使用示例

    import cv2
    import matplotlib.pyplot as plt
    img = cv2.imread('C:/Users/Administrator/Desktop/Test1/picture1.jpg')
    hist = cv2.calcHist([img], [0], None, [256], [0, 255])
    # hist是一个shape为(256,1)的数组,表示0-255每个像素值对应的像素个数,下标即为相应的像素值
    # plot一般需要输入x,y,若只输入一个参数,那么默认x为range(n),n为y的长度
    plt.plot(hist)
    plt.show()

      输出结果 

    3.2 直方图均衡化

    3.2.1 直方图均衡化的定义

            把原始图像的灰度直⽅图从⽐较集中的某个灰度区间变成在全部灰度范围内的均匀分布的技术。直⽅图均衡化能起到增强图像对⽐度的作⽤。

    3.2.2 基本思想

            直方图均衡化方法的基本思想是对在图像中像素个数多的灰度级进行展宽,而对像素个数少的灰度级进行缩减。从而达到清晰图像的目的。

    计算步骤:

    • 确定图像的灰度级
    • 计算原始直方图分布概率p(i)
    • 计算直方图概率累计值s(i)
    • 根据公式求取像素映射关系
    • 灰度映射 

    3.2.3 编程实现

    import cv2
    import numpy as np
    import matplotlib.pyplot as plt
    
    # 获取直方图——计算像素值出现概率
    def GetHist(img):
        assert isinstance(img, np.ndarray)
        prob = np.zeros(shape=(256))
    
        for rv in img:
            for cv in rv:
                prob[cv] += 1
    
        row, col = img.shape
        prob = prob / (row * col)
        return prob
    
    # 直方图均衡化
    def EqualHist(img, prob):
        # 累计概率
        prob = np.cumsum(prob)
    
        # 像素值映射
        img_map = [int(i * prob[i]) for i in range(256)]
    
        # 像素值替换
        assert isinstance(img, np.ndarray)
        row, col = img.shape
        for i in range(row):
            for j in range(col):
                img[i, j] = img_map[img[i, j]]
        return img
    
    # 画直方图
    def Draw_plot(y, name):
        plt.figure(num=name)
        plt.bar([i for i in range(256)], y, width=1)
    
    
    if __name__ == '__main__':
    
        # 读取灰度图
        img = cv2.imread("C:/Users/Administrator/Desktop/Test1/picture1.jpg", 0)
        # 获取原图取直方图
        prob = GetHist(img)
        # 画原图直方图
        Draw_plot(prob, "原图直方图")
    
        # 直方图均衡化
        img = EqualHist(img, prob)
        cv2.imwrite("source_hist.jpg", img)  # 保存图像
    
        # 获取均衡化后直方图
        prob = GetHist(img)
        # 画均衡化后的直方图
        Draw_plot(prob, "直方图均衡化结果")
        plt.show()

    运行结果:

    原图灰度图像
    均衡化后的灰度图像

    四、高斯滤波

    4.1 什么是高斯滤波?

            ⾼斯滤波是⼀种线性平滑滤波,适⽤于消除⾼斯噪声,⼴泛应⽤于图像处理的减噪过程。通俗的讲,⾼斯滤波就是对整幅图像进⾏加权平均的过程,每⼀个像素点的值,都由其本身和邻域内 的其他像素值经过加权平均后得到。⾼斯滤波的具体操作是:⽤⼀个模板(或称卷积、掩模)扫 描图像中的每⼀个像素,⽤模板确定的邻域内像素的加权平均灰度值去替代模板中⼼像素点的值。

    4.2 基本原理

            数值图像处理中,⾼斯滤波主要可以使⽤两种⽅法实现。⼀种是离散化窗⼝滑窗卷积,另⼀种⽅法是通过傅⾥叶变化。最常⻅的就是滑窗实现,只有当离散化的窗⼝⾮常⼤,⽤滑窗计算量⾮常 搭的情况下,可能会考虑基于傅⾥叶变化的实现⽅法。所以本⽂将主要介绍滑窗实现的卷积。

            离散化窗⼝划船卷积时主要利⽤的是⾼斯核,⾼斯核的⼤⼩为奇数,因为⾼斯卷积会在其覆盖区 域的中⼼输出结果。常⽤的⾼斯模板有如下⼏种形式:

     ⾼斯模板是通过⾼斯函数计算出来的,公式如下:

     4.3 使用示例

      opencv函数 cv2.GaussianBlur实现高斯滤波:

    cv2.GaussianBlur(src, ksize, sigmaX, sigmaY, borderType)

      参数详解

    • 第一个参数:InputArray类型的src,输入图像,Mat类的对象。该函数对通道是独立处理的,且可以处理任意通道数的图像,但是待处理的图像深度应该是CV_8U,CV_16U,CV_16S,CV_32F,CV_64F。
    • 第二个参数:OutputArray类型的dst,目标图像,需要和输入图像有相同的尺寸和类型。
    • 第三个参数:Size类型的lsize,内核的大小。一般用Size(w,h)的写法表示,w和h可以不同,但是必须是正数和奇数,例如Size(3,3),Size(5,5)。
    • 第四个参数:double类型的sigmaX,表示高斯核函数在X方向上的标准偏差。
    • 第五个参数:double类型的sigmaY,表示高斯核函数在Y方向上的标准偏差。如果sigmaY是0,就将它设为sigmaX。如果sigmaX和sigmaY都是0,那么就由ksize.width和ksize.height计算出来。为了结果的正确性,最好是将Size、sigmaX、sigmaY全部指定到。
    • 第六个参数:int类型的borderType,用于推断图像外部像素的某种边界模式,默认值 BORDER_DEFAULT,我们一般不管它。  

      使用示例

    import cv2
    img = cv2.imread('C:/Users/Administrator/Desktop/Test1/picture1.jpg')
    img1 = cv2.GaussianBlur(img, (3, 3), 10)
    img2 = cv2.GaussianBlur(img, (3, 3), 100)
    img3 = cv2.GaussianBlur(img, (3, 3), 1000)
    
    cv2.namedWindow('img', cv2.WINDOW_NORMAL)
    cv2.namedWindow('img1', cv2.WINDOW_NORMAL)
    cv2.namedWindow('img2', cv2.WINDOW_NORMAL)
    cv2.namedWindow('img3', cv2.WINDOW_NORMAL)
    cv2.resizeWindow('img', 600, 450)
    cv2.resizeWindow('img1', 600, 450)
    cv2.resizeWindow('img2', 600, 450)
    cv2.resizeWindow('img3', 600, 450)
    cv2.imshow('img', img)
    cv2.imshow('img1', img1)
    cv2.imshow('img2', img2)
    cv2.imshow('img3', img3)
    cv2.waitKey(0)

     输出结果: 

    下面四张图中,img为原图,其他都是经过高斯滤波后的图像,可以看出草地变得更加平滑了!

    展开全文
  • 数字图像处理计算机视觉 计算机视觉.pdf
  • 图像处理、分析与机器视觉(第三版) 图像处理算法 传统图像处理技术
  • 图像处理计算机视觉算法及应用-第二版高清带书签
  • python计算机视觉.pdf

    2018-10-26 09:17:13
    Python计算机视觉编程是计算机视觉编程的实践指南,依赖Python语言讲解了基础理论与算法,并通过大量示例细致分析了对象识别、基于内容的图像搜索、光学字符识别、光流法、跟踪、三维重建、立体成像、增强现实、姿态...
  • 图像处理计算机视觉算法及应用第2版-图像处理计算机视觉算法及应用教程(源码+pdf)... 计算机视觉.pdf
  • 计算机视觉的常用图像处理技术 计算机视觉.pdf
  • Pytorch入门到进阶视频教程(实战计算机视觉与自然语言处理项目),完整版15章,附源码;PyTorch比其他深度学习框架更易学,也是新手入门的好选择。本课程将算法、模型和基础理论知识进行有机结合,结合多个不同的CV...
  • 基于计算机视觉算法的图像处理技术探析.pdf
  • 计算机视觉技术课后答案-计算机视觉课后作业1——图像处理基础 计算机视觉.pdf
  • 计算机视觉特征提取与图像处理总结 计算机视觉.pdf
  • 计算机视觉的常用图像处理技术

    万次阅读 多人点赞 2020-05-21 22:38:59
    本篇将介绍常用基于OpenCv等视觉库的影像分割以及图像处理技术,并且附赠源码 一:边检测器 先复习一下基础的OpenCv操作:如上图:第一张是原图; 第二张是灰度图: gray = cv2.imread('lena.jpg', cv2.IMREAD_...
  • 图像处理计算机视觉基础,经典以及最近发展 计算机视觉.pdf
  • 一文了解计算机视觉与自然语言处理融合的研究进展 计算机视觉.pdf
  • 图像处理计算机视觉算法及应用 第2版 (高清完整版) pdf 扫描版
  • 计算机视觉——三维视觉 I

    千次阅读 2022-03-26 14:08:22
    【本学期选修国科大计算机视觉课程,本人方向也是cv,...从Marr最开始的图像处理到Hinton提出深度学习,甚至延续到现在,也就40年的时间,也就意味着计算机视觉此时只是处于一种前期发展,更需要人们去投入心思发现其奇
  • 纵观一切关系,发现计算机视觉的应用服务于机器学习。各个环节缺一不可,相辅相成。

空空如也

空空如也

1 2 3 4 5 ... 20
收藏数 173,834
精华内容 69,533
关键字:

计算机视觉处理