精华内容
下载资源
问答
  • 常用的图像获取方法
    千次阅读
    2022-04-14 11:27:13

    大规模数据集是成功应用深度神经网络的前提。例如,我们可以对图像进行不同方式的裁剪,使感兴趣的物体出现在不同位置,从而减轻模型对物体出现位置的依赖性。我们也可以调整亮度、色彩等因素来降低模型对色彩的敏感度。可以说,在当年AlexNet的成功中,图像增强技术功不可没

    1.常用的图像增强方法

    图像增强(image augmentation)指通过剪切、旋转/反射/翻转变换、缩放变换、平移变换、尺度变换、对比度变换、噪声扰动、颜色变换等一种或多种组合数据增强变换的方式来增加数据集的大小。图像增强的意义是通过对训练图像做一系列随机改变,来产生相似但又不同的训练样本,从而扩大训练数据集的规模,而且随机改变训练样本可以降低模型对某些属性的依赖,从而提高模型的泛化能力。

    常见的图像增强方式可以分为两类:几何变换类和颜色变换类

    • 几何变换类,主要是对图像进行几何变换操作,包括**翻转,旋转,裁剪,变形,缩放**等。

    • 颜色变换类,指通过模糊、颜色变换、擦除、填充等方式对图像进行处理

    实现图像增强可以通过tf.image来完成,也可以通过tf.keras.imageGenerator来完成。

    2.tf.image进行图像增强

    导入所需的工具包并读取要处理的图像:

    # 导入工具包
    import tensorflow as tf
    import matplotlib.pyplot as plt
    import numpy as np
    # 读取图像并显示
    cat = plt.imread('./cat.jpg')
    plt.imshow(cat)
    

    2.1 翻转和裁剪

    左右翻转图像是最早也是最广泛使用的一种图像增广方法。可以通过tf.image.random_flip_left_right来实现图像左右翻转。

    # 左右翻转并显示
    cat1 = tf.image.random_flip_left_right(cat)
    plt.imshow(cat1)
    

    创建tf.image.random_flip_up_down实例来实现图像的上下翻转,上下翻转使用的较少。

    # 上下翻转
    cat2 = tf.image.random_flip_up_down(cat)
    plt.imshow(cat2)
    

    随机裁剪出一块面积为原面积10%∼100%10%∼100%的区域,且该区域的宽和高之比随机取自0.5∼20.5∼2,然后再将该区域的宽和高分别缩放到200像素。

    # 随机裁剪
    cat3 = tf.image.random_crop(cat,(200,200,3))
    plt.imshow(cat3)
    

    2.2 颜色变换

    另一类增广方法是颜色变换。我们可以从4个方面改变图像的颜色:亮度、对比度、饱和度和色调。接下来将图像的亮度随机变化为原图亮度的50%50%(即1−0.51−0.5)∼150%∼150%(即1+0.51+0.5)。

    cat4=tf.image.random_brightness(cat,0.5)
    plt.imshow(cat4)
    

    类似地,我们也可以随机变化图像的色调

    cat5 = tf.image.random_hue(cat,0.5)
    plt.imshow(cat5)
    

    3 使用ImageDataGenerator()进行图像增强

    ImageDataGenerator()是keras.preprocessing.image模块中的图片生成器,可以在batch中对数据进行增强,扩充数据集大小,增强模型的泛化能力。比如旋转,变形等,如下所示:

    keras.preprocessing.image.ImageDataGenerator(
                   rotation_range=0, #整数。随机旋转的度数范围。
                   width_shift_range=0.0, #浮点数、宽度平移
                   height_shift_range=0.0, #浮点数、高度平移
                   brightness_range=None, # 亮度调整
                   shear_range=0.0, # 裁剪
                   zoom_range=0.0, #浮点数 或 [lower, upper]。随机缩放范围
                   horizontal_flip=False, # 左右翻转
                   vertical_flip=False, # 垂直翻转
                   rescale=None # 尺度调整
                )
    

    来看下水平翻转的结果:

    # 获取数据集
    (x_train, y_train), (x_test, y_test) = tf.keras.datasets.mnist.load_data()
    # 将数据转换为4维的形式
    x_train = X_train.reshape(X_train.shape[0],28,28,1)
    x_test = X_test.reshape(X_test.shape[0],28,28,1)
    # 设置图像增强方式:水平翻转
    datagen = ImageDataGenerator(horizontal_flip=True)
    # 查看增强后的结果
    for X_batch,y_batch in datagen.flow(x_train,y_train,batch_size=9):
        plt.figure(figsize=(8,8)) # 设定每个图像显示的大小
        # 产生一个3*3网格的图像
        for i in range(0,9):
            plt.subplot(330+1+i) 
            plt.title(y_batch[i])
            plt.axis('off')
            plt.imshow(X_batch[i].reshape(28,28),cmap='gray')
        plt.show()
        break
    


    更多相关内容
  • 提出了一种多次曝光融合的方法,采用指数积分时间对固定场景进行4次采样,将获取的低动态范围图像序列乘以一个积分时间因子直接进行图像非饱和区域的匹配。然后,以图像各点的对比度为权重因子,对各幅图像高低端...
  • 异源图像匹配是视觉导航、多源图像融合分析的关键步骤之一,常用的匹配方法是分别从两幅图像中提取特征,再对特征进行匹配。但是对于成像机理差别较大的异源图像,如合成孔径雷达(SAR)图像和可见光图像,很难提取到...
  • 数字图像处理(2)——数字图像获取

    千次阅读 2022-03-19 11:12:16
    文章目录2.1图像数字化2.1.1数字图像的表示2.1.1.1黑白图像2.1.1.2灰度图像2.1.1.3彩色图像2.1.2图像数字化过程2.1.2.1采样2.1.2.2量化2.1.2.3采样、量化参数与数字化图像间的关系2.1.2.4图像数字化设备2.2图像灰度...

    2.1图像数字化

    • 原理:图像数字化是将一幅画面转换成计算机能处理的形式–数字图像的过程.
    • 包括采样和量化两个过程.

    2.1.1数字图像的表示

    • 数字图像用矩阵来描述:以一幅数字图像F左上角像素中心为坐标原点,一幅m*n的数字图像用矩阵表示为:

    在这里插入图片描述

    数字图像根据灰度级的差异可以分为:黑白图像,灰度图像和彩色图像.

    2.1.1.1黑白图像

    • 图像的每个像素只能是黑或者白,没有中间的过渡,因此又称为二值图像.二值图像的像素值为1或0.

    2.1.1.2灰度图像

    • 每个像素的信息由一个量化的灰度来描述图像,没有彩色信息,字节(8位)可表示256级灰度[0,255]

    2.1.1.3彩色图像

    • 彩色图像是指每个像素由R G B分量构成的图像,其中R G B是由不同的灰度级来描述,1个灰度级使用一个字节,3字节可以表示一个像素.

    2.1.2图像数字化过程

    2.1.2.1采样

    • 采样:将空间上连续的图像变换成离散点的操作成为采样。

    • 采样的两个参数:

      • 采样间隔

        • 采样点之间的距离。
        • 采样间隔需要符合信号与系统处理中的抽样定理即在一定的采样间隔之下,能够完全把原始信号回复的一个原则。
      • 采样孔径

        • 采样的形状和大小
        • 在这里插入图片描述

    2.1.2.2量化

    • 量化:
      • 将像素灰度转换成离散的整数值的过程。
      • 一幅数字图像中不同灰度值的个数成为灰度级,用G表示。一般数字图像灰度级数G为2的整数幂,即G=2^g,g为量化bit数、若一幅图像的量化灰度级G=256级,灰度值范围为0-255,常称为8bit量化。
    • 图像数据量:
      • 一幅M*N,灰度级为G的图像所需的存储空间为M * N * g(bit)为图像数据量。

    2.1.2.3采样、量化参数与数字化图像间的关系

    • 数字化方式可分为均匀采样、量化和非均匀采样、量化。

      • 所谓均匀,指的是采样、量化均为等间隔方式。图像数字化一般采用均匀采样和均匀量化方式。
    • 非均匀采样:根据图像细节的丰富程度改变采样间隔,细节丰富的地方,采样间隔小,否则间距大。

    • 非均匀量化:对图像层次少的区域采用间隔大量化,而对图像层次丰富的区域采用间隔小量化。

    • 采样关系:

      • 采样间隔大,所得图像像素数越少,空间分辨率低,质量差
      • 采样间隔越小,所得图像像素书越多,空间分辨率高,图像质量好,但数据量大
      • 下图像素数从256 * 256递减至8 * 8

    在这里插入图片描述

    • 量化关系:

      • 量化等级越多,所得图像层次越丰富,灰度分辨率越高,质量越好,但数据量大,量化等级越少,图像层次欠丰富,灰度分辨率低,质量变差,会出现加轮廓现象,但是数据量小。

      • 例子:下面图像为采样间距相同时灰度级数从256到64,16,8,4,2所得的图像。

        [外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-JlvgdAAX-1647659514973)(C:\Users\23642\AppData\Roaming\Typora\typora-user-images\image-20220318111202779.png)]

    2.1.2.4图像数字化设备

    • 数字化器组成

    在这里插入图片描述

    • 扫描仪工作原理

      在这里插入图片描述

    • 图像数字化器的性能评价:

      在这里插入图片描述

    2.2图像灰度直方图

    • 图像灰度直方图的概念:灰度直方图是反应一幅图像中各灰度级像素出现的频率与灰度级的关系,以灰度级为横坐标,频率为纵坐标,绘制频率同灰度级的关系图就是一幅灰度图像的直方图。
    • 灰度直方图的性质:
      • 只能反映图像的灰度分布情况,而不能反应图像像素的位置,即其会丢失位置信息
      • 一幅图像对应唯一的灰度直方图,反之不成立
      • 一幅图像分为多个区域,多个区域的直方图之和为该图像的直方图
    • 应用:
      • 判断图像量化是否恰当
      • 确定图像二值化的阈值

    2.3图像处理算法的形式

    2.3.1基本功能形式

    • 单幅图像->单幅图像
    • 多幅图像->单幅图像
    • 单(或多)幅图像->数字或符号等

    2.3.2几种具体算法形式

    2.3.2.1局部处理

    • 领域:

      • 对于任一像素(i,j),该像素周围的像素构成的集合{(i+p,j+q),p、q取合适的整数},叫做该像素的邻域

        在这里插入图片描述

      • 常用的邻域:下图分别表示中心像素的4-邻域、8-邻域

        在这里插入图片描述

    • 局部处理的概念:

      • 对输入图像IP(i,j)处理时,某一输出像素JP(i,j)值由输入图像像素(i,j)及其邻域N(IP(i,j))中的像素值确定。这种处理成为局部处理。

        计算公式:

        在这里插入图片描述

    • 局部处理的例子

      • 对一幅图像采用3 * 3模板进行卷积运算

      在这里插入图片描述

    2.3.2.2点处理:

    • 在局部处理中,当输出值JP(i,j)仅与IP(i,j)有关,称为点处理。

      在这里插入图片描述

    2.3.2.3大局处理

    • 在局部处理中,输出像素JP(i,j)的值取决于图像大范围或者全部像素的值,这种处理成为大局处理。

      在这里插入图片描述

    2.3.2.4迭代处理

    • 反复对图像进行某种运算直至满足给定的条件,从而得到输出图像的处理形式称为迭代处理。

    • 图像的细化处理过程:

      在这里插入图片描述

    2.3.2.5跟踪处理

    • 选择满足适当条件的像素作为起始像素,检查输入图像和已得到的输出结果,求出下一步应该处理的像素,进行规定的处理,然后决定时继续处理下面的像素,还是终止处理。
    • 特点:
      • 目标像素依赖于前一个像素的位置和处理条件。

    2.3.2.6窗口处理和模板处理

    • 对图像的处理,一般采用对整个画面进行处理,但也有只对画面中特定的部分进行处理的情况。这种处理方式的代表由窗口处理和模板处理。

    • 单独对图像中选定的矩形区域内的像素进行处理的方式叫做窗口处理。

      在这里插入图片描述

    • 希望单独处理任意形状的区域时,可采用模板处理。

    • 模板的概念:任意形状的区域。

    • 模板平面:一个和处理图像相同大小的二维数组,用来存储模板信息。一般是一幅二值图像。

    • 模板处理:边参照模板平面对图像进行某种操作。

      在这里插入图片描述

    • 若模板成矩形区域,则与窗口处理有相同的效果,但是窗口处理与模板处理不同之处是后者必须设置一个模板平面。

    2.3.2.7串行处理和并行处理

    • 串行处理:
      • 后一像素输出结果依赖于前面像素处理的结果,并且只能一次处理各像素而不能同时对各像素进行相同处理的一种处理形式。
      • 特点:用输入图像的第(i,j)像素邻域的像素值和输出图像(i,j)以前像素的处理结果计算输出图像(i,j)像素的值。处理算法要按照一定顺序进行
    • 并行处理:
      • 对图像内的各像素同时进行相同形式运算的一种处理形式。
      • 特点:输出图像像素(i,j)的值,只用输入图像像素进行运算。各输出值可以独立运算。

    2.4图像的数据结构与特征

    • 图像数据结构是指图像像素灰度值的存储方式,常用方式是将图像各像素灰度值用一维或者二维数组相应的各元素加以存储。其他方式

    2.4.1图像的数据结构

    2.4.1.1组合方式

    • 方法:一个字长存放多个像素灰度值。
    • 特点:节省内存,但是计算量增加,处理程序复杂。

    2.4.1.2比特面方式

    • 将所有像素灰度的相同比特位用一个二维数组表示,形成比特面。n个比特位表示的灰度图像按比特面方式存储,就得到n个比特面。

    • 特点:能充分利用内存空间,便于进行比特面之间的运算,但对灰度图像处理耗时比较多。

      在这里插入图片描述

    2.4.1.3分层结构

    • 从原始图像开始依次构成像素数越来越少的系列图像,使数据表示具有分层性。代表为锥形(金字塔)结构。

    • 锥形结构:对2^k * 2^k 个像素形成的图像,依次构成分辨率下降的k+1幅图像的层次集合。

    • 方法:从原图像I0开始,依次产生行列像素数都变为1/2的一幅幅的图像I1,I2,…,Ik。此时,作为像素Ii的各像素的值,就是它前一个图像Ii-1的对应的2*2像素的灰度平均值。

      在这里插入图片描述

    • 优点:先对低分辨率图像进行处理,然后根据需要对高分辨率图像进行处理,可提高效率。

    2.4.1.4树结构

    • 对于如图所示的一幅二值图像的行、列接连不断地二等分,如果图像被分割部分中的全体像素都变成具有相同的特征时,这一部分不再分割。

    • 用此种方法,可以把图像用树结构(4叉树)来表示。这可以用在特征提取和信息压缩等方面。

      在这里插入图片描述

    2.4.1.5多重图像数据结构

    • 对于彩色图像或者多波段图像而言,每个像素包含着多个波段的信息。
    • 存储方式有三种:
      • 逐波段存储,分波段处理时采用
      • 逐行存储,逐行扫描记录设备采用
      • 逐像素存储,用于分类

    2.4.2图像文件格式

    • 按不同的方式进行组织或者存储数字图像像素的灰度,就得到不同格式的像素文件,图像文件按照其格式的不同具有相应的扩展名。
    • 常见的图像文件格式按照扩展名分为:RAW格式、BMP格式、TGA格式、PCX格式、GIF格式、TIFF格式等。
    • 上述图像格式大致包含下列特征:
      • 描述图像的高度、宽度以及各种物理特征的数据
      • 彩色定义
      • 描述图像的位图数据体

    2.4.2.1 RAW格式

    • 将像素按照行列号顺粗存储在文件中,这种文件只含有图像像素数据,不含有信息头,因此,在读图像时,需要事先知道图像大小(矩阵大小),它是最简单的一种图像文件格式。

    2.4.2.2 BMP格式

    • 由以下四个部分组成:

      • 14字节的文件头
      • 40字节的信息头
      • 8字节的颜色定义
      • 位图数据
    • 位图文件头:BITMAPFILEHEADER

      在这里插入图片描述

    • 位图信息头:

      在这里插入图片描述

    • palette(调色板)

      • 调色板实际上是一个数组,数组中每个元素的类型为RGBQUAD结构,占4个字节。

      • 结构定义如下:

        在这里插入图片描述

      • 有些位图,比如真彩色图,没有调色板,他们的位图信息头后直接是位图数据。

    • 位图数据:

      • 分为两种情况:
        • 对于用到调色板的位图,图像数据就是该像素颜色在调色板中的索引值
        • 对于真彩色图,图像数据就是实际的R、G、B值。
      • 对于2色位图,用1位就可以表示该像素的颜色,因此一个字节可以表示8个像素。对于16色位图,用4位可以标识一个像素的颜色,所以1个字节可以表示2个像素;对于256色位图,一个字节刚好可以表示一个像素
      • 对于真彩色图,3个字节才能表示1个像素

    2.4.2.3 GIF格式

    • GIF图像是基于颜色列表的,最多支持8位。GIF支持在一幅GIF文件中存放多幅彩色图像,并且可以按照一定的顺序和时间间隔将多幅图像依次读出并且显示在屏幕上,这样就可以形成一种简单的动画效果。
    • GIF一般由7个数据区组成:头文件、通用调色板、位图数据区以及四个扩充区。

    2.4.2.4 TIFF格式

    • 文件主要由三个部分组成:
      • 文件头
      • 标识信息区
      • 图像数据区
    • TIFF文件有其特有的标识信息,并能进行自定义,是一种开放易于扩展的数据格式,能支持较大数据量和不同定义方式的影像数据,广泛应用于遥感、地理信息领域。

    2.4.3图像的特征与噪声

    2.4.3.1图像的特征类别

    1. 自然特征
      • 光谱特征
      • 几何特征
      • 时相特征
    2. 人工特征
      • 直方图特征
      • 灰度边缘特征
      • 线、角点、纹理特征
    3. 按照提取特征分为:
      • 点特征:仅由各个像素就能决定的性质。如单色图像中的灰度值、彩色图像中的R G B成分的值。
      • 局部特征:在小邻域内所具有的特征,如线和边缘的强度、方向、密度和统计量(平均值、方差等)等。
      • 区域特征:在图像内的对象物(一般是指与该区域外部有区别的具有一定性质的区域)内的点或者局部的特征分布,或者统计量,以及区域的几何特征(面积、形状)等。
      • 整体特征:整个图像作为一个区域看待时的统计性质和结构特征等。

    2.4.3.2特征提取与特征空间

    2.4.3.2.1特征提取
    • 获取图像特征信息的操作称作特征提取。
    • 它作为模式识别、图像理解或者信息量压缩的基础是很重要的。通过特征提取,可以获得特征构成的图像(称作特征图像)和特征参数。
    2.4.3.2.2特征空间
    • 把从图像提取的m个特征量y1,y2,…ym,用m维的向量Y = [y1 y2 ym]^t表示称为特征向量。另外,对应于各特征量的m维空间叫做特征空间。

    2.4.4图像噪声

    1. 噪声种类:
      • 外部噪声:如天体放电干扰等
      • 内部噪声:系统内部产生,主要包括四种:由光和电的基本性质引起,机械运动产生的噪声、元器件噪声、系统内部电路噪声等。
    2. 噪声特征:
      • 对灰度图像f(x,y)来说,可看作二维亮度分布,而噪声可看作对亮度的干扰,用n(x,y)表示,常用统计特征来描述噪声,如均值、方差(交流功率)、总功率等。
    3. 噪声的模型:
      • 按照噪声对图像的影响可分为加性噪声模型和乘性噪声模型两大类。设f(x,y)为理想图像,n(x,y)为噪声,实际输出图像为g(x,y)
      • 加性噪声,与图像光强大小无关,g(x,y)=f(x,y)+n(x,y)
      • 乘性噪声,与图像光强大小相关,随亮度大小变化而变化,g(x,y)=f(x,y)[1+n(x,y)]
    4. 图像系统常见的噪声:
      • 光电管噪声
      • 摄像管噪声
      • 前置放大器噪声
      • 光学噪声
    展开全文
  • 噪声图像中的边缘检测是一项关键任务,然而目前常用的几种梯度算子,包括已经提出的高斯—拉普拉斯算子都没能取得理想效果。提出的方法对传统的拉普拉斯边缘检测算子作了改进,并与高斯滤波器相结合,应用高斯滤波器...
  • 构建了图像增强系统平台,主要探讨了在图像增强基础上,...BIOS测试中的测试用例大多是在未安装操作系统的环境下进行的,常用的在Windows和DOS环境下的抓图方法[1]并不适用在文中系统中,因此开发并设计出图像增强模块。
  • 图像预处理方法总结

    千次阅读 多人点赞 2020-03-30 15:31:45
    1. 图像二值化 1.1. 简单阈值或全局阈值 gray = cv.cvtColor(image, cv.COLOR_RGB2GRAY) #把输入图像灰度化 ret, binary = cv.threshold(gray, 0, 255, cv.THRESH_BINARY | cv.THRESH_TRIANGLE) 简单阈值当然是最...

    1. 图像二值化

    1.1. 简单阈值或全局阈值

    gray = cv.cvtColor(image, cv.COLOR_RGB2GRAY) #把输入图像灰度化
    ret, binary = cv.threshold(gray, 0, 255, cv.THRESH_BINARY | cv.THRESH_TRIANGLE)

    简单阈值当然是最简单,选取一个全局阈值,然后就把整幅图像分成了非黑即白的二值图像了。这个函数有四个参数,第一个原图像,第二个进行分类的阈值,第三个是高于(低于)阈值时赋予的新值,第四个是一个方法选择参数,常用的有:
    • cv2.THRESH_BINARY(黑白二值)
    • cv2.THRESH_BINARY_INV(黑白二值反转)
    • cv2.THRESH_TRUNC (得到的图像为多像素值)
    • cv2.THRESH_TOZERO
    • cv2.THRESH_TOZERO_INV

    1.2. 自适应阈值

    gray = cv.cvtColor(image, cv.COLOR_RGB2GRAY) #把输入图像灰度化
    binary = cv.adaptiveThreshold(gray, 255, cv.ADAPTIVE_THRESH_GAUSSIAN_C,cv.THRESH_BINARY, 25, 10)

    前面看到简单阈值是一种全局性的阈值,只需要规定一个阈值值,整个图像都和这个阈值比较。而自适应阈值可以看成一种局部性的阈值,通过规定一个区域大小,比较这个点与区域大小里面像素点的平均值(或者其他特征)的大小关系确定这个像素点是属于黑或者白(如果是二值情况)。使用的函数为:cv2.adaptiveThreshold()
    该函数需要填6个参数:
    • 第一个原始图像
    • 第二个像素值上限
    • 第三个自适应方法Adaptive Method:
    — cv2.ADAPTIVE_THRESH_MEAN_C :领域内均值
    —cv2.ADAPTIVE_THRESH_GAUSSIAN_C :领域内像素点加权和,权 重为一个高斯窗口
    • 第四个值的赋值方法:只有cv2.THRESH_BINARY 和cv2.THRESH_BINARY_INV
    • 第五个Block size:规定领域大小(一个正方形的领域)
    • 第六个常数C,阈值等于均值或者加权值减去这个常数(为0相当于阈值 就是求得领域内均值或者加权值)
    这种方法理论上得到的效果更好,相当于在动态自适应的调整属于自己像素点的阈值,而不是整幅图像都用一个阈值。

    2. 图像降噪

    2.1. 均值滤波

    cv2.blur(image, (3, 3))
    均值滤波是典型的线性滤波算法,它是指在图像上对目标像素给一个模板,该模板包括了其周围的临近像素(以目标像素为中心的周围8个像素,构成一个滤波模板,即去掉目标像素本身),再用模板中的全体像素的平均值来代替原来像素值
    均值滤波本身存在着固有的缺陷,即它不能很好地保护图像细节,在图像去噪的同时也破坏了图像的细节部分,从而使图像变得模糊,不能很好地去除噪声点。

    2.2. 高斯滤波

    cv2.GaussianBlur(image, (3, 3), 0)
    高斯滤波是一种线性平滑滤波,适用于消除高斯噪声,广泛应用于图像处理的减噪过程。 通俗的讲,高斯滤波就是对整幅图像进行加权平均的过程,每一个像素点的值,都由其本身和邻域内的其他像素值经过加权平均后得到。高斯滤波的具体操作是:用一个模板(或称卷积、掩模)扫描图像中的每一个像素,用模板确定的邻域内像素的加权平均灰度值去替代模板中心像素点的值。

    2.3. 中值滤波

    cv2.medianBlur(image, 3)
    

    中值滤波是一种典型的非线性滤波,是基于排序统计理论的一种能够有效抑制噪声的非线性信号处理技术,基本思想是用像素点邻域灰度值的中值来代替该像素点的灰度值,让周围的像素值接近真实的值从而消除孤立的噪声点。该方法在取出脉冲噪声、椒盐噪声的同时能保留图像的边缘细节。这些优良特性是线性滤波所不具备的。

    2.4. 双边滤波

    cv2.bilateralFilter(image, 5, 21, 21)
    bilateral filter双边滤波器可以很好的边缘保护,即可以在去噪的同时,保护图像的边缘特性。双边滤波(Bilateral filter)是一种非线性的滤波方法,是结合图像的空间邻近度和像素值相似度的一种折衷处理,同时考虑空域信息和灰度相似性,达到保边去噪的目的。

    3. 图像增强

    3.1. 灰度图像

    获取灰度图像。
    grayscaled = tf.image.rgb_to_grayscale(image)

    3.2. 饱和图像

    通过提供饱和度因子使图像饱和。
    saturated = tf.image.adjust_saturation(image, 3)

    3.3. 更改图像亮度

    bright = tf.image.adjust_brightness(image, 0.4)

    3.4. 基于直方图均衡化的图像增强

    直方图均衡化是通过调整图像的灰阶分布,使得在0~255灰阶上的分布更加均衡,提高了图像的对比度,达到改善图像主观视觉效果的目的。对比度较低的图像适合使用直方图均衡化方法来增强图像细节

    3.5. 基于拉普拉斯算子的图像增强

    使用中心为5的8邻域拉普拉斯算子与图像卷积可以达到锐化增强图像的目的,拉普拉斯算子如下图所示:

    在这里插入图片描述

    3.6. 基于对数Log变换的图像增强

    对数变换可以将图像的低灰度值部分扩展,显示出低灰度部分更多的细节,将其高灰度值部分压缩,减少高灰度值部分的细节,从而达到强调图像低灰度部分的目的。变换方法:
    在这里插入图片描述

    3.7. 基于伽马变换的图像增强

    伽马变换主要用于图像的校正,将灰度过高或者灰度过低的图片进行修正,增强对比度。变换公式就是对原图像上每一个像素值做乘积运算:
    在这里插入图片描述

    4. 图像几何变化

    4.1. 翻转图像

    垂直或水平翻转图像。
    flipped = tf.image.flip_left_right(image)

    4.2. 旋转图像

    将图像旋转90度
    rotated = tf.image.rot90(image)

    4.3. 中心裁剪图像

    从中心裁剪图像到所需的图像部分。
    cropped = tf.image.central_crop(image, central_fraction=0.5)

    5. 图像插值

    图像插值是在基于模型框架下,从低分辨率图像生成高分辨率图像的过程,用以恢复图像中所丢失的信息。图象插值方法有:最近邻插值,双线性插值,双平方插值,双立方插值以及其他高阶方法。
    cv2.resize(src, dsize[, dst[, fx[, fy[, interpolation]]]])
    interpolation 选项 所用的插值方法:
    INTER_NEAREST 最近邻插值
    INTER_LINEAR 双线性插值(默认设置)
    INTER_AREA 使用像素区域关系进行重采样。 它可能是图像抽取的首选方法,因为它会产生无云纹理的结果。 但是当图像缩放时,它类似于INTER_NEAREST方法。
    INTER_CUBIC 4x4像素邻域的双三次插值
    INTER_LANCZOS4 8x8像素邻域的Lanczos插值

    5.1. 最邻插值算法

    是最简单的一种插值算法,当图片放大时,缺少的像素通过直接使用与之最近原有颜色生成,也就是说照搬旁边的像素。这样做结果产生了明显可见的锯齿。
    在待求象素的四邻象素中,将距离待求象素最近的邻灰度赋给待求象素。

    5.2. 双线性插值算法

    在数学上,双线性插值是有两个变量的插值函数的线形插值扩展,其核心思想是在两个方向分别进行一次线性插值。
    双线性内插法的计算比最邻近点法复杂,计算量较大但没有灰度不连续的缺点,结果基本令人满意。它具有低通滤波性质,使高频分量受损,图像轮廓可能会有一点模糊。

    5.3. 三次内插法

    该方法利用三次多项式S(x)求逼近理论上最佳插值函数sin(x)/x, 其数学表达式为:

    待求像素(x, y)的灰度值由其周围16个灰度值加权内插得到

    展开全文
  • 图像增强主要有哪些方法

    千次阅读 2022-05-19 14:15:25
    图像增强是按照特定的需要去除或者突出图像中的某些信息,改善图像的视觉效果,使图像更适合分析。 一般主要分为两种方法,空间域和频率域。空间域直接在图像像素上操作,频率域,其操作是在图像的傅里叶变换上操作...

    图像增强是按照特定的需要去除或者突出图像中的某些信息,改善图像的视觉效果,使图像更适合分析。

    一般主要分为两种方法,空间域和频率域。空间域直接在图像像素上操作,频率域,其操作是在图像的傅里叶变换上操作。

    线性变换------可以应用在由于照明不足,图像对比度比较低的情况中,通过分段的线性变换函数,来对图像对比度进行拉伸。

    非线性变换------对数变换完成图像灰度级的扩展或者压缩。伽马变换可以用在电脑的显示器或者网站中图像的伽马校正,也可以用在图像的对比度增强中。

    加法运算------对于有噪声的图像,通过图像多张叠加求平均,可以对图像进行降噪。

    减法运算------图像相减常用于医学图像处理来消除背景。也可以用在运动检测中。

    乘法运算------获取对图像感兴趣的部分,保留感兴趣区域。

    直方图均衡------改善图像亮度和对比度。

    均值滤波------去除图像高斯噪声。

    高斯低通滤波-----是一种加权策略的均值滤波,用来降低噪声。          

    中值滤波器-----有效去除脉冲噪声,也叫椒盐噪声。

    Laplace算子-----是一种微分算子,应用强调在图像中灰度的突变区域,并不强调灰度级缓慢变化的区域。

    Sobel算子-----主要用在工业检测图像的边缘检测。

    频率域低通滤波-----去除边缘和噪声。

    频率域高通滤波-----把低频图像平滑的区域去掉。

    频率域同态滤波-----主要用于减少由于光照不均匀引起的图像降质,并对感兴趣的景物进行有效地增强。能够减少低频并且增加高频,锐化边缘细节

    展开全文
  • [总结] 常见图像增强方法总结(附实现代码)

    万次阅读 多人点赞 2019-08-05 08:30:07
    本篇博文用于总结常见图像增强方式,其中包括传统方法以及深度学习方法,并附有相应的实现代码。
  • 常用传统图像处理方法梳理

    千次阅读 2020-04-19 00:35:36
    图像滤波(1) 图像滤波(2) 图像增强——常见边缘检测算子2. HoG特征与SIFT特征(1) HoG(2) SIFT 特征3. 霍夫变换(1) 直线检测(2) 霍夫变换圆检测4. 开闭运算 腐蚀膨胀5. 插值 0. 颜色空间 常见颜色空间: RGB HSI...
  • 像素级图像融合常用方法

    万次阅读 多人点赞 2019-07-18 11:22:42
    像素级图像融合常用方法: 根据对图像信息处理运用方式不同,可将图像融合分为三个层次上的研究,即像素级,特征级和决策级。其中像素级融合位于最低层,可以看作是对信息仅作特征提取并直接使用。也正是得益于其对...
  • 图像灰度化的三种常见方法

    千次阅读 2022-04-25 12:09:20
    灰度化是图像处理的根基,下层基础决定上层建筑,因此学习灰度化是有关图像的一切研究之开端。
  • 图像分类方法总结

    千次阅读 2022-05-15 10:26:32
    1. 图像分类问题描述 图像分类问题是计算机视觉领域的基础问题,它的目的是根据图像的语义信息将不同类别图像区分开来,实现最小的分类误差。具体任务要求是从给定的分类集合中给图像分配一个标签的任务。总体来说,...
  • 今天景联文科技给大家介绍10种常见图像数据标注方法及其应用。 http://www.jinglianwen.com/admin/rest/newsinfo?id=51 1、语义分割 语义分割是指根据物体的属性,对复杂不规则图片进行进行区域划分,并标注...
  • 结合人眼获取信息的方式,提出一种面向人眼视觉的图像增强方法。在保持图像原有信息的前提下,使图像中相邻区域间的灰度差异最大限度地被人眼感知。根据图像区域间的邻接关系,设计一种灰度合并策略,用最少的灰度...
  • 前言:Mat是OpenCV的最基本的类型,他有很多常见的属性和方法,可以获取这张图片的基本信息,帮助我们更好地理解图片,本文做了一个简单的小结,并说明了一些常见的易错点。 一、Mat对象常见的属性以及方法一览 ...
  • 图像融合方法总结

    万次阅读 多人点赞 2018-12-06 17:09:37
    图像融合方法总结图像融合分类像素级的图像融合特征级图像融合决策级图像融合 图像融合分类 根据图像表征层次的不同,图像融合可分为三个层次的融合:像素级融合、特征级融合和决策级融合。图像融合的:1.图像增强...
  • 打开考生文件夹下的Word文档WDA051.doc,其内容如下:【WDA051.doc文档开始】常用的网罗互联设备常用的网罗互联设备主要有中继器、网桥、路由器和网关。中继器比较简单,它只对传送后变弱的信号进行放大和转发,所以...
  • 图像增强方法

    万次阅读 多人点赞 2019-03-26 14:54:49
    一般的图像增强方法根据增强处理过程所在的空间不同,可分为基于空域和频域的方法。基于空域的方法直接对图像进行处理,包括对比度增强和图像平滑;基于频域的方法是在图像的某种变换域内对图像的变换系数进行修正,...
  • 常见图像处理技术

    千次阅读 2022-02-20 01:15:09
    点击上方“小白学视觉”,选择加"星标"或“置顶”重磅干货,第一时间送达本期文章中,让我们一起来学习以下内容。通过PIL和OpenCV来使用一些常见图像处理技术,例如将RGB图像转换为灰度...
  • 【遥感图像预处理方法

    千次阅读 2022-05-02 10:54:07
    遥感图像预处理作为无人机图像拼接的第一环节,其处理效果会直接影响到后续拼接的速度、配准准确度以及图像拼接质量。 受限于无人机的飞行高度低、体积小、重量轻导致的抗风能力差、数码摄像头焦距不足等因素的限制...
  • 针对常用的双边滤波算法易造成图像细节丢失及Retinex算法在光照变化剧烈时易出现光晕伪影现象等缺点,提出了一种基于双边滤波和多尺度Retinex算法的图像增强方法。该方法首先对图像进行小波分解,获得图像高频和低频...
  • 本文将分享下我做图像识别项目工作过程中常用的关于图像分类数据处理方法,如有不当之处,欢迎大家指正。 图像数据增强 我们做项目过程中,经常会遇到某些类的图像数据出现严重不足,比如低于100张,我们就可以通过...
  • 深度图像获取原理

    2021-10-23 01:18:50
    点击上方“小白学视觉”,选择加"星标"或“置顶”重磅干货,第一时间送达转载| 机器人配视觉今天介绍一下深度图像获取方法主要有哪些,以及这些方法会导致深度图像中存在什么样的问题。在计算机视...
  • 数字图像处理的常用方法

    千次阅读 2019-03-26 19:18:13
    layout: post # 使用的布局(不需要改)...title: 数字图像处理的常用方法 date: 2019-03-25 16:59:56 type: categories author: Liu Fan tags: Image processing categories: Computer vision mathjax: true catal...
  • 图像去噪方法研究进展

    千次阅读 2021-07-16 04:36:28
    文章介绍了几种常用图像去噪方法,如中值滤波、BM3D、均值滤波、小波去噪等,通过对这几种去噪方法的基本思想和算法流程的对比研究,分析并总结了这些方法处理噪声的效果和优缺点。关键词: 图像去噪; 椒盐噪...
  • 规则网格是视觉词袋模型中常用图像检测方法,该方法抽取图像所有区块,获得背景区块和目标区块完整的图像信息。事实上,抽取的背景区块信息对类别的判定往往会有一定的混淆作用。以“摩托车”类和“小汽车”类的...
  • 图像分割有哪些方法

    2020-08-28 18:25:39
    图像分割中常用的直方图门限法、区域生长法、基于图像的随机场模型法、松弛标记区域分割法等均属于基于区域的方法。 (1)直方图门限分割就是在一定的准则下,用一个或几个门限值将图像的灰度直方图(一维的或多维...
  • 医学图像由于成像设备和获取条件等影响,可能会出现图像质量的退化:另外影像医生希望获得对比度高、细节丰富、可读性好的图像以降低阅片强度便于诊断。通过图像增强改善图像的视觉质量,让观察者能够看到更加直接、...
  • 常用数字图像分割方法

    千次阅读 2018-11-05 06:52:50
    图像分割是一种重要的图像处理技术。 人们在对图像的认知,理解和应用中,往往仅对其中的某些特定部分感兴趣,这些部分通常被称为目标或前景,它们一般对应图像中特定的,具有独特性质的区域。 这里所说的特定部分...

空空如也

空空如也

1 2 3 4 5 ... 20
收藏数 219,598
精华内容 87,839
热门标签
关键字:

常用的图像获取方法