• 数字图像处理数字图像处理学习内容总结 第一章 绪论 1 什么是数字图像处理 2 使用数字图像处理领域的实例 3 数字图像处理的基本步骤 4 图像处理系统的组成 第二章 数字图像处理基础 1 视觉感知要素 2 光和电磁...

    数字图像处理


    一、学习内容总结

    1. 第一章 绪论

    本章主要有几个目的:

    1. 定义我们称之为数字图像处理领域的范围;
    2. 通过考察几个领域,给出图像处理技术状况的概念;
    3. 讨论图像处理用到的几种方法;
    4. 概述通用目的的典型图像处理系统的组成。

    1.1 什么是数字图像处理

    我们给出一些定义:

    • 强度灰度:一幅图像可以被定义为一个二维函数 f(x,y),其中 x,y 是空间(平面)坐标,而在任何一处的幅值 f 被称为在该点的灰度或强度。
    • 数字图像:当 x,y 或灰度值 f有限的离散数值时,称该图像为数字图像。也就是说数字图像是由有限数量的元素组成,每个元素都有特定的位置和幅值。这些元素被称为图画元素图像元素像素
    • 数字图像处理 : 指用特定的计算机来处理数字图像。

    本书中将数字图像处理界定为其输入和输出都是图像的处理。

    1.2 使用数字图像处理领域的实例

    • 伽马射线成像:医学和天文。
    • X射线成像:最早用于成像的电磁辐射源之一,医学诊断。
    • 紫外波段成像 :荧光显微镜。
    • 可见光及红外线成像 :可见显微镜技术,遥感,天气预测和预报,红外卫星图像,自动视觉检测,检测丢失的部件,指纹图像。
    • 微波波段成像 :雷达。
    • 无线电波段成像 :天文学和医学(核磁共振)。
    • 其他方式 :声波成像,电子显微镜方法,(由计算机产生的)合成图像。

    1.3 数字图像处理的基本步骤

    这里写图片描述

    1.4 图像处理系统的组成

    这里写图片描述

    2. 第二章 数字图像处理基础

    本章主要介绍数字图像处理一些基本概念

    2.1 视觉感知要素

    • 人眼的结构

      重点介绍视网膜里的两类光感受器

      • 锥状体 :对颜色高度敏感,这种视觉称为白昼视觉或者亮视觉。高照明水平下执行。
      • 杆状体 :没有彩色感觉,对低照明度敏感,称为暗视觉或微光视觉。低照明水平下执行。
    • 亮度适应与辨别

      • 亮度适应现象 :视觉系统不能同时在一个范围内工作,它是通过改变其整个灵敏度来完成这一较大变动的。
      • 韦伯比 :较大:亮度辨别能力较差;反之,较好。
    • 感知亮度 不是简单的强度的函数

      • 视觉系统往往会在不同强度区域的边界处出现“下冲”或“上冲”现象。
      • 同时对比、错觉

    2.2 光和电磁波谱

    • 电磁波是能量的一种,任何有能量的物体都会释放电磁波谱。它可以用 波长 (λ)、频率(v)或能量(E) 来描述,其中

    λ=c/v

    E=hv

    • 光是一种特殊的电磁辐射,可以被人眼感知。
      • 单色光 是没有颜色的光,也成为无色光。唯一属性就是它的强度或者大小,用 灰度级 来表示。单色图像常被称为 灰度图像
      • 彩色光源 的质量可以用发光强度、光通量和亮度 来表示。

    2.3 图像感知和获取

    • 图像获取方式

      • 使用单个传感器来获取图像
      • 使用条带传感器获取图像
      • 使用传感器阵列获取图像
    • 简单的图像形成模型

      用形如 f(x,y) 的二维函数来表示图像,那么:

      0<f(x,y)<

      f(x,y) 可以用两个分量来表征:

      • 入射分量 入射到被观察场景的光源照射总量,用i(x,y) 表示;
      • 反射分量 场景中物体所反射的光照总量,用r(x,y) 表示。

      所以有:

      f(x,y)=i(x,y)r(x,y),0<i(x,y)<,0<r(x,y)<1

    2.4 图像取样和量化

    • 取样和量化的基本概念

      • 取样 :对坐标值进行数字化
      • 量化 : 对幅值数字化

      数字图像的质量在很大程度上取决于取样和量化中所用的样本数灰度级

    • 数字图像表示

      用数列矩阵来表示一幅数字图像。在实数矩阵中,每个元素称为图像单元、图像元素或像素。

      对比度 一幅图像最高和最低灰度级间的灰度差为对比度。

      存储数字图像所用的比特数为:

      b=M×N×k,M=Nb=N2k

      灰度级数L=2k

    • 空间和灰度分辨率

      • 空间分辨率 :图像中可辨别的最小细节的度量。在数量上,表示每单位距离线对数和每单位距离点数是最通用的度量(必须针对空间单位来规定才有意义)。
      • 灰度分辨率 :指在灰度级中可分辨的最小变化。
    • 图像内插

      用已知数据来估计未知位置的数据处理。是基本的图像重取样方法。可以处理图像的放大和缩小。

    2.5 像素间的基本关系

    • 相邻像素

      位于坐标 (x,y) 处的像素 p 有4个水平和垂直上的相邻像素,用 N4(p) 表示;有四个对角相邻像素,用 ND(p) 表示。如果 p 位于图像边界,则某些邻点可能 落在图像外边。

    • 邻接性、连通性、区域和边界

      • 4邻接、8邻接、混合邻接
    • 距离度量

      • 欧氏距离(圆)
      • D4 城市街区距离(菱形)
      • 棋盘距离(正方形)

    2.6 常用数学工具介绍

    • 阵列和矩阵操作
    • 线性操作和非线性操作
    • 算术操作
    • 集合和逻辑操作
      • 基本集合操作
      • 逻辑操作
      • 模糊集合
    • 空间操作
      • 单像素操作
      • 邻域操作
      • 几何空间变换与图像配准
    • 向量和矩阵操作
    • 图像变换

    3.第三章

    3.1 背景知识

    • 空间域 就是简单的包含图像像素的平面。空间域处理可用以下方式表示:

    g(x,y)=T[f(x,y)],T(x,y)

    • 灰度变换函数
      s=T(r),r,s

    3.2 基本灰度变换函数

    • 图像反转

      得到灰度范围为 [0,L1] 的一幅图像的反转图像:(得到等效的照片底片)

      s=L1r

    • 对数变换

      对数变换的通用形式:

      s=clog(1+r)

      扩展图像中暗像素的值,同时压缩更高灰度级的值。反对数变换的作用与此相反。

    这里写图片描述

    • 幂律变换(伽马)变换

      基本形式:

      s=crγ

      γ<1 变亮,大于1变暗,c=γ=1 恒等变换。

    这里写图片描述
    * 分段线性变换函数
    * 对比度拉伸:扩展图像灰度级动态范围处理,因此它可以跨越记录介质和显示装置的全部灰度范围。

    根据$r,s$ 的取值,变换可以为线性函数和阈值处理函数。
    
    • 灰度级分层:突出特定图像灰度范围的亮度。有两种方法:

      • 突出范围 [A,B] 内的灰度,并将所有其他灰度降低到一个更低的级别;
      • 突出范围[A,N] 内的灰度,并保持所有其他灰度级不变。
    • 比特平面分层:突出特定比特为整个图像外观作贡献。

      • 4个高阶比特平面,特别是最后两个比特平面,包含了在视觉上很重要的大多数数据。
      • 低阶比特平面在图像中贡献更精细的灰度细节。

      得出结论:储存四个高阶比特平面将允许我们以可接受的细节来重建原图像。这样可减少50%的存储量。

    3.3 直方图的处理

    • 理论基础:若一幅图像的像素倾向于占据可能的灰度级并且分布均匀,则该图像会有高对比度的外观并展示灰色调的较大变化。

    • 直方图均衡:

      • 灰度范围为 [0,L1] 的数字图像的直方图是离散函数 h(rk)=nk,其中 rk 是第 k 级灰度值,nk 是图像中灰度为rk 的像素的个数。
      • 通过转换函数T(rk)变换,得到直方图均衡化。
      • 应用:自适应对比度增强。
    • 直方图匹配:用于处理后有特殊直方图的方法。

    • 局部直方图处理:以图像中每个像素邻域中的灰度分布为基础设计变换函数,来增强图像中小区域的细节。

    • 在图像增强中使用直方图统计:提供这样一种增强图像的方法:

      在仅处理均值和方差时,实际上直接从取样值来估计它们,不必计算直方图。这些估计被称为取样均值和取样方差。

    3.4 空间滤波基础

    • 空间滤波机理

      • 空间滤波器的组成:
      • 一个邻域
      • 对该邻域包围的图像像素执行的预定义操作

      滤波产生的是一个新像素,新像素的坐标等于邻域中心的坐标,像素的值是滤波操作的结果。

    • 空间相关与卷积

      • 相关:滤波器模板移过图像并计算每个位置乘积之和的处理。一个大小为m×n 的滤波器与一幅图像 f(x,y) 做相关操作,可表示为w(x,y)f(x,y)
      • 卷积:与相关机理相似,但滤波器首先要旋转180o 一个大小为m×n 的滤波器与一幅图像 f(x,y) 做j卷积操作,可表示为w(x,y)f(x,y)

    3.5 平滑空间滤波器

    用于模糊处理和降低噪声。

    • 平滑线性滤波器(均值滤波器)

      它使用滤波器确定的邻域内像素的平均灰度值代替图像中每个像素的值。应用:

      • 降低噪声
      • 灰度级数量不足而引起的伪轮廓效应的平滑处理
      • 去除图像的不相关细节
    • 统计排序(非线性)滤波器

      最有代表性的是中值滤波器 ,特点:

      • 将像素邻域内灰度的中值(在中值计算中,包括原像素值)代替该像素的值;
      • 对处理脉冲噪声(椒盐噪声)非常有效。

    3.6 锐化空间滤波器

    • 拉普拉斯算子:最简单的各向同性微分算子,是一个线性算子。因其为微分算子,因此强调的是图像中灰度的 突变而不是灰度级缓慢变换的区域。

    • 非锐化隐蔽和高提升滤波:从原图像中减去一部分非锐化的版本。步骤:

      • 模糊原图像
      • 从原图像减去模糊图像
      • 将模板加到原图像上
    • 梯度:图像处理中的一阶微分用梯度实现。对于函数f(x) ,在坐标(x,y) 处的梯度定义为二维列向量。它指出在位置f(x,y)f的最大变化率方向。

      应用:边缘增强。

    4.第四章

    本章主要为傅里叶变换的原理打一个基础,并介绍在基本的图像滤波中如何使用傅里叶变换。

    4.1. 基本概念

    • 傅里叶概念:任何周期函数都可以表示为不同频率的正弦和或余弦和的形式,每个正弦项和或余弦项乘以不同的系数(傅里叶级数)。
    • 傅里叶变换:在非周期函数用正弦和或余弦和乘以加权函数的积分来表示的公式。
    • 介绍复数、傅里叶级数、冲击及其取样特征、连续函数的傅里叶变换以及之前提过的卷积。

    4.2. 取样与取样函数中的傅里叶变换

    • 取样

      在连续函数f(x,y) 中模拟取样的一种方法是:用一个ΔT 单位间隔的冲击串作为取样函数去乘以f(t) .

    • 取样函数的傅里叶变换

      空间域来两个函数乘积的傅里叶变换是两个函数在频率域的卷积。

    • 取样定理

      如果以超过函数最高频率的两倍的取样来获取样本,连续的带限函数可以完全从它的样本集来恢复。

    4.3. DFT小结

    在课本上,作者给了我们详细的总结:

    这里写图片描述
    这里写图片描述
    这里写图片描述

    4.4. 频率域滤波

    • 步骤
      • 等到填充参数PQ
      • 形成大小为P×Q 的填充后的图像fp(x,y)
      • (1)x+y 乘以fp(x,y)移到其变换中心
      • 计算上一步骤的DTF,得到F(u,v)
      • 生成实的、对称的滤波函数H(u,v)
      • 得到处理后的图像gp(x,y)
      • gp(x,y) 的做上限提取M×N区域 ,得到最终的处理结果g(x,y)
    • 空间域与频率域间的纽带是卷积定理。

    4.5. 使用频率域滤波器平滑图像

    三种低通滤波器来平滑图像

    • 定义总结

    这里写图片描述

    • 特性
      • 理想低通滤波器(ILFP)
      • 特性:模糊和振铃。
      • 布特沃斯低通滤波器(BLPF)
      • 特性:随着阶数增高,其振铃和负值变明显。(一阶时无)
      • 高斯低通滤波器(GLPF)
      • 特性:无振铃

    4.6. 使用频率域滤波器锐化图像

    • 三种高通滤波器来锐化图像
      • 定义总结

    这里写图片描述
    * 特性

    * 理想高通滤波器(IHPF)
      * 有振铃
    * 布特沃斯高通滤波器(BHPF)
      * 比IHPF更平滑
    * 高斯低通滤波器(GHPF)
      * 比前两个更平滑,即使微小物体和细线条得到的结果也比较其清晰
    
    • 其他方式

      • 拉普拉斯算子
      • 钝化模板、高提升滤波和高频强调滤波
      • 同态滤波

    4.7.选择性滤波器

    处理指定频段或者频率域的小区域

    • 带阻滤波器和带通滤波器

      • 带阻滤波器
        这里写图片描述

      • 带通滤波器

      • 通过1减去带阻得到。

    • 陷波滤波器:拒绝事先定义的关于频率矩形中心的一个邻域的频率。

      • 陷波带阻滤波器

      用中心已被平移到陷波滤波中心的高通滤波器的乘积来构造。

      • 陷波带通滤波器

      通过1减去带阻得到。

    展开全文
  • 概念与方法 一幅图像可定义为一个二维函数f(x,y),其中x,y是空间坐标,而在任何一对空间坐标(x,y)处的...数字图像处理是借助于数字计算机来处理数字图像。 采样与量化:所谓的图像数字化,是指将模拟图像经过离散...

    概念与方法

         一幅图像可定义为一个二维函数f(x,y),其中x,y是空间坐标,而在任何一对空间坐标(x,y)处的幅值称为图像在该点处的强度或灰度。当x,y和灰度值f是有限的离散数值时,我们称该图像为数字图像
    数字图像是由有限的元素组成的,每个元素都有特定的位置和幅值,这些元素称为像素。
    数字图像处理是借助于数字计算机来处理数字图像。

    采样与量化:所谓的图像数字化,是指将模拟图像经过离散化之后,得到用数字表示的图像。
    图像的数字化包括了空间离散化(即采样)和明暗表示数据的离散化(即量化)。

    对坐标的数值化称为取样;对幅值的数字化称为量化。

    分辨率:  区分图像中的目标物细节的程度,称为图像的分辨率。图像分辨率包括空间分辨力和幅度分辨率,分别由图像的采样和量化决定。

    • 空间分辨率是图像中可辨别的最小细节的度量。
    • 灰度分辨率是灰度级中可分辨的最小变化。

    图像增强通过某种技术有选择的突出对某一具体应用有用的信息,削弱或抑制一些无用的信息。

    • 基于图像的灰度直方图,根据所在空间不同,分为空域和频域两种。
    • 常用的彩色增强有:真彩色增强技术、假彩色增强技术、伪彩色增强技术。

    图像加减乘除:相加用于平滑噪声,相减用于增强差别,相乘用于矫正阴影和模板操作。

    直方图均衡化对在图像中像素的个数多的灰度级进行展宽,而对像素个数少的灰度级进行缩减,从而达到清晰图像的目的。

    直方图匹配:    直方图规定化是使原图像灰度直方图变成规定形状的直方图而对图像作修正的增强方法,也称为直方图匹配

    空域滤波:

    • 空域滤波是指利用像素及像素邻域组成的空间进行图像增强的方法。
    • 其原理是对图像进行模板运算。
    • 模板运算的基本思路是将赋予某个像素的值作为它本身灰度值和其相邻像素灰度值的函数。

    微分滤波器模板系数设计:

         roberts交叉梯度算子,prewitt梯度算子,sobel梯度算子。两种模板处理后取绝对值再相加。

         -1  0              -1  -1  -1            -1  -2  -1

          0  1               0   0   0              0   0   0

                               1   1   1              1   2   1

    取样定理:

    取样定理百度百科

                                                 \frac {1}{\Delta T}>2u_{max}

    如果以超过函数最高频率两倍的取样率来获得样本,连续带限函数能完全由其样本集恢复。

     

    混淆:

    以低于奈奎斯特取样率取样的最终效果是周期重叠,并且不管使用什么样滤波器,都不可能分离出变换的一个单周期。

    由函数欠采样导致的后果称为频率混淆即:一个连续函数的高频分量在取样后的函数中用低频修改的过程。

     

    一维DFT及IDFT:

    F(u)=\sum_{x=0}^{M-1}f(x)e^{-j2\pi ux/M}, u=0,1,2,.....,M-1;

    f(x)=\frac {1} {M}\sum_{x=0}^{M-1}F(u)e^{j2\pi ux/M}, x=0,1,2,.....,M-1;

    \overline{f}(x,y) =F(0,0);  若f(x,y)为一幅图像,在原点的傅里叶变换等于该图像的平均灰度级。

    DFT步骤:

    1. 使用paddedsize获得填充参数:PQ = paddedsize(size(f));%如果输入是彩色图像,必须要灰度化rgb2gray;
    2. 对f(x,y)添加必要的零;
    3. 得到使用填充的傅里叶变化:F = fft2(f, PQ(1), PQ(2));
    4. 生成一个大小为PQ(1)  X  PQ(2) 的滤波函数H,如果该滤波函数已居中,使用前要令H = ifftshift(H)。
    5. 将变换乘以滤波函数:G = H.*F;
    6. 获得G的傅里叶逆变换的实部:g = real(ifft2(G));
    7. 将左上部分的矩形剪切为原来尺寸大小:g = g(1:size(f,1), 1:size(f, 2));

    频率域滤波器:

    H_{BP}(u,v)=1-H_{BR}(u,v)

     

     

    H_{np}(u,v)=1-H_{nr}(u,v)

    高频提升,高频加强,钝化模板

    高频滤波后的图像,其背景平均强度 减小到接近黑色(因为高通滤波器滤除 了傅里叶变换的零频率成分: F(0,0)=f(x,y)=0)

     解决办法:把原始图像加到过滤后的 结果,如拉普拉斯算子增强,这种处理 称为高频提升过滤

    钝化模板(锐化或高通图像):从一幅图像减去 其自身模糊图像而生成的锐化图像构成。在频率 域,即从图像本身减去低通滤波(模糊)后的图 像而得到高通滤波(锐化)的图像

    高频提升过滤:

    当A=1,即高通过滤;当A>1,累加图像本身

    振铃效应

    用理想低通滤波器滤波时,频域:G(u,v)=F(u,v)H(u,v)

    傅立叶反变换到时域有:g(x,y)=f(x,y)∗h(x,y)

    频域相乘相当于时域作卷积。因此,图像经过理想低通滤波器后,时域上相当于原始图像与sinc函数卷积,由于sinc函数振荡,则卷积后图像也会振荡;或者说由于sinc函数有两个负边带,卷积后图像信号两侧出现“过冲现象”,而且能量不集中,即产生振铃效应。若截止频率越低,即D0越小,则sinc函数主瓣越大,表现为中心环越宽,相应周围环(旁瓣)越大。而中心环主要决定模糊,旁瓣主要决定振铃效应。因此当截止频率较低时,会产生很强的振铃效应。选择适当的截止频率,会减小振铃效应

    PS:这里的时域也就是空间域

    各种噪声概率密度函数

    高斯噪声

    p(z)= \frac {1} {\sqrt {2 \pi}\sigma}e^{-(z-\overline z)^2/2\sigma^2}

    瑞丽噪声

    p(z)=$$\left\{ \begin{array}{c} \frac {2}{b}(z-a)e^{-(z-a)^2/b}, z\geq a \\ 0, \qquad \qquad \; z<a \end{array} \right. $$             \overline z=a+\sqrt{\pi b/4}             \sigma^2=\frac {b(4-\pi)}{4}

    爱尔兰(伽马)噪声

    p(z)=$$\left\{ \begin{array}{c} \frac {a^bz^{(b-1)}} {(b-1)!}e^{-az}, z\geq a \\ 0, \qquad \qquad \; z<a \end{array} \right. $$                              \overline z=\frac b a                 \sigma^2=\frac {b} {a^2}

    指数噪声

    p(z)=$$\left\{ \begin{array}{c} ae^{-az}, z\geq \textsl{0} \\ 0, \qquad z<\textsl{0} \end{array} \right. $$                                     \overline z=\frac 1 a                        \sigma^2=\frac {1} {a^2}

     

    均匀噪声

    p(z)=$$\left\{ \begin{array}{c} \frac 1 {b-a}, \;\;\; a\leq z \leq b \\ 0, \qquad other \end{array} \right. $$                        \overline z=\frac {a+b}{2}                           \sigma^2=\frac {(a-b)^2} {12}

    脉冲(椒盐)噪声

    p(z)=$$\left\{ \begin{array}{c} p_a,\quad z=a \\ p_b, \quad z=b \\ 0,\quad \; other \end{array} \right. $$

    图像复原与增强的区别和联系:

    • 与图像增强相似,图像复原的目的也是改善图像质量。
    • 两者都可以使用空间域或频率域滤波器实现。
    • 图像增强主要是一个主观过程,而图像复原主要是一个客观过程。
    • 图像增强被认为是一种对比度拉伸,提供给用户喜欢接收的图像;而图像复原技术追求恢复原始图像的最优估值。

     

    维纳滤波

    展开全文
  • VC++数字图像处理 杨淑滢 本文对该老师的代码进行总结,代码小白顺便补充一下自己比较困惑的知识点,方便后续复习。 对于BMP格式的图像结构分为以下四个部分: 位图文件头结构BITMAPFILEHEADER ...

    VC++数字图像处理 杨淑滢

    本文对该老师的代码进行总结,代码小白顺便补充一下自己比较困惑的知识点,方便后续复习。

    • 对于BMP格式的图像结构分为以下四个部分:
    位图文件头结构BITMAPFILEHEADER
    位图信息头结构BITMAPINFOHEADER
    位图颜色表RGBQUAD
    位图像素数据部分

     

    • 对于位图的图像分为四类:
    1. 单色图像:有两个值:0,255其中0表示黑,255表示白(也可以进行归一化处理为0和1)。
    2. 灰度图像:带有颜色表,相当于索引表。RGB的分量值相同。
    3. 伪彩色图像:RGB的分量不完全相同,带有颜色表,相当于索引,整个图像256种颜色。
    4. 24位真彩色图像:没有调色表,RGB三分量各占8位。
    • 对于C++中结构体结构的介绍:

                在c++中如果用typedef的话:

        struct   Student   
        {   
        int   a;   
        }stu1;//stu1是一个变量  

     
        typedef   struct   Student2   
        {   
        int   a;   
        }stu2;//stu2是一个结构体类型=struct Student  

                 即在C++中用typedef相当于重命名操作,相当于对struct后面的变量重新命名。

    •   对于变量中的类型别名问题—引入头文件“windowsX.h"

                 windef.h——基本型态定义 
                 winbase.h——Kernel函数 
                 wingdi.h——图形设备接口函数 
                 winuser.h——使用者接口函数

                其中这里主要使用的是第一个应用:基本形态定义,这里面定义了宏,方便后面的使用。

             

    1 typedef unsigned long       DWORD; 
    2 typedef int                 BOOL;
    3 typedef unsigned char       BYTE; 
    4 typedef unsigned short      WORD;
    5 typedef float               FLOAT;

    于是可以将BMP图像的格式用代码的方式展现出来

    位图文件头:

    1 typedef struct tagBITMAPFILEHEADER
    2 {
    3     WORD bftype;//表示2个字节,16位的短整数,用来判断是否为位图文件类型
    4     DWORD bfsize;//表示4个字节,位图文件的大小。
    5     WORD  bfReaserved1;//位图文件的保留字,必须为0.
    6     WORD  bfReaserved2;//位图文件的保留字,必须为0
    7     DWORD bfOffBits;//表示数据的起始位置     
    8 } BITMAPFILEHEADER; 

    位图信息头:

    typedef struct tagBITMAPINFOHEADER
    {
    DWORD biSize;//本结构所占用字节数
    LONG biWidth;//位图的宽度,以像素为单位
    LONG biHeight;//位图的高度,以像素为单位
    WORD biPlanes;//目标设备的级别,必须为1
    WORD biBitCount;//每个像素所需的位数,1、4、8、24
    DWORD biCompression;/*位图压缩类型,必须为0(不压缩)、1(BI_RLE8压缩类型)、2(BI_RLE4压缩类型)之一*/
    DWORD biSizeImage;//位图的大小,以字节为单位
    LONG biXPelsPerMeter;//位图水平分辨率,每米像素数
    LONG biYPelsPerMeter;//位图垂直分辨率,每米像素数
    DWORD biClrUsed;//位图实际使用的颜色表的颜色数
    DWORD biClrImportant;//位图显示过程中重要的颜色数
    }BITMAPINFOHEADER;

    颜色表:

    typedef struct tagRGBQUAD
    {
    BYTE rgbBlue;//蓝色的亮度(0~255)
    BYTE rgbGreen;//绿色
    BYTE rgbRed;//红色
    BYTE rgbReserved;//保留,必须为0
    }RGBQUAD;

    把结构体构造结束之后,来构造BMP文件的类:

     

     

             

    转载于:https://www.cnblogs.com/liutonghao/p/9757970.html

    展开全文
  • 花了点时间整理了一下数字图像处理知识体系,从宏观上把握图像处理,使自己的学习思路就更加清晰。 1.本文大部分内容来自:http://blog.csdn.net/byxdaz/article/details/4375228 2.有些内容待添加,特别是opencv...

    站得高,才能看得远!

    花了点时间整理了一下数字图像处理知识体系,从宏观上把握图像处理,使自己的学习思路就更加清晰。

    1.本文大部分内容来自:http://blog.csdn.net/byxdaz/article/details/4375228

    2.有些内容待添加,特别是opencv相关的算法实现。

    目录

    一、数字图像基础... 3

    二、数字图像存储与显示... 3

    三、图像变换... 4

    1.卷积... 4

    2.梯度和Sobel导数... 5

    3.拉普拉斯变换... 5

    4.Canny算子... 5

    5.霍夫变换... 5

    6.重映射... 5

    7.几何操作:拉伸、收缩、扭曲和旋转... 5

    8.离散傅里叶变换(DFT)... 5

    9.离散余弦变换(DCT)... 5

    四、形态学图像处理... 5

    1.平滑处理... 5

    2.膨胀与腐蚀... 5

    3.开操作与闭操作... 5

    4.漫水填充算法... 5

    5.尺寸调整... 5

    6.图像金字塔... 6

    7.阈值化... 6

    五、图像边缘检测... 6

    六、图像增强和复原... 8

    1.图像增强... 8

    (1)空间域增强处理... 8

    (2)频率域增强处理... 9

    2.图像复原... 11

    七、图像压缩... 11

    八、图像分割... 12

    九、图像特征提取与匹配... 13

    十、图像分类(识别)... 15

     

    数字图像处理[wq1] 是对图像进行分析、加工、和处理,使其满足视觉、心理以及其他要求的技术。图像处理是信号处理在图像域上的一个应用。目前大多数的图像是以数字形式存储,因而图像处理很多情况下指数字图像处理。此外,基于光学理论的处理方法依然占有重要的地位。 数字图像处理是信号处理的子类, 另外与计算机科学、人工智能等领域也有密切的关系。 传统的一维信号处理的方法和概念很多仍然可以直接应用在图像处理上,比如降噪、量化等。然而,图像属于二维信号,和一维信号相比,它有自己特殊的一面,处理的方式和角度也有所不同。大多数用于一维信号处理的概念都有其在二维图像信号领域的延伸,它们中的一部分在二维情形下变得十分复杂。同时图像处理也具有自身一些新的概念,例如,连通性、旋转不变性,等等。这些概念仅对二维或更高维的情况下才有非平凡的意义。图像处理中常用到快速傅立叶变换,因为它可以减小数据处理量和处理时间。

    数字图像处理应用在以下方面 :

    摄影及印刷 (Photography and printing)

    卫星图像处理 (Satellite imageprocessing)

    医学图像处理 (Medical image processing)

    面孔识别, 特征识别 (Face detection,feature detection, face identification)

    显微图像处理 (Microscope imageprocessing)

    汽车障碍识别 (Car barrier detection)

    一、数字图像基础

    图像的基本概念、图像取样和量化、数字图像表示、空间和灰度级分辨率、图像纹理、像素间的一些基本关系(相邻像素、邻接性、连通性、区域和边界、距离度量)[wq2] 、线性和非线性变换操作。[wq3] 

        常用色彩空间分类:

    二、数字图像存储与显示

    在计算机中,有两种类型的图:矢量图(vector graphics)和位映象图(bitmappedgraphics)。矢量图是用数学方法描述的一系列点、线、弧和其他几何形状,如图(a)所示。因此存放这种图使用的格式称为矢量图格式,存储的数据主要是绘制图形的数学描述;位映象图(bitmappedgraphics)也称光栅图(raster graphics),这种图就像电视图像一样,由象点组成的,如图(b),因此存放这种图使用的格式称为位映象图格式,经常简称为位图格式,存储的数据是描述像素的数值。

        图像格式目前包括bmp格式、gif格式、jpeg格式、jpeg2000格式、tiff格式、psd格式、Png格式、swf格式、svg格式、pcx格式、dxf格式、wmf格式、emf格式、LIC格式、eps格式、TGA格式等。

    目前比较出名的图像处理库有很多,比如LEADTOOLS、OPENCV,LEADTOOLS这个是功能非常强大的图像多媒体库,但是这个是收费注册的。OpenCV 是一个跨平台的中、高层 API 构成,目前包括 300 多个 C 函数。它不依赖与其它的外部库,尽管也可以使用某些外部库。OpenCV 对非商业用途和商业用途都是免费(FREE)的。开源的图像库也有不少,比如:ImageStone、GIMP、CxImage等,虽然它们的功能没有LEADTOOLS强大[wq4] ,但是一般的图像处理是可以应付的。

    三、图像变换

    由于图像阵列很大,直接在空间域[wq5] 中进行处理,涉及计算量很大。因此,往往采用各种图像变换的方法,如傅立叶变换、沃尔什变换、离散余弦变换等间接处理技术,将空间域的处理转换为变换域处理,不仅可减少计算量,而且可获得更有效的处理(如傅立叶变换可在频域中进行数字滤波处理)。目前新兴研究的小波变换在时域和频域中都具有良好的局部化特性,它在图像处理中也有着广泛而有效的应用。

    图像变换,也认为是将一副图像转变成图像数据。

    1.    卷积

     

    2.    梯度和Sobel导数[wq6] 

     

    3.    拉普拉斯变换[wq7] 

     

    4.    Canny算子

     

    5.    霍夫变换

     

    6.    重映射

     

    7.    几何操作:拉伸、收缩、扭曲和旋转[wq8] 

     

    8.    离散傅里叶变换(DFT)

     

    9.    离散余弦变换(DCT)

     

    四、形态学图像处理

    1.    平滑处理

     

    2.    膨胀与腐蚀

     

    3.    开操作与闭操作

     

    4.    漫水填充算法

     

    5.    尺寸调整

     

    6.    图像金字塔

     

    7.    阈值化

     

    五、图像边缘检测

    数字图像的边缘检测是图像分割、目标区域的识别、区域形状提取等图像分析领域十分重要的基础,图像理解和分析的第一步往往就是边缘检测,目前它以成为机器视觉研究领域最活跃的课题之一,在工程应用中占有十分重要的地位。所谓边缘就是指图像局部亮度变化最显著的部分,它是检测图像局部变化显著变化的最基本的运算。边缘的记录有链码表和线段表2种,链码表适合计算周长,线段表容易计算面积以及相关的,他们之间可以相互的转换。

    迄今为止,已经出现了许多成熟的算法。例如微分算法,掩模算法等。在微分算法中,常使用N*N的像素块,例如3*3或者4*4。3*3的像素块如下,

    f(i-1,j-1)  f(i-1,j)  f(i-1,j+1)

    f(i,j-1)     f(i,j)    f(i,j+1)

    f(i+1,j-1)  f(i+1,j)   f(i+1,j+1)

    我们不妨设f(i,j)为待处理的像素,而g(i, j)为处理后的像素。

    常见的边缘检测算法:

    A. Roberts边缘算子

    g(i, j) = sqrt( (f(i, j) - f(i + 1, j))^2 + (f(i + 1, j) - f(i, j +1))^2 )

    或者

    g(i, j) = |f(i,j) - f(i + 1,j)| + |f(i+1,j) - f(i,j+1)|

    B. Sobel边缘算子

    对数字图像的每一个像素f(i,j),考察它的上、下、左、右邻域灰度的加权值,把各方向上(0度、45度、90度、135度)的灰度值加权之和作为输出,可以达到提取图像边缘的效果。

    即 g(i,j) = fxr + fyr, 其中

    fxr = f(i-1,j-1)+2*f(i-1,j)+f(i-1,j+1)-f(i+1,j-1)-2*f(i+1,j)-f(i+1,j+1)

    fyr = f(i-1,j-1)+2*f(i,j-1)+f(i+1,j-1)-f(i-1,j+1)-2*f(i,j+1)-f(i+1,j+1)

    C. Laplace算子

    Laplace算子是一种二阶微分算子。它有两种形式:4邻域微分算子和8邻域微分算子。

     ⊙   4邻域微分

    g(i,j)=|4*f(i,j)-f(i,j-1)-f(i-1,j)-f(i+1,j)-f(i,j+1)|

     ⊙   8邻域微分

    g(i,j)=|8*f(i,j)-f(i,j-1)-f(i-1,j)-f(i+1,j)-f(i,j+1)-f(i-1,j-1)-f(i-1,j+1)-f(i+1,j-1)-f(i+1,j+1)|

    D. Prewitt边缘算子

    prewitt算子是一个边缘模板算子,由八个方向的样板组成,能够在0度,45度,90度,135度,180度,225度角

    等八个方向检测边缘。8个3*3边缘模板及方向如下:

    90度角:            45度角:

    1   1   1          -1  -1  -1

    1  -2   1           1  -2   1

    -1 -1 -1            1   1   1

    0度角:             315度角:

    -1   1   1         1   1   -1

    -1  -2   1        1  -2   -1

    -1   1   1        1   1   -1

    270度角:       225度角:

    1   1   1         -1   -1  1

    -1  -2 1         -1  -2   1

    -1 -1  1           1   1   1

    180度角:      135度角:

    1   1   1          1   -1   -1

    1  -2  -1         1   -2   -1

    1  -1  -1         1    1     1

    3*3时表达式如下:

    A1*f(i-1,j-1)    A8*f(i,j-1)      A7*f(i+1,j-1)

    A2*f(i-1,j)        -2*f(i,j)         A6*f(i+1, j)

    A3*f(i-1,j+1)     A4*f(i,j+1)     A5*f(i+1,j+1)

    g(i,j)=|-2*f(i,j)+A8*f(i,j-1)+A1*f(i-1,j-1)+A2*f(i-1,j)+A3*f(i-1,j+1)+A4*f(i,j+1)+A5*f(i+1,j+1)+A6*f(i+1,j)+A7*f(i+1,j-1)|

    在程序设计中,依次用样板去检测图像,与被检测区域最为相似的样板给出最大值,用该最大值作为算子的输出值。

    E.Kirsch边缘算子

    Kirsch算子是一个模板算子,由八个方向的边缘样板组成,能够在0度,45度,90度,135度,180度,225度角

    等八个方向检测边缘。8个3*3边缘模板及方向如下:

    90度角:            45度角:

    5   5   5          -3   5    5

    -3  0   -3         -3    0   5

    -3 -3 -3          -3   -3  -3

    0度角:             315度角:

    -3  -3   5        -3 -3   -3

    -3  0   5        -3  0   5

    -3   -3   5       -3  5   5

    270度角:       225度角:

    5   5  -3         -3   -3  -3

    5    0  -3        5   0   -3

    -3  -3   -3       5  5   -3

    180度角:      135度角:

    5   -3   -3       5   5   -3

    5   0  -3         5   0  -3

    5  -3  -3         -3  -3  3

    使用方法与prewitt算子一样。

    F.CANNY边缘检测

    六、图像增强和复原

    图像增强和复原的目的是为了提高图像的质量,如去除噪声,提高图像的清晰度等。图像增强不考虑图像降质的原因,突出图像中所感兴趣的部分。如强化图像高频分量,可使图像中物体轮廓清晰,细节明显;如强化低频分量可减少图像中噪声影响。图像复原要求对图像降质的原因有一定的了解,一般讲应根据降质过程建立“降质模型”,再采用某种滤波方法,恢复或重建原来的图像。

    1.     图像增强

    图像增强的目的在于改善图像的显示质量,以利于信息的提取和识别。从方法上说,则是设法摒弃一些认为不必要或干扰的信息,而将所需要的信息得以突出出来,以利于分析判读或作进一步的处理。

    (1)  空间域增强处理

    空间域是指图像平面所在的二维空间,空间域图像增强是指在图像平面上应用某种数学模型,通过改变图像像元灰度值达到增强效果,这种增强并不改变像元的位置。空域增强包括空域变换增强与空域滤波增强两种。空域变换增强是基于点处理的增强方法、空域滤波增强是基于邻域处理的增强方法。

    1)  空域变换增强

    常用的空域变换增强方法包括:对比度增强、直方图增强和图像算术运算等。

    A.对比度增强

    对比度增强是一种通过改变图像像元的亮度分布态势,扩展灰度分布区间来改变图像像元对比度,从而改善图像质量的图像处理方法。因为亮度值是辐射强度的反映,所以也称为辐射增强。常用的方法有对比度线性变换和非线性变换。其关键是寻找到一个函数,以此函数对图像中每一个像元进行变换,使像元得到统一的重新分配,构成得到反差增强的图像。

    B.直方图增强

    直方图均衡化:

        直方图均衡化基本做法是将每个灰度区间等概率分布代替了原来的随机分布,即增强后的图象中每一灰度级的像元数目大致相同。直方图均衡化可使得面积最大的地物细节得以增强,而面积小的地物与其灰度接近的地物进行合并,形成综合地物。减少灰度等级换取对比度的增大。

    直方图归一化:

        直方图归一化是把原图像的直方图变换为某种指定形态的直方图或某一参考图像的直方图,然后按着已知的指定形态的直方图调整原图像各像元的灰级,最后得到一个直方图匹配的图像。这种方法主要应用在有一幅很好的图像作为标准的情况下,对另一幅不满意的图像用标准图像的直方图进行匹配处理,以改善被处理图像的质量。如在数字镶嵌时,重叠区影像色调由于时相等原因差异往往很大,利用直方图匹配这一方法后可以改善重叠区影像色调过度,如果镶嵌图像时相相差不大,完全可以作到无缝镶嵌。

    C.数字图像的算术运算

    两幅或多幅单波段影像,完成空间配准后,通过一系列运算,可以实现图像增强,达到提取某些信息或去掉某些不必要信息的目的。

    2)  空域滤波增强

    空域变换增强是按像元逐点运算的,从整体上改善图像的质量,并不考虑周围像元影响。空间滤波增强则是以重点突出图像上的某些特征为目的的(如突出边缘或纹理等),通过像元与周围相邻像元的关系,采取空间域中的邻域处理方法进行图像增强。邻域法处理用于去噪声、图像平滑、锐化和相关运算。

    图像卷积运算是在空间域上对图像作局部检测的运算,以实现平滑和锐化的目的。具体作法是选定一卷积函数,又称为“M×N窗口”或“模板”,如3×3或5×5等。然后从图像左上角开始开一与模板同样大小的活动窗口,图像窗口与模板像元的亮度值对应相乘再相加。将计算结果赋予中心像元作为其灰度值,然后待移动后重新计算,将计算结果赋予另一个中心像元,以此类推直到全幅图像扫描一遍结束生成新的图像。

    平滑是指图像中出现某些亮度变化过大的区域,或出现不该有的亮点(“噪声”)时,采用平滑方法可以减小变化,使亮度平缓或去掉不必要“噪声”点。它实际上是使图像中高频成分消退,即平滑图像的细节,降低其反差,保存低频成分,在频域中称为低通滤波。具体方法有:均值平滑、中值滤波、锐化。

    锐化的作用在于提高边缘灰度值的变化率,使界线更加清晰。它是增强图像中的高频成分,在频域处理中称为高通滤波,也就是使图像细节的反差提高,也称边缘增强。要突出图像的边缘、线状目标或亮度变化率大的部分常采用锐化方法。一般有三种实现方法:

    A.梯度法

    梯度反映了相邻像元的亮度变化率,即图像中如果存在边缘,如湖泊、河流的边界,山脉和道路等,则边缘处有较大的梯度值。对于亮度值较平滑的部分,亮度梯度值较小。因此,找到梯度较大的位置,也就找到边缘,然后再用不同的梯度计算值代替边缘处像元的值,也就突出了边缘,实现了图像的锐化。通常有罗伯特梯度和索伯尔梯度方法。

    B.拉普拉斯算法

    拉普拉斯算法的意义与梯度法不同,它不检测均匀的亮度变化,而是检测变化率的变化率,相当于二阶微分。计算出的图像更加突出亮度值突变的位置。

    C.定向检测

    当有目的地检测某一方向的边、线或纹理特征时,可选择特定的模板卷积运算作定向检测。可以检测垂直边界、水平边界和对角线边界等,各使用的模板不同。

    (2)  频率域增强处理

    频域增强指在图像的频率域内,对图像的变换系数(频率成分)直接进行运算,然后通过Fourier逆变换以获得图像的增强效果。一般来说,图像的边缘和噪声对应Fourier变换中的高频部分,所以低通滤波能够平滑图像、去除噪声。图像灰度发生聚变的部分与频谱的高频分量对应,所以采用高频滤波器衰减或抑制低频分量,能够对图像进行锐化处理。频域,就是由图像f(x,y)的二维傅立叶变换和相应的频率变量(u,v)的值所组成的空间。在空间域图像强度的变化模式(或规律)可以直接在该空间得到反应。F(0,0)是频域中的原点,反应图像的平均灰度级,即图像中的直流成分;低频反映图像灰度发生缓慢变化的部分;而高频对应图像中灰度发生更快速变化的部分,如边缘、噪声等。但频域不能反应图像的空间信息。

    空域和频域滤波间的对应关系,卷积定理是空域和频域滤波的最基本联系纽带。二维卷积定理:

    基本计算过程:

    取函数h(m,n)关于原点的镜像,得到h(-m,-n)

    对某个(x,y),使h(-m,-n)移动相应的距离,得到h(x-m,y-n)

    对积函数f(m,n)h(x-m,y-n)在(m,n)的取值范围内求和

    位移是整数增量,对所有的(x,y)重复上面的过程,直到两个函数:f(m,n)和h(x-m,y-n)不再有重叠的部分。

    傅立叶变换是空域和频域的桥梁,关于两个域滤波的傅立叶变换对:

    频域与空域滤波的比较:

    1. 对具有同样大小的空域和频率滤波器:h(x,y), H(u,v),频域计算(由于FFT)往往更有效(尤其是图像尺寸比较大时)。但对在空域中用尺寸较小的模板就能解决的问题,则往往在空域中直接操作。

    2. 频域滤波虽然更直接,但如果可以使用较小的滤波器,还是在空域计算为好。    因为省去了计算傅立叶变换及反变换等步骤。

    3. 由于更多的直观性,频率滤波器设计往往作为空域滤波器设计的向导。

    平滑的频率域滤波器类型:

    1 、理想低通滤波器

    2 、巴特沃思低通滤波器

    3 、高斯低通滤波器

    频率域锐化滤波器类型:

    1 理想高通滤波器

    2 巴特沃思高通滤波器

    3 高斯型高通滤波器

    4 频率域的拉普拉斯算子

    5 钝化模板、高频提升滤波和高频加强滤波

    频率域图像增强处理的过程:

    2.     图像复原

    试图利用退化过程的先验知识,去恢复已被退化图像的本来面目。图像复原[wq9] 的基本思路:先建立退化的数学模型,然后根据该模型对退化图像进行拟合。

    图像复原模型可以用连续数学和离散数学处理,处理项的实现可在空间域卷积,或在频域相乘。

    七、图像压缩

    图像压缩是数据压缩技术在数字图像上的应用,它的目的是减少图像数据中的冗余信息从而用更加高效的格式存储和传输数据。图像压缩可以是有损数据压缩也可以是无损数据压缩。对于如绘制的技术图、图表或者漫画优先使用无损压缩,这是因为有损压缩方法,尤其是在低的位速条件下将会带来压缩失真。如医疗图像或者用于存档的扫描图像等这些有价值的内容的压缩也尽量选择无损压缩方法。有损方法非常适合于自然的图像,例如一些应用中图像的微小损失是可以接受的(有时是无法感知的),这样就可以大幅度地减小位速。编码是压缩技术中最重要的方法,它在图像处理技术中是发展最早且比较成熟的技术。

    1.     无损图像压缩方法

    A.行程长度编码

    B.熵编码法

    C.LZW算法

    2.     有损压缩方法

    A.将色彩空间化减到图像中常用的颜色。所选择的颜色定义在压缩图像头的调色板中,图像中的每个像素都用调色板中颜色索引表示。这种方法可以与 抖动(en:dithering)一起使用以模糊颜色边界。

    B.色度抽样,这利用了人眼对于亮度变化的敏感性远大于颜色变化,这样就可以将图像中的颜色信息减少一半甚至更多。

    C.变换编码,这是最常用的方法。首先使用如离散余弦变换(DCT)或者小波变换这样的傅立叶相关变换,然后进行量化和用熵编码法压缩。

    D.分形压缩(en:Fractal compression)。

    八、图像分割

    图像分割是数字图像处理中的关键技术之一。图像分割是将图像中有意义的特征部分提取出来,其有意义的特征有图像中的边缘、区域等,这是进一步进行图像识别、分析和理解的基础。虽然目前已研究出不少边缘提取、区域分割的方法,但还没有一种普遍适用于各种图像的有效方法。因此,对图像分割的研究还在不断深入之中,是目前图像处理中研究的热点之一。

    通常图像分割的实现方法是,将图像分为“黑”、“白”两类,这两类分别代表了两个不同的对象。

    图像分割方法:阈值分割、区域分割、数学形态学、模式识别方法

    A.阈值分割包括以下几种:

    (1)由直方图灰度分布选择阈值

    (2)双峰法选择阈值

    (3)迭代法选取阈值

    原理如下,很好理解。

        迭代法是基于逼近的思想,其步骤如下:

        1.求出图像的最大灰度值和最小灰度值,分别记为ZMAX和ZMIN,令初始阈值T0=(ZMAX+ZMIN)/2;

        2.根据阈值TK将图象分割为前景和背景,分别求出两者的平均灰度值ZO和ZB;

        3.求出新阈值TK+1=(ZO+ZB)/2;

        4.若TK=TK+1,则所得即为阈值;否则转2,迭代计算。

    4)大津法选择阈值[wq10] 

    大津法是属于最大类间方差法,它是自适应计算单阈值的简单高效方法,或者叫(Otsu)。大津法由大津于1979年提出,对图像Image,记t为前景与背景的分割阈值,前景点数占图像比例为w0,平均灰度为u0;背景点数占图像比例为w1,平均灰度为u1。图像的总平均灰度为:u=w0*u0+w1*u1。从最小灰度值到最大灰度值遍历t,当t使得值g=w0*(u0-u)2+w1*(u1-u)2最大时t即为分割的最佳阈值。对大津法可作如下理解:该式实际上就是类间方差值,阈值t分割出的前景和背景两部分构成了整幅图像,而前景取值u0,概率为 w0,背景取值u1,概率为w1,总均值为u,根据方差的定义即得该式。因方差是灰度分布均匀性的一种度量,方差值越大,说明构成图像的两部分差别越大, 当部分目标错分为背景或部分背景错分为目标都会导致两部分差别变小,因此使类间方差最大的分割意味着错分概率最小。直接应用大津法计算量较大,因此一般采用了等价的公式g=w0*w1*(u0-u1)2。

    (5)由灰度拉伸选择阈值

    大津法是较通用的方法,但是它对两群物体在灰度不明显的情况下会丢失一些整体信息。因此为了解决这种现象采用灰度拉伸的增强大津法。在大津法的思想上增加灰度的级数来增强前两群物体的灰度差。对于原来的灰度级乘上同一个系数,从而扩大了图像灰度的级数。试验结果表明不同的拉伸系数,分割效果差别比较大。

    B.区域的分割

    区域生长、区域分离与合并

    区域生长算法

    C.基于形态学分水岭的分割

    分水岭分割算法

    九、图像特征提取与匹配[wq11] 

    常用的图像特征有颜色特征、纹理特征、形状特征、空间关系特征。

    A.颜色特征

    特点:颜色特征是一种全局特征,描述了图像或图像区域所对应的景物的表面性质。一般颜色特征是基于像素点的特征,此时所有属于图像或图像区域的像素都有各自的贡献。由于颜色对图像或图像区域的方向、大小等变化不敏感,所以颜色特征不能很好地捕捉图像中对象的局部特征。

    常用的特征提取与匹配方法:

    颜色直方图

    其优点在于:它能简单描述一幅图像中颜色的全局分布,即不同色彩在整幅图像中所占的比例,特别适用于描述那些难以自动分割的图像和不需要考虑物体空间位置的图像。其缺点在于:它无法描述图像中颜色的局部分布及每种色彩所处的空间位置,即无法描述图像中的某一具体的对象或物体。

    颜色直方图特征匹配方法:直方图相交法、距离法、中心距法、参考颜色表法、累加颜色直方图法。

    B.纹理特征

    纹理特征的提取方法比较简单,它是用一个活动的窗口在图像上连续滑动,分别计算出窗口中的方差、均值、最大值、最小值及二者之差和信息熵等,形成相应的纹理图像,当目标的光谱特性比较接近时,纹理特征对于区分目标可以起到积极的作用。选取适当的数据动态变化范围,进行纹理特征提取后,使影像的纹理特征得到突出,有利于提取构造信息。

    特点:纹理特征也是一种全局特征,它也描述了图像或图像区域所对应景物的表面性质。但由于纹理只是一种物体表面的特性,并不能完全反映出物体的本质属性,所以仅仅利用纹理特征是无法获得高层次图像内容的。与颜色特征不同,纹理特征不是基于像素点的特征,它需要在包含多个像素点的区域中进行统计计算。在模式匹配中,这种区域性的特征具有较大的优越性,不会由于局部的偏差而无法匹配成功。作为一种统计特征,纹理特征常具有旋转不变性,并且对于噪声有较强的抵抗能力。但是,纹理特征也有其缺点,一个很明显的缺点是当图像的分辨率变化的时候,所计算出来的纹理可能会有较大偏差。另外,由于有可能受到光照、反射情况的影响,从2-D图像中反映出来的纹理不一定是3-D物体表面真实的纹理。

    常用的特征提取与匹配方法:

    纹理特征描述方法分类

    (1)统计方法统计方法的典型代表是一种称为灰度共生矩阵的纹理特征分析方法Gotlieb 和 Kreyszig 等人在研究共生矩阵中各种统计特征基础上,通过实验,得出灰度共生矩阵的四个关键特征:能量、惯量、熵和相关性。统计方法中另一种典型方法,则是从图像的自相关函数(即图像的能量谱函数)提取纹理特征,即通过对图像的能量谱函数的计算,提取纹理的粗细度及方向性等特征参数

    (2)几何法

    所谓几何法,是建立在纹理基元(基本的纹理元素)理论基础上的一种纹理特征分析方法。纹理基元理论认为,复杂的纹理可以由若干简单的纹理基元以一定的有规律的形式重复排列构成。在几何法中,比较有影响的算法有两种:Voronio 棋盘格特征法和结构法。

    (3)模型法

    模型法以图像的构造模型为基础,采用模型的参数作为纹理特征。典型的方法是随机场模型法,如马尔可夫(Markov)随机场(MRF)模型法和 Gibbs 随机场模型法

    (4)信号处理法

    纹理特征的提取与匹配主要有:灰度共生矩阵、Tamura 纹理特征、自回归纹理模型、小波变换等。灰度共生矩阵特征提取与匹配主要依赖于能量、惯量、熵和相关性四个参数。Tamura 纹理特征基于人类对纹理的视觉感知心理学研究,提出6种属性,即:粗糙度、对比度、方向度、线像度、规整度和粗略度。自回归纹理模型(simultaneousauto-regressive, SAR)是马尔可夫随机场(MRF)模型的一种应用实例。

    C.形状特征

    特点:各种基于形状特征的检索方法都可以比较有效地利用图像中感兴趣的目标来进行检索,但它们也有一些共同的问题。

    常用的特征提取与匹配方法:

    通常情况下,形状特征有两类表示方法,一类是轮廓特征,另一类是区域特征。图像的轮廓特征主要针对物体的外边界,而图像的区域特征则关系到整个形状区域。

    几种典型的形状特征描述方法:

    (1)    边界特征法

    该方法通过对边界特征的描述来获取图像的形状参数。其中Hough 变换检测平行直线方法和边界方向直方图方法是经典方法。Hough 变换是利用图像全局特性而将边缘像素连接起来组成区域封闭边界的一种方法,其基本思想是点—线的对偶性;边界方向直方图法首先微分图像求得图像边缘,然后,做出关于边缘大小和方向的直方图,通常的方法是构造图像灰度梯度方向矩阵。

    (2)傅里叶形状描述符法

    傅里叶形状描述符(Fourier shapedescriptors)基本思想是用物体边界的傅里叶变换作为形状描述,利用区域边界的封闭性和周期性,将二维问题转化为一维问题。由边界点导出三种形状表达,分别是曲率函数、质心距离、复坐标函数。

    (3)几何参数法

    形状的表达和匹配采用更为简单的区域特征描述方法,例如采用有关形状定量测度(如矩、面积、周长等)的形状参数法(shape factor)。在 QBIC 系统中,便是利用圆度、偏心率、主轴方向和代数不变矩等几何参数,进行基于形状特征的图像检索。

    D.空间关系特征

    特点:所谓空间关系,是指图像中分割出来的多个目标之间的相互的空间位置或相对方向关系,这些关系也可分为连接/邻接关系、交叠/重叠关系和包含/包容关系等。通常空间位置信息可以分为两类:相对空间位置信息和绝对空间位置信息。前一种关系强调的是目标之间的相对情况,如上下左右关系等,后一种关系强调的是目标之间的距离大小以及方位。显而易见,由绝对空间位置可推出相对空间位置,但表达相对空间位置信息常比较简单。

    空间关系特征的使用可加强对图像内容的描述区分能力,但空间关系特征常对图像或目标的旋转、反转、尺度变化等比较敏感。另外,实际应用中,仅仅利用空间信息往往是不够的,不能有效准确地表达场景信息。为了检索,除使用空间关系特征外,还需要其它特征来配合。

    常用的特征提取与匹配方法:

    提取图像空间关系特征可以有两种方法:一种方法是首先对图像进行自动分割,划分出图像中所包含的对象或颜色区域,然后根据这些区域提取图像特征,并建立索引;另一种方法则简单地将图像均匀地划分为若干规则子块,然后对每个图像子块提取特征,并建立索引。

    十、图像分类(识别)

    图像分类(识别)属于模式识别的范畴,其主要内容是图像经过某些预处理(增强、复原、压缩)后,进行图像分割和特征提取,从而进行判决分类。图像分类常采用经典的模式识别方法,有统计模式分类和句法(结构)模式分类,近年来新发展起来的模糊模式识别和人工神经网络模式分类在图像识别中也越来越受到重视。

    模式识别是一种从大量信息和数据出发,在专家经验和已有认识的基础上,利用计算机和数学推理的方法对形状、模式、曲线、数字、字符格式和图形自动完成识别的过程。模式识别包括相互关联的两个阶段,即学习阶段和实现阶段,前者是对样本进行特征选择,寻找分类的规律,后者是根据分类规律对未知样本集进行分类和识别。广义的模式识别属计算机科学中智能模拟的研究范畴,内容非常广泛,包括声音和语言识别、文字识别、指纹识别、声纳信号和地震信号分析、照片图片分析、化学模式识别等等。计算机模式识别实现了部分脑力劳动自动化。

    模式识别--对表征事物或现象的各种形式的(数值的,文字的和逻辑关系的)信息进行处理和分析,以对事物或现象进行描述、辨认、分类和解释的过程,是信息科学和人工智能的重要组成部分。

    模式还可分成抽象的和具体的两种形式。前者如意识、思想、议论等,属于概念识别研究的范畴,是人工智能的另一研究分支。我们所指的模式识别主要是对语音波形、地震波、心电图、脑电图、图片、文字、符号、三位物体和景物以及各种可以用物理的、化学的、生物的传感器对对象进行测量的具体模式进行分类和辨识。

    模式识别问题指的是对一系列过程或事件的分类与描述,具有某些相类似的性质的过程或事件就分为一类。模式识别问题一般可以应用以下4种方法进行分析处理。

    模版比对:

    统计模式识别方法:统计模式识别方法是受数学中的决策理论的启发而产生的一种识别方法,它一般假定被识别的对象或经过特征提取向量是符合一定分布规律的随机变量。其基本思想是将特征提取阶段得到的特征向量定义在一个特征空间中,这个空间包含了所有的特征向量,不同的特征向量,或者说不同类别的对象都对应于空间中的一点。在分类阶段,则利用统计决策的原理对特征空间进行划分,从而达到识别不同特征的对象的目的。统计模式识别中个应用的统计决策分类理论相对比较成熟,研究的重点是特征提取。统计模式识别的基本原理是:有相似性的样本在模式空间中互相接近,并形成“集团”,即“物以类聚”。其分析方法是根据模式所测得的特征向量Xi=(xi1,xi2,…,xid)T(i=1,2,…,N),将一个给定的模式归入C个类ω1,ω2,…,ωc中,然后根据模式之间的距离函数来判别分类。其中,T表示转置;N为样本点数;d为样本特征数。

    统计模式识别的主要方法有:判别函数法,k近邻分类法,非线性映射法,特征分析法,主因子分析法等。

    在统计模式识别中,贝叶斯决策规则从理论上解决了最优分类器的设计问题,但其实施却必须首先解决更困难的概率密度估计问题。BP神经网络直接从观测数据(训练样本)学习,是更简便有效的方法,因而获得了广泛的应用,但它是一种启发式技术,缺乏指定工程实践的坚实理论基础。统计推断理论研究所取得的突破性成果导致现代统计学习理论——VC理论的建立,该理论不仅在严格的数学基础上圆满地回答了人工神经网络中出现的理论问题,而且导出了一种新的学习方法——支撑向量机。

    人工神经网络模式识别:人工神经网络的研究起源于对生物神经系统的研究。人工神经网络区别于其他识别方法的最大特点是它对待识别的对象不要求有太多的分析与了解,具有一定的智能化处理的特点。

    句法结构模式识别:又称结构方法或语言学方法。其基本思想是把一个模式描述为较简单的子模式的组合,子模式又可描述为更简单的子模式的组合,最终得到一个树形的结构描述,在底层的最简单的子模式称为模式基元。在句法方法中选取基元的问题相当于在决策理论方法中选取特征的问题。通常要求所选的基元能对模式提供一个紧凑的反映其结构关系的描述,又要易于用非句法方法加以抽取。显然,基元本身不应该含有重要的结构信息。模式以一组基元和它们的组合关系来描述,称为模式描述语句,这相当于在语言中,句子和短语用词组合,词用字符组合一样。基元组合成模式的规则,由所谓语法来指定。一旦基元被鉴别,识别过程可通过句法分析进行,即分析给定的模式语句是否符合指定的语法,满足某类语法的即被分入该类。

    在几种算法中,统计模式识别是最经典的分类识别方法,在图像模式识别中有着非常广泛的应用。


     [wq1]

    本文参考《数字图像处理》(第二版)

    作者:冈萨雷斯

     [wq2]

    参考第二章,掌握概念?

     [wq3]

    线性变换:如果变换函数是线性的或是分段线性,这种变换就是线性变换。以线性函数加大图像的对比度的效果是使整幅图像的质量改善。以分段线性函数加大图像中某个(或某几个)亮度区间的对比度的效果是使局部亮度区间的质量得到改善。

    非线性变换:当变换函数是非线性时,即为非线性变换。常用的有指数变换和对数变换。

     

     [wq4]

    参考《几种图像处理库的研究》:http://blog.csdn.net/byxdaz/article/details/3972293

     [wq5]

    以时间作为变量所进行的研究就是时域

    以频率作为变量所进行的研究就是频域

    以空间坐标作为变量进行的研究就是空间域

    以波数作为变量所进行的研究称为波数域

     [wq6]

    一阶微分

     [wq7]

    二次导数,其离散实现类似于二阶Sobel导数

     [wq8]

    1)  仿射变换

    2)  透视变换

     [wq10]

    OTSU

     [wq11]

    SIFT特征怎么用?




    展开全文
  • 数字图像处理期中学习报告,包含总结讲义重点知识点等 第一章:绪论 第二章 :数字图像基础 第三章灰度变换和空间滤波 第四章频率域滤波
  • 《MATLAB数字图像处理实战》深入浅出地介绍了数字图像基础和MATLAB数字图像处理的新功能及其应用案例,同时还结合作者科研、教学的经验,对数字图像处理学习、思维、方法和技巧进行了总结与点拨。本书分为“基础”...
  • 数字图像处理第二章 一、 图像的基本概念介绍 图像:一幅图像可以定义为一个二维函数f(x,y),其中x和y是空间(平面)坐标,而在任何一对空间坐标(x,y)处的幅值f称为图像在该点处的强度或灰度。当x,y和灰度值f是有限...

    数字图像处理第二章(未完待续)

    一、 图像的基本概念介绍

    图像:一幅图像可以定义为一个二维函数f(x,y),其中x和y是空间(平面)坐标,而在任何一对空间坐标(x,y)处的幅值f称为图像在该点处的强度或灰度。当x,y和灰度值f是有限的离散数值时,我们称该图像为数字图像。
    灰度级数:出于存储和量化硬件考虑,灰度级数通常取2的整数次幂,即L=2k且它们是区间[0,L-1]内的整数。
    动态范围:系统中最大可度量灰度与最小可检测灰度之比。
    对比度:将一幅图像中最高和最低灰度级间的灰度差定义为对比度
    四邻域:位于坐标(x,y)处的像素P有4个水平和垂直的相邻像素,其坐标是(x+1,y)、(x-1,y)、(x,y+1)、(x,y-1),这组像素称为P的四邻域,用N4( P )表示。
    八邻域:P的4个对角相邻像素的坐标是(x+1,y+1)、(x-1,y-1)、(x-1,y+1)、(x+1,y-1),用ND( P )表示。而ND( P )和N4( P )一起称为P的八邻域,用N8( P )表示。

    二、邻接性

    令V是用于定义邻接性的灰度值集合。在二值图像中,如果把具有1值的像素归诸于邻接像素,则V={1}。
    (a)、4邻接。如果q在集合N4( P )中,则具有V中数值的两个像素p和q是4邻接的。
    (b)、8邻接。如果q在集合N8( P )中,则具有V中熟知的两个像素p和q是8邻接的。
    (c)、m邻接(混合邻接)。如果q在N4( P )中,或q在ND( P )中,且集合N4( P )∩N4( q )中没有来自V中数值的像素,则具有V中数值的两个像素p和q是m邻接的。

    展开全文
  • 本专栏将以学习笔记形式对数字图像处理的重点基础知识进行总结整理,欢迎大家一起学习交流! 专栏链接:数字图像处理学习笔记 一、阵列和矩阵操作 图像可以被等价的看作是矩阵 事实上,在很多情况下,图像间的...
  • OpenCV是学习数字图像处理的好工具,本专栏拟打算从对OpenCV源码的学习来研究数字图像处理中的基本操作。我开设本专栏不为别的,只希望能系统地学习OpenCV,并把我支离破碎的数字图像处理知识好好理一理。当然,最终...
  • 2.数字图像处理可以理解为两个方面的操作:一个是图像到图像的处理(如图像的灰度转换,图像增强等),另外一个是图像到非图像的一种表示,比如图像的测量。3.数字图像处理的研究内容有很多个方向,比如: ·图像...
  • 数字图像处理技术

    2018-11-25 19:28:31
    数字图像处理技术 所谓数字图像处理,是指利用计算机对图像进行分析、加工、和处理,使其满足视觉、心理或其他要求的技术,主要有去除噪声、增强、复原、分割、提取特征等处理的方法。20 世纪 50 年代,电子计算机...
  • 数字图像处理知识结构
  • 数字图像处理及MATLAB实现》可作为高等院校数字图像处理等相关课程的教学参考书,也可作为自学学习数字图像处理的辅导材料,还可供数字图像处理和分析领域的科技工作者参考。
  • 数字图像处理学习

    2018-07-21 11:42:45
    并没有接触过这方面的课程,一开始对于数字图像处理这门课真的是无从下手,打算利用暑假这段时间把基础课程给学好,在网上看了各种经验帖,总结和计划了一波自己的学习计划,首先把《数字图像处理》刚萨雷西第三版的...
  • 本专栏将以学习笔记形式对数字图像处理的重点基础知识进行总结整理,欢迎大家一起学习交流! 专栏链接:数字图像处理学习笔记 目录 彩色图像基础 彩色空间(也称彩色模型或彩色系统) 彩色空间转换 伪彩色...
  • 1、图像数字化一般采用均匀采样和均匀量化方式。 均匀采样,即等间隔采样。当对采样点数目有所限制时,比如说N×N个采样点,此时可以根据图像的特性采用自适应采样方案,有可能获得更好的效果。 自适应采样方案...
  • 数字图像处理 总结

    2018-01-17 18:35:34
    图像概述 分类 属性 二维图像 三维图像 像素间关系 相关 图像预处理 颜色空间转换 RGB to Gray RGB三原色合成法 RGB to HSV 二值化 图像变换 图像复原和增强 图像平滑模糊 线性滤波器 非线性滤波器 图像增强...
  • 本专栏将以学习笔记形式对数字图像处理的重点基础知识进行总结整理,欢迎大家一起学习交流! 专栏链接:数字图像处理学习笔记 一、数字图像的像素表示 像素的概念:数字图像由二维元素组成,每一个元素具有一个...
  • 本专栏将以学习笔记形式对数字图像处理的重点基础知识进行总结整理,欢迎大家一起学习交流! 专栏链接:数字图像处理学习笔记 数字图像处理学习笔记(一)——数字图像处理概述 一、什么是图像 Ⅰ、图像的定义:...
  • 关于数字图像处理,主要是通过上海交大赵宇明老师和电子科技大学李庆嵘老师的公开课学习的,毕竟之前没有这方面相关的学习背景,一边听老师的公开课,一边看冈萨雷斯的《数字图像处理》,这样理解的更深入一些。...
1 2 3 4 5 ... 20
收藏数 33,135
精华内容 13,254
关键字:

学习小结 数字图像处理