数学图像处理中的算术编码_matlab图像算术编码 - CSDN
精华内容
参与话题
  • 数字图像处理笔记

    千次阅读 2015-06-23 16:35:45
    数字图像处理基本概念 P3 图形采用矢量结果,而图像采用栅格结构 P3 根据图像的产生方法分为3类:可见图像、物理图像、数学图像 P3 可见图像:指视觉系统可以直接看见的图像。 P4 物理图像:反映物体的电磁波辐射...

    第一章

    数字图像处理基本概念

    P3 图形采用矢量结果,而图像采用栅格结构

    P3 根据图像的产生方法分为3类:可见图像、物理图像、数学图像

    P3 可见图像:指视觉系统可以直接看见的图像。

    P4 物理图像:反映物体的电磁波辐射能,包括可见光和不可见光

    P4 数学图像: 由连续函数或离散函数生成的抽象图像,其中离散函数生成的图像就是计算机可以处理的数字图像

    P4 图像是其所表示物体的信息的直接描述和概括表示

    P5 数字图像是指一个被采样和量化后的二维强度函数(该二维函数可以由光学方法产生),采用等距离矩形网格采样,对幅度进行等间隔量化。也可以说,一幅数字图像是一个被均与采样和均匀量化(即离散处理)的二维数值矩阵。

    P5 数字图像运算的分类:全局运算,点运算,局部运算

    P5 相关概念:噪声、对比度、采样密度、放大率、数字化

    P5 噪声:一般指加性的或乘性的非图像本源信息

    P6 数字化:是将一幅图像从其原来的形式转换为数字形式的处理过程。逆过程是显示。数字化步骤:扫描、采样、量化。

    P6 扫描:是按照一定的先后顺序对一幅图像进行遍历的过程

    P6 采样:是指遍历的过程中,在图像的每个像素位置上测量其灰度值,即亮度值

    P6 量化:将采样得到的灰度值通过模数转换器等器件转换为离散的整数值

    P6 扫描、采样、量化这三个步骤组成了数字图像化的主要过程

    P6 获取数字图像是三种方法:传统可见图像经过数字化处理转换、各种光电转换设备转换得到、二维离散数学函数生成。

    P6 最终得到的数字图像在数学上是一个二维矩阵

    P7 数字图像在计算机中采用二维矩阵表示和存储

    P7 像素是构成图像的最小基本单位,图像的每一像素都具有独立的属性,其中最基本的属性包括像元位置和灰度值两个属性

    P8 静态图像按特性分来:矢量图、位图(栅格图像)

    P8 位图根据颜色和灰度值划分成4种类型:二值图像、灰度图像、索引图像、真彩色RGB图像

    会计算RGB所图像大小

    P10 颜色模型RGB、HSI、CMYK、YUV

    P10 RGB模型 从物理光学角度描述颜色 加色模型 R红色 G绿色 B蓝色

    P11 HSI模型 根据视觉的主观感觉描述颜色 H色调 S饱和度 I亮度

    在HSI彩色空间中,I表示强度,它决定了像素的整体亮度,而不考虑色彩,而表征相思引彩色信息的两个参数是色度和饱和度

    色度H表面颜色的种类,而颜色是由波长决定的

    饱和度S是表示颜色的深浅浓淡程度的物理量。

    强度I是人眼所能感觉到的表示颜色明暗程度的物理量

    P12 CMYK 表色系统 减色模型 C青色 M品红色 Y黄色 K黑色 一般在彩色印刷领域使用

    P13 YUV 表示电视彩色坐标系统 PAL制电视将RGB三原色信号改成YUV新航,其中Y信号表示亮度,UV表示色差信号

    第二章

    P29 采样与量化:对模拟图像在空间(x,y)方向上以及亮度函数f(x,y)都进行离散化处理,通常把这一过程称为采样与量化。

    采样:图像在空间 (x,y)上的离散化称为采样

    采样分类 :均匀采样、非均匀采样,均匀采样等间距采样

    P30 量化:量化过程就是以离散的灰度值信息代替连续的模拟量灰度信息的过程,该过程是一对多的映射过程

    线性量化:....等间距

    同样灰度级下,图像质量会因采样点数的减少,效果逐渐变差,当采样点数过少时,图像可能无法分辨

    若采样数不变,则当灰度级数量减少到一定程度时,图像质量也将产生一定的不利影响

    非线性量化: ....不等间隔

    第三章

    P53 卷积运算在信号处理和图像处理学科中通常称为滤波

    P67  直方图:直方图是统计学中的常用工具之一,在数字图像处理中的灰度直方图是灰度级的函数,它描述了图像中具有该灰度的 个数其横坐标是灰度级,纵坐标是该灰度级出现的频率(像素的个数)

    任一灰度级D的面积函数就是大于等于该灰度值 像素个数

    直方图的性质:直方图是一幅图像各像素灰度值出现次数或频数的统计结果、图像与直方图之间是一种多对一的映射关系、子直方图的和等于原图像直方图

    P68 直方图的作用:判断一幅图像是否合理地利用了全部被允许的灰度级范围

    P69 直方图与图像的关系:直方图是面积函数关于灰度级的导数的负值

    第四章

    P71 三类运算:单幅图像→单幅图像、多幅图像→单幅图像、单幅或多幅图像→数字/符号等

    广义图像:所有以二维信息形式输出的信息统称为广义图像,标号图像也属于广义图像的范畴

    第一类运算功能是数字图像处理中最基本的功能

    根据输入图像到输出图像处理运算的数学特征分类:点运算、代数运算、几何运算

    点运算可以改变图像数据所占据的灰度值范围

    线性点运算

    非线性点运算

    点运算的应用:对比度增强、光度学标定、显示标定、轮廓线、剪裁

    P75 代数运算 加、减、乘、除

    图像相加运算的重要应用之一时对同一场景的多幅图像求平均值的运算,它可以被用于相除或降低加性随机噪声,并具有良好的效果

    图像相减运算可用于消除一幅图像中所不需要的加性图案。

    减法运算还可用于检测同一场景的两幅图像之间的变化。

    除法运算还可以对产生对颜色和多光谱图像分析十分重要的比率图像

    P75 加法运算通常用于平均值降噪等多种场合

    P78 图像相减常用于检测变化及运动的物体,图像相减运算又称为图像差分运算

    差影法:所谓差影法,实际上就是图像的减法运算(又称减影技术),是指将同一景物在不同时间拍摄的图像或同一景物在不同波段的图像相减

    P81:几何运算

    几何变换可改变像素点所在的几何位置,以及图像中的各物体之间的空间位置关系,这种运算可以被看成是将各物体在图像内移动,特别是图像具有一定的规律性时,一个图像可以又另一个图像通过几何变换产生

    齐次坐标、平移、缩放、镜像变换、旋转变换、复合变换

    P97 灰度级插值

    几何变换之后的目标图像的位置坐标并非整数

    在进行图像的几何变换时,除了要进行几何变换运算之外,还需要进行灰度级插值处理。常用的灰度级差之方法有三种:最邻近法、双线性插值法和三次内插法。

    P97 最邻近法 这种灰度估值方法会产生较大的误差,甚至可能影响图像质量

    P99 双线性插值法 这种方法具有低通滤波性质,使高频分量受到损失,是图像细节退化而变得轮廓模糊。在某些应用中,双线性灰度插值的斜率不连续还可能会产生一些不期望的结果

    第六章

    P139 图像增强是数字图像处理的基本内容之一,其目的是根据应用需要突出图像中的某些有用的信息,削弱或除去不需要的信息,以达到扩大图像中不同物体特征之间的差别,使处理后的图像对于特定应用而言,比原始图像更合适或者为图像的信息提取以及为其他图像分析技术奠定基础

    图像的增强处理并不一定是一种无损处理

    图像噪声的消除是以纹理信息(高频信息)的减弱为代价而实现的

    噪声是指图像中的非本源信息

    P140 图像噪声分类,按产生原因分外部噪声和内部噪声,外部噪声是指系统外部干扰从电磁波或经电源传进系统内部而引起的噪声

    P140 图像噪声的特点:叠加性、分布和大小不规则、噪声与图像之间具有相关性

    P141 图像增强分类:空域增强和频域增强

    空域增强又分为:灰度变换和空域滤波

    灰度变换:灰度变换时基于点操作的增强方法,将每一像素点的灰度值按照一定的数学变换转换为一个新的灰度值。

    空域滤波:空域滤波是基于领域处理的增强方法,它应用某一模板对每个像素点与其周围领域的所有像素点进行某种确定数学运算得到该像素点的新的灰度值,输出值的大小不仅与该像素点的灰度值有关,而且还与其领域内的像素点的灰度值有关,常见的图像平滑滤波与锐化滤波技术就属于空域滤波范畴

    频域增强:频率域增强法首先将图像从空间域安装某种变换模型(如傅里叶变换或其他变换)变换到频率域,然后在频域对图像进行处理,再将其反变换到空间域。通常包括低通、高通、带通和带阻四种典型的滤波器结构。

    P142 图像增强效果评价 定性评价、定量评价

    P142 常见的空域灰度变换:直接灰度变换、基于直方图的灰度变换、对多个灰度图像进行代数运算实现灰度变换

    P143 线性灰度拉伸

    按 比例线性拉伸

    分段线性拉伸

    直方图均衡化

    空间滤波增强 均值滤波 中值滤波

    第七章

    P177 图像复原

    图像复原与图像增强技术一样,也是一种改善图像质量的技术。图像复原的基本方法是根据事先建立起来的系统退化模型,将退化了的图像以最大的保真度恢复为原始图像或物体的真实影像。

    第八章

    P200 图像中的信息冗余:视觉冗余,空间冗余,时间冗余,信息熵冗余,结构冗余,知识冗余

    视觉冗余:指人类视觉系统不敏感或不能感知的那部分图像信息

    空间冗余:图像内部向量像素之间存在相关性所产生的图像冗余信息称为空间冗余

    信息熵冗余:又称为编码冗余

    结构冗余:许多图像中可能村咋很强的结构或自相似性

    P202 图像编码:图像编码是安装一定的格式存储图像的数据的过程,而编码技术则是研究如何在满足一定图像保真条件下,压缩表示原始图像数据的编码方法。

    信道编码:信道编码的主要任务是解决信息传输的可靠性问题,使处理过的信号在传输过程中尽量不出错或少出错,以及产生出错之后的错误纠正

    信源编码:信源编码的主要任务是解决信息表示的有效性问题,即尽量提高编码效率,以最少的数码表示尽可能多的信息量,对信源实现压缩处理。

    图像编码的目的是要研究数码的压缩率,即高校编码问题

    按压缩原理划分,编码方法可以分为四大类:熵编码、预测编码、变换编码、混合编码。

    根据解码后的图像与原始图像数据是否完全一致,可分为有损编码和无损编码。

    有损压缩编码是指对图像进行解压后重新构造的图像与原始图像存在一定的误差。有损压缩李永乐图像信息本身包含的许多冗余信息,例如视觉冗余和空间冗余

    无损编码是指对图像数据进行解压后重新构造出来的图像与原始图像之间完全相同,行程编码就是无损编码的一个实例

    P203 图像编码的新方法:分形编码、小波变换编码、模型压缩编码

    分形编码最大限度地利用了图像在空间域上的自相似性

    P204 图像编码的评价

    图像编码的评价可分为主观评价和客观评价

    效率指标:信息熵、码字长度、编码效率、信息冗余度、,每秒钟所需的传输比特数、压缩比

    P206 图像的统计编码

    8.3 重点 大题2个 霍夫曼编码、香农范诺编码、香农对分编码、算术编码,行程编码的最简单形式

    P214 行程编码。REL编码原理比较简单,即在被压缩文件中寻找连续重复的数值,以重复次数和重复数值自身两个值取代文件中的连续值,重复次数称为行程长度。

    例如,若有一串字符信息"aaaaabbbbcccddeefffaa',经过RLE编码处理可表示为"5a4b3c2d2e3f2a"

    8.6 8.7知道JPEGMPEG的定义

    静止彩色图像和灰度图像(也称为连续色调图像)的压缩标准--JPEG标准。

    MPEG标准不是一个单一的标准,而是一个用于全运动视频和相关音频压缩的标准系列。

    第九章

    P242

    图像的技术特征分为三层结构:图像处理、图像分析、图像理解与识别

    图像处理、图像分析、图像理解与识别的基础工作都是建立在图像分割的基础上的

    图像分割的最终结果是将图像分解成一些具有某种特征的单元,称为图像的基元

    图像特征是指图像中可用作标志的属性,它可以分为统计特征和视觉特征两类

    图像分割是进行图像分析的关键步骤

    所谓边缘(又称为边沿),是指其周围像素灰度有阶跃变化或屋顶形变化的那些像素的集合

    分割依据:相似性、非连续性

    P243 分割的三种途径:以区域对象进行分割、以物体的边界为对象进行分割、先检测边缘像素,再将边缘像素连接起来构成边界进行分割

    P244 灰度阈值法分割

    P249 常见的边缘检测算子

    图像的边缘点包括:空间曲面上的不连续点、物体与背景的分界线、不同材料组成的边缘线、阴影引起的边缘线

    P251 边缘检测算子

    罗伯特(Robert)边缘算子模板

    1 0
    0 -1
    (a)
    0 1
    -1 0
    (b)

    索贝尔(Sobel)边缘算子

    -1 -2 -1
    0 0 0
    1 2 1
    (a)


    -1 0 1
    -2 0 2
    -1 0 1
    (b)

    普瑞维特(Prewitt)边缘算子

    -1 -1 -1
    0 0 0
    1 1 1
    (a)
    1 0 -1
    1 0 -1
    1 0 -1
    (b)

    拉普拉斯(Laplacian)边缘算子

    0 -1 0
    -1 4 -1
    0 -1 0
    (a)
    -1 -1 -1
    -1 8 -1
    -1 -1 -1
    (b)

    凯西(Kirsch)边缘算子

    5 5 5
    -3 0 -3
    -3 -3 -3
    (a)
    -3 5 5
    -3 0 5
    -3 -3 -3
    (b)
    -3 -3 5
    -3 0 5
    -3 -3 5
    (c)
    -3 -3 -3
    -3 0 5
    -3 5 5
    (d)
    -3 -3 -3
    -3 0 -3
    5 5 5
    (e)
    -3 -3 -3
    5 0 -3
    -3 5 5
    (f)
    5 -3 -3
    5 0 -3
    5 -3 -3
    (g)
    5 5 -3
    5 0 -3
    -3 -3 -3
    (h)





    展开全文
  • 数字图像处理期末复习

    千次阅读 2020-04-22 21:18:03
    第一章 图像的概念: 1.什么是图像? 图 —— 物体投射或反射光的分布,是客观存在; 像 —— 人的视觉系统对图的接收在大脑形成的印象或认识,是人的...数字图像处理的定义、特点 图像处理:对图像信息进行性加工(...

    第一章

    图像的概念:
    1.什么是图像?
    图 —— 物体投射或反射光的分布,是客观存在;
    像 —— 人的视觉系统对图的接收在大脑中形成的印象或认识,是人的感觉;
    数字图像的概念
    数字图像是图像的数字表示,像素是其最小单位。
    数字图像的描述有:

    1. 无彩色图像
    2. 彩色图像
      图像处理的研究目的
      目的:满足人的视觉、心理需要;实际应用或某种目的的要求
      数字图像处理的定义、特点
      图像处理:对图像信息进行性加工(处理)和分析
      特点:
      优:精度高、内容丰富、方法易变、灵活度高;
      缺:处理速度较慢。
      数字图像处理研究的主要内容及其特点
      包括图像数字化、图像变换、图像编码、图像增强、图像恢复、图像分割、图像分析与描述、图像的理解和识别。
      图像数字化:将非数字形式的图像信号通过数字化设备转换成数字图像,包括采样和量化。
      图像变换:对图像信息进行变换以便于在频域对图像进行更有效的处理。
      图像增强:增强图像中的有用信息,削弱干扰和噪声,提高图像的清晰度,突出图像中感兴趣的部分。主要技术有:直方图修正、图像平滑、图像锐化、同态系统、伪彩色技术
      图像压缩编码: 对待处理图像进行压缩编码以减少描 述图像的数据量,以便节省图像传输、处理时间、减少存储空间。
      图像复原:是寻找图像降质的起因,尽可能恢复图像本来面目。
      图像分割:根据选定的特征将图像划分成若干个有意义的部分,这些选定的特征包括图像的边缘、区域等。
      目的:提取出感兴趣的对象,为进一步的理解和识别做准备。
      主要方法:灰度阈值分割、基于纹理的分割、区域生长法
      图像分析与描述: 主要是对已经分割的或正在分割的图像各部分的属性及各部分之间的关系进行分析表述。
      图像识别分类:根据从图像中提取的各目标物的特征,与目标物固有的特征进行匹配、识别,以识别出目标物。
      图像工程相关概念
      包括图像处理、图像分析和图像理解三个层次。把这三个层次综合集成在一个整体框架上进行,这个框架就是图像工程。
      在这里插入图片描述
      数字图像处理系统的组成
      一个基本的数字图像处理系统由图像输入、图像输出、图像存储、图像通信、图像处理和分析五个模块组成。
      在这里插入图片描述
      图像的数学表示
      I=f(x,y,z,λ,t)
      (1)静止图像:I = f(x,y,z, λ)
      (2)灰度图像:I = f(x,y,z,t )
      (3)平面图像:I = f(x,y,λ,t)
      而对于平面上的静止灰度图像,其数学表达式可简化
      为:
      I = f(x,y)

    第二章

    人眼视觉特点
    ①总范围很宽( c=10^8 )
    ②人眼适应某一环境亮度后,范围限制
    适当平均亮度下:c=10^3
    很低亮度下: c = 10
    对比度概念
    C=Bmax/Bmin
    相对对比度:cr=(B-B0)/B0
    色度学基础
    各种表示颜色的方法,称做颜色模型。目前使用最多的是面向机器(如显示器、摄像机、打印机等)的RGB 模型和面向颜色处理(也面向人眼视觉)的 HIS/HSV模型。
    图像的数字化
    所谓的图像数字化,是指将模拟图像经过离散化之后,得到用数字表示的图像
    一幅图像必须要在空间灰度上都离散化才能被计算机处理。空间坐标的离散化叫做空间采样,而灰度的离散化叫做灰度量化图像的空间分辨率主要由采样所决定,而图像的幅度分辨率主要由量化所决定。
    采样和量化相关概念
    采样是指将在空间上连续的图像转换成离散的采样点(即像素)集的操作。位置上离散化为采样点,称为像素(pixel)
    量化是将各个像素所含的明暗信息离散化后,用数字来表示。一般的量化值为整数
    分辨率相关概念、特点
    图像分辨率:区分细节的程度;
    影响因素:采样点数( M,N)和灰度级数G。
    采样点数越多空间分辨率越高,G越多图像幅度分辨率越高
    数字图像类型、常见文件格式
    数字图像的特点:信息量大、占用频带宽、像素间相关性大、视觉效果的主观性大
    常见文件按格式:两种存储模式,一种点阵图又称位图模式,另一种是矢量图模式。BMP、TIFF、GIF、JPEG、PNG、WMF。视频文件格式:AVI、MOV、RM、MPEG、WMV
    领域相关概念
    4邻域——N4§
    在这里插入图片描述
    对角邻域——ND§
    在这里插入图片描述
    8邻域——N8§
    在这里插入图片描述

    第三章

    图像变换的目的、方法
    目的:方便处理、便于抽取特性
    方法:傅立叶变换、离散余弦变换、沃尔什-哈达玛变换
    频谱各部分意义
    Fourier变换后的图像,中间部分为低频部分,越靠外边频率越高。
    因此,我们可以在Fourier变换图中,选择所需要的高频或是低频滤波。

    第四章

    图像增强的目的、方法
    目的:目的是根据应用需要突出图像中的某些“有用”信息,削弱或去除不需要的信息,以达到扩大图像中不同物体特征之间的差别。
    主要技术有:直方图修正、图像平滑、图像锐化、同态系统、伪彩色技术
    在这里插入图片描述
    点运算的概念、特点
    所谓点运算是指像素值(像素点的灰度值)通过运算之后,可以改善图像的显示效果。这是一种像素的逐点运算。
    点运算与相邻的像素之间没有运算关系,是原始图像与目标图像之间的影射关系。又称为“对比度增强”、“对比度拉伸”、“灰度变换”
    点运算方法包括:灰度变换、直方图变换
    灰度变换
    在这里插入图片描述
    直方图均衡化概念、基本思想、步骤
    在这里插入图片描述
    例:设图象有64*64=4096个象素,有8个灰度级,灰度分布如表所示。进行直方图均衡化。
    在这里插入图片描述
    直方图规定化概念、基本思想、步骤
    修改一幅图像的直方图,使它与另一幅图像的直方图匹配或具有一种预先规定的函数形状
    在这里插入图片描述
    模板的概念、作用,模板卷积基本步骤
    在这里插入图片描述
    在这里插入图片描述
    图像平滑的目的、方法(空间域、频率域)
    邻域平均法(线性的)和中值滤波法(非线性的)
    噪声的类型、特点
    类型:
    设备元器件及材料本身引起的噪声
    系统内部设备电路所引起的噪声
    电器部件机械运动产生的噪声
    特点:
    叠加性
    分布和大小的不规则性
    噪声与图像之间具有相关性
    邻域平均法(均值滤波)基本思想、步骤
    与模板相乘求其平均值
    中值滤波法基本思想、步骤
    按从小到大的顺序排列取中间数值
    均值滤波和中值滤波的比较
    对大的边缘高度,中值滤波较邻域均值滤波好得多,而对于较小边缘高度,两种滤波只有很少差别。
    中值滤波是非线性的。
    中值滤波在抑制图像随机脉冲噪声方面甚为有效。且运算速度快,便于实时处理。
    中值滤波去除孤立线或点干扰,而保留空间清晰度较均值滤波为好;但对高斯噪声则不如均值滤波。
    前面使用的邻域平均法属于低通滤波的处理方法。它在抑制噪声的同时使图像变得模糊,即图像的细节(例如边缘信息)被削弱,如果既要抑制噪声又要保持细节可以使用中值滤波。
    低通滤波
    双线性插值具有低通滤波器的性质,使高频分量减弱,所以使图像的轮廓在一定程度上受损。

    1. 理想低通滤波器
    2. 巴特沃思低通滤波器
    3. 指数型低通滤波器
    4. 梯形低通滤波器
      在这里插入图片描述
      图像锐化的目的、方法(空间域、频率域)
      图像锐化的目的:是加强图像中景物的细节边缘和轮廓,锐化作用是使灰度反差增强,锐化算法的实现基于微分作用
      方法:图像的景物细节特征,一阶微分锐化方法、二阶微分锐化方法
      一阶锐化各方法的特点和区别
      单方向的一阶锐化是指对某个特定方向上的边缘信息进行增强。
      因为图像为水平、垂直两个方向组成,所以,所谓的单方向锐化实际上是包括水平方向与垂直方向上的锐化。
      在这里插入图片描述
      在这里插入图片描述
      这种锐化算法需要进行后处理,以解决像素值为负的问题。
      后处理的方法不同,则所得到的效果也就不同。
      后处理方法:
      整体加一个整数——》可以得到类似浮雕的效果
      取绝对值—————》可以获得对边缘的有方向提取
      无方向一阶锐化
      在这里插入图片描述
      在这里插入图片描述在这里插入图片描述
       Sobel算法与Priwitt算法的思路相同,属于同一类型,因此处理效果基本相同。
       Roberts算法的模板为2*2,提取出的信息较弱。
       单方向锐化经过后处理之后,也可以对边界进行增强。
      二阶锐化各方法的特点和区别
      在这里插入图片描述
      在这里插入图片描述
      在这里插入图片描述
      在这里插入图片描述
      高通滤波
      图像轮廓是灰度陡然变化的部分,包含着丰富的空间高频成分。
      把高频分量相对突出,显然可使轮廓清晰。
      高频滤波器使高频分量相对突出,而低频分量和甚高频分量则相对抑制。
    5. 理想高通滤波器
    6. 巴特沃思高通滤波器
    7. 指数形高通滤波器
    8. 梯形高通滤波器
      两种颜色模型概念、特点
      假彩色增强:把真实的自然彩色图像或遥感多光谱图像处理成假彩色图像。
      伪彩色增强:把黑白图象处理成伪彩色图象。
      伪彩色处理的概念、分类
      伪彩色增强方法:
      灰度分层法
      伪彩色变换
      频域滤波
      图像几何变换概念、分类、方法
      图像的几何变换(Geometric Transformation)是指图像处理中对图像平移、旋转、放大和缩小,这些简单变换以及变换中灰度内插处理等
      几何变换不改变像素值,而可能改变像素所在的位置。
      空间变换(齐次坐标、图像的平移、图像的缩小、图像的放大、图像的镜像)、灰度插值(最邻近插值法、双线性插值、高阶插值)
      在这里插入图片描述
      在这里插入图片描述

    第五章

    图像复原的目的、常用方法
    目的:是寻找图像降质的起因,尽可能恢复图像本来面目。是当给定退化的图像g(x,y)及系统h(x,y)和噪声n(x,y)的某种了解或假设,估计出原始图像f(x,y)
    方法:代数复原法、逆滤波复原法、中值滤波复原法
    退化模型
    在这里插入图片描述
    在这里插入图片描述
    在这里插入图片描述
    图像退化的常见点扩展函数
    在这里插入图片描述
    在这里插入图片描述
    在这里插入图片描述

    第六章

    图像分割目的、方法
    图像分割的目的是把图像分成一些具有不同特征的有意义区域,将图像中有意义的特征或者应用所需要的特征信息提取出来,以便进一步分析和说明。
    基于阈值的图像分割方法
    基于边界的图像分割方法
    基于区域的图像分割方法
    图像分割算法:三类(阈值法、边缘检测、区域提取)
    常见分割算法的基本思想、步骤:阈值分割法、区域生长法、分裂合并法
    阈值化分割的基本原理就是利用图像中要提取的目标物与其背景在灰度特性上的差异,选取一个或多个处于图像灰度取值范围之中的灰度阈值,然后将图像中各个像素的灰度值与阈值进行比较,并根据比较的结果将图像中的像素分成不同等级,从而把图像分成互不交叉重叠的区域的集合,达到图像分割的目的。
    基于边界的图像分割方法就是根据图像不同区域边界的像素灰度值变化比较剧烈的情况,首先检测出图像中可能的边缘点,再按一定策略连接成轮廓,从而实现不同区域的图像分割
    区域生长也称为区域生成,其基本思想是将一幅图像分成许多小的区域,并将具有相似性质的像素集合起来构成区域。相似性准则可以是灰度级、彩色、组织、梯度或其他特性,相似性的测度可以由所确定的阈值来判定。从满足检测准则的点开始,在各个方向上生长区域,当其邻近点满足检测准则就并入小块区域中。当新的点被合并后再用新的区域重复这一过程,直到没有可接受的邻近点时生成过程终止。
    区域生长的主要步骤
    对图像进行逐行扫描,找出尚没有归属的像素;
    以该像素为中心检查它的邻域像素,即将邻域中的像素逐个与它比较,如果灰度值小于预先确定的阈值,将它们合并;
    以新合并的像素为中心,返回步骤2,检查新像素的邻域,直到区域不能进一步扩张;
    返回到步骤1,继续扫描到不能发现没有归属的像素,则结束整个生长过程
    图像阈值分割法可以认为是从上到下对图像进行分开,而区域生长法相当于从下往上不断对像素进行合并。将这两种方法结合起来对图像进行划分,便是分裂合并法。

    1. 四叉树
      基本思路:将图像任意分成若干子块,对每个子块的属性进行计算。
    2. 当属性表明该子块包含不同区域的像素,则该子块再分裂成若干子块。
    3. 如果几个子块的属性相似,则这几个相似属性的子块合并成一个大的区域。
      在这里插入图片描述

    第九章

    图像压缩编码目的、不同方法的特点
    是在满足一定图像质量条件下,用尽可能少的比特数来表示原始图像,
    以提高图像传输的效率和减少图像存储的容量。在信息论中称为信源编码。
    图像冗余
    对于一个图像,很多单个像素对视觉的贡献是冗余的。
    图像编码方法常用评价参数:熵H、平均码字长度R、编码效率n、压缩比,等
    在这里插入图片描述
    在这里插入图片描述
    在这里插入图片描述
    信息冗余度为:
    在这里插入图片描述
    每秒钟所需的传输比特数bps为:
    在这里插入图片描述
    压缩比r为:
    在这里插入图片描述
    图像编码算法
    在这里插入图片描述
    哈夫曼编码基本思想、步骤
    哈夫曼编码是一种利用信息符号概率分布特性的变字长的编码方法。对于出现概率大的信息符号编以短字长的码,对于出现概率小的信息符号编以长字长的码。
    在这里插入图片描述
    在这里插入图片描述
    算术编码基本思想、步骤
    算术编码方法是将被编码的信源消息表示成0~1之间的一个间隔,即小数区间,消息越长,编码表示它的间隔就越小;
    以小数表示间隔,表示的间隔越小所需的二进制位数就越多,码字就越长。反之,间隔越大,编码所需的二进制位数就少,码字就短。
    算术编码将被编码的图像数据看作是由多个符号组成的字符序列,对该序列递归地进行算术运算后,成为一个二进制分数;
    接收端解码过程也是算术运算,由二进制分数重建图像符号序列。
    在这里插入图片描述 在这里插入图片描述
    在这里插入图片描述
    在这里插入图片描述
    在这里插入图片描述
    在这里插入图片描述
    在这里插入图片描述
    在这里插入图片描述
    行程编码基本思想、步骤
    编码思想:去除像素冗余。
    用行程的灰度和行程的长度代替行程本身。
    例:设重复次数为 iC, 重复像素值为 iP
    编码为:iCiP iCiP iCiP
    编码前:aaaaaaabbbbbbcccccccc
    编码后:7a6b8c

    展开全文
  • 数字图像处理》复习提纲

    千次阅读 2019-06-11 09:44:34
    本文在撰写过程参考了由何东健教授主编、西安电子科技大学出版社出版的《数字图像处理》(第三版),一切著作权归原书作者和出版社所有。特别感谢长安大学软件系老师的认真负责的教导。 第1章 概论 1.1 数字...

    本文在撰写过程中参考了由何东健教授主编、西安电子科技大学出版社出版的《数字图像处理》(第三版),一切著作权归原书作者和出版社所有。特别感谢长安大学软件系老师的认真负责的教导。

    第1章 概论

    1.1 数字图像处理及其特点

    1、数字图像与图像处理
    区分模拟图像与数字图像。
    数字图像处理:利用计算机对图像进行去噪、增强、复原、分割、特征提取、识别等的理论、方法和技术。
    2、数字图像处理的特点:
    处理精度高、易于控制处理效果、处理的多样性、图像数据量大、处理费时、综合性强

    1.2 图像处理的目的及主要内容

    1、数字图像处理的目的
    提高图像的视感质量、特征信息的提取、图像数据变换、编码和压缩
    2、数字图像处理的主要内容
    图像获取、表示和表现,复原,增强,分割,分析,重建、压缩编码

    1.3 数字图像处理的应用(略)

    第2章 数字图像处理基础

    2.1 图像数字化技术

    数字图像处理的先决条件:连续图像离散化。
    图像的数字化包括采样和量化两个过程。
    连续图像数字化的结果是图像矩阵,每一个元素称为像素、像元或图像元素。
    采样方法:正方形采样、三角形采样、正六角形采样
    1、采样
    采样:图像在空间上的离散化,即用采样点的灰度值代替图像。
    采样方法:先垂直采样,在水平采样。对于视频,先对时间采样,再沿垂直方向采样,最后沿水平方向采样。
    一维采样定理:若一维信号的g(t)的最大频率为ω,则采样周期小于等于1/(2ω),则能够根据采样频结果完全恢复图像。
    2、量化
    量化:把采样得到的各像素点的灰度值从模拟量到离散量的转换称为图像灰度的量化,转换前的灰度值称为连续灰度值,转换后的灰度值称为量化灰度值,量化灰度值与连续灰度值的差的绝对值称为量化误差。
    量化方法:等间隔量化(均匀量化、线性量化)、非等间隔量化。
    非等间隔量化是根据图像灰度值分布的概率密度函数,按总量化误差最小的原则来进行量化的。具体做法是“高概率细分,低概率粗分”。
    3、采样与量化参数的选择
    图像存储大小=采样数×量化灰度值位数(bit)
    低采样数导致马赛克,低量化级数导致假轮廓。
    采样原则:
    缓变——细量化、粗采样
    细节丰富——粗量化、细采样
    4、图像数字化设备
    组成:采样孔、图像扫描机构、光传感器、量化器、输出储存装置
    性能指标:像素大小、量化位数(颜色元数)、图像尺寸、线性度、噪声

    2.2 色度学基础与颜色模型

    1、色度学基础
    视杆细胞辨亮度,视锥细胞辨颜色,RGB光的三原色
    颜色属性:色调、饱和度、亮度
    2、颜色模型
    计算颜色模型:RGB、CIE XYZ、Lab
    视觉颜色模型:HSI、HSV、HSL
    工业颜色模型:CMYK、YUV、YCbCr
    (1)RGB模型
    在这里插入图片描述
    (2)CIE XYZ模型
    F=x•X+y•Y+z•Z, x=X/(X+Y+Z), y=Y/(X+Y+Z), z=Z/(X+Y+Z)
    (3)Lab颜色模型
    具有设备无关性,L表示亮度分量,a、b为色度分量,其中a正向绝对值越大表示越红,负向绝对值越大表示越绿;b正向绝对值越大表示越黄,负向绝对值越大表示越蓝。
    (4)HSI颜色模型
    色调H:反应颜色的种类(波长)
    饱和度S:表示颜色的深浅
    强度I:亮度/灰度
    (5)CMY与CMYK颜色模型
    (C,M,Y)=(1,1,1)-(R,G,B)
    在这里插入图片描述
    (6)YUV电视信号彩色坐标系统
    Y表示亮度信号,U、V表示色差
    (7)YCbCr模型
    由亮度Y,色差Cb、Cr组成,但充分考虑RGB分量在视觉感受中的不同重要性。
    3、颜色变换
    颜色变换模型:g(x, y) = T[ f(x, y) ]
    颜色变换关系:si = Ti [r1, r2, r3, … ,rn], i = 1, 2, … , n
    彩色切片:识别目标颜色分离出来

    2.3 数字图像类型

    矢量图:数学公式描绘图像,存储量小,图像清晰度与分辨率无关,缺点是单调且不真实
    位图:像素点阵表示图像,每个像素点具有颜色和位置属性,分为线画稿、灰度图像、索引颜色图像、真彩色图像
    1、位图
    线画稿:二值图像
    灰度图像:介于黑色与白色之间的多级灰度
    索引颜色:选择一些颜色,然后编号,用编号作为颜色的索引
    真彩色图像:RGB颜色
    2、位图有关术语
    像素:显示器显示图像的基本单位
    样点:将原图像网格化,用样点代替网格中所有点
    分辨率:单位长度像素数,按照像素的来源分为图像分辨率屏幕分辨率、打印机分辨率、扫描仪分辨率

    2.4 图像文件格式

    BMP图像文件格式:
    (1)四部分组成:位图文件头、位图信息头、调色板、图像数据
    (2)字节对齐,4byte整数倍
    (3)上下倒置存放
    其他文件格式略

    2.5 OpenCV编程简介

    OpenCV = Open Source Computer Vision Library
    1、OpenCV简介 不考
    2、OpenCV的安装与配置 不考
    3、OpenCV的数据结构 不太可能考
    二维点、三维点、Size_、Rect_、RotatedRect、Matx、Vec、Scalar_、Range、Mat
    4、读入、显示和存储图像

    #include <iostream>
    #include <opencv2/core/core.hpp>
    #include <opencv2/highgui/highgui.hpp>
    using namespace std;
    using namespace cv;
    int main(){
    	Mat image, result;
    	cout << "size: " << image.size().height() << " , " << image.size().width << endl;
    	image = imread("tiger.jpg");
    	if(!image.data){
    		cout << "read image file failed!" << endl;
    	}
    	namedWindow("Original Image");
    	imshow("Original Image", image);
    	flip(image, result,1);
    	namedWindow("Output Image");
    	imshow("Output Image", result);
    	imwrite("output.bmp", result);
    	waitKey(0);
    	return 0
    }
    

    5、操作图像像素
    (1)at方法

    void colorReduce(Mat& inputImage, Mat& outputImage, int div){
    	outputImage = inputImage.clone();
    	int rows = outputImage.rows;
    	int cols = outputImage.cols;
    	for(int i=0;i<rows;i++){
    		for(int j=0;j<cols;j++){
    			outputImage.at<Vec3b>(i,j)[0] = outputImage.at<Vec3b>(i,j)[0]/div*div+div/2;
    			outputImage.at<Vec3b>(i,j)[1] = outputImage.at<Vec3b>(i,j)[1]/div*div+div/2;
    			outputImage.at<Vec3b>(i,j)[2] = outputImage.at<Vec3b>(i,j)[2]/div*div+div/2;
    		}
    	}
    }
    

    (2)使用迭代器

    void colorReduce(Mat& inputImage, Mat& outputImage, int div){
    	outputImage = inputImage.clone();
    	Mat_<Vec3b>::iterator it = inputImage.begin<Vec3b>();
    	Mat_<Vec3b>::iterator it = inputImage.end<Vec3b>();
    	Mat_<Vec3b> cimage = outputImage;
    	Mat_<Vec3b>::iterator itout = cimage.begin();
    	Mat_<Vec3b>::iterator itoutend = cimage.end();
    	for(; it != itend; it++,itout++){
    		(*itout)[0]=(*it)[0]/div*div+div/2;
    		(*itout)[1]=(*it)[1]/div*div+div/2;
    		(*itout)[2]=(*it)[2]/div*div+div/2;
    	}
    }
    

    (3)使用指针

    void colorReduce(Mat& inputImage, Mat& outputImage, int div){
    	outputImage = inputImage.clone();
    	int rows = outputImage.rows;
    	int cols = outputImage.cols;
    	if(outputImage.isContinuous()){
    		cols = cols * rows;
    		rows = 1;
    	}
    	for(int i=0;i<rows;i++){
    		uchar * dataout = outputImage.ptr<uchar>(i);
    		for(int j=0;j<cols;j++){
    			dataout[j] = dataout[j]/div*div+div/2;
    		}
    	}
    }
    

    注意:OpenCV中的彩色图像不是以RGB顺序存放的,而是以BGR顺序存放的。
    4、整行整列像素值的赋值

    img.row(i).setTo(Scalar(255));
    img.col(i).setTo(Scalar(255));
    

    6、图形交互和媒体接口HighGui 不太可能考

    第3章 图像增强

    图像增强的目的:改善图像的视觉效果,或使图像更适合于人或机器的分析处理。减少图像噪声,提高目标与背景的对比度,强调或抑制图像中的某些细节。
    图像增强的方法:空域法、频域法,空域法又可以分为点处理和区处理,频域增强可以分为低通滤波、高通滤波、带通滤波、带阻滤波和同态滤波。

    3.1 灰度变换

    灰度变化模型:g(x, y) = T[ f(x, y) ]
    区处理:灰度变换操作在像素的邻域内进行,区处理一般基于模板卷积实现,因此又称为模板操作或空域滤波。
    常见的灰度变换方法:直接灰度变换法、直方图修正法。直接灰度变换法包括线性、分段线性以及非线性变换;直方图修正法可以分为直方图均衡化和直方图规定化。
    1、灰度线性变换
    在这里插入图片描述
    2、分段线性变换
    在这里插入图片描述
    3、非线性变换
    在这里插入图片描述
    在这里插入图片描述

    3.2 直方图修正

    1、直方图的基本概念
    灰度直方图是图像量化灰度值的频数分布直方图或频率分布直方图。
    2、直方图的性质
    (1)丢失位置信息,保留统计信息
    (2)图像与灰度直方图是一对多的关系
    (3)灰度直方图具有可加性
    3、直方图的计算
    (1)初始化:数组零值初始化
    (2)统计:将量化灰度值映射为数组下标,遍历图像将对应数组元素的值++
    (3)归一化:数组所有元素除以像素总数
    也可以像素值沿水平轴划分为若干子区间称为箱格,从而简化计算。
    4、直方图均衡化
    (1)基本思想:把原始图像的直方图变换为均匀分布的形式,从而增加图像灰度的动态范围,以达到增强图像对比度的效果。经过均衡化处理的图像,其灰度级出现的概率相同,此时图像的熵最大,图像包含的信息量最大。
    (2)推导
    s=T(r)s=T(r)
    s和r分别为灰度变换前后的灰度级,T(r)T(r)单调递增且有界[0,1]
    η=T(ξ)η=T(ξ),则有
    Fη(s)=P(η&lt;s)=P(ξ&lt;r)=rPr(x)dxF_{η}(s) = P(η&lt;s) = P(ξ&lt;r) = \int_{-\infty}^{r}P_{r}(x)dx
    对两边同时求导得
    ps(s)=[pr(r)drds]r=T1(s)p_{s}(s)=[p_{r}(r)•\frac{\mathrm{d} r}{\mathrm{d} s}]_{r=T^{-1}(s)}
    若要使变换后的图像灰度s为均匀分布,即有
    ps(s)=1p_s(s)=1
    代入上式有
    ds=pr(r)dr\mathrm{d} s=p_r(r)\mathrm{d}r
    两边同时积分有
    T(r)=s=0rpr(ω)dωT(r)=s=\int_0^rp_r(ω)\mathrm{d}ω
    其中0rpr(ω)dω\int_0^rp_r(ω)\mathrm{d}ω是r的累计分布函数。
    容易证明,以CDF为灰度变换函数,可得到灰度分布均匀的图像。
    (3)数字图像的直方图均衡化

    k rk nk pr=T(rk) sk=int[(L-1)sk+0.5] s rk->sk ps(sk)
    0 0 790 0.19 0.19 0.19→1 0→1 -
    1 1 1023 0.25 0.44 0.144→3 1→3 0.19
    2 2 850 0.21 0.65 0.65→5 2→5 -
    3 3 656 0.16 0.81 0.81→6 3→6 0.25
    4 4 329 0.08 0.89 0.89→6 4→6 -
    5 5 245 0.06 0.95 0.95→7 5→7 0.21
    6 6 122 0.03 0.98 0.98→7 6→7 0.24
    7 7 81 0.02 1 1→7 7→7 0.11

    简并:频数较低的灰度级被归并为一个新的灰度级上,使得变换过后的灰度级的数量减少了,这种现象称为简并。简并现象增大了灰度级的间隔,增加了图像对比度,可以看清更多的细节。
    理论上,直方图均衡化的结果应该是平坦的,但由于不能将同一灰度级的像素映射到不同的灰度级,因而实际结果只是近似均衡。
    5、直方图规定化
    直方图规定化:实际应用中希望将直方图变换为某个特定的形状,从而有选择地增强某个灰度范围内的对比度,这种方法就称为直方图规定化。
    直方图规定化的步骤:
    第一步,对原始直方图进行均衡化,得到映射关系1;
    第二步,对规定直方图进行均衡化,得到映射关系2;
    第三步,按照单映射规则或组映射规则,根据映射关系1和映射关系2得到最终的映射关系。

    rk,zl pr(rk) pz(zl) sk=T(rk) vl=G(zl) 单映射rk→zl 单映射ps(sk) 组映射rk→zl 组映射ps(sk)
    0 0.19 - 0.19 - r0→r3 0 r0→r3 0
    1 0.25 - 0.44 - r1→r3 0 r1→r5 0
    2 0.21 - 0.65 - r2→r5 0 r2→r5 0
    3 0.16 0.2 0.81 0.2 r3→r5 0.44 r3→r7 0.19
    4 0.08 - 0.89 - r4→r7 0 r4→r7 0
    5 0.06 0.5 0.95 0.7 r5→r7 0.37 r5→r7 0.46
    6 0.03 - 0.98 - r6→r7 0 r6→r7 0
    7 0.02 0.3 1 1 r7→r7 0.19 r7→r7 0.35

    单映射:对于每一个sk找距离它最近的vl
    组映射:对于每一个vl找距离它最近的sk,作为分组依据(分界值归到左侧区间),再进行组映射。

    3.3 图像平滑

    目的:消噪或模糊图像,去除小的细节或弥合目标间的缝隙。
    低频代表信号缓慢变化的部分,高频代表迅速变化的部分;图像边缘、跳跃以及噪声等灰度变化剧烈的部分代表图像的高频分量,灰度变化缓慢的部分代表图像的低频分量。
    1、图像噪声
    (1)噪声分类
    外部噪声和内部噪声
    平稳噪声和非平稳噪声
    高斯噪声和椒盐噪声
    白噪声和粉红噪声(1/f噪声)
    加性噪声和乘性噪声
    (2)特点
    随机性、图像相关性、叠加性
    2、模板卷积
    模板操作的种类:卷积、相关
    功能:图像平滑、锐化、边缘检测
    线性滤波,其输出像素是输入邻域像素的加权核。
    卷积和相关运算的主要区别在于卷积运算需要将模板绕模板中心旋转180°,因其余运算过程一致而统称为模板卷积。模板卷积中的模板称为卷积核,其元素称为卷积系数、模板系数或加权系数,其大小和排列顺序决定了对图像邻域处理的类型。
    模板卷积的运算过程:移动模板、对应相乘再相加、赋值
    3、邻域平均
    Box模板:
    19[111111111] \frac{1}{9}\begin{bmatrix} 1 &amp; 1 &amp; 1 \\ 1 &amp; 1* &amp; 1 \\ 1 &amp; 1 &amp; 1 \end{bmatrix}
    高斯模板:
    116[121242121] \frac{1}{16}\begin{bmatrix} 1 &amp; 2 &amp; 1 \\ 2 &amp; 4* &amp; 2 \\ 1 &amp; 2 &amp; 1 \end{bmatrix}
    领域平均法的主要优点是算法简单,缺点是降噪时会模糊图像,尤其是在边缘和细节处,尺寸越大模糊程度越大。适合处理高斯噪声,不适合处理椒盐噪声。
    4、中值滤波
    非线性滤波,滤除噪声的同时很好地保持图像边缘。
    基本原理:窗口内元素灰度值求中位数并赋给中心元素
    统计排序滤波器:模板内元素排序,选取某个值作为中心元素的值。中值滤波是统计排序滤波器的一种。最值滤波器用于检测亮点或暗点。
    中值滤波的性质:
    (1)不影响阶跃信号、斜坡信号、连续个数少于窗口长度一半的脉冲受到抑制,三角函数顶部变平。
    (2)中值滤波的输出与输入噪声的密度分布有关
    (3)中值滤波频谱特性起伏不大,可以认为中值滤波之后,信号频谱基本不变
    中值滤波窗口形状和尺寸决定了滤波效果,就一般经验而言,对于有缓变的较长轮廓线物体的图像,采用方形或圆形窗口为宜;对于包含有尖顶角物体的图像,用十字形窗口。窗口大小不宜超过图像中最小有效物体的尺寸。如果图像中包含的点、线、尖角较多,则不宜采用中值滤波。
    复合型中值滤波器:中值滤波的线性组合、高阶中值滤波组合、加权中值滤波、迭代中值滤波
    5、图像平均
    基本原理:同一景物的多幅图像取平均值来消噪。
    缺点:难以操作

    3.4 图像锐化

    目的:使模糊的图像变清晰,增强图像的边缘等细节,但同时也会增强噪声,一般先做消噪处理。
    图像锐化的方法:空域法、频域法
    1、微分法
    微分运算通常通过一阶向前差分运算或二阶中心差分来实现。
    (1)梯度算子
    梯度算子的定义
    f(x,y)=[fxfy]T \mathrm{▽}\mathbf{f}(x,y)=\begin{bmatrix}\frac{\partial f}{\partial x} &amp; \frac{\partial f}{\partial y}\end{bmatrix}^T
    梯度幅度
    f(x,y)=f(x,y)=(Gx2+Gy2)12 \mathrm{▽} f(x,y)=|\mathrm{▽}\mathbf{f}(x,y)|=(G_x^2+G_y^2)^{\frac 1 2}
    梯度方向角
    φ(x,y)=arctan(GyGx) φ(x,y)=arctan(\frac {G_y} {G_x})
    水平梯度差分法
    f(x,y)f(x+1,y)f(x,y)+f(x,y+1)f(x,y) \mathrm{▽} f(x,y) \approx |f(x+1,y)-f(x,y)|+|f(x,y+1)-f(x,y)|
    Robert交叉算子
    f(x,y)f(x+1,y+1)f(x,y)+f(x,y+1)f(x+1,y) \mathrm{▽} f(x,y) \approx |f(x+1,y+1)-f(x,y)|+|f(x,y+1)-f(x+1,y)|
    中心差分算子
    {Gx=f(x+1,y)f(x1,y)2Gy=f(x,y+1)f(x,y1)2 \left \{\begin{matrix} G_x=\frac{f(x+1,y)-f(x-1,y)}{2} \\ \\ G_y=\frac{f(x,y+1)-f(x,y-1)}{2} \end{matrix}\right.
    常见的梯度算子:

    算子名称 模板H1 模板H2 特点
    Roberts [0110]\begin{bmatrix}0* &amp; -1 \\ 1 &amp; 0\end{bmatrix} [1001]\begin{bmatrix}-1* &amp; 0 \\ 0 &amp; 1\end{bmatrix} 各向同性;对噪声敏感;模板尺寸为偶数,中心位置不明显
    Prewitt [101101101]\begin{bmatrix}-1 &amp; 0 &amp; 1 \\ -1 &amp; 0* &amp; 1 \\ -1 &amp; 0 &amp; 1 \end{bmatrix} [111000111]\begin{bmatrix}-1 &amp; -1 &amp; -1 \\ 0 &amp; 0* &amp; 0 \\ 1 &amp; 1 &amp; 1\end{bmatrix} 引入了平均因素,对噪声有抑制作用;操作简便
    Sobel [101202101]\begin{bmatrix}-1 &amp; 0 &amp; 1 \\ -2 &amp; 0* &amp; 2 \\ -1 &amp; 0 &amp; 1 \end{bmatrix} [121000121]\begin{bmatrix}-1 &amp; -2 &amp; -1 \\ 0 &amp; 0* &amp; 0 \\ 1 &amp; 2 &amp; 1\end{bmatrix} 引入了平均因素,增强了最近像素的影响,噪声抑制效果比Prewitt要好
    Krisch [335305335]\begin{bmatrix}-3 &amp; -3 &amp; 5 \\ -3 &amp; 0* &amp; 5 \\ -3 &amp; -3 &amp; 5 \end{bmatrix} [333303555]\begin{bmatrix}-3 &amp; -3 &amp; -3 \\ -3 &amp; 0* &amp; -3 \\ 5 &amp; 5 &amp; 5\end{bmatrix} 噪声抑制效果要好;需求出8个方向的响应(这里只给出两个方向的模板)
    Isotropic Sobel [101202101]\begin{bmatrix}-1 &amp; 0 &amp; 1 \\ -\sqrt 2 &amp; 0* &amp; \sqrt 2 \\ -1 &amp; 0 &amp; 1 \end{bmatrix} [121000121]\begin{bmatrix}-1 &amp; -\sqrt 2 &amp; -1 \\ 0 &amp; 0* &amp; 0 \\ 1 &amp; \sqrt 2 &amp; 1\end{bmatrix} 权值反比于邻点与中心点的距离,检沿不同方向边缘时梯度幅度一致,即具有各向同性

    (2)拉普拉斯算子
    拉普拉斯算子:
    Δf=2f=2f2x+2f2y \Delta f=\nabla ^2f=\frac{\partial ^2f}{\partial ^2x}+\frac{\partial ^2f}{\partial ^2y}
    差分表示:
    2ff(x+1,y)+f(x1,y)+f(x,y+1)+f(x,y1)4f(x,y) \nabla ^2f \approx f(x+1,y)+f(x-1,y)+f(x,y+1)+f(x,y-1)-4f(x,y)
    常用拉普拉斯模板:
    [010141010][111181111][121242121] \begin{bmatrix} 0 &amp; -1 &amp; 0 \\ -1 &amp; 4* &amp; -1 \\ 0 &amp; -1 &amp; 0 \end{bmatrix} \begin{bmatrix} -1 &amp; -1 &amp; -1 \\ -1 &amp; 8* &amp; -1 \\ -1 &amp; -1 &amp; -1 \end{bmatrix} \begin{bmatrix} 1 &amp; -2 &amp; 1 \\ -2 &amp; 4* &amp; -2 \\ 1 &amp; -2 &amp; 1 \end{bmatrix}
    平滑模板和微分模板的对比:
    (1)微分模板的权系数之和为0,使得灰度平坦区的响应为0。平滑模板的权系数都为正,和为1,这使得灰度平坦区的输出与输入相同。
    (2)一阶微分模板在对比度较大的点产生较高的响应,二阶微分模板在对比度大的点产生零交叉。一阶微分一般产生更粗的边缘,二阶微分则产生更细的边缘。相对一阶微分而言,二阶微分对细线、孤立的点等小细节有更强的响应。
    (3)平滑模板的平滑或去噪程度与模板的大小成正比,跳变边缘的模糊程度与模板的大小成正比。
    2、非锐化滤波
    非锐化滤波:从原始图像中减去原始图像的一个非锐化的或者说是平滑的图像,从而达到增强边缘等细节的目的,用公式表示为:
    g(x,y)=f(x,y)fs(x,y) g(x,y)=f(x,y)-f_s(x,y)
    式中f表示输入图像,fs表示由输入图像得到的平滑图像,g为输出图像。
    图像平滑的实质是一种低通滤波,从原始图像中减去平滑图像就相当于除去低频成分保留了高频成分。
    3、高频增强滤波
    高频增强滤波:如果原始图像与高通图像相加,则可以在保持原始图像概貌的同时突出边缘等细节。将原始图像乘以一个比例系数A,高通图像也乘以一个比例系数K,两者相加得到一个增强图像,称该过程为高频增强滤波。
    fhb(x,y)=Af(x,y)+Kg(x,y) f_{hb}(x,y)=Af(x,y)+Kg(x,y)
    fhb(x,y)f_{hb}(x,y)表示输出图像,g(x,y)g(x,y)f(x,y)f(x,y)的一个高通图像,A>=0,0<=K<=1。K在0.2~0.7之间取值时,高频增强滤波的效果最好;A足够大时,图像锐化作用削弱,输出图像接近原始图像整数倍;特别地,当A=1,K=1时为常用的拉普拉斯高频增强模板。
    常见的拉普拉斯高频增强模板:
    [010151010][111191111][121252121] \begin{bmatrix} 0 &amp; -1 &amp; 0 \\ -1 &amp; 5* &amp; -1 \\ 0 &amp; -1 &amp; 0 \end{bmatrix} \begin{bmatrix} -1 &amp; -1 &amp; -1 \\ -1 &amp; 9* &amp; -1 \\ -1 &amp; -1 &amp; -1 \end{bmatrix} \begin{bmatrix} 1 &amp; -2 &amp; 1 \\ -2 &amp; 5* &amp; -2 \\ 1 &amp; -2 &amp; 1 \end{bmatrix}

    3.5 伪彩色处理

    原理:不同灰度级赋予不同彩色。
    1、灰度分层法:类似于等高线、卫星云图、天气预报图等
    2、灰度变换法:红外热成像仪等
    3、频域滤波法:在频率域进行伪彩色处理

    3.6 同态滤波

    同态滤波:在压缩动态范围的同时增强图像对比度,既增强暗区的图像细节又不损失亮区的图像细节。同态滤波用于消除图像中的非均匀光照,对乘性噪声的滤波效果也比较好。
    通常认为,像素的灰度值为光照的入射分量与物体的反射分量的乘积决定。
    f(x,y)=i(x,y)r(x,y) f(x,y)=i(x,y)r(x,y)
    入射分量描述景物的照明,与景物无关,在空间均匀或缓慢变化,频谱特性集中在低频部分。由于景物具有较多细节内容,因而反射分量随空间变化较大,其频谱特性主要集中在高频部分。通过消除场景关照的不均匀性可以增强图像细节。
    对上式两边取对数
    lnf(x,y)=lni(x,y)+lnr(x,y) \mathrm{ln}f(x,y)=\mathrm{ln}i(x,y)+\mathrm{ln}r(x,y)
    两边做傅里叶变换,得
    Ff(u,v)=Fi(u,v)+Fr(u,v) F_f(u,v)=F_i(u,v)+F_r(u,v)
    高斯高通同态滤波器:
    H(u,v)=(γHγL)[1ecD2(u,v)D02]+γL H(u,v)=(\gamma _H-\gamma _L)[1- e^{-c\frac{D^2(u,v)}{D_0^2}}]+\gamma _L
    γH\gamma _HγL\gamma _L用于控制滤波强度,c用于控制滤波器斜面的锐化程度,D2(u,v)D^2(u,v)为频谱上点(u,v)到频谱中心的距离,D02D_0^2为截止半径。
    同态滤波结果:
    g(x,y)=exp{F1[Ff(u,v)H(u,v)]} g(x,y)=exp\{F^{-1}[F_f(u,v)H(u,v)]\}

    第4章 图像的几何变换

    4.1 几何变换基础

    1、概述
    2、齐次坐标
    标准化齐次坐标是几何变换的基础。
    3、二维图像几何变换矩阵
    P=TP0P0=[x1x2...xny1y2...yn11...1]P=[Hx1Hx2...HxnHy1Hy2...HynHH...H]T=[abpcdq001] P=TP_0 \\ P_0=\begin{bmatrix}x_1 &amp; x_2 &amp; ... &amp; x_n \\ y_1 &amp; y_2 &amp; ... &amp; y_n \\ 1 &amp; 1 &amp; ... &amp; 1\end{bmatrix} \\ \\ P_=\begin{bmatrix}Hx_1&#x27; &amp; Hx_2&#x27; &amp; ... &amp; Hx_n&#x27; \\ Hy_1&#x27; &amp; Hy_2&#x27; &amp; ... &amp; Hy_n&#x27; \\ H &amp; H &amp; ... &amp; H\end{bmatrix} \\ T=\begin{bmatrix}a &amp; b &amp; p \\ c &amp; d &amp; q \\ 0 &amp; 0 &amp; 1\end{bmatrix}

    4.2 图像比例缩放

    1、图像比例放缩变换
    全比例放缩:x轴方向和y轴方向缩放比例相同
    几何畸变:x轴方向和y轴方向缩放比例不相同,会改变像素间的相对位置,产生几何畸变
    插值处理:比例缩放可能导致出现空穴,必须进行插值。插值方法有最邻近插值法和插值算法(如双线性内插值法)
    (1)图像的比例缩小
    I(x,y)=F(int(cx),int(cy)),c=1k I(x,y)=F(int(cx),int(cy)), c=\frac 1 k
    (2)图像的非比例缩小
    I(x,y)=F(int(c1x),int(c2y)),c1=1k1,c2=1k2 I(x,y)=F(int(c_1x),int(c_2y)), c_1=\frac 1 {k_1}, c_2=\frac 1 {k_2}
    (3)图像的比例放大
    最邻近插值法:原图像对应元素如果不存在就取邻近的元素。
    线性插值法:
    g(x,y)=(1q)[(1p)f([x],[y]+1)+pf([x]+1,[y])]+q[(1p)f([x],[y]+1)+pf([x]+1,[y]+1)] g(x,y)=(1-q)[(1-p)f([x],[y]+1)+pf([x]+1,[y])]+q[(1-p)f([x],[y]+1)+pf([x]+1,[y]+1)]
    在这里插入图片描述
    2、比例缩放的实现 (略)

    4.3 图像平移

    没啥说的

    4.4 图像镜像

    没啥说的

    4.5 图像旋转

    1、图像的旋转变换
    变换矩阵没啥说的
    插值方法:行插值、列插值、双线性插值
    2、图像旋转的实现(略)

    4.6 图像复合变换

    复合平移、复合比例、复合旋转、图像转置、任意点比例缩放、任意点旋转
    插值方法:
    在这里插入图片描述
    插值算法:双线性插值、最邻近插值

    4.7 透视变换

    1、透视变换
    投影变换:把空间坐标系中的三维物体或对象转变为二维图像表示的过程称为投影变换。根据视点和投影平面之间的距离的不同,投影可分为平行投影(距离∞)和透视投影(有限距离)。
    平行投影:投影线互相平行的投影称为平行投影,分为正投影和斜投影。正投影要求投影线垂直于投影面,分为正交投影和正轴测投影,正交投影要求坐标轴必须正交,正轴测投影要求坐标轴夹角都相等即为120°,根据坐标轴单位长度是否都相等分为正等轴测图、正二轴测图、正三轴测图。斜投影不要求投影线与投影面垂直,根据坐标轴单位长度是否相等分为斜等测投影和斜二测投影。
    透视投影:投影线不相互平行的投影,根据灭点的数量分为一点透视、两点透视和三点透视。
    2、其他变换
    几何畸变:成像与目标之间不相似的情况称为几何畸变。
    (1)非矩形像素坐标的转换
    极坐标、柱坐标、球坐标→笛卡尔坐标系
    (2)图像错切
    平面景物在投影平面上的非垂直投影。
    水平错切、垂直错切
    (3)图像卷绕
    通过指定一系列控制点的位移来定义空间变换的图像变形的处理技术,非控制点的位移则通过控制点进行插值。

    4.8 几何畸变的矫正

    在这里插入图片描述
    几何畸变两个关键步骤:图像空间像素坐标的几何变换——空间变换;变换后的标准图像空间的各像素灰度值的计算——灰度值计算。
    校正函数的建立步骤:
    (1)利用控制点对图像数据建立一个模拟几何畸变的数学模型,以建立畸变图像空间与标准空间的对应关系
    (2)用这种对应关系把畸变空间中的全部元素变换到标准空间中去。
    重采样的方法:
    (1)直接成图法
    畸变图像元素→标准图像空间正确的位置
    (x,y)=f(u,v)(x,y)=\boldsymbol f(u,v)
    (2)间接成图法(重采样成图法)
    标准图像空间某个位置→对应畸变图像位置
    (u,v)=f1(x,y)(u,v)=\boldsymbol f^{-1}(x,y)
    两种方法的区别:校正函数不同,直接成图法通过亮度重配置获得亮度值,间接成图法通过亮度重采样获得亮度值。
    多项式校正法:将几何畸变看成各种类型仿射变换复合作用的结果。
    {u=gu(x,y)=i=0nj=0niaijxiyjv=gv(x,y)=i=0nj=0nibijxiyj \left \{ \begin{matrix} u=g_u(x,y)=\sum_{i=0}^{n}\sum_{j=0}^{n-i}a_{ij}x^iy^j \\ \\ v=g_v(x,y)=\sum_{i=0}^{n}\sum_{j=0}^{n-i}b_{ij}x^iy^j \end{matrix} \right.
    拟合误差平方和:
    {εu=k=1K(uki=0nj=0niaijxkiykj)2εv=k=1K(vki=0nj=0nibijxkiykj)2 \left \{ \begin{matrix} \varepsilon_u=\sum_{k=1}^K(u_k-\sum_{i=0}^{n}\sum_{j=0}^{n-i}a_{ij}x_k^iy_k^j)^2 \\ \\ \varepsilon_v=\sum_{k=1}^K(v_k-\sum_{i=0}^{n}\sum_{j=0}^{n-i}b_{ij}x_k^iy_k^j)^2 \end{matrix} \right.
    使用最小二乘法计算系数时,控制点的数目不能小于n。

    第5章 频域处理

    数字图像处理的两类方法:空域法、频域法
    频域法:把图像信号从空域转换为频域进行图像分析
    频域处理的应用:图像特征的提取、图像压缩编码、减小计算维数

    5.1 频域与频域变换

    频域变换的理论基础:任意波形都可以表示为一系列正弦波的加和
    幅频特性——振幅与频率之间的关系
    相频特性——初相与频率之间的关系
    时域和频域的变换:
    f(x)A(ω),Φ(ω)F(ω)f(x)\begin{matrix}正变换 \\ \Leftrightarrow \\ 逆变换\end{matrix}A(\omega),\Phi(\omega) \rightarrow F(\omega)
    5.2 傅里叶变换
    1、连续函数的傅里叶变换
    关键词:狄利克雷条件、二维傅里叶变换
    2、离散傅里叶变换
    定义:
    F[f(x)]=F(u)=x=0N1f(x)ej2πuxNF1[F(u)]=f(x)=1Nu=0N1F(u)ej2πuxNF[f(x)]=F(u)=x=0N1f(x)[cos(2πNux)jsin(2πNux)]F1[F(u)]=f(x)=1Nu=0N1F(u)[cos(2πNux)+jsin(2πNux)] \mathscr{F}[f(x)]=F(u)=\sum_{x=0}^{N-1}f(x)e^{-j\frac {2\pi ux}{N}} \\ \mathscr{F}^{-1}[F(u)]=f(x)=\frac 1 N \sum_{u=0}^{N-1}F(u)e^{j\frac {2\pi ux}{N}} \\ \mathscr{F}[f(x)]=F(u)=\sum_{x=0}^{N-1}f(x)[cos(\frac {2\pi} Nux)-j\cdot sin(\frac {2\pi} Nux)] \\ \mathscr{F}^{-1}[F(u)]=f(x)=\frac 1 N \sum_{u=0}^{N-1}F(u)[cos(\frac {2\pi} Nux)+j\cdot sin(\frac {2\pi} Nux)] \\
    离散傅里叶变换的结果仍然是一个离散的序列,对每一个u对应的傅里叶变换结是所有输入序列f(x)的加权和,u决定了每个傅里叶变换结果的频率
    如果F(u)可以表示为F(u)=R(u)+jI(u)F(u)=R(u)+jI(u),且R(u)和I(u)是实函数,则称F(u)=R2(u)+I2(u)|F(u)|=\sqrt {R^2(u)+I^2(u)}为f(x)的频谱,φ(u)=arctan(I(u)R(u))\varphi(u)=arctan(\frac {I(u)}{R(u)})为f(x)的相位谱。频谱的平方称为能量谱。
    二维离散傅里叶变换:
    F[f(x,y)]=F(u,v)=x=0M1y=0N1f(x,y)ej2π(uxM+vyN)F1[f(x,y)]=F(u,v)=1MNu=0M1v=0N1F(u,v)ej2π(uxM+vyN) \mathscr{F}[f(x,y)]=F(u,v)=\sum_{x=0}^{M-1}\sum_{y=0}^{N-1}f(x,y)e^{-j2\pi (\frac {ux} M+\frac {vy} N)} \\ \mathscr{F}^{-1}[f(x,y)]=F(u,v)=\frac 1 {MN}\sum_{u=0}^{M-1}\sum_{v=0}^{N-1}F(u,v)e^{j2\pi (\frac {ux} M+\frac {vy} N)}
    3、离散傅里叶变换的性质
    在这里插入图片描述
    在这里插入图片描述
    4、离散傅里叶变换的openCV 不考

    5.3 频域变换的一般表达式

    1、可分离变换
    二维傅里叶变换通用表达式:
    F(u,v)=x=0M1y=0N1f(x,y)g(x,y,u,v)f(x,y)=u=0M1v=0N1F(u,v)h(x,y,u,v) F(u,v)=\sum_{x=0}^{M-1}\sum_{y=0}^{N-1}f(x,y)\cdot g(x,y,u,v) \\ f(x,y)=\sum_{u=0}^{M-1}\sum_{v=0}^{N-1}F(u,v)\cdot h(x,y,u,v)
    其中g和h分别被称为正向变换核与负向变换核。
    可分离的:
    如果
    g(x,y,u,v)=g1(x,u)g2(y,v)h(x,y,u,v)=h1(x,u)h2(y,v) g(x,y,u,v)=g_1(x,u)\cdot g_2(y,v) \\ h(x,y,u,v)=h_1(x,u)\cdot h_2(y,v)
    则称正反变换核是可分离的。进一步地,如果g1和g2,h1和h2在函数形式上一致,则称该变换核是对称的。
    2、图像变换的矩阵表示
    F=PfQf=P1FQ1P(u,x)=g1(x,u)=ej2πuxMQ(y,v)=g2(y,v)=ej2πvyN \boldsymbol {F=PfQ} \\ \boldsymbol {f=P^{-1}FQ^{-1}} \\ P(u,x)=g_1(x,u)=e^{-j\frac {2\pi ux} M} \\ Q(y,v)=g_2(y,v)=e^{-j\frac {2\pi vy} N}

    5.4 离散余弦变换(DCT)

    1、一维离散余弦变换
    DCT变换核定义:
    g(x,u)=C(u)2Ncos(2x+1)uπ2NC(u)={12,u=01,else \begin{matrix} g(x,u)=C(u)\sqrt {\frac 2 N cos \frac {(2x+1)u\pi} {2N}} \\ \\ C(u)=\left \{ \begin{matrix} \frac 1 {\sqrt 2}, u=0 \\ \\ 1,else\end{matrix}\right. \end{matrix}
    一维DCT定义:
    F(u)=x=0N1f(x)g(x,u)F=Gf(G(u,x)=g(x,u) F(u)=\sum_{x=0}^{N-1}f(x)g(x,u) \\ \boldsymbol {F=Gf}(矩阵形式,G(u,x)=g(x,u))
    在这里插入图片描述
    DCT逆变换IDCT:
    h(x,u)=g(x,u)=C(u)2Ncos(2x+1)uπ2Nf(x)=u=0N1F(u)h(x,u) h(x,u)=g(x,u)=C(u)\sqrt {\frac 2 N cos \frac {(2x+1)u\pi} {2N}} \\ f(x)=\sum_{u=0}^{N-1}F(u)h(x,u)
    2、二维离散余弦变换
    2D-DCT:
    g1(x,u)=2MC(u)cos(2x+1)uπ2Mg2(y,v)=2NC(v)cos(2x+1)vπ2Ng(x,y,u,v)=g1(x,u)g2(y,v)F(u,v)=x=0M1y=0N1f(x,y)g(x,y,u,v) g_1(x,u)= \sqrt {\frac 2 M} C(u) cos \frac {(2x+1)u\pi} {2M} \\ g_2(y,v)= \sqrt {\frac 2 N} C(v) cos \frac {(2x+1)v\pi} {2N} \\ g(x,y,u,v)=g_1(x,u)g_2(y,v) \\ F(u,v)=\sum_{x=0}^{M-1}\sum_{y=0}^{N-1}f(x,y)g(x,y,u,v)
    2D-IDCT:
    h1(x,u)=g1(x,u)h2(y,v)=g2(y,v)h(x,y,u,v)=h1(x,u)h2(y,v)f(x,y)u=0M1v=0N1F(u,v)h(x,y,u,v) h_1(x,u)=g_1(x,u) \\ h_2(y,v)=g_2(y,v) \\ h(x,y,u,v)=h_1(x,u)\cdot h_2(y,v) \\ f(x,y)\sum_{u=0}^{M-1}\sum_{v=0}^{N-1}F(u,v)h(x,y,u,v)

    5.5 频域中图像处理的实现

    1、理解数字图像的频谱图
    数字图像平移后的频谱中,图像的能量将集中到频谱中心(低频成分),细节信息分散在图像频谱的边缘。频谱中的低频成分代表了图像的概貌,高频成分代表了图像中的细节。
    2、频域图像处理步骤
    在这里插入图片描述
    3、频域滤波
    低通滤波器、高通滤波器、带通滤波器、带阻滤波器
    高通巴特沃斯滤波器:H(u,v)=11+[D0D(u,v)]2nH(u,v)=\frac 1 {1+[\frac {D_0} {D(u,v)}]^{2n}}
    低通巴特沃斯滤波器:H(u,v)=11+[D(u,v)D0]2nH(u,v)=\frac 1 {1+[\frac {D(u,v)} {D_0}]^{2n}}

    5.6 小波变换简介(暂略)

    第6章 数学形态学处理

    数学形态学四种基本运算:腐蚀、膨胀、开运算、闭运算

    6.1 引言

    1、数学形态学
    数学形态学的基本思想:用具有一定形态的结构元素去量度和提取图像中的对应形状,已以达到图像分析和识别的目的。
    2、基本符号和术语
    元素和集合、交并补差、平移反射、目标图像与结构元素
    击中与击不中:交集为空击不中,交集不为空击中

    6.2 二值形态学

    1、腐蚀
    XS={xXS+xX}X\ominus S=\{x\in X |S+x\subseteq X\}
    理解:把结构体元素放在目标图像中移动,则结构体元素的原点的集合构成腐蚀的结果。
    2、膨胀
    XS={X+ssS}={S+xxX}={x(Sv+x)X}X\oplus S=\bigcup\{X+s|s\in S\}=\bigcup\{S+x|x\in X\}=\{x|(S^v+x) \cap X\neq \varnothing\}
    理解:第二种定义比较好理解,即吧结构体元素原点放在目标图像中移动,所有结构体元素的并。
    运算律:
    X(YZ)=(XY)(XZ)X(YZ)=(XY)(XZ)(XY)Z(XZ)(YZ)(XY)Z=(XZ)(YZ)(XY)Z=(XZ)(YZ)(XY)Z(XZ)(YZ) X\ominus(Y\cap Z)=(X\ominus Y)\cap(X\ominus Z) \\ X\oplus(Y\cap Z)=(X\oplus Y)\cap(X\oplus Z) \\ (X\cap Y)\ominus Z\supset(X\ominus Z)\cap (Y\ominus Z) \\ (X\cap Y)\oplus Z=(X\oplus Z)\cap (Y\oplus Z) \\ (X\cup Y)\ominus Z=(X\ominus Z)\cup (Y\ominus Z) \\ (X\cup Y)\oplus Z\subseteq(X\oplus Z)\cup (Y\oplus Z)
    3、开闭运算
    开运算:XS=(XS)SX○S=(X\ominus S)\oplus S
    闭运算:XS=(XS)SX\cdot S=(X\oplus S)\ominus S
    开闭运算的代数性质:
    (1)对偶性:(XCS)C=XS;(XCS)=XS(X^C○S)^C=X\cdot S; (X^C\cdot S)=X○S
    (2)扩展性:XSXXSX○S\subseteq X \subseteq X\cdot S
    开运算恒使图像缩小,闭运算恒使图像扩展。
    (3)单调性:XYXSYS,XSYSX\subseteq Y \Rightarrow X\cdot S\subseteq Y\cdot S, X○ S\subseteq Y○ S
    YZZY=ZXYXZY\subseteq Z\wedge Z\cdot Y=Z \Rightarrow X\cdot Y\subseteq X \cdot Z
    (4)平移不变性:(X+h)S=(XS)+h(X+h)\cdot S=(X\cdot S)+h
    (X+h)S=(XS)+h(X+h)○ S=(X○ S)+h
    X(S+h)=XSX\cdot (S+h)=X\cdot S
    X(S+h)=XSX○ (S+h)=X○ S
    (5)等幂性:(XS)S=XS,(XS)S=XS(X\cdot S)\cdot S = X\cdot S,(X○ S)○ S = X○ S
    (6)开闭运算与集合的关系:
    (i=0nXi)Si=0n(XiS)(\bigcup_{i=0}^{n}X_i)○S\supseteq \bigcup_{i=0}^{n}(X_i○S)
    (i=0nXi)Si=0n(XiS)(\bigcap_{i=0}^{n}X_i)○S\subseteq \bigcap_{i=0}^{n}(X_i○S)
    (i=0nXi)Si=0n(XiS)(\bigcup_{i=0}^{n}X_i)\cdot S\supseteq \bigcup_{i=0}^{n}(X_i\cdot S)
    (i=0nXi)Si=0n(XiS)(\bigcap_{i=0}^{n}X_i)\cdot S\subseteq \bigcap_{i=0}^{n}(X_i\cdot S)
    4、击中击不中变换
    XS={xS1+xXS2+xXC}=(XS1)(XCS2)X\odot S=\{x|S_1+x\subseteq X \wedge S_2+x\subseteq X^C\}=(X\ominus S_1)\cap(X^C\ominus S_2)

    6.3 灰值形态学

    1、灰值腐蚀
    (fb)(s,t)=min{f(s+x,t+y)b(x,y)s+x,t+yDfx,yDb}(f\ominus b)(s,t)=min\{f(s+x,t+y)-b(x,y)|s+x,t+y\in D_f \wedge x,y \in D_b\}
    腐蚀的计算是在由结构元素确定的领域中选取fbf\ominus b的最小值,所以灰值图像的腐蚀操作会有两类效果:如果结构体元素的值都为正,则输出图像会比原图像暗;如果输入图像中亮细节的尺寸比结构元素小,则其影响会被减弱。
    2、灰值膨胀
    (fb)(s,t)=max{f(sx,ty)+b(x,y)sx,tyDfx,yDb}(f\oplus b)(s,t)=max\{f(s-x,t-y)+b(x,y)|s-x,t-y\in D_f \wedge x,y \in D_b\}
    膨胀的计算是在由结构元素确定的领域中选取fbf\oplus b的最大值,所以对灰值图像的膨胀有两类效果:如果结构体元素的值都为正,则输出图像会比原图像亮;如果输入图像中暗细节的灰度值及形状相对于结构体元素的大小,则其被消减或消除。
    膨胀或腐蚀满足以下对偶关系:
    (fb)C=fCbV(f\oplus b)^C=f^C \ominus b^V
    (fb)C=fCbV(f\ominus b)^C=f^C \oplus b^V
    3、灰值开闭运算
    定义与二值形态学定义类似,亦满足类似的对偶关系。
    灰值开运算削平山峰。灰值闭运算填平深谷。
    实际中常用开运算操作消除与结构元素相比尺寸较小的亮细节,而保持整体灰度值和大的亮区域;实际应用中常使用闭运算操作消除与结构元素相比尺寸较小的暗细节,而保持图像整体灰值和大的暗区域。

    6.4 形态学的应用

    灰值形态学的主要算法有:灰值形态学梯度、形态学平滑、纹理分割、顶帽变换等
    二值形态学的主要算法有:二值形态学滤波、骨架抽取等
    1、形态学滤波
    将开运算与闭运算相结合可以构成形态学噪声滤除器,开运算滤除黑色背景上的白色噪声,闭运算滤除白色前景中的黑色噪声。
    2、骨架提取
    骨架定义方法:火种法、最大圆盘法
    (1)基于腐蚀和开运算的细化
    定义骨架子集Sk(X)S_k(X)为图像X内所有最大圆盘kB(至少与两条边相切的内切圆)的圆心x构成的集合。从骨架的定义可知,骨架是所有骨架子集的并,即
    Sk(X)={Sk(X)k=0,1,...,n} S_k(X)=\bigcup\{S_k(X)|k=0,1,...,n\}
    可以证明骨架子集可以表示为:
    Sk(X)=(XkB)[(XkB)B]XkB=(X(k1)B)B S_k(X)=(X\ominus kB)-[(X\ominus kB)○ B] \\ 递推公式:X\ominus kB=(X\ominus (k-1)B)\ominus B
    所以:
    S(X)={(XkB)[(XkB)B]k=0,1,2,...,n} S(X)=\bigcup\{(X\ominus kB)-[(X\ominus kB)○B]|k=0,1,2,...,n\}
    停止迭代的时机:XkBX\ominus kB\varnothing
    (2)快速形态学细化算法

    在这里插入图片描述
    (1)(2)(4)(6)都不能删除,(2)(4)可以删除
    可以删除的情况:内部点不可删除、孤立点不可删除、直线端点不可删除、去掉后连通分量不增加。

    第7章 图像分割

    图像分割就是把图象分成一系列有意义的、各具特征的目标或区域的技术和过程。这里的特征包括图像的统计特征和视觉特征。统计特征包括图像的直方图、矩和频谱等,图像的视觉特征主要包括区域的亮度、纹理或轮廓等。
    图像分割一般基于像素灰度值的两个性质:不连续性和相似性。区域之间的边界往往具有有灰度不连续性,而区域内部一般具有灰度相似性。
    图像分割算法一般分为两类:利用灰度不连续性——基于边界的分割;利用灰度相似性——基于区域的分割
    常用算法:阈值分割、区域生长、区域分裂与合并、边缘检测与边界连接、区域标记与轮廓跟踪、分水岭分割、Mean Shift和Graph Cuts算法

    7.1 阈值分割

    1、概述
    基本假设:目标与背景相邻像素间灰度值高度相关;目标与边界两侧像素灰度值差别很大;目标与背景的灰度分布都是单峰的。
    阈值分割过程:阶跃函数
    阈值分割的关键——阈值的确定:
    (1)种类:全局阈值、局部阈值、动态阈值(自适应阈值)
    (2)阈值分割的要素:T=T[x,y,f(x,y),p(x,y)]T=T[x,y,f(x,y),p(x,y)], f(x,y)表示灰度值,p(x,y)表示某种局部性质。
    2、全局阈值
    适用条件:“双峰”性质
    确定全局阈值的方法:
    (1)极小点阈值法:取直方图谷底位置作为阈值
    (2)迭代阈值法:初始阈值T1T_1→像素划分为G1G_1G2G_2→计算平均灰度μ1\mu_1μ2\mu_2→计算新的阈值T2=μ1+μ22T_2=\frac {\mu_1+\mu_2} 2→迭代→终止条件T2T1&lt;T0|T_2-T_1| &lt;T_0
    (3)最优阈值法:选择一个阈值使得总的分类误差概率降到最低。
    p(z)p(z)为灰度概率密度函数,p1(z)p_1(z)p2(z)p_2(z)分别为背景和目标灰度条件概率密度函数,P1P_1P2P_2为背景和目标像素出现的概率,那么由全概率公式得:
    p(z)=P1p1(z)+P2p2(z) p(z)=P_1p_1(z)+P_2p_2(z)
    把目标像素错分为背景像素的误差条件概率为:
    E1(T)=Tp1(z)dz E_1(T)=\int_{-\infty}^Tp_1(z)\mathrm{d}z
    把背景像素错分为背景像素的误差条件概率为:
    E2(T)=T+p2(z)dz E_2(T)=\int_T^{+\infty}p_2(z)\mathrm{d}z
    由全概率公式得总误差概率为:
    E(T)=P2E1(T)+P1E2(T) E(T)=P_2E_1(T)+P_1E_2(T)
    一般认为目标与背景的灰度服从高斯分布,利用概率论与数理统计中最大似然估计方法可以得到最优解
    T=μ1+μ22+σ2μ1μ2ln(P2P1) T=\frac {\mu_1+\mu_2} 2+\frac {\sigma^2} {\mu_1-\mu_2}ln(\frac{P_2}{P_1})
    (4)Otsu方法:使阈值分割后各个像素类的类间方差最大。
    步骤:将像素按灰度值进行分级,计算从第0个灰度级到第k个灰度级的概率和均值(数学期望),M个阈值将灰度值分为M+1个像素类,计算每个像素类的概率、平均灰度、方差,所有像素类的概率之和为1,图像总的平均灰度是所有像素类灰度的数学期望,类内方差定义为像素类灰度方差的数学期望,类间方差定义为像素类灰度均值的方差。
    (5)p参数法
    选取一个阈值T使得目标面积与背景面积的比为p:(1-p)
    3、局部阈值
    (1)直方图变换法
    对波谷进行切割或峰谷颠倒、根据像素的梯度值进行加权
    (2)散射图
    二维坐标图,横轴为灰度,纵轴为某种局部性质(如梯度值),亮度表示频数。根据亮色进行聚类。
    4、动态阈值
    网格划分,每个子图像定一个阈值。
    一种动态阈值算法:
    子图像分解→对于具备“双峰”采用最优阈值→插值得到其他阈值→分割

    7.2 基于区域的分割

    1、区域生长
    实质是bfs,需要初始种子,相似性准则
    2、区域分裂与合并
    先进行迭代四分裂,满足一致性条件后停止迭代,然后进行合并

    7.3 边缘检测

    常见的边缘类型:阶跃型、斜坡型、线状型、屋顶型
    1、微分算子
    在这里插入图片描述
    结论:一阶导数的幅度值可以用来检测边缘的存在,通过检测二阶导数的过零点可以确定边缘的中心位置,利用二阶导数在过零点附近的符号可以判断是在边缘的亮区还是暗区,处理之前要先消噪。
    (1)梯度算子:
    Krisch、Prewitt,均可沿8个方向
    (2)高斯-拉普拉斯算子
    结合了高斯平滑滤波器与拉普拉斯锐化滤波器。
    在这里插入图片描述
    在这里插入图片描述
    (3)Canny边缘检测
    Canny算子是一个非常有效的边界检测算子。
    ①首先对灰度图像进行高斯平滑。
    ②接着计算每个像素的梯度幅值和梯度方向。
    ③ 然后细化边缘。如果当前像素的梯度幅值不高于梯度方向上两个邻点的梯度幅值,则抑制该像素响应,这种方法称之为非最大抑制。
    ④ Canny算子使用两个幅值阈值,高阈值用于检测梯度幅值大的强边缘,低阈值用于检测梯度幅值较小的弱边缘。低阈值通常取为高阈值的一半。
    ⑤ 边缘细化后,就开始跟踪具有高幅值的轮廓。
    ⑥ 最后,从满足高阈值的边缘像素开始,顺序跟踪连续的轮廓段,把与强边缘相连的弱边缘连接起来。
    2、边界连接
    幅度阈值、角度阈值
    3、哈夫变换
    前提条件:已知区域形状
    (1)直线检测
    y=ax+b→b=-ax+y→{b=axi+yib=axj+yj\left \{\begin{matrix}b=-ax_i+y_i \\ b=-ax_j+y_j\end{matrix}\right.
    在这里插入图片描述
    如果多个点在同一条直线上,则在参数空间中对应直线必交于同一点。
    步骤:参数a、b进行量化,对于目标空间的每一个点,让a取遍每一个值apa_p,代入b=-ax+y,得到bpb_p,给A(p,q)++,处理完所有像素查找峰值即可知道最可能的a与b。
    斜截式方程有缺陷,一般可以换为法线式方程:ρ=xcosθ+ysinθ\rho=xcos\theta +ysin\theta
    (2)圆的检测:
    {a=xrcosθb=yrsinθ \left \{ \begin{matrix} a=x-rcos\theta \\ b=y-rsin\theta \end{matrix} \right.
    (3)任意曲线的检测:类似做法

    7.4 区域标记与轮廓追踪

    1、区域标记
    递归标记:BFS
    序贯标记:左、左上、上、右上邻点,如果都是背景,当前点新建标记;如果有一个被标记,复制标记;如果有两个不同标记,赋值之一,并在等价表中记录,再次扫描把等价的标记改为最小标记。
    2、轮廓提取
    八面合围置为背景
    3、轮廓追踪
    步骤:扫描图像,选定左上角点,初始dir为左下方向(4方向中为向下),逆时针查找边界点,查找到的新边界点作为当前点,在顺时针转回一个方向,迭代直到回到起始点。

    7.5 分水岭分割

    1、基本分水岭算法
    降雨法:降水,递归寻找低洼点,雨水流向>=2个低洼的是分水岭。
    淹没法:提升水位,如果水流溢出地外就筑坝,最后堤坝就是分水岭。
    2、Vincent-Soille算法
    类似并查集,提升水位,水平面与一些点相交,对于这些点,如果邻接点没有标记,新建标记,如果有标记,复制标记(取最近的积水盆地)
    使用分水岭分割之前先做距离变换,去除粘连。

    7.6 现代分割方法(略)

    7.7 图像分割实例

    大米计数:
    (1)高斯滤波、中值滤波或开闭运算消噪
    (2)消除非均匀光照:背景照度估计、灰值形态学、同态滤波
    (2)区域分割

    第8章 图像特征与理解

    图像特征:人视觉能够识别的自然特征,分为全局特征和局部特征。
    ,全局特征用于描述图像或目标的颜色或形状等整体特征,局部特征指一些能够稳定出现并具有良好可区分性的特征。

    8.1 图像的基本特征

    提取图像几何特征之前,分割和二值化处理。
    1、几何特征
    (1)位置和方向
    位置:质心
    方向:最小二阶矩轴(最小转动惯量)
    (2)周长
    隙码:把像素看成小方块后图形的绝对周长
    链码:边界像素中心点连线的长度
    边界点数之和:边界像素的个数
    (3)面积
    像素计数面积:统计边界内部像素的个数
    由边界行程码计算面积:
    ①已知区域的行程编码,只需把值为1的行程长度相加,即为区域面积。
    ②若给定边界的某种表示,则相应连通区域的面积应为区域外边界包围的面积,减去它的内边界包围的面积(空的面积)
    yk=y0+i=0kΔyiΔyi={1,εi=1,2,30,εi=0,41,εi=5,6,7Δxi={1,εi=0,1,70,εi=2,61,εi=3,4,5A=i=1n(yi1Δxi+a) y_k=y_0+\sum_{i=0}^k\Delta y_i \\ \Delta y_i=\left \{\begin{matrix}-1,\varepsilon _i = 1,2,3 \\ 0,\varepsilon _i = 0,4\\ 1,\varepsilon _i = 5,6,7 \\\end{matrix}\right. \\ \Delta x_i=\left \{\begin{matrix}-1,\varepsilon _i = 0,1,7 \\ 0,\varepsilon _i = 2,6\\ 1,\varepsilon _i = 3,4,5 \\\end{matrix}\right. \\ A=\sum_{i=1}^n(y_{i-1}\Delta x_i+a)
    由边界坐标计算面积:利用格林公式,A=12i=1Nb(xiyi+1xi+1yi]A=\frac 1 2 \sum_{i=1}^{N_b}(x_iy_{i+1}-x_{i+1}y_i]
    (4)长轴和短轴
    最小外接矩形的长与宽
    (5)距离
    欧式距离、市区距离、棋盘距离
    2、形状特征
    (1)矩形度=物体面积/最小外接矩形面积
    长宽比=最小外接矩形的宽与长的比值
    (2)圆形度:
    致密度=周长^2/面积
    边界能量:物体的周长为P,p表示边界点到某一起始点的距离,该点处的曲率半径为r§,则曲率为K§=1/r§,边界能量为E=1P0pK(p)2dpE=\frac 1 P\int_{0}^{p}|K(p)|^2\mathrm{d}p,在面积相同的情况下,圆具有最小的边界能量E0=(2πP)2=(1R)2E_0=(\frac {2\pi} P)^2=(\frac 1 R)^2
    原型性=区域质心到边界点的平均距离/区域质心到边界点的距离均方差,当区域R趋向圆形时,圆形性趋向无穷。
    面积与平均距离平方的比值=面积/内部点到边界点的平均距离
    3、球状性=内切圆半径/外接圆半径
    4、偏心率=区域长轴/区域短轴
    5、形状描述子
    (1)边界链码
    在这里插入图片描述
    在这里插入图片描述
    (2)一阶差分链码
    为了改进边界链码在旋转过程中会改变的情况。
    在这里插入图片描述
    (3)傅里叶描述子
    原理:将二维问题转化为一维问题进行处理,可以将边界曲线转化为一维函数,或者将边界曲线转化为复平面上点的序列。假定有一个复数序列,可以对其采用采用离散傅里叶变换,得到的结果就成为傅里叶变换子。

    8.2 角点特征

    角点:亮度变化最剧烈、图像边缘曲线上曲率最大,具有高信息密度和旋转不变的特性
    角点检测算法的4个准则:检测性、定位性、稳定性、复杂性
    角点检测方法的分类:基于边缘的检测算法、基于灰度变化的检测算法。前者做法是找曲率最大边界点或拐点或进行多边形拟合,但抗噪差且依赖边缘提取结果。后者做法为对局部结果进行分析,进行角点性质检测。
    1、Moravec算法
    灰度变化定义为沿各个方向移动窗口的灰度值与当前窗口灰度值差的平方和。
    E(u,v)=(x,y)W(I(x+u,y+v)I(x,y))2 E(u,v)=\sum_{(x,y)\in W}(I(x+u,y+v)-I(x,y))^2
    在这里插入图片描述
    2、Harris算法
    在Moravec算法基础上给不同方向的灰度变化方差加上权值,该权值为二维高斯窗口函数。
    E(u,v)=(x,y)Ww(x,y)(I(x+u,y+v)I(x,y))2w(x,y)=e(xx0)2+(yy0)22σ2I(x+u,y+v)I(x+u,y+v)=I(x,y)+uIx+vIy:E(u,v)=[u,v]M[u,v]TM=(x,y)Ww(x,y)[Ix2IxIyIxIyIy2]=[abcd] E(u,v)=\sum_{(x,y)\in W}w(x,y)(I(x+u,y+v)-I(x,y))^2 \\ w(x,y)=e^{-\frac {(x-x_0)^2+(y-y_0)^2} {2\sigma^2}} \\ 对I(x+u,y+v)进行泰勒展开:I(x+u,y+v)=I(x,y)+uI_x+vI_y \\ 代入上面的式子得:E(u,v)=[u,v]\boldsymbol M[u,v]^T \\ \boldsymbol M=\sum_{(x,y)\in W}w(x,y)\begin{bmatrix}I_x^2 &amp; I_xI_y \\ I_xI_y &amp; I_y^2 \end{bmatrix}=\begin{bmatrix}a &amp; b \\ c &amp; d \end{bmatrix}
    特征值λ1与λ2决定了矩阵M的性质:
    在这里插入图片描述
    3、SUSAN算法
    角点处的SUSAN面积具有局部最小值
    在这里插入图片描述

    8.3~8.6 (略)

    附加:图像匹配

    方法:投影法与差影法
    投影法:分为水平投影法和垂直投影法。基本原理是统计每行或每列目标像素的个数,得到一个直方图,根据直方图很容易就能找到目标图像的位置。
    差影法:利用同一景物同一时刻或不同时刻的图像,进行加、减、乘、除代数运算,分析得出某一物体的位置和运动情况

    第9章图像编码

    9.1 图像编码概述

    1、图像编码的基本原理和方法
    (1)图像数据冗余:
    空间冗余:内部相邻像素较强的相关性导致的冗余
    时间冗余:相邻两帧图像之间的相关性导致的冗余
    信息熵冗余:编码冗余,用于表示信源符号的平均比特数大于其信息熵时所产生的冗余。信息熵H=i=1Npilbpi=i=1Npilb1pilbNH=-\sum_{i=1}^{N}p_ilbp_i=\sum_{i=1}^{N}p_ilb\frac 1 {p_i}\le lbN
    结构冗余:图像中存在较强的纹理结构和自相似性
    知识冗余:图像中包含与某些先验知识有关的信息
    视觉冗余:人眼不能感知的那部分信息
    (2)图像编码方法
    分类:有损编码和无损编码;熵编码、预测编码、变换编码、量化编码
    熵编码:
    ①哈夫曼编码、香农-范诺编码、算术编码
    ②理论基础:平均码长等于信息熵时,总可设计出一种无损编码
    ③等长编码与变长编码
    ④变长编码定理:若一个离散无记忆信源的符号集具有r个码元,熵为H,则总可以找到一种无失真编码,构成单义可译码,使其平均码长L满足HlbrLHlbr+1\frac H {lbr}\le L \le \frac H {lbr}+1
    预测编码:基于图像数据的空间或时间冗余性,利用相邻已知像素预测当前像素的值,再对预测误差进行量化和编码。
    变换编码:空间域图像正交变换到另一变换域上,降低相关性。
    量化编码:通过将动态范围较大的输入信号映射到有限个离散值上。
    2、图像编码新技术(略)
    3、图像编码评价
    编码效率:平均码字长度L,压缩比CRC_R,编码效率η
    L=i=1NpiLiCR=BLη=HL L=\sum_{i=1}^{N}p_iL_i \\ C_R=\frac B L \\ \eta = \frac H L
    编码质量:均方误差MSE、峰值信噪比PSNR
    算法复杂度和算法的适用范围

    9.2 哈夫曼编码

    不会的挨打

    9.3 香农-范诺编码

    1、基本方法:
    信源符号出现概率降序排序;
    计算符号对应码字长度:logDPiNilogDPi+1-log_DP_i\le N_i \le -log_DP_i+1
    计算累加概率:Ai=k=0i1piA_i=\sum_{k=0}^{i-1}p_i
    将累加概率转换为二进制,取前NiN_i位。
    2、二分法香农-范诺编码方法
    在这里插入图片描述

    9.4 算术编码

    两种模式:基于信源概率统计特性的固定编码模式、针对未知信源概率模型的自适应模式
    在这里插入图片描述

    9.5 行程编码

    aabbbcddddd=2a3b1c5d

    9.6 LZW编码

    在这里插入图片描述
    在这里插入图片描述
    在这里插入图片描述
    在这里插入图片描述

    展开全文
  • 图像压缩——算术编码

    千次阅读 2016-11-22 20:57:25
    目录 目录 背景 原理 实例 注意事项 背景早在1948年,香农就提出将信源符号依其出现的概率降序排序,用符号...Elias没有公布他的发现,因为他知道算术编码数学上虽然成立,但不可能在实际实现。1976年,R. Pasco和

    背景


    早在1948年,香农就提出将信源符号依其出现的概率降序排序,用符号序列累计概率的二进值作为对信源的编码,并从理论上论证了它的优越性。1960年, Peter Elias发现无需排序,只要编、解码端使用相同的符号顺序即可,提出了算术编码的概念。Elias没有公布他的发现,因为他知道算术编码在数学上虽然成立,但不可能在实际中实现。1976年,R. Pasco和J. Rissanen分别用定长的寄存器实现了有限精度的算术编码。1979年Rissanen和G. G. Langdon一起将算术编码系统化,并于1981年实现了二进制编码。1987年Witten等人发表了一个实用的算术编码程序,即CACM87(后用 于ITU-T的H.263视频压缩标准)。同期,IBM公司发表了著名的Q-编码器(后用于JPEG和JBIG图像压缩标准)。从此,算术编码迅速得到了 广泛的注意。

    原理


    算术编码的基本原理是将编码的消息表示成实数0和1之间的一个间隔(Interval),消息越长,编码表示它的间隔就越小,表示这一间隔所需的二进制位就越多。

    算术编码用到两个基本的参数:符号的概率和它的编码间隔。信源符号的概率决定压缩编码的效率,也决定编码过程中信源符号的间隔,而这些间隔包含在0到1之间。编码过程中的间隔决定了符号压缩后的输出。

    给定事件序列的算术编码步骤如下:

    1. 编码器在开始时将“当前间隔” [ L, H) 设置为[0,1)。
    2. 对每一事件,编码器按步骤(a)和(b)进行处理
      (a)编码器将“当前间隔”分为子间隔,每一个事件一个。
      (b)一个子间隔的大小与下一个将出现的事件的概率成比例,编码器选择子间隔对应于下一个确切发生的事件相对应,并使它成为新的“当前间隔”。
    3. 最后输出的“当前间隔”的下边界就是该给定事件序列的算术编码。

    设Low和High分别表示“当前间隔”的下边界和上边界,CodeRange为编码间隔的长度,LowRange(symbol)和HighRange(symbol)分别代表为了事件symbol分配的初始间隔下边界和上边界。上述过程的实现可用伪代码描述如下:

    set Low to 0
    set High to 1
    while there are input symbols do
        take a symbol
        CodeRange = High – Low
        High = Low + CodeRange *HighRange(symbol)
        Low = Low + CodeRange * LowRange(symbol)
    end of while
    output Low

    算术码解码过程用伪代码描述如下:

    get encoded number
    do
        find symbol whose range straddles the encoded number
        output the symbol
        range = symbo.LowValue – symbol.HighValue
        substracti symbol.LowValue from encoded number
        divide encoded number by range
    until no more symbols

    实例

    算术编码器的编码解码过程可用例子演示和解释。
    例1:假设信源符号为{A, B, C, D},这些符号的概率分别为{ 0.1, 0.4, 0.2,0.3 },根据这些概率可把间隔[0, 1]分成4个子间隔:[0, 0.1], [0.1, 0.5], [0.5, 0.7], [0.7, 1],其中[x,y]表示半开放间隔,即包含x不包含y。上面的信息可综合在表03-04-1中。

    表03-04-1 信源符号,概率和初始编码间隔

    符号 A B C D
    概率 0.1 0.4 0.2 0.3
    初始编码间隔 [0, 0.1) [0.1, 0.5) [0.5, 0.7) [0.7, 1]

    如果二进制消息序列的输入为:C A D A C D B。编码时首先输入的符号是C,找到它的编码范围是[0.5,0.7]。由于消息中第二个符号A的编码范围是[0, 0.1],因此它的间隔就取[0.5, 0.7]的第一个十分之一作为新间隔[0.5,0.52]。依此类推,编码第3个符号D时取新间隔为[0.514, 0.52],编码第4个符号A时,取新间隔为[0.514, 0.5146],…。消息的编码输出可以是最后一个间隔中的任意数。整个编码过程如图03-04-1所示。
    图03-04-1 算术编码过程举例
    这个例子的编码和译码的全过程分别表示在表03-04-2和表03-04-3中。

    表03-04-2 编码过程

    步骤 输入符号 编码间隔 编码判决
    1 C [0.5, 0.7] 符号的间隔范围[0.5, 0.7]
    2 A [0.5, 0.52] [0.5, 0.7]间隔的第一个1/10
    3 D [0.514, 0.52] [0.5, 0.52]间隔的最后一个1/10
    4 A [0.514, 0.5146] [0.514, 0.52]间隔的第一个1/10
    5 C [0.5143, 0.51442] [0.514, 0.5146]间隔的第五个1/10开始,二个1/10
    6 D [0.514384, 0.51442] [0.5143, 0.51442]间隔的最后3个1/10
    7 B [0.5143836, 0.514402] [0.514384,0.51442]间隔的4个1/10,从第1个1/10开始
    8 从[0.5143876, 0.514402]中选择一个数作为输出:0.5143876

    表03-04-3 译码过程

    步骤 间隔 译码符号 译码判决
    1 [0.5, 0.7] C 0.51439在间隔 [0.5, 0.7)
    2 [0.5, 0.52] A 0.51439在间隔 [0.5, 0.7)的第1个1/10
    3 [0.514, 0.52] D 0.51439在间隔[0.5, 0.52)的第7个1/10
    4 [0.514, 0.5146] A 0.51439在间隔[0.514, 0.52]的第1个1/10
    5 [0.5143,0.51442] C 0.51439在间隔[0.514, 0.5146]的第5个1/10
    6 [0.514384,0.51442] D 0.51439在间隔[0.5143, 0.51442]的第7个1/10
    7 [0.51439,0.5143948] B 0.51439在间隔[0.51439,0.5143948]的第1个1/10
    8 译码的消息:C A D A C D B

    在上面的例子中,我们假定编码器和译码器都知道消息的长度,因此译码器的译码过程不会无限制地运行下去。实际上在译码器中需要添加一个专门的终止符,当译码器看到终止符时就停止译码。

    注意事项

    在算术编码中有几个问题需要注意:

    • 由于实际的计算机的精度不可能无限长,一个明显的问题是运算中出现溢出,但多数机器都有16、32或者64位的精度,因此这个问题可使用比例缩放方法解决。

    • 算术编码器对整个消息只产生一个码字,这个码字是在间隔[0,1]中的一个实数,因此译码器在接受到表示这个实数的所有位之前不能进行译码。

    • 算术编码也是一种对错误很敏感的编码方法,如果有一位发生错误就会导致整个消息译错。

    算术编码可以是静态的或者自适应的。在静态算术编码中,信源符号的概率是固定的。在自适应算术编码中,信源符号的概率根据编码时符号出现的频繁程度动态地进行修改,在编码期间估算信源符号概率的过程叫做建模。需要开发动态算术编码的原因是因为事先知道精确的信源概率是很难的,而且是不切实际的。当压缩消息 时,我们不能期待一个算术编码器获得最大的效率,所能做的最有效的方法是在编码过程中估算概率。因此动态建模就成为确定编码器压缩效率的关键。

    此外,在算术编码的使用中还存在版权问题。JPEG标准说明的算术编码的一些变体方案属于IBM, AT&T和Mitsubishi拥有的专利。要合法地使用JPEG算术编码必须得到这些公司的许可。

    展开全文
  • 图像压缩之算术编码

    千次阅读 2019-05-14 15:06:25
    JPEG使用了量化、哈夫曼编码...lepton使用算术编码(VP8)替换哈夫曼编码,以得到更高的压缩率。算术编码90年代已经出现,但是受限于专利,没有被广泛使用。同样由于专利限制没有广泛使用的还有gif的压缩编码l...
  • 算术编码matlab

    2020-07-29 14:20:39
    使用matlab完成的数字编码算法,可以借鉴
  • 本节为opencv数字图像处理(15):图像压缩的第二小节,图像压缩的编码方法:霍夫曼编码、Golomb编码、Rice编码、算术编码及其实现,主要包括:霍夫曼编码、Golomb编码、Rice编码、算术编码的原理与实现代码。
  • 算术编码简单研究

    千次阅读 2010-10-08 16:36:00
    和其它熵编码方法不同的地方在于,其他的熵编码方法通常是把输入的消息分割为符号,然后对每个符号进行编码,而算术编码是直接把整个输入的消息编码为一个数,一个满足(0.0 ≤ n 目录[隐藏]1算术编码工作原理2精度和...
  • 由于前面算术编码是采用浮点数,而由于浮点数的精度有限,所以要表示的位数有限,导致可以压缩的内容不多。那么就需要采用二进制的方式来表示小数,这样就可以表示很长的小数了。不过在计算的过程会出现相互接近的...
  • 数字图像处理的技术方法和应用

    万次阅读 2016-11-18 10:56:01
    所谓数字图像处理,是指将图像信号转换成数字信号并利用计算机对其进行处理的过程。20 世纪 50 年代,电子计算机已经发展到一定水平,人们开始利用计算机来处理图形和图像信息,这便是早期的图像处理。早期图像处理...
  • 数字图像处理是指将图像信号转换成数字信号并利用计算机对其进行处理的过程。图像处理最早出现于 20 世纪 50 年代,当时的电子计算机已经发展到一定水平,人们开始利用计算机来处理图形和图像信息。数字图像处理作为...
  • 掌握图像算术运算; 二、内容 编写程序,实现两个大小不同图像的叠加。 编写程序,实现两个图像的减法,要求A-B和B-A效果一样。 上述两题的处理过程,用子函数实现。 用动态效果展示图像。 三、代码 def mix...
  • FPGA与数字图像处理技术

    千次阅读 2017-09-17 09:01:18
    数字图像处理方法的重要性源于两个主要应用领域: 改善图像信息以便解释。 为存储、传输和表示而对图像数据进行处理,以便于机器自动理解。 图像处理(image processing): 用计算机对图像...
  • 数字图像处理的大体框架

    千次阅读 2016-03-25 10:28:22
    刚开始认真接触数字图像处理,来了解一下数字图像处理的一个特别大体的框架。 1. 概论 数字图像处理的主要内容: 1⃣️ 图像获取、表示和表现;2⃣️ 图像复原;3⃣️ 图像增强; 4⃣️ 图像分割;5⃣️ 图像...
  • 数字图像处理基本知识

    千次阅读 多人点赞 2017-09-24 09:42:31
    1、数字图像: ...2、数字图像处理包括内容: 图像数字化;图像变换;图像增强;图像恢复;图像压缩编码;图像分割;图像分析与描述;图像的识别分类。 3、数字图像处理系统包括部分: 输入(采集);存储
  • 数字图像处理基础知识

    万次阅读 2018-07-06 15:41:45
    1、数字图像: 数字图像,又称为数码图像或数位图像,是二维图像用有限数字数值像素的表示。数字图像是由模拟图像数字化...2、数字图像处理包括内容: 图像数字化;图像变换;图像增强;图像恢复;图像压缩编码...
  • 压缩算法之算术编码

    万次阅读 多人点赞 2017-09-14 22:24:04
    熵编码 香农范诺(Shannon)编码 霍夫曼(Huffman)编码 算术编码(arithmeticcoding)
  • 数据压缩,算术编码

    千次阅读 2016-01-04 15:49:53
    早在1948年,香农就提出将信源符号依其出现的概率降序排序,用符号序列累计...Elias没有公布他的发现,因为他知道算术编码数学上虽然成 立,但不可能在实际实现。1976年,R. Pasco和J. Rissanen分别用定长的寄存器
  • 算术编码

    2019-03-18 16:45:01
    图像压缩的主要算法之一。 是一种无损数据压缩方法,也是一种熵编码的方法。和其它熵编码方法不同的地方在于,其他的熵编码方法通常是把输入的消息分割为符号,然后对每个符号进行编码,而算术编码是直接把整个...
1 2 3 4 5 ... 20
收藏数 5,480
精华内容 2,192
关键字:

数学图像处理中的算术编码