pdf 冈萨雷斯图像处理

2013-11-03 19:14:41 u010418035 阅读数 3251
colorbar        显示彩条
getimage       由坐标轴得到图像数据
ice(DIPUM)  交互彩色编辑
image          创建和显示图像对象
imagesc        缩放数据并显示为图像
immovie       由多帧图像制作电影
imshow        显示图像
imview         在Image Viewer中显示图像
montage        将多个图像帧显示为矩阵蒙太奇
movie          播放录制的电影帧
rgbcube         显示一个彩色RGB立方体
subimage        在单个图形中显示多幅图像
truesize          调整图像的显示尺寸
warp            将图像显示为纹理映射的表面
图像文件输入/输出
Dicominfo       从一条DICOM消息中读取元数据
Dicomread       读一幅DICOM图像
Dicomwrite       写一幅DICOM图像
Dicom-dict.txt    包含DICOM数据字典的文本文件
Dicomuid        产生DICOM唯一的识别器
Imfinfo          返回关于图像的文件的信息
Imread          读图像文件
Imwrite          写图像文件
图像算术
Imabsdiff         计算两幅图像的绝对差
Imadd            两幅图像相加或把常数加到图像上
Imcomplement     图像求补
Imdivide          两幅图像相除,或用常数除图像
Imlincomb        计算图像的线性组合
Immultiply        两幅图像相乘或用常数乘图像
Imsubtract         两幅图像相减,或从图像中减去常数
几何变换
Checkerboard      创建棋盘格图像
Findbounds        求几何变换的输出范围
Fliptform          颠倒TFORM结构的输入/输出
Imcrop            修剪图像
Imresize           调整图像大小
Imrotate          旋转图像
Imtransform        对图像应用几何变换
Intline             整数坐标线绘制算法
Makersampler   创建重取样器结构
Maketform      创建几何变换结构(TFORM)
Pixeldup(DIPUM)在两个方向上复制图像的像素
Tformarray        对N-D数组应用几何变换
Tformfwd         应用正向几何变换
Tforminv         应用反向几何变换
Vstformfwd(DIPUM)可视化正向几何变换
图像匹配
Cpstruct2pairs     将CPSTRUCT转换为有效的控制点对
Cp2tform         由控制点对推断几何变换
Cpcorr            使用互相关校准控制点位置
Cpselect          控制点选择工具
Normxcorr2       归一化二维互相关
像素值及统计
Corr2            计算二维相关系数
Covmatrix(DIPUM)计算向量族的协方差矩阵
Imcontour         创建图像数据的轮廓线
Imhist            显示图像数据的直方图
Impixel           确定像素的彩色点
Improfile          计算沿着线段的像素值横截面
Mean2            计算矩阵元素的均值
Pixval             显示关于像素的信息
Regionprops        测量图像区域的属性
Statmoments(DIPUM)计算一幅图像直方图的统计中心距
Std2                 计算矩阵元素的标准偏差
图像分析(包括分割、描述和识别)
Bayesgauss(DIPUM) 高斯模式的贝叶斯分类器
Bound2eight(DIPUM)将4连接边界转换为8连接边界
Bound2four(DIPUM)将8连接边界转换为4连接边界
Bwboundaries           追踪区域边界
Bwtraceboundary        追踪单个边界
Bound2im(DIPUM)    将边界转换为图像
Boundaries(DIPUM)    追踪区域边界
Bsubsamp(DIPUM)     对边界二次取样
Colorgrad(DIPUM)      计算一幅RGB图像的向量梯度
Colorseq(DIPUM)       分割一幅彩色图像
Connectpoly(DIPUM)    连接多边形的顶点
Diameter(DIPUM)       测量图像区域的直径
Edge(DIPUM)           在一幅亮度图像中寻找边缘
Fchcode(DIPUM)         计算边界的freeman链码
Frdescp(DIPUM)         计算傅里叶描绘子
Graythresh                  使用Ostu方法计算图像的全局阈值
Hough(DIPUM)           Hough变换
Houghlines(DIPUM)       基于Hough变换提取线段
Houghpeaks(DIPUM)      在Hough变换中检测峰值
Houghpixels(DIPUM)      计算属于Hough变换bin的图像像素
Ifrdescp(DIPUM)          计算逆傅里叶描绘子
Imstack2vectors(DIPUM)    从图像堆栈提取向量
Invmoments(DIPUM)       计算图像不变距
Mahalanobis(DIPUM)        计算Mahalanobis距离
Minperpoly(DIPUM)        计算最小周长多边形
Polyangles(DIPUM)         计算多边形内角
Princomp(DIPUM)          得到主分量向量和相关量
Qtdecomp                    执行四叉树分解
Qtgetblk                      得到四叉树分解中的块值
Qtsetblk                      在四叉树中设置块值
Randvertex(DIPUM)         随机置换多边形顶点
Regiongrow(DIPUM)         由区域生长来执行分割
Signature(DIPUM)           计算边界的标记
Specxture(DIPUM)           计算图像的谱纹理
Splitmerge(DIPUM)          使用分离-合并算法分割图像
Statxture(DIPUM)            计算图像中纹理的统计度量
Strsimilarity(DIPUM)         两个串间的相似性度量
X2majoraxis(DIPUM)         以区域的主轴排列坐标x
图像压缩
Compare(DIPUM)           计算和显示两个矩阵间的误差
Entropy(DIPUM)            计算矩阵的熵的一阶估计
Huff2mat(DIPUM)           解码霍夫曼编码矩阵
Huffman(DIPUM)            为符号源建立一个变长霍夫曼码
Im2jpeg(DIPUM)            使用JPEG近似压缩一幅图像
Im2jpeg2k(DIPUM)          使用JPEG2000近似压缩一幅图像
Imratio(DIPUM)              计算两幅图像或变量中的比特率
Jpeg2im(DIPUM)           解码IM2JPEG压缩的图像
Jpeg2k2im(DIPUM)           解码IM2JPEG2K压缩的图像
Lpc2mat(DIPUM)             解压缩一维有损预测编码矩阵
Mat2huff(DIPUM)            霍夫曼编码矩阵
Mat2lpc(DIPUM)              使用一维有损预测编码矩阵
Quantize(DIPUM)             量化UINT8类矩阵的元素
图像增强
Adapthisteq                   自适应直方图量化
Decorrstretch                  对多通道图像应用去相关拉伸
Gscale(DIPUM)             按比例调整输入图像的亮度
Histeq                        使用直方图均衡化来增强对比度
Intrans(DIPUM)             执行亮度变换
Imadjust                      调整图像亮度值或彩色映射
Stretchlim                     寻找对比度拉伸图像的限制
图像噪声
Imnoise                       给一幅图像添加噪声
Imnoise2(DIPUM)             使用指定的PDF生成一个随机数数组
Imnoise3(DIPUM)             生成周期噪声
线性和非线性空间滤波
Adpmedian(DIPUM)        执行自适应中值滤波
Convmtx2                   计算二维卷积矩阵
Dftcorr(DIPUM)            执行频率域相关
Dftfilt(DIPUM)             执行频率域滤波
Fspecial                      创建预定义滤波器
Medfilt2                     执行二维中值滤波
Imfilter                      滤波二维和N维图像
Ordfilter2                     执行二维顺序统计滤波
Spfilt(DIPUM)                     执行线性和非线性空间滤波
Wiener2                      执行二维去噪滤波
线性二维滤波器设计
Freqspace            确定二维频率响应间隔
Freqz2               计算二维频率响应
Fsamp2              使用频率取样设计二维FIR滤波器
Ftrans2               使用频率变换设计二维FIR滤波器
Fwind1               使用一维窗法设计二维滤波器
Fwind2               使用二维窗法设计二维滤波器
Hpfilter(DIPUM)     计算频率域高通滤波器
Lpfilter(DIPUM)     计算频率域低通滤波器
图像去模糊(复原)
Deconvblind           使用盲去卷积去模糊图像
Deconvlucy            使用Lucy-Richardson方法去模糊
Deconvreg            使用规则化滤波器去模糊
Deconvwnr             使用维纳滤波器去模糊
Edgetaper              使用点扩散函数锐化边缘
Otf2psf                光传递函数到点扩散函数
Pst2otf                点扩散函数到光传递函数
图像变换
Dct2                  二维离散余弦变换
Dctmtx                离散余弦变换矩阵
Fan2para               将扇形束投影变换为并行射束
Fanbeam               计算扇形射束变换
Fft2                   二维快速傅里叶变换
Fftn                   N维快速傅里叶变换
Fftshift                颠倒FFT输出的象限
Idct2                  二维逆离散余弦变换
Ifanbeam               计算扇形射束逆变换
Ifft2                   二维快速傅里叶逆变换
Ifftn                  N维快速傅里叶逆变换
Iradon                 计算逆Radon变换
Para2fan               将并行射束投影变换为扇形射束
Phantom               生成头部仿真模型的图像
Radon                 计算Radon变换
小波
Wave2gray(DIPUM)   显示小波分解系数
Waveback(DIPUM)    执行多灰度级二维快速小波逆变换
Wavecopy(DIPUM)    存取小波分解结构的系数
Wavecut(DIPUM)      在小波分解结构中置零系数
Wavefast(DIPUM)     执行多灰度级二维快速小波变换
Wavefilter(DIPUM)    构造小波分解和重构滤波器
Wavepaste(DIPUM)    在小波分解结构中放置系数
Wavework(DIPUM)    编辑小波分解结构
Wavezero(DIPUM)     将小波细节系数设置为零
领域和块处理
Bestblk                为块处理选择块大小
Blkproc                为图像实现不同的块处理
Col2im                将矩阵列重排为块
Colfilt                 按列邻域操作
Im2col                将图像块重排为列
Nlfilter                执行一般的滑动邻域操作
形态学操作(亮度和二值图像)
Conndef               默认连通性
Imbothat              执行底帽滤波
Imclearborder          抑制与图像边框相连的亮结构
Imclose               关闭图像
Imdilate              膨胀图像
Imerode              腐蚀图像
Imextendedmax        最大扩展变换
Imextendedmin        最小扩展变换
Imfill                填充图像区域和孔洞
Imhmax              H最大变换
Imhmin              H最小变换
Imimposemin         强制最小
Imopen              打开图像
Imreconstruct         形态学重构
Imregionalmax        局部最大区域
Imregionalmin        局部最小区域
Imtophat             执行顶帽滤波
Watershed            分水岭变换
形态学操作(二值图像)
Applylut             使用查表法执行邻域操作
Bwarea              计算二值图像中的对象面积
Bwareaopen          打开二值区域(删除小对象)
Bwdist              计算二值图像的距离变换
Bweuler             计算二值图像的欧拉数
Bwhitmiss          二值击不中操作
Bwlabel            在二维图像中标记连接分量
Bwlabeln           在N维二值图像中标记连接分量
Bwmorph          对二值图像执行形态学操作
Bwpack            打包二值图像
Bwperim           确定二值图像中的对象的周长
Bwselect          选择二值图像中的对象   
Bwulterode         最终腐蚀
Bwunpack          解包二值图像
Endpoints(DIPUM)计算二值图像的端点
Makelut           构建applylut使用的查找表
结构元素(STREL)的创建和操作
Getheight          得到strel的高度
Getneighbors       得到strel邻域的偏移位置和高度
Getnhood          得到strel邻域
Getsequence        得到分解的strel序列
Isflat              对平坦的strel返回值
Reflect            以其中心反射strel
Strel              创建形态学结构元素
Translate          变换strel
基于区域的处理
Histroi(DIPUM)  计算图像中的ROI的直方图
Poly2mask         将ROI多边形转换为掩膜
Roicolor           基于颜色选择ROI
Roifill             在任意区域内平稳地内插
Roifilt2            对ROI进行滤波
Roipoly           选择多边形ROI
彩色映射处理
Brighten           加亮或加暗彩色映射
Cmpermute         在彩色映射中重排颜色
Cmunique          寻找唯一的彩色映射颜色和相应的图像
Colormap          设置或得到彩色查找表
Imapprox           以很少的颜色近似被索引的图像
Rgbplot           绘制RGB彩色映射分量
彩色空间转换
Applyform         应用独立于设备的彩色空间变换
Hsv2rgb           将HSV值转换为RGB彩色空间
Iccread            读ICC彩色配置文件
Lab2double        将L*a*b*彩色值转换为double类
Lab2uint16        将L*a*b*彩色值转换为uint16类
Lab2uint8         将L*a*b*彩色值转换为uint8类
Makecform        创建独立于设备的彩色空间变换结构
Ntsc2rgb          将NTSC值转换为RGB彩色空间
Rgb2hsv          将RGB值转换为HSV彩色空间
Rgb2ntsc            将RGB值转换为NTSC彩色空间
Rgb2ycbcr           将RGB值转换为YCBCR彩色空间
Ycbcr2rgb           将YCBCR值转换为RGB彩色空间
Rgb2hsi(DIPUM)  将RGB值转换为HSI彩色空间
Hsi2rgb(DIPUM)   将HSI值转换为RGB彩色空间
Whitepoint           返回标准照明的XYZ值
Xyz2double          将XYZ彩色值转换为double类
Xyz2uint16          将XYZ彩色值转换为uint16类
数组操作
Circshift            循环地移位数组
Dftuv(DIPUM)    计算网格数组
Padarray            填充数组
Paddedsize(DIPUM)计算用于FFT的最小填充尺寸
图像类型和类型转换
Changeclass        改变一幅图像的类
Dither             使用抖动转换图像
Gray2ind          将亮度图像转换为索引图像
Grayslice          通过阈值处理从亮度图像创建索引图像
Im2bw            通过阈值处理将图像转换为二值图像
Im2double         将图像数组转换为双精度
Im2java           将图像转换为Java图像
Im2java2d         将图像转换为Java缓存的图像对象
Im2uint8          将图像数组转换为8比特无符号整数
Im2uint16         将图像数组转换为16比特无符号整数
Ind2gray          将索引图像转换为亮度图像
Ind2rgb           将索引图像转换为RGB图像
Label2rgb         将标记矩阵转换为RGB图像
Mat2gray          将矩阵转换为亮度图像
Rgb2gray         将RGB图像或彩色映射转换为灰度图像
Rgb2ind          将RGB图像转换为索引图像
其他函数
Conwaylaws(DIPUM) 对单个像素应用Conway的遗传定律
Manualhist(DIPUM)  交互地生成2模式直方图
Twomodegauss(DIPUM)生成一个2模式高斯函数
Uintlut          基于查找表计算新数组值
工具箱参数
Iptgetpref        获得图像处理工具箱参数的值
Iptsetpref        设置图像处理工具箱参数的值
2019-08-06 13:13:41 Arthur_Holmes 阅读数 1856

为了体验,还如果原文还在的话,还是看原文比较好

教材:RafaelC.Gonzalez, RichardE.Woods, StevenL.Eddins,等. 数字图像处理[M]. 电子工业出版社, 2014.


第一章 绪论

1 数字图像处理的主要内容(基本步骤)是什么?

主要内容:图像获取、图像增强、图像复原、彩色图像处理、(小波变换)、形态学处理、分 割、识别、压缩编码。

基本步骤:

图像获取:利用电磁波不同波段的成像特点进行成像,以及利用其他方式(如声波、电 子、计算机图形学)进行成像。

图像增强:利用增强算法增强原图像中的特定特征,从而更有利于后续的处理工作。

图像复原:根据成像系统建立退化模型,应用退化过程的逆过程对原图像进行复原。

彩色图像处理:将色系的概念引入数字图像处理,使得数字图像处理能够处理生活中的彩色图像。

形态学处理:运用算法对原图像所含有的几何特征(点、线、物体等)进行提取。

图像分割:根据图像自身表达的内容,将组成原图像表达内容的各个元件拆分成相互独立且完整的整体。

图像识别:根据图像自身信息,与现实生活中的物体进行匹配。

压缩编码:对图像的存储大小进行压缩和编码,分为有损压缩和无损压缩,利用图像自身冗余减少存储图像时所用的数据量。

2 根据成像信息源,数字图像处理主要应用有哪些?(电磁波不同波段的成像特点及应用),其它成像方式,如声波、电子显微镜等。

伽马射线成像:核医学和天文观测

X射线成像:医学诊断(血管照相术、计算机轴向断层)、工业和天文学

紫外波段成像:平板印刷术、工业检测、荧光显微镜方法、激光、生物成像和天文观测等

可见光及红外波段成像:光显微镜方法、天文学、遥感、工业和法律实施

微波波段成像:雷达

无线电波段成像:医学(核磁共振成像)、天文学

其它成像方式:声波成像—医学、地震勘测、地质勘探;电子显微镜(电子);合成图像


第二章 数字图像基础

视觉感知要素

1 人眼中两类光感受细胞锥状体细胞、杆状体细胞的主要功能和特点

锥状体:数量在600-700万之间,主要位于视网膜的中间部分,且对颜色高度敏感。

杆状体:7500-15000万之间,分布在视网膜表面。没有彩色感觉,而对低照明度敏感


2 名词解释:马赫带现象

在明暗交界的地方,亮区一侧的抑制作用大于暗区的抑制作用,从而产生暗区更暗,亮区更亮


3 人眼对亮度的适应范围

从暗阈值到强闪光约有 [公式] 个量级。主观亮度是进入人眼的光强的对数函数,分为暗视觉和亮视觉。视觉系统不能同时在一个范围内工作,需通过改变整个灵敏度来完成这一较大的变动,也就是亮度适应。

问:当在白天进入一个黑暗剧场时,想要看清并找到空座位时眼睛需要适应一段时间,试述发生这种现象的视觉原理
答:视觉不能同时在大范围工作,存在亮度适应现象,1)由于户外与剧场亮度差异很大,因此当人进入一个黑暗的剧场时,无法适应如此大的亮度差异,在剧场中什么也看不见;2)人眼不断调节亮度适应范围,逐渐地将视觉亮度中心调整到剧场的亮度范围,因此又可以看见、分清场景中的物体了


4 解释为什么大口径镜头的照相机成像清晰?假定镜头制作工艺水平相同的情况下

[公式][公式] 为实物粒子波长(光子,电子等), [公式] 为成像系统的镜头直径, [公式] 为爱里斑所成角。当 [公式] 变大,则 [公式] 越小,物体上某一点在成像系统中由于衍射形成的光斑大小就变小,成像就越清晰。同样,实物粒子波长 [公式] 越小,则成像也越清晰。


5 视觉错觉

眼睛填充了不存在的信息或者错误地感知了物体的几何特点。


图像感知和获取

6 图像的形成模型—用于同态滤波

用形如 [公式] 的二维函数来表示图像,且 [公式][公式] 可由两个分量来表征:入射分量 [公式] 和反射分量 [公式]

其中, [公式] , [公式]

反射分量 [公式] 限制在0(全吸收)和1(全反射)之间。 [公式] 的性质取决于照射源,而 [公式] 的性质则取决于成像物体的特性。


图像取样和量化

7 图像数字化包括哪两个过程?数字化参数对数字化图像质量有何影响?

取样和量化。对坐标值进行数字化称为取样,对幅值进行数字化称为量化。数字图像的质量在很大程度上取决于取样和量化中所用的样本数和灰度级。


8 对比度、空间和灰度分辨率

对比度:图像中最高和最低灰度级间的灰度差。

空间分辨率:每单位距离线对数或每单位距离点数(像素 )

灰度分辨率:灰度级中可分辨的最小变化


像素间的一些基本关系

9 4邻域、D邻域、8邻域

4邻域:位于坐标 [公式] 处的像素 [公式] 有4个水平和垂直的相邻像素,其坐标为 [公式]

D邻域: [公式] 的四个对角相邻像素,其坐标为 [公式]

8邻域:4邻域+D邻域


第三章 灰度变换和空间域滤波

1 空间域滤波与频率域滤波的特点分别是什么?常用的滤波器有哪些?

空间域滤波直接在图像像素上进行操作,频率域滤波操作在图像的傅里叶变换上执行,而不针对图像本身。

常用空间滤波器

线性滤波器:低通、中通、高通

非线性滤波器:最小值、中值、最大值


基本灰度变换

2 基本的灰度变换函数:反转、对数或幂次

图像反转:得到灰度级范围为 [公式] 的一幅图像的反转图像

[公式]

特点:实现反白

对数变换

[公式]

特点:扩展低输入,压缩高输入

应用:当原图动态范围太大,超出显示设备的范围时,如直接显示原图可能会使部分细节丢失,此时可采用对数变换,如傅里叶频谱的显示。

幂律(伽马)变换

[公式]

特点:根据拉伸或者压缩的需要,选择不同的 [公式][公式] 值。

应用:图像获取、打印和显示的各种装置时按幂次规律响应的。用于修正幂次响应现象的过程称为伽马校正。

分段线性变换

(1)对比度拉伸。压缩两端动态范围,扩展中段目标的动态范围。

(2)灰度切分。突出目标轮廓,消除或保留背景细节。


直方图处理

3 什么是灰度直方图?有哪些应用?从灰度直方图能获得图像的哪些信息?

灰度直方图:表示图像中具有某种灰度级的像素的个数

应用:评价成像条件,图像增强处理,图像分割,图像压缩,其他图像处理任务(条件直方图,联合直方图 [公式] 条件熵,联合熵,互信息,广义熵等,最大熵图像复原,图像配准,目标识别等)

直方图反映图像的总体性质:明暗性质、细节是否清晰、动态范围大小等


4 直方图均衡化的基本步骤

  1. 统计原始图像的直方图,求出 [公式]
  2. 用累计分布函数 [公式] 作变换,求变换后的新灰度
  3. 用新灰度代替旧灰度,求出 [公式] ,这一步是近似的,同时把灰度相等的或相近的合在一起


5 直方图规定化的基本步骤

  1. [公式]
  2. [公式]
  3. 建立 [公式][公式] 的映射


6 局部直方图处理

以图像中每个像素的邻域中的灰度分布为基础设计变换函数。当使用非重叠区域转移时可以减少计算量,但是处理后的图像会出现棋盘效应。


空间滤波

7 利用平滑滤波器对图像进行低通滤波时,能抑制噪声,但同时也模糊了细节,可以采用哪种措施来减小对图像的模糊程度

加权均值滤波或中值滤波

中值滤波:将像素领域内灰度的中值代替该像素的值,对处理脉冲噪声(椒盐噪声)非常有效。


8 图像锐化:一阶微分、二阶微分,一阶微分算子、二阶微分算子

突出图像中的细节、边缘或轮廓。因为边缘和轮廓都位于灰度突变的地方,所以锐化算法的实现是基于微分作用。

一阶微分

[公式]

一阶微分通常会产生较宽的边缘。对灰度阶梯有较强的响应。

二阶微分

[公式]

二阶微分对细节有较强的响应,如细线、孤立点、噪声等。对灰度阶梯变化产生双响应。在灰度变化值相似时,对线的响应比对阶梯的响应强,对点的响应比对线的响应强。(点>线>阶梯)

二阶微分增强细节的能力比一阶微分好。

一阶微分算子:Roberts、Sobel、Prewitt算子

二阶微分算子:拉普拉斯算子。拉普拉斯算子具有各向同性,即旋转不变性。

[公式]


第四章 频率域滤波

傅里叶变换

1 图像二维离散傅里叶变换的公式,并分析傅里叶变换的频率分量与图像空间特征之间的联系

正变换

[公式]

反变换

[公式]

图像的频率是表征图像中灰度变化剧烈程度的指标,是灰度在平面空间上的梯度。直流分量 [公式] 对应一幅图像的平均灰度,低频对应图像中变化缓慢的灰度分量,高频部分对应图像边缘和灰度级突变的部分。


2 用傅里叶变换的性质证明图像频域中心化处理等于 [公式] ,为什么要进行中心化处理?

用傅里叶变换的平移特性证明

[公式]

其中 [公式][公式]

由傅里叶变换的平移特性可得

[公式]

因此

[公式]

原因:一张图像中的能量主要集中在低频区,中心化处理可以将图像的低频分量集中在频谱图中央,便于观察。


频率域滤波

3 写出图像频域滤波的基本步骤

  1. 补零:对 [公式] 补0,得到 [公式] 填充后图像 [公式] ,避免缠绕;
  2. 中心化变换:用 [公式] 乘输入图像得 [公式]
  3. DFT:对(2)中 [公式] 做离散傅里叶变换,得 [公式][公式]
  4. 滤波:用滤波函数 [公式] 乘以 [公式][公式]
  5. 得到处理后图像: [公式]
  6. [公式] 左上限提取 [公式] 区域,得到最终结果 [公式]

4 写出三种频率域平滑(低通)滤波器,并分析各自特点。截止频率对结果的影响。

目的:对图像产生平滑作用。

理想低通滤波器、巴特沃斯低通滤波器、高斯低通滤波器

理想低通滤波器(ILPF):

截断傅里叶变化中所有的高频部分,物理不可实现。单位冲激响应为sinc函数,有模糊振铃现象。

巴特沃斯低通滤波器(BLPF):

[公式]

在带通和被滤除的频率之间没有明显的截断,有一个平滑的过渡带。1阶巴特沃斯滤波器没有振铃,2阶中振铃通常很微小,阶数增高时振铃现象逐渐成为一个重要的因素。当阶数n充分大时,巴特沃斯滤波器就变成理想低通滤波器。

高斯低通滤波器(GLPF):

[公式]

[公式] 时,滤波器下降到它最大值的 [公式]

空间高斯滤波器没有振铃现象


5 写出三种频率域高通滤波器,并分析各自特点

理想高通滤波器、巴特沃斯高通滤波器、高斯高通滤波器

理想高通滤波器(IHPF):

将以 [公式] 为半径的圆周内的所有频率置为0,而毫不衰减通过圆周外的任何频率。物理不可实现。有振铃现象。

巴特沃斯高通滤波器(BHPF):

[公式]

BHPF比IHPF更平滑,相同设置的BHPF的边缘失真比IHPF小得多。

高斯高通滤波器(GHPF):

[公式]

[公式][公式] 。GHPF比前两种滤波器更平滑,即使对微小物体和西线用GHPF过滤也是加清晰的。没有振铃现象。


6 用傅里叶变换的性质证明空间锐化滤波器拉普拉斯算子在频域是高通滤波器

[公式]

乘以 [公式] 中心化

[公式]

在空域中,用原始图像减去拉普拉斯算子部分,得到增强图像 [公式]

频域中,用反变换实现

[公式]

[公式] 在频域上表现为高通滤波器


7 同态滤波过程、目的是什么?

目的:消除不均匀照度的影响,增强图像细节

依据:物理过程产生的图像,灰度值正比于物理源的辐射能量,而辐射能量有照射分量和反射分量合成。反射分量反映图像内容,随图像细节不同在空间上作快速变化。照射分量在空间上通常具有缓慢变化的性质。照射分量的频谱落在空间低频区域,反射分量的频谱落在空间高频区域。

实现步骤

  1. [公式]
  2. [公式]
  3. [公式]
  4. 压缩 [公式] 分量变化范围,削弱 [公式] ,增强 [公式] 分量的对比度,提升 [公式] ,增强细节,确定 [公式][公式]
    [公式]

效果:压缩动态范围,增强对比度


第五章 图像复原与重建

图像退化/复原模型

图像退化:由于成像系统受各种因素影响,在获取和传输过程中使图像质量降低的现象称为图像退化。主要原因有:成像系统的散焦,成像设备与物体间的相对运动,成像器材的固有缺陷,外界环境(噪声、干扰)。这里只研究由噪声引起的退化。

图像复原:根据图像降质过程的某些先验知识,建立“退化模型”,运用与退化相反的过程(逆过程),将退化图像恢复原来面目。目的是改善图像的质量。

1 写出图像在空间域和频率域的退化数学模型的表达式,并分析造成图像退化的原因

空间域:​ [公式]

频率域:​ [公式]

造成图像退化的原因:成像系统的散焦,成像设备与物体间的相对运动,成像器材的固有缺陷,外界环境(噪声、干扰)。


空间域图像复原

2 带噪图像空间域复原的方法:均值滤波(算术、几何、谐波/调和),统计排序滤波

均值滤波器

算术均值滤波器:​ [公式]

在滤除噪声的同时,会造成图像的模糊

几何均值滤波器:​ [公式]

几何均值滤波器实现的平滑程度与算术均值滤波器相当,但能保留更多的图像细节,对黑色物体有扩大作用。

谐波均值滤波器:​ [公式]

谐波均值滤波器对于“盐粒”噪声效果更好,但不适用于“胡椒”噪声,对于高斯噪声有比较好的效果。

逆谐波均值滤波器:​ [公式]

适用于消除椒盐噪声。
Q>0时,用于消除“胡椒”噪声;
Q<0时,用于消除“盐粒”噪声。
但不能同时消除两种噪声。
Q=0,为算术均值滤波器;
Q=-1,为谐波均值滤波器

统计排序滤波器

中值滤波器: [公式]

对单极或双极脉冲噪声非常有效。

最大值滤波器:​ [公式]

用于发现图像中的最亮点,可有效过滤“胡椒”噪声。

最小值滤波器:​ [公式]

用于发现图像中的最暗点,可有效过滤“盐粒”噪声。

中点滤波器:​ [公式]

结合了顺序统计和求平均,对于高斯和均匀随机分布噪声有最好的效果。

修正的阿尔法均值滤波器:​ [公式]

在​邻域内去掉​最高灰度值的​和最低灰度值的​,​代表剩余的​个像素。

当d=0,退变为算术均值滤波器;
当d=mn-1,退变为中值滤波器;
当d取其他值时,适用于包括多种噪声的情况下,例如高斯噪声和椒盐噪声混合的情况。


3 自适应滤波器为何有比较好的处理效果?

以​的矩形窗口​定义的滤波器区域内图像的统计特性为基础,其性能优于迄今为止讨论过的所有滤波器的性能,但增加了算法复杂性。包括:自适应局部降低噪声滤波器,自适应中值滤波器。

自适应局部降低噪声滤波器

[公式]

预期性能如下,若 [公式] ​, [公式] ​,保留原灰度值,不做处理;若 [公式] ​,​ [公式][公式] ​本身权重增加;若 [公式] ​, [公式] ​,降低局部噪声

自适应局部降低噪声滤波器效果好于算术、几何均值,保留细节更好,付出代价时增加了复杂性。
细节边缘部分,局部方差变大,更多保留g(x,y),灰度变化平坦区域,平滑作用更强。

自适应中值滤波器

主要目的:去除“椒盐”噪声(冲激噪声),平滑其它非冲激噪声,减少物体边界细化或粗化等失真现象。

算法实现:

进程A——找到一个非脉冲的中值

[公式][公式] ​,若 [公式] ​且 [公式] ​, [公式] ​,中值不是脉冲,转到进程B,否则增大窗口尺寸。如果窗口尺寸​ [公式] ,重复进程A,否则输出 [公式] ​。

进程B——判断中心像素是否脉冲

[公式][公式] ​,若​ [公式][公式] ​, [公式] ​,​不是脉冲,输出 [公式] ​。否则,[公式]或​[公式] 输出​ [公式]

自适应中值滤波器可以处理具有更大密度的冲激噪声,可以在平滑非冲激噪声时保留细节。
而传统中值滤波器无法做到。


频率域滤波消除周期噪声

4 如何去除图像中的周期噪声?带阻或陷波、最佳陷波

带阻滤波器

理想:​ [公式]

巴特沃斯: [公式]

高斯:​ [公式]

带通滤波器

[公式]

陷波滤波器

阻止或通过实现定义的中心频率邻域内的频率。是一种特殊的带阻/通滤波器,它的阻/通带范围极小,有着很高的Q因子。以原点对称。

最佳陷波滤波器

提取干扰模式的主频率分量,从被污染的图像中减去该模式的一个可变的加权部分。

估计退化函数

5 在图像复原中,估计退化函数的主要方法有哪些?

图像观察估计

后验判断。对于一幅模糊图像,若没有退化函数的知识,则需从退化图像本身来估计​。

[公式]

假设系统空间位移不变,可推导出针对整幅图像的​,它必然与​具有相同的形状。

可选择有特征的部分图像进行估计。
选取图像中强信号区域(SNR大,如清晰的点),利用空间不变,得全局h(x,y)。
原景物含有明显的直线,从这些线条的退化图像求h(x,y)。
有明显的界限,已知形状的物体,如:篮球、足球、车牌文字、标志性建筑等。

试验估计

可使用相似的退化图像获取设备,建立理论上近似准确的退化函数估计。利用相同的系统设置,对一个脉冲成像,得到退化函数的冲激响应。

[公式]

[公式]

建模估计

运用先验知识建模。根据:大气湍流、光学系统三角、照相机与景物相对运动导致模糊的物理过程(先验知识)来确定​。

大气湍流退化:​ [公式]

照相机与景物相对运动:​ [公式]

光学散焦退化: [公式]

高斯退化: [公式]


6 建模估计当中,由于成像传感器与被摄物体之间存在相对的均匀线性运动,给出图像退化函数​

设T为快门时间,​和​使位移的x分量和y分量,则

[公式]

​为模糊图像,上式两边作傅里叶变换,得

[公式]

[公式] ​得

[公式]

假定图像只在x方向以给定的速度​做匀速直线运动,可得

[公式]

若允许y分量随着变化,按​则退化函数变为

[公式]


由退化函数复原图像

7 由退化函数​复原图像的主要方法:逆滤波、最小均方误差(维纳)滤波、约束最小二乘滤波

逆滤波

原始图像傅里叶变换的估计值 [公式]

复原后的图像为 [公式]

最小均方误差滤波(维纳滤波)

寻找一个滤波器,使得复原后的图像和原图像的均方差最小,即

[公式]

[公式] 如果噪声为0,维纳滤波器退化为逆滤波。

处理白噪声时, [公式] 为常数,可作如下简化处理

[公式]

约束最小二乘滤波

除需要关于退化系统的传递函数外,还需知道某些噪声的统计特性或噪声与图像的某些相关情况。


8 逆滤波时,为什么图像存在噪声时,不能采用全滤波?试采用逆滤波原理说明,并给出正确的处理方法。

[公式]

即使知道退化函数,也不能准确复原未退化的图像,因为未知。如果退化函数是零或非常小的值,将导致不稳定解,比值非常大,噪声项将被放大,对复原的结果占主导地位。

解决退化函数为零或非常小的值的问题的一种处理方法为限制滤波的频率,使其接近原点。


第六章 彩色图像处理

伪彩色图像处理

1 什么是伪彩色图像处理?目的是什么?试列举伪彩色处理的主要方法

基于指定规则将灰度值映射成为彩色值。

主要目的是,景物映射成奇异彩色,比本色更引人注目;适应人眼对颜色的灵敏度,提高鉴别能力。可把细节丰富的物体映射成深浅与亮度不一的颜色;遥感多光谱图像转换成假彩色,可以获得更多信息。

主要处理方法:强度映射、通道合成


彩色模型

1 图像的彩色模型解释:RGB、CMYK、HSI的含义及应用

面向硬件的彩色模型

RGB(红、绿、蓝)模型—彩色监视器、彩色视频摄像机

每种颜色出现在红、绿、蓝的原色光谱分量中。

CMY(青、深红、黄)/CMYK(青、深红、黄、黑)模型—彩色打印机

一种减色系统,将从白光中滤出三种原色之后获得的颜色作为表色系的三原色。K为黑色,印刷时可用黑色墨来印刷。

由等量的颜料原色青色、深红色和黄色组合所产生的黑色不纯。为了产生真正的黑色(在打印中起主要作用的颜色),加入了第四种颜色——黑色。

面向应用的彩色模型

HSI(色调、饱和度、亮度)模型—面向一般彩色图像应用

该模型可在彩色图像中从携带的彩色信息(色调和饱和度)中消去强度分量的影响,反映了人类观察彩色的方式,是开发基于彩色描述的图像处理算法的理想工具。

饱和度:色环原点到彩色点的半径长度。

色调:由角度表示,反映了该颜色最接近什么样的光谱波长。


第八章 图像压缩

1 图像压缩中,主要数据冗余是什么?列举常见的图像压缩格式

主要数据冗余:编码冗余、像素间冗余、心理视觉冗余。

  • 编码冗余:信息熵冗余。图像中平均每个像素使用的比特数大于该图像的信息熵。
  • 像素间冗余(空间和时间冗余):大多数像素存在空间连贯性,视频中帧间像素也存在相关性,造成了数据的冗余。
  • 心理视觉冗余:多数图像中包含由一些被人类视觉系统忽略或与用途无关的信息。

常见图像压缩格式

静态图像:二值—CCITT Group3/4、JBIG/JBIG2、TIFF;连续音调—JPEG/JPEG-LS/JPEG-2000、BMP、GIF、PDF、PNG、TIFF

视频:DV、H.261/262/263/264、MPEG-1/2/4/4 AVC、AVS、HDV、M-JPEG、Quick Time、VC-1

基本压缩方法


2 霍夫曼编码,并计算编码效率。压缩率、冗余度、信息熵

步骤:

  1. 将信源符号按概率递增顺序排列
  2. 将两个最小的概率加起来作为新符号的概率
  3. 重复步骤1和2,直到概率和为1
  4. 完成上述步骤后沿路径返回进行编码。寻找从每一信源符号到概率为1处的路径,每层有两个分支,分别为大的概率赋予0和小的概率为1,从而得到每个符号的编码

压缩率: [公式] ​。大于1,压缩前比特数除以压缩后平均码长。

冗余度:​ [公式]

信息熵: [公式] ​,​ [公式]


3 算术编码

原理:根据信源不同符号序列的概率,把​区间划分为互不重叠的子区间,子区间的宽度恰好是各符号序列的概率,这样不同符号序列与各子区间一一对应,因此每个子区间内任意一个实数都可用来表示对应的符号序列,这个数就是该符号序列所对应的码字。显然遗传符号序列发生的概率越大,对应的子区间就越宽,要表达它所用的比特数就减少,因而相应的码字就越短。

算术编码分为静态模型和自适应模型。静态模型信源符号概率分布固定,自适应模型信源符号概率分布的估计随着每次这种上下文出现时的符号而自适应更新,从而更加符合实际的概率分布。不管编码器使用怎样的模型,解码器也必须使用同样的模型。

特点:

  • 较容易地定义自适应模式,即为各个符号设定相同的概率初值,然后根据出现的符号做相应的改变,得到改变值。由于编码和解码使用同样的初始值和改变值,因此概率模型保持一致。自适应模式适用于不进行概率统计的场合。
  • 实现比霍夫曼编码复杂,但当信号源符号的出现概率相近时,算术编码的效率高于霍夫曼编码5%左右。
这种技术不像霍夫曼编码方法那样要求每个符号转换成整数,在理论上达到了香农第一定理的极限。

这里给出例题。假设信源符号为 [公式] ,这些符号的概率分别为 [公式] ,对输入的序列cadacdb进行算术编码。


4 给出离散余弦变换DCT变换的表达式和基于DCT块编码系统实现的主要步骤,并对每一步作简要说明

离散余弦变换

对于大小为​的子图像​,其离散余弦变换可表示为

[公式]

若给定 [公式] ​,则可以使用离散反变换得到​

[公式]

其中,​ [公式]

[公式][公式] ​类似

基于DCT块编码系统

编码器执行子图像分解、变换、量化和编码,解码器执行解码、反变换、图像合并。一幅大小为的输入图像首先被分解为大小为的子图像,然后用离散余弦变换变换这些子图以生成个子图像变换阵列,每个阵列的大小为。离散余弦变换的目的时对每幅子图像中的像素进行去相关,或用最少数量的变换系数包含尽可能多的信息。在量化阶段,以一种预定义的方式有选择地消除或更粗略地量化那些携带最少信息的系数,这些系数对重建的子图像质量影响最小。通过对量化后的系数进行编码阶数编码过程。

DCT的信息携带能力比DFT和WHT要强。在计算度上,虽然WHT的计算量最小,但是由于DCT可采用快速算法,因而在信息综合能力和计算复杂度上的综合性能比较好而得到广泛应用。

第九章 形态学图像处理

形态学的基本思想是用具有一定形态的结构元素去度量和提取图像中的对应形状已达到对图像分析和识别的目的。

将数学形态学作为工具从图像中提取表达和描绘区域形状的有用图像分量,如边界、骨架、凸壳等,或用于图像的预处理和后处理,如形态学滤波、细化和修剪等。数学形态学的语言是集合论

形态学图像处理的基本运算有四种:膨胀、腐蚀、开操作和闭操作。

二值形态学基本运算

1 腐蚀和膨胀操作:名词解释或简答、实现,说明主要特点及应用

膨胀

定义:假定​A和B是 [公式] ​上的集合,​ A被​B(结构元)膨胀定义为

[公式]

含义:把结构元B​平移z后得到 [公式] ​,若 [公式] ​,记下这个z点,所有满足上述条件的z点组成的集合称作​A被B​膨胀的结果。

过程:结构元​B也可以看为卷积掩码,因为膨胀的操作过程和线性卷积过程很类似。用​B的原点和A​上的点逐一对比,如果上有一个点落在​的范围内,则​原点对应的点就为图像。

特点:膨胀的结果会使目标变大。

应用:将裂缝桥接起来,消除小的孔洞。

腐蚀

定义:假定​A和B​是​ [公式] 上的集合,A​被B​(结构元)腐蚀定义为

[公式]

含义:腐蚀结果是由移位元素z组成的集合,以至​B对这些元素移位操作的结果完全包含于A。

过程:把结构元素B​平移z后得到 [公式] ​,若​ [公式] 包含于A​,记下这个z点,所有满足上述条件的z点组成的集合称作​A被​B腐蚀的结果。

特点:腐蚀缩小或细化了二值图像中的物体。

应用:消除二值图像中的不相关细节。当结构元素小于目标时,则腐蚀掉目标的边界成分;腐蚀可以把小于结构元素的物体(毛刺、小凸起)去除;如果两个物体之间有细小的连通,结构元素足够大时,通过腐蚀运算可以将两个物体分开。

腐蚀和膨胀关于补集和反射操作呈对偶关系。
[公式]


2 开操作和闭操作:名词解释或简答、实现,说明主要特点及应用

开运算

定义:​ [公式]

含义:先用结构元B​对A​腐蚀,再对腐蚀结果用同样的结构元进行膨胀操作。

特点:等幂性,即多次开运算结果与一次是一样的

应用:断开狭窄的连接,如去除细胞粘连、字体粘连;消除西小物体,可用于去噪点;使用圆、椭圆等结构元素时,使对象轮廓变光滑;保持大物体尺寸基本不变。

闭运算

定义:​ [公式]

含义:先用结构元​对​膨胀,再对膨胀结果用同样的结构元进行腐蚀操作,过程与开运算正好相反。

特点:等幂性,即多次闭运算结果与一次是一样的

应用:连接狭窄的间隙,如短线粘连、字体连接;填充物体内细小孔洞,可用于去噪点;填补轮廓线的断裂;保持大物体的尺寸基本不变。

开运算通常对图像轮廓进行平滑,使狭窄的“地峡”形状断开,去掉细的突起(与结构元有关,如圆、椭圆结构元造成平滑结果,而矩形则非)。闭运算也是趋向于平滑图像的轮廓,但与开运算相反,它一般使窄的断开部位和细长的沟融合,填补轮廓上的间隙。


二值形态学图像处理基本操作

边界提取:先用一合适的结构元B对A腐蚀,然后再把A减去腐蚀的结果来获得。​ [公式]

区域填充:从界内一点P开始,用1去填充整个区域,填充过程为: [公式] ​,为条件膨胀。

连接分量提取: [公式] ​,取交集的作用是消除中心元素标志为0的膨胀结果。

还有凸壳、细化、粗化、骨架、裁剪等操作,涉及到击中击不中变换这里不再给出具体定义。


灰度级形态学

腐蚀:​ [公式]

膨胀:​ [公式]

开运算:​ [公式]

闭运算:​ [公式]


第十章 图像分割

图像分割

1 解释图像分割及应用,图像分割是基于灰度的什么特征实现的?

定义:将一幅图像分解为若干互不交叠的、有意义的、具有相似性质的区域或对象。

应用:确定航空照片中的森林、耕地、城市区域等;文字识别、识别和标定细胞。

图像分割基于区域内部灰度值的相似性和区域之间灰度的不连续性。


间断检测

2 一阶、二阶导数对图像的灰度特征是如何响应的?

一阶导数:在恒定灰度区域为零;在灰度台阶或斜坡开始处不为零;沿斜坡灰度点处不为零

二阶导数:在恒定灰度区域为零;在灰度台阶或斜坡开始处不为零;沿斜坡灰度点处为零

一阶导数用于检测一个点是否属于边缘;二阶导数的正负符号可以用于判断边缘像素是在亮的一边还是暗的一边。

点检测

使用如下模板

[公式]

[公式] ​,则在模板中心的位置已经检测到一个孤立点,T为非负门限。

线检测

第一个模板对水平方向的线条有很强的响应;第二个模板对+45度方向线有最佳响应。模板系数为0,表明恒定灰度区域响应为0。


边缘模型

在边缘处,灰度和结构等信息发生突变。沿边缘方向灰度变化平缓,垂直边缘方向灰度变化剧烈。这种变化可用微分算子检测,通常用一阶或二阶导数来检测边缘。

3 边缘检测(梯度sobel、Prewitt、Roberts、拉普拉斯算子),给出模板,分析其功能

步骤:滤波、锐化、检测、定位

梯度算子

Roberts算子:计算对角方向相邻两像素之差,也成为四点差分法。

[公式]

特点:对4点进行差分求得梯度,方法简单;对噪声较敏感,常用于不含噪声的图片边缘点检测。

Prewitt算子:先求平均,再求差分得到梯度。

[公式]

上述Prewitt算子分别用来检测水平、 [公式] ​、垂直、 [公式] ​四个方向边缘。

效果:去噪+增强边缘

Sobel算子:加权平均后差分,减弱对边缘的模糊程度。

[公式]

上述Sobel算子分别用来检测水平、 [公式] ​、垂直、 [公式] ​四个方向边缘。

效果:去噪+增强边缘

拉普拉斯算子

求图像的二阶导数。​ [公式]

常用模板

[公式]

分别以 [公式] ​和 [公式] ​旋转各向同性。

特点:一般不直接用拉普拉斯算子检测边缘—对噪声敏感;会产生双边缘;不能检测边缘的方向

作用:边缘检测各向同性;利用它的零交叉的性质进行边缘定位;确定一个像素是在边缘暗的一边还是亮的一边。


4 高级复杂的边缘检测方法:Marr-Hildreth和Canny算子实现步骤、特点和应用,给出主要步骤的数学模型

Marr-Hildreth

高斯拉普拉斯(LOG—Laplacian of Gaussian)

步骤:用高斯函数平滑图像;用拉普拉斯算子进行边缘检测;根据二阶导数算子过零点的性质来确定边缘的位置。

表达式:

[公式]

这里给出一个 [公式] ​大小的LoG算子模板

[公式]

LoG滤波器的尺寸: [公式]

特点:

  • 优点—图像中的边缘比梯度边缘细;高斯滤波器平滑,有利于抑制噪声;拉普拉斯算子是各向同性的。
  • 缺点—零阈值时边缘由许多闭合环的零交叉点决定;非零阈值的零交叉点的计算比较复杂。

高斯差(DoG—Difference of Gaussians)

[公式]

k=1.6时是LoG的近似,两个高斯核的大小决定了两个高斯模糊后的影像间的尺度。用于图像增强时,k=4或5,很好地近似了视网膜上神经节细胞的视野。

Canny边缘检测器

步骤:高斯平滑;计算梯度幅值图像和角度图像;对梯度幅值图像应用非最大抑制(NMS);用双阈值处理和连接分析来检测和连接边缘。

特点:图像中的边缘比梯度边缘细;高斯滤波器平滑,有利于抑制噪声。实现复杂,执行时间长。


5 Hough变换检测直线

将在图像空间中过点​ [公式] 的直线 [公式] ​表示为参数空间表达式​ [公式] 。参数空间ab中相交直线最多的点交点 [公式] ​即为图像空间中过点 [公式] ​和 [公式] ​的直线的斜率和截距。由于垂直直线斜率趋于无穷大,故改用极坐标 [公式] ​参数空间​ [公式] 。对应不是直线而是正弦曲线。

使用交点累加器,或交点统计直方图,找出相交线段最多的参数空间的点,然后找出该点对应的xy平面对应的直线线段。

Hough变换不仅能检测直线,还可以检测具有解析式的曲线。


阈值处理

6 简述门限(阈值)分割图像的基本思路,自动全局阈值如何选取?

基本思路

根据图像的整体信息(如直方图),或局部信息(共生矩阵等)来选择一个或多个值,从而把该图像分割成目标与背景两类区域或者多个目标与背景的区域。

根据灰度图,绘制直方图,根据直方图,决定阈值,原图灰度高于阈值的置 1,低于阈值的置 0,得到二值图像。

自动全局阈值的选取

  1. 选择一个T的初始估计值;
  2. 用T分割图像,会生成两组像素:​ [公式] 由所有 [公式] ​的像素组成,而​ [公式] 由所有 [公式] ​的像素组成;
  3. 计算区域​和​的平均灰度值​ [公式] 和​ [公式]
  4. 计算新的阈值​ [公式]
  5. 重复步骤2-4,直到迭代中T值之差小于事先定义的参数​ [公式]

门限处理的分类:

全局门限处理:仅取决于灰度级值

局部门限处理:取决于灰度级值和局部性质

动态(自适应)门限处理:取决于空间坐标x和y

基于Otsu方法的最佳全局阈值处理*

  1. 计算输入图像的归一化直方图,直方图各个分量为​ [公式]
  2. 计算累积和​ [公式]
  3. 计算累积均值​ [公式]
  4. 计算全局灰度均值​ [公式]
  5. 计算类间方差 [公式]
  6. 得到Otsu阈值​ [公式] ,即令 [公式] ​最大的k值。如果最大值不唯一,用相应检测到的各个最大值k的平均得到​ [公式]
  7. 在​ [公式] 处计算,得到可分性度量​ [公式]


区域分割*

传统区域分割算法有区域生长法区域分裂合并法。空间和时间开销较大。

区域生长

步骤

  1. 根据图像的不同应用选择一个或一组种子
  2. 选择一个相似性准则
  3. 从该种子开始向外扩张,不断将与集合中各个像素连通且满足相似性准则的像素加入集合
  4. 上一过程进行到不再有满足条件的新结点加入集合为止

区域分裂合并

  1. 设整幅图像为初始区域
  2. 对图像的每一个区域R​,计算P®​,如果P®=FALSE​,则把该区域分裂成四个子区域
  3. 重复步骤2直至没有区域可分裂
  4. 对图像中任意两个相邻的 [公式][公式] ,如果 [公式] ,则把这两个区域合并成一个区域
  5. 重复步骤4直至没有相邻区域可合并,算法结束

基于形态学分水岭的分割*

分水岭算法借鉴了形态学理论,将图像看成拓扑地形图,其中灰度值被认为时地形高度值,高灰度值对应着山峰,低灰度值对应着山谷。图像分割就是在灰度图像中找出不同的吸水盆地和分水岭。分水岭算法是一种自适应的多阈值分割算法。

由于梯度图中可能有较多的局部极小点,因此可能会导致过分割。

2018-07-07 01:02:00 weixin_30412167 阅读数 5270

下载地址:网盘下载

 

数字图像处理(MATLAB版)冈萨雷斯+中文高清版。包含MATLAB代码实现

《数字图像处理(MATLAB版)》是把图像处理基础理论论述与软件实践方法相结合的第一本书,它集成了冈萨雷斯和伍兹所著的《数字图像处理》一书中的重要内容和MathWorks公司的图像处理工具箱。本书的特色在于它重点强调了怎样通过开发新代码来增强这些软件工具。本书在介绍MATLAB编程基础知识之后,讲述了图像处理的主要内容,具体包括亮度变换、线性和非线性空间滤波、频率域滤波、图像复原与配准、彩色图像处理、小波、图像数据压缩、形态学图像处理、图像分割、区域和边界表示与描述以及对象识别等。

下载地址:网盘下载

转载于:https://www.cnblogs.com/long12365/p/9730203.html

2017-09-11 19:56:13 linxid 阅读数 10148

第一章 绪言

  • 本书站点:www.prenhall.com/gonzalezwoodseddins。
    网站包括:
    1.可下载的m文件
    2.培训
    3.计划等资料

1.6 MATLAB工作环境

1.6.2使用编辑器创建m文件

文本编辑器,也是图形MATLAB调试器,扩展符.m来表示。命令窗口输入edit打开文本编辑器。同样,输入edit filename会打开filename.m文件。如果不存在,会创建一个文件,文件必须在当前目录下,或者搜索路径的目录中。

1.6.3获得帮助

  • 双击问号符(?),或输入helpbrowser,打开帮助浏览器。image.png。可使用search,查找相应函数的帮助。
  • doc 加函数名,可获取相应帮助。同样可使用help 加函数名查找帮助。

1.6.4保存和检索工作回会话

  • 保存一个完整的工作空间(workspace)
    工作浏览器窗口,右击,选择save,选择文件夹,保存为.mat文件。保存特定变量,在显示区域,左击(用crtl可多选),可选择多个变量。可使用类似方法,载入保存过的工作空间/变量。save和load命令可实现相同目的。

第二章 基本原理

  • 图像处理工具箱(IPT)是扩展MATLAB数值计算能力的函数集。
  • 本章主要内容:介绍MATLAB表示法的基本知识,讨论IPT的基本属性和函数,介绍增强IPT的程序设计概念。

2.1数字图像的表示

图像可定义为二位函数f(x,y),平面坐标(x,y),上的亮度(灰度表示)。彩色图像是三幅独立分量图像的叠加(R、G、B)。

2.1.1坐标约定

  • 方法一:
    图像取样,得到M*N的图像,选定坐标原点(0,0),然后依次取样。x的范围是0到M-1的整数,y的范围是0到N-1的整数。如图所示:image.png
  • 方法二:
    工具箱中的约定与此不同,使用(r,c)来表示行和列,顺序一致,第一个元素表示行,第二个表示列,坐标原点实在(r,c)=(1,1)处。
    image.png
    图像用矩阵表示,表示形式为:
    image.png

2.2读取图像

  • imread读取图像进入MATLAB环境。语法:imread('filename')
    图像格式包括:
    image.png
    f = imread('chest.jpg') 将JPEG图像读入图像数组f。单引号指定文件字符串。
    尽量使用绝对路径,使得MATALAB的路径包括,所含的图片的路径,通过找到相应文件夹,然后选择Add to Path来实现。
  • size(f)可以给出一幅图像的大小。以下命令常用:
[M , N] = size(f);
whos f;给出数组的附加信息,whos同样可给出其他变量的信息

2.3显示图像

  • 显示图像基本语法:imshow(f , G)。f是一个图像数组,由imread读入,G是显示图像的灰度级数,若省略,默认为256.
  • imshow(f,[low high]):所有小于或等于low的值显示为黑色,大于或等于high的值显示为白色。low 和high之间的显示为中等亮度值。
  • imshow(f,[ ]):low设置为数组的最小值,high设置为最大值。
  • pixval:可用于交互的显示单个像素的亮度值,光标在图像上移动,将所在位置的坐标和该电亮度值显示处理啊,彩色图像会显示RGB分量。???
  • figure, imshow(f):可在显示第一幅图像的同时,显示第二幅图像。
  • imwrite(f, ‘filename.jpg’,’quality’,q):q为0到100的整数,JPEG压缩,q越小,图像越模糊。
  • imfinfo filename:可显示图像文件的其他信息,filename为图像的全名。
    image.png

  • 压缩比:width乘以height再乘以BitDepth,然后将结果除以8,得到图像字节数,用结果除以FileSize得到压缩比。

  • K = imfinfo(‘bubbles.jpg’):可以将图像的信息存入结构变量中,以便以后的调用。其他信息可通过命令调用。
image_bytes = K.Width * K.Height * K.BitDepth/8;
compress_bytes = K.FileSize;
compress_ratios = image_bytes/compress_bytes;
  • imwrite另一用法:
    imwrite(q,'filename.tif','compression','parameter' 'resolution',[colres rowres])
    parameter : ‘none’无压缩;‘ccitt’二值图像默认参数压缩。
    [colres rowres]:垂直方向和水平方向每英寸的点数。

  • 按MATLAB桌面显示的那样输出到磁盘:
    1.File下拉菜单,选择Export,选择保存路径,文件名,以及文件格式。
    2.print 函数:`print -fno -dfilename -rresno filename
    no:感兴趣的图形窗口的图形编号;
    fileformat:文件格式
    resno:单位为dpi的分辨率
    filename:指定的文件名

2019-01-13 15:37:54 u010608296 阅读数 20751

1.1 图像与图像处理的概念

图像(Image): 使用各种观测系统以不同形式和手段观测客观世界而获得的,可以直接或间接作用于人眼并进而产生视觉的实体。包括:

·各类图片,如普通照片、X光片、遥感图片;

·各类光学图像,如电影、电视画面;

·客观世界在人们心目中的有形想象以及外部描述,如绘画、绘图等。

数字图像:为了能用计算机对图像进行加工,需要把连续图像在坐标空间和性质空间都离散化,这种离散化了的图像是数字图像。

图像中每个基本单元叫做图像的元素,简称像素(Pixel)。

数字图像处理(Digital Image Processing):是指应用计算机来合成、变换已有的数字图像,从而产生一种新的效果,并把加工处理后的图像重新输出,这个过程称为数字图像处理。也称之为计算机图像处理(Computer Image Processing)。

1.2 图像处理科学的意义

1.图像是人们从客观世界获取信息的重要来源

·人类是通过感觉器官从客观世界获取信息的,即通过耳、目、口、鼻、手通过听、看、味、嗅和接触的方式获取信息。在这些信息中,视觉信息占70%。

·视觉信息的特点是信息量大,传播速度快,作用距离远,有心理和生理作用,加上大脑的思维和联想,具有很强的判断能力。

·人的视觉十分完善,人眼灵敏度高,鉴别能力强,不仅可以辨别景物,还能辨别人的情绪。

2.图像信息处理是人类视觉延续的重要手段

非可见光成像。如:γ射线、X射线、紫外线、红外线、微波。利用图像处理技术把这些不可见射线所成图像加以处理并转换成可见图像,可对非人类习惯的那些图像源进行加工。

3.图像处理技术对国计民生有重大意义

图像处理技术发展到今天,许多技术已日益趋于成熟,应用也越来越广泛。它渗透到许多领域,如遥感、生物医学、通信、工业、航空航天、军事、安全保卫等。

1.3 数字图像处理的特点

1. 图像信息量大

每个像素的灰度级至少要用6bit(单色图像)来表示,一般采用8bit(彩色图像),高精度的可用12bit或16bit。

一般分辨率的图像像素为256×256、 512×512 256×256×8=64kB 512×512×8=256kB

高分辨率图像像素可达1024×1024、2048×2048

1024×1024×8=1MB 2048×2048×8=4MB

如:X射线照片一般用64到256kB的数据量 一幅遥感图像3240×2340×4≈30Mb

2. 图像处理技术综合性强

一般来说涉及通信技术、计算机技术、电视技术、电子技术,至于涉及到的数学、物理学等方面的基础知识就更多。

3.图像信息理论与通信理论密切相关

图像理论是把通信中的一维问题推广到二维空间上来研究的。

通信研究的是一维时间信息,时间域和频率域的问题。任何一个随时间变化的波形都是由许多频率不同、振幅不同的正弦波组合而成的。

图像研究的是二维空间信息,研究的是空间域和空间频率域(或变换域)之间的关系。任何一幅平面图像是由许多频率、振幅不同的X-Y方向的空间频率波相叠加而成。

1.4 数字图像处理的主要方法

1.空域法

把图像看作是平面中各个像素组成的集合,然后直接对这一二维函数进行相应的处理。主要有两大类:

· 域处理法:包括梯度运算,拉普拉斯算子运算,平滑算子运算和卷积运算。

· 点处理法:包括灰度处理,面积、周长、体积、重心运算等等。

2.变换域法

数字图像处理的变换域处理方法是首先对图像进行正交变换,然后在施行各种处理,处理后再反变换到空间域,得到处理结果。 包括滤波、数据压缩、特征提取等处理。

1.5 数字图像处理的主要内容

完整的数字图像处理系统大体上可分为如下几个方面:

1.图像的信息的获取(Image information acquisition)

把一幅图像转换成适合输入计算机和数字设备的数字信号。需要两个部件以获取数字图像:

(1)物理设备,该设备对我们希望成像的物体发射的能量很敏感。

(2)数字化器,是一种把物理感知装置的输出转化为数字形式的设备。

常见的图像输入设备有:扫描仪、摄像机、数码相机、图像采集卡等

2.图像信息的存储(Image information storage)

主要有三类:

(1)处理过程中使用的快速存储器;

·计算机内存。

·帧缓存,通常可存储多幅图像并可以视频速度读取。它可以允许对图像进行放大、缩小,以及垂直翻转和水平翻转。

(2)用于比较快的重新调用的在线或联机存储器;

·磁盘,可存储几个G byte的数据;

·磁光存储器,可在51/4英寸的光片上存储上G byte的数据;

·光盘塔,一个光盘塔可放几十个到几百个光盘,利用机械装置插入或从光盘驱动器中抽取光盘。

(3)不经常使用的数据库(档案库)存储器。

·磁带。长13英尺的磁带可存储近1G byte的数据,但储藏寿命较短。

·一次写多次读(WORM)光盘。可在12英寸的光盘上存储6G byte数据,在14英寸的光盘上存储10G byte数据,并易于储藏。

3.图像信息的传送(Image information transmission)

可分为系统内部传送与远距离传送:

(1)内部传送:

指在不同设备间交换图像数据。现在有许多用于局域通信的软件和硬件以及各种标准协议。多采用DMA(Direct Memory Access)技术以解决速度问题。

(2)外部远距离传送:

主要问题是图像数据量大而传输通道比较窄。

这一状况由于光纤和其他宽带技术的发展,正在迅速得到改进。另一方面,解决这个问题需要依靠对图像数据压缩。

4.图像的输出与显示

图像处理的最终目的是为人或机器提供一幅更便于解释和识别的图像。因此图像的输出也是图像处理的重要内容之一。

主要分两类:(1)硬拷贝(记录图像)。如激光打印机、胶片照相机、热敏装置、喷墨装置和数字单元(如CD-ROM)等。

(2)软拷贝。如CRT (Cathode Ray Tube)显示、液晶显示器(LCD)、场致发光显示(FED)。

5.数字图像处理(Digital image processing)

主要包括以下几项内容:

(1)几何处理(Geometrical Image Processing)

主要包括坐标变换,图像的放大、缩小、旋转、移动,多个图像配准,全景畸变校正,扭曲校正,周长、面积、体积计算等。

(2)算术处理(Arithmetic Processing)

主要对图像施以+、-、×、÷等运算,虽然该处理主要针对像素点的处理,但非常有用,如医学图像的减影处理就有显著的效果。

(3)图像增强(Image Enhancement)

就是突出图像中感兴趣的信息,而减弱或去除不需要的信息,从而使有用信息得到加强。

·改善图像的视觉效果,提高图像成分的清晰度;

·使图像变得更有利于计算机处理,便于进一步进行区分或解释。

(4)图像复原(或恢复)(Image Restoration)

就是尽可能地减少或者去除图像在获取过程中的降质(干扰和模糊),恢复被退化图像的本来面貌,从而改善图像质量。

关键是对每种退化(图像品质下降)建立一个合理的模型。

(5)图像重建(Image Reconstruction)

是从数据到图像的处理。即输入的是某种数据,而处理结果得到的是图像。典型应用有CT技术和三维重建技术。

(6)图像编码(Image Encoding)

主要是利用图像信号的统计特性及人类视觉的生理学及心理学特征对图像信号进行高效编码,其目的是压缩数据量,以解决数据量大的矛盾。

(7)图像识别(Image Recognition)

利用计算机识别出图像中的目标并分类、用机器的智能代替人的智能。它所研究的领域十分广泛,如,机械加工中零部件的识别、分类;从遥感图片中分辨农作物、森林、湖泊和军事设施;从气象观测数据或气象卫星照片准确预报天气;从X光照片判断是否发生肿瘤;从心电图的波形判断被检查者是否患有心脏病;在交通中心实现交通管制、识别违章行驶的汽车及司机,等等。

1.6 数字图像处理的起源与应用

数字图像处理的起源:

最早可追溯到20世纪20年代,借助打印设备进行数字图像的处理。

基于光学还原的技术,该技术在电报接收端用穿孔纸带打出图片。

到1929年由早期的用5个灰度等级对图像编码,增加到15个等级。

真正数字图像处理技术的诞生可追溯到20世纪60年代早期。

数字图像处理技术在20世纪60年代末和20世纪70年代初开始用于医学图像、地球遥感监测和天文学等领域。

数字图像处理主要应用于下面的几个领域:

(1) 通讯

按业务性能划分可分为:电视广播传真、可视电话、会议电视、图文电视、可视图文以及电缆电视。

按图像变化性质分可分为:静止图像和活动图像通信。

(2) 遥感

航空遥感和卫星遥感图像都需要数字图像处理技术的加工处理,并提取出有用的信息。主要用于土地测绘,资源调查,气候监测,农作物估产,自然灾害预测预报,环境污染监测,气象卫星云图处理以及地面军事目标的识别。

(3) 生物医学领域中的应用

计算机图像处理在医学上应用最成功的例子就X射线CT(X-ray Computed Tomography),20世纪70年代发明的计算机轴向断层术(CAT),简称计算机断层。

(4) 工业生产中的应用

从70年代起得到了迅速的发展,图像处理技术的重要应用领域。在生产线中对产品及部件进行无损检测,如食品、水果质量检查,无损探伤,焊缝质量或表面缺陷 等等。

(5) 军事、 公安等方面的应用

军事目标的侦察、制导和警戒系统、自动灭火器的控制及反伪装;公安部门的现场照片、指纹、手迹、人像等的处理和辨识;历史文字和图片档案的修复和管理等。

(6) 教学和科研领域

如科学可视化技术,远程培训及教学也将大量使用图像处理技术的成果。

(7) 电子商务

如身份认证、产品防伪、水印技术等。

1.7 数字图像处理领域的发展动向

需进一步研究的问题:

(1)在进一步提高精度的同时着重解决处理速度问题。

(2)加强软件研究、开发新的处理方法。

(3)加强边缘学科的研究工作,促进图像处理技术的发展。

(4)加强理论研究,逐步形成图像处理科学自身的理论体系。

(5)图像处理领域的标准化。

未来发展动向大致可归纳为:

(1)图像处理的发展将围绕HDTV的研制,开展实时图像处理的理论及技术研究,向着高速、高分辨率、立体化、多媒体化、智能化和标准化方向发展。

(2)图像、图形相结合,朝着三维成像或多维成像的方向发展。

(3)硬件芯片研究。

(4)新理论与新算法研究。

2-1. 数字数据传输通常用波特率度量,其定义为每秒中传输的比特数。通常的传输是以一个开始比特、一个字节(8比特)的信息和一个停止比特组成的包完成的。基于这个概念回答下列问题:

(a)用56K波特的调制解调器传输一幅1024×1024、256级灰度的图像要花费几分钟?

(b)以750K波特[是典型的电话DSL(数字用户线)连接的速度]传输要用多少时间?

解:(a)传输数据包(包括起始比特和终止比特)为:N=n+m=10bits

对于一幅1024×1024 大小的图像,其总的数据量为M=(1024)2×N,

故以56K 波特的速率传输所需时间为T=M/56000=(1024)2×(8+2)/56000=187.25s=3.1min

(b) 以750K 波特的速率传输所需时间为T=M/56000=(1024)2×(8+2)/750000=14s

(类似题目) 在串行通信中,常用波特率描述传输的速率,它被定义为每秒传输的数据比特数。串行通信中,数据传输的单位是帧,也称字符。假如一帧数据由一个起始比特位、8 个信息比特位和一个结束比特位构成。根据以上概念,请问:

(1)如果要利用一个波特率为56kbps(1k=1000)的信道来传输一幅大小为1024×1024、256级灰度的数字图像需要多长时间?

(2)如果是用波特率为750kbps 的信道来传输上述图像,所需时间又是多少?

(3)如果要传输的图像是512×512的真彩色图像(颜色数目是32 bit),则分别在上面两种信道下传输,各需要多长时间?

解答:

(1)传输的比特数为1024×1024×8×(1+8+1)/8=10485760,则在波特率为56kbps 的信道上传输时,所需时间为10485760/56000=187.25 秒。

(2)传输的比特数为1024×1024×8×(1+8+1)/8=10485760,则在波特率为750kbps 的信道上传输时,所需时间为10485760/750000=13.98 秒=14s。

(3)传输的比特数为512×512×32×(1+8+1)/8=10485760。在波特率为56kbps 的信道上传输时,所需时间为10485760/56000=187.25 秒;在波特率为750kbps 的信道上传输时,所需时间为10485760/750000=13.98 秒。

2.11 两个图像子集S1和S2图下图所示。对于V={1},确定这两个子集是(a)4-邻接,(b)8-邻接,还是(c)m邻接的?

解a) S1 和S2 不是4 连接,因为q 不在N4(p)集中。

(b) S1 和S2 是8 连接,因为q 在N8(p)集中。

(c) S1 和S2 是m 连接,因为q 在集合ND(p)中,且N4(p)∩ N4(q)没有V 值的像素

2-3.考虑如下所示的图像分割:

(a)令V={0,1}并计算p和q间的4,8,m通路的最短长度。如果在这两点间不存在特殊通路,其解释原因。

(b)对V={1,2}重复上题。

解: (1) 在V={0,1}时,p和q之间通路的D4距离为∞,D8距离为4,Dm距离为5。

(2) 在V={1,2}时,p和q之间通路的D4距离为6,D8距离为4,Dm距离为6。

解:(a) 当V={0,1}时,p 和q 之间不存在4 邻接路径,因为不同时存在从p 到q 像素的4 毗邻像素和具备V 的值,情况如图(a)所示。p 不能到达q。8 邻接最短路径如图(b)所示,其最短长度为4。m邻接路径如图(b)虚线箭头所示,最短长度为5。这两种最短长度路径在此例中均具有唯一性。

(b) 当V={1, 2}时,最短的4 邻接通路的一种情况如图(c)所示,其长度为6,另一种情况,其长度也为6;8 邻接通路的一种情况如图(d)实线箭头所示,其最短长度为4;m 邻接通路的一种情况如图(d)虚线箭头所示,其最短长度为6.

3.6试解释为什么离散直方图均衡技术一般不能得到平坦的直方图?

答:(翻译答案)所有均衡直方图是大规模的映射组件。获得一个统一的直方图要求对像素强度进行重新分配,这样使n/L像素组具有相同的强度,L是离散的强度水平。n=MN是输入图像的总像素。直方图均衡方法没有规定这类(人工)强度的再分配过程。

(百度答案:)由于离散图像的直方图也是离散的,其灰度累积分布函数是一个不减的阶梯函数。如果映射后的图像仍然能取到所有灰度级,则不发生任何变化。如果映射的灰度级小于256,变换后的直方图会有某些灰度级空缺。即调整后灰度级的概率基本不能取得相同的值,故产生的直方图不完全平坦。

 

问题3.21

分别应用n=23、25和45的方形均值掩膜处理下面一幅图像。结果发现当n=23、45时,处理后图像中左下角的垂直竖条被模糊了,但是竖条与竖条之间的分割仍然很清楚。当n=25时,竖条却已经融入了整幅图像,尽管产生这幅图像的掩膜比45小得多,请解释这一现象。

注:垂直线段是5个像素宽,100个像素高;它们的间隔是20个像素。

3.22 以下的三幅图像是分别通过n=23,25和45的方形均值掩模处理后的模糊图像。图(a)和(c)中左下角的垂直竖条被模糊了,但竖条与竖条之间的分割仍然很清楚。但图(b)中的竖条却已经融人了整幅图像,尽管产生这幅图像的掩模要比处理图像(c)的小得多,请解释这一现象。

解:从图可知,垂直线有5个像素宽,100像素高,他们的间隔是20像素。问题是相关的现象与水平之间的间隔线有关,所以我们可以简化问题,考虑一个单一的扫描行通过线的图像。回答这个问题的关键在于实际之间的距离(无像素)开始的线条,下一个(其右面)是25个像素。考虑扫描线,如图,同样显示是一个断面25 x25掩膜。掩膜反应包括的像素是平均的。我们注意到,当一个像素掩膜移动右面,它失去了左边竖线的价值,可是它捡起一个相同的一个在右边,所以反应不会改变。

事实上,多少像素属于垂直线和包含在掩膜并不会改变,无论在掩膜的任何地方(只要是包含在线内,而不是在边缘附近线)。这一事实的线像素数量低于掩膜并不会改变是由于特有的线条和分隔线之间的宽度的相当于25像素。这个常数宽度的反应是没有看到白色的差距在问题的声明中图像显示的理由。注意这个常数不发生在23 x23或45 x45的掩膜,因为他们不是同步与线条宽度和将它们分开的距离。

补充注意:在这张图中还有明显的边界现象。这是因为为了使处理后图像大小不变,在原始图像的边缘以外补0,经处理后再去除添加区域的结果。而且滤波器越大边界越宽。

结论:空间均值处理是为得到感兴趣物体的一个粗略的描述而模糊一幅图像。较小物体与背景混合在一起,较大物体变得像“斑点”而易于检测。而模板的大小由那些将融入背景中去的物体的尺寸决定。

Problem 5.18 6-2.

设一幅图像的模糊是由于物体在x方向的匀加速运动产生的。当t=0时物体静止,在t=0到t=T间物体加速度是x0(t)=at2/2,求转移函数H(u,v)。讨论匀速运动和匀加速运动所造成的模糊的不同特点。

Problem 5.22 6-1.

成像时由于长时间曝光受到大气干扰而产生的图像模糊可以用转移函数H(u,v)=exp[-(u2+v2)/2σ2]表示。这噪声可忽略,求恢复这类模糊的维纳滤波器的方程。

噪声可忽略时,维纳滤波器退化成理想的逆滤波器,所以

答:这是一个简单的插件问题。其目的是熟悉各种维纳滤波器

问题5.27 6-3.

一位考古学家在作流通货币方面的研究。最近发现,有4个罗马帝国时期的罗马硬币对它的研究可以起到决定性作用。它们被列在伦敦大英博物馆的馆藏目录中,遗憾的是,他到达那里之后,被告知现在硬币已经被盗了,但博物馆保存了一些照片。只是由于摄取照片时照相机的散焦,硬币的照片是模糊的,无法看清上面小的标记。

已知用来拍摄图像的原照相机一直能用,另外馆内还有同一时期的其他硬币。你能否帮助教授恢复图像,使他能看清这些标记?请给出解决这一问题的过程。

这个问题背后的基本思想是使用相机和代表硬币反应动力学的降解过程,利用这个结果对其进行逆滤波器操作。主要步骤如下:

1。选择和丢失的硬币大小和内容尽可能接近的硬币。选择与丢失的硬币照片有接近的纹理和亮度的背景

2. 建立摄影相机几何图像库尽可能的接近类似丢失的硬币的图像。获得一些测试的照片。简化实验,获得能够给出类似测试图片图像的电视相机。这可以通过相机与图像处理系统从而生成将在实验中应用的数字图像。

3。获得每一个硬币的图像有不同的镜头设置。由此产生的图像的角度,大小(这个与背景区域有关)方面与丢失的硬币的模糊照片接近。

4.在第三步中为每一个图像的镜头设置是对丢失的硬币信息图像模糊处理的模型。每个这样的设置,移动硬币及其背景并用一个规定背景下的小亮点来替代它,或者用另外的机制时期接近于一个光脉冲。数字话这个脉冲。这是模糊处理的变换功能叫傅里叶变换。

5.数字化丢失硬币的模糊照片得到它的傅里叶变换形式。每个硬币有函数H(u,v)和G(u,v)描述。

6.用维纳滤波器得到一个近似的F(u,v)。

7.对每个*F(u,v)进行傅里叶反变换可以得出硬币的恢复图像。通常这样的基本步骤都可以用来解决这样的问题。

 

6.18 证明彩色图像的补色的饱和度分量不能单独地由输入图像的饱和度分量计算出来。

我们看到,最基本的问题是许多不同的颜色有相同的饱和度值。在那里纯红、黄、绿、青色、蓝色,洋红都有一个饱和1。也就是说只要任何一个RGB组件是0,将产生一个饱和1。

考虑RGB颜色(1,0,0)和(0,0.59,0),其代表红色和绿色的映射。HSI颜色值分别为 (0,1,0.33)和(0.33 ,1,0.2)。现在RGB的初始补充值分别为(0、1,1)和(1,0.41,1),相应的颜色是青和洋红。他们的HSI值分别为(0.5, 1,0.66)和(0.83,0.48,0.8)。因此为红色,一个起始饱和度1取得的青色“补充”饱和度1,而为绿色,一个起始饱和度1取得洋红“互补”饱和度0.48。也就是说,起始同样的饱和度值导致两个不同的“互补”饱和度。饱和本身并不是足够的信息计算饱和度补充颜色。

6.22 假定一个成像系统的监视器和打印机没有完美校准。在该监视器上看起来平衡的一幅图像打印时出现了青色。描述可矫正这种不平衡的通用变换。

答:我们就可以通过如下几种方法减少黄色的比例(1)减少黄色、(2)增加蓝色、(3)增加青色和洋红、(4)减少红色和绿色

11.1(a)重新定义链码的一个起始点,以便所得的数字序列形成一个最小整数值。请证明该编码与边界上的初始起点无关

数字图像一般是按固定间距的网格采集的,所以最简单的链码是顺时针跟踪边界并赋给每两个相邻像素的连线一个方向值。问题的关键是要认识到, 在一个链码中每个元素值是相对于它的前身的值。这个代码的边界,追踪在一个一致的方式(例如,顺时针),是一种独特的循环组编号。在不同的地点开始在这个设定不改变循环序列的结构。选择的最小整数的函数为出发点仅仅识别中同一点序列。即使出发点并非是独一无二的,该方法仍然会给一个独特的序列。例如,101010年有3个不同的序列的起点,但他们都产生相同的最小整数010101。

(b)求出链码0101030303323232212111的一阶差分

答: 3131331313031313031300

4. 求下图中目标的形状数和形状数的阶。

 

链码: 110003301232

微分码 303003011113

形状数 003011113303

阶 12

2. 为什么一般情况下对离散图像的直方图均衡化并不能产生完全平坦的直方图?【因为同一个灰度值的各个象素没有理由变换到不同灰度级,所以数字图像的直方图均衡化的结果一般不能得到完全均匀分布的直方图,只是近似均匀的直方图。】

3. 设已用直方图均衡化技术对一幅数字图像进行了增强,如再用这一方法对所得结果增强会不会改变其结果?【从原理上分析,直方图均衡化所用的变换函数为原始直方图的累积直方图,均衡化后得到的增强图像的累积直方图除有些项合并外,其余项与原始图像的累积直方图相同。如果再次均衡化,所用的变换函数即为均衡化后得到的增强图像的累积直方图(并且不会有新的合并项),所以不会改变其结果。】

4. 设工业检测中工件的图像受到零均值不相关噪声的影响。如果图像采集装置每秒可采集30幅图像,要采用图像平均法将噪声的均方差减少到1/10,那么工件需保持多长时间固定在采集装置前?

小结

傅立叶变换(FFT) 具有快速算法,数字图象处理中最常用。需要复数运算。可把整幅图象的信息很好地用若干个系数来表达。

余弦变换(DCT) 有快速算法,只要求实数运算。在相关性图象的处理中,最接近最佳的K-L变换,在实现编码和维纳滤波时有用。同DFT一样,可实现很好的信息压缩。

沃尔什-哈达玛变换(WHT) 在数字图象处理的硬件实现时有用。容易模拟但很难分析。在图象数据压缩、滤波、编码中有应用。信息压缩效果好。

Haar变换 非常快速的一种变换。在特征抽取、图像编码、图像分析中有用。信息压缩效果平平。

Slant变换 一种快速变换。图像编码中有用,有很好的信息压缩功能。

K-L变换(KLT) 在许多意义下是最佳的。无快速算法。在进行性能评估和寻找最佳性能时有用。对小规模的向量有用,如彩色多谱或其他特征向量。对一组图像集而言,具有均方差意义下最佳的信息压缩效果。

奇异值分解(SVD) 对任何一幅给定的图像而言,具有最佳的信息压缩效果。无快速算法。设计有限冲激响应(FIR)滤波器时,寻找线性方程的最小范数解时有用。潜在的应用是图像恢复,能量估计和数据压缩。

5-1. 有一种常见的图像增强技术是将高频增强和直方图均衡化结合起来以达到使边缘锐化的反差增强效果,以上两个操作的先后次序对增强效果有影响吗,为什么?【有,高频增强是一种线性操作,但直方图均衡化是一种非线性操作,所以两个操作的先后次序对增强效果有影响,不能互换。】

5-2. 在天体研究所获得图像中有一些相距很远的对应恒星的亮点。由于大气散射原因而迭加的照度常使得这些亮点很难看清楚。如果将这类图像模型化为恒定亮度的背景和一组脉冲的乘积,根据同态滤波的概念设计一种增强方法将对应恒星的亮点提取出来。

【恒定亮度的背景对应低频成分,脉冲则对应高频成分,所以对乘积取对数可将两种成分区别开分别处理。根据同态滤波的概念可设计减少低频成分,增加高频成分的滤波器。】

19为什么伪彩色处理可以达到增强的效果呢?

由于人眼对彩色的分辨能力远远大于对黑白灰度的分辨率。对于一般的观察者来说。通常能分辨十几级灰度,就是经专业训练的人员也只能分辨几十级灰度。而对于彩色来说,人的眼睛可分辨出上千种彩色的色调和强度。因此,在一幅黑白图像中检测不到的信息,经伪彩色增强后可较容易的被检测出来。

13如何实现彩色图像灰度直方图匹配(规定化)?