图像处理 框架_图像处理框架 - CSDN
  • https://blog.csdn.net/axi295309066/article/details/56984137
    展开全文
  • 图像处理知识框架

    2018-08-05 14:00:02
    花了点时间整理了一下数字图像处理知识体系,从宏观上把握图像处理,使自己的学习思路就更加清晰。 1.本文大部分内容来自:http://blog.csdn.net/byxdaz/article/details/4375228 2.有些内容待添加,特别是opencv...

    转自https://blog.csdn.net/hitwengqi/article/details/8292675

    花了点时间整理了一下数字图像处理知识体系,从宏观上把握图像处理,使自己的学习思路就更加清晰。
    1.本文大部分内容来自:http://blog.csdn.net/byxdaz/article/details/4375228
    2.有些内容待添加,特别是opencv相关的算法实现。

    目录
    一、数字图像基础… 3
    二、数字图像存储与显示… 3
    三、图像变换… 4
    1.卷积… 4
    2.梯度和Sobel导数… 5
    3.拉普拉斯变换… 5
    4.Canny算子… 5
    5.霍夫变换… 5
    6.重映射… 5
    7.几何操作:拉伸、收缩、扭曲和旋转… 5
    8.离散傅里叶变换(DFT)… 5
    9.离散余弦变换(DCT)… 5
    四、形态学图像处理… 5
    1.平滑处理… 5
    2.膨胀与腐蚀… 5
    3.开操作与闭操作… 5
    4.漫水填充算法… 5
    5.尺寸调整… 5
    6.图像金字塔… 6
    7.阈值化… 6
    五、图像边缘检测… 6
    六、图像增强和复原… 8
    1.图像增强… 8
    (1)空间域增强处理… 8
    (2)频率域增强处理… 9
    2.图像复原… 11
    七、图像压缩… 11
    八、图像分割… 12
    九、图像特征提取与匹配… 13
    十、图像分类(识别)… 15

    数字图像处理[wq1] 是对图像进行分析、加工、和处理,使其满足视觉、心理以及其他要求的技术。图像处理是信号处理在图像域上的一个应用。目前大多数的图像是以数字形式存储,因而图像处理很多情况下指数字图像处理。此外,基于光学理论的处理方法依然占有重要的地位。 数字图像处理是信号处理的子类, 另外与计算机科学、人工智能等领域也有密切的关系。 传统的一维信号处理的方法和概念很多仍然可以直接应用在图像处理上,比如降噪、量化等。然而,图像属于二维信号,和一维信号相比,它有自己特殊的一面,处理的方式和角度也有所不同。大多数用于一维信号处理的概念都有其在二维图像信号领域的延伸,它们中的一部分在二维情形下变得十分复杂。同时图像处理也具有自身一些新的概念,例如,连通性、旋转不变性,等等。这些概念仅对二维或更高维的情况下才有非平凡的意义。图像处理中常用到快速傅立叶变换,因为它可以减小数据处理量和处理时间。
    数字图像处理应用在以下方面 :
    摄影及印刷 (Photography and printing)
    卫星图像处理 (Satellite imageprocessing)
    医学图像处理 (Medical image processing)
    面孔识别, 特征识别 (Face detection,feature detection, face identification)
    显微图像处理 (Microscope imageprocessing)
    汽车障碍识别 (Car barrier detection)
    一、数字图像基础
    图像的基本概念、图像取样和量化、数字图像表示、空间和灰度级分辨率、图像纹理、像素间的一些基本关系(相邻像素、邻接性、连通性、区域和边界、距离度量)[wq2] 、线性和非线性变换操作。[wq3]
    常用色彩空间分类:

    二、数字图像存储与显示
    在计算机中,有两种类型的图:矢量图(vector graphics)和位映象图(bitmappedgraphics)。矢量图是用数学方法描述的一系列点、线、弧和其他几何形状,如图(a)所示。因此存放这种图使用的格式称为矢量图格式,存储的数据主要是绘制图形的数学描述;位映象图(bitmappedgraphics)也称光栅图(raster graphics),这种图就像电视图像一样,由象点组成的,如图(b),因此存放这种图使用的格式称为位映象图格式,经常简称为位图格式,存储的数据是描述像素的数值。

    图像格式目前包括bmp格式、gif格式、jpeg格式、jpeg2000格式、tiff格式、psd格式、Png格式、swf格式、svg格式、pcx格式、dxf格式、wmf格式、emf格式、LIC格式、eps格式、TGA格式等。
    

    目前比较出名的图像处理库有很多,比如LEADTOOLS、OPENCV,LEADTOOLS这个是功能非常强大的图像多媒体库,但是这个是收费注册的。OpenCV 是一个跨平台的中、高层 API 构成,目前包括 300 多个 C 函数。它不依赖与其它的外部库,尽管也可以使用某些外部库。OpenCV 对非商业用途和商业用途都是免费(FREE)的。开源的图像库也有不少,比如:ImageStone、GIMP、CxImage等,虽然它们的功能没有LEADTOOLS强大[wq4] ,但是一般的图像处理是可以应付的。
    三、图像变换
    由于图像阵列很大,直接在空间域[wq5] 中进行处理,涉及计算量很大。因此,往往采用各种图像变换的方法,如傅立叶变换、沃尔什变换、离散余弦变换等间接处理技术,将空间域的处理转换为变换域处理,不仅可减少计算量,而且可获得更有效的处理(如傅立叶变换可在频域中进行数字滤波处理)。目前新兴研究的小波变换在时域和频域中都具有良好的局部化特性,它在图像处理中也有着广泛而有效的应用。
    图像变换,也认为是将一副图像转变成图像数据。
    1. 卷积

    1. 梯度和Sobel导数[wq6]

    2. 拉普拉斯变换[wq7]

    3. Canny算子

    4. 霍夫变换

    5. 重映射

    6. 几何操作:拉伸、收缩、扭曲和旋转[wq8]

    7. 离散傅里叶变换(DFT)

    8. 离散余弦变换(DCT)

    四、形态学图像处理
    1. 平滑处理

    1. 膨胀与腐蚀

    2. 开操作与闭操作

    3. 漫水填充算法

    4. 尺寸调整

    5. 图像金字塔

    6. 阈值化

    五、图像边缘检测
    数字图像的边缘检测是图像分割、目标区域的识别、区域形状提取等图像分析领域十分重要的基础,图像理解和分析的第一步往往就是边缘检测,目前它以成为机器视觉研究领域最活跃的课题之一,在工程应用中占有十分重要的地位。所谓边缘就是指图像局部亮度变化最显著的部分,它是检测图像局部变化显著变化的最基本的运算。边缘的记录有链码表和线段表2种,链码表适合计算周长,线段表容易计算面积以及相关的,他们之间可以相互的转换。
    迄今为止,已经出现了许多成熟的算法。例如微分算法,掩模算法等。在微分算法中,常使用N*N的像素块,例如3*3或者4*4。3*3的像素块如下,
    f(i-1,j-1) f(i-1,j) f(i-1,j+1)
    f(i,j-1) f(i,j) f(i,j+1)
    f(i+1,j-1) f(i+1,j) f(i+1,j+1)
    我们不妨设f(i,j)为待处理的像素,而g(i, j)为处理后的像素。
    常见的边缘检测算法:
    A. Roberts边缘算子
    g(i, j) = sqrt( (f(i, j) - f(i + 1, j))^2 + (f(i + 1, j) - f(i, j +1))^2 )
    或者
    g(i, j) = |f(i,j) - f(i + 1,j)| + |f(i+1,j) - f(i,j+1)|
    B. Sobel边缘算子
    对数字图像的每一个像素f(i,j),考察它的上、下、左、右邻域灰度的加权值,把各方向上(0度、45度、90度、135度)的灰度值加权之和作为输出,可以达到提取图像边缘的效果。
    即 g(i,j) = fxr + fyr, 其中
    fxr = f(i-1,j-1)+2*f(i-1,j)+f(i-1,j+1)-f(i+1,j-1)-2*f(i+1,j)-f(i+1,j+1)
    fyr = f(i-1,j-1)+2*f(i,j-1)+f(i+1,j-1)-f(i-1,j+1)-2*f(i,j+1)-f(i+1,j+1)
    C. Laplace算子
    Laplace算子是一种二阶微分算子。它有两种形式:4邻域微分算子和8邻域微分算子。
    ⊙ 4邻域微分
    g(i,j)=|4*f(i,j)-f(i,j-1)-f(i-1,j)-f(i+1,j)-f(i,j+1)|
    ⊙ 8邻域微分
    g(i,j)=|8*f(i,j)-f(i,j-1)-f(i-1,j)-f(i+1,j)-f(i,j+1)-f(i-1,j-1)-f(i-1,j+1)-f(i+1,j-1)-f(i+1,j+1)|
    D. Prewitt边缘算子
    prewitt算子是一个边缘模板算子,由八个方向的样板组成,能够在0度,45度,90度,135度,180度,225度角
    等八个方向检测边缘。8个3*3边缘模板及方向如下:
    90度角: 45度角:
    1 1 1 -1 -1 -1
    1 -2 1 1 -2 1
    -1 -1 -1 1 1 1
    0度角: 315度角:
    -1 1 1 1 1 -1
    -1 -2 1 1 -2 -1
    -1 1 1 1 1 -1
    270度角: 225度角:
    1 1 1 -1 -1 1
    -1 -2 1 -1 -2 1
    -1 -1 1 1 1 1
    180度角: 135度角:
    1 1 1 1 -1 -1
    1 -2 -1 1 -2 -1
    1 -1 -1 1 1 1
    3*3时表达式如下:
    A1*f(i-1,j-1) A8*f(i,j-1) A7*f(i+1,j-1)
    A2*f(i-1,j) -2*f(i,j) A6*f(i+1, j)
    A3*f(i-1,j+1) A4*f(i,j+1) A5*f(i+1,j+1)
    g(i,j)=|-2*f(i,j)+A8*f(i,j-1)+A1*f(i-1,j-1)+A2*f(i-1,j)+A3*f(i-1,j+1)+A4*f(i,j+1)+A5*f(i+1,j+1)+A6*f(i+1,j)+A7*f(i+1,j-1)|
    在程序设计中,依次用样板去检测图像,与被检测区域最为相似的样板给出最大值,用该最大值作为算子的输出值。
    E.Kirsch边缘算子
    Kirsch算子是一个模板算子,由八个方向的边缘样板组成,能够在0度,45度,90度,135度,180度,225度角
    等八个方向检测边缘。8个3*3边缘模板及方向如下:
    90度角: 45度角:
    5 5 5 -3 5 5
    -3 0 -3 -3 0 5
    -3 -3 -3 -3 -3 -3
    0度角: 315度角:
    -3 -3 5 -3 -3 -3
    -3 0 5 -3 0 5
    -3 -3 5 -3 5 5
    270度角: 225度角:
    5 5 -3 -3 -3 -3
    5 0 -3 5 0 -3
    -3 -3 -3 5 5 -3
    180度角: 135度角:
    5 -3 -3 5 5 -3
    5 0 -3 5 0 -3
    5 -3 -3 -3 -3 3
    使用方法与prewitt算子一样。
    F.CANNY边缘检测
    六、图像增强和复原
    图像增强和复原的目的是为了提高图像的质量,如去除噪声,提高图像的清晰度等。图像增强不考虑图像降质的原因,突出图像中所感兴趣的部分。如强化图像高频分量,可使图像中物体轮廓清晰,细节明显;如强化低频分量可减少图像中噪声影响。图像复原要求对图像降质的原因有一定的了解,一般讲应根据降质过程建立“降质模型”,再采用某种滤波方法,恢复或重建原来的图像。
    1. 图像增强
    图像增强的目的在于改善图像的显示质量,以利于信息的提取和识别。从方法上说,则是设法摒弃一些认为不必要或干扰的信息,而将所需要的信息得以突出出来,以利于分析判读或作进一步的处理。
    (1) 空间域增强处理
    空间域是指图像平面所在的二维空间,空间域图像增强是指在图像平面上应用某种数学模型,通过改变图像像元灰度值达到增强效果,这种增强并不改变像元的位置。空域增强包括空域变换增强与空域滤波增强两种。空域变换增强是基于点处理的增强方法、空域滤波增强是基于邻域处理的增强方法。
    1) 空域变换增强
    常用的空域变换增强方法包括:对比度增强、直方图增强和图像算术运算等。
    A.对比度增强
    对比度增强是一种通过改变图像像元的亮度分布态势,扩展灰度分布区间来改变图像像元对比度,从而改善图像质量的图像处理方法。因为亮度值是辐射强度的反映,所以也称为辐射增强。常用的方法有对比度线性变换和非线性变换。其关键是寻找到一个函数,以此函数对图像中每一个像元进行变换,使像元得到统一的重新分配,构成得到反差增强的图像。
    B.直方图增强
    直方图均衡化:
    直方图均衡化基本做法是将每个灰度区间等概率分布代替了原来的随机分布,即增强后的图象中每一灰度级的像元数目大致相同。直方图均衡化可使得面积最大的地物细节得以增强,而面积小的地物与其灰度接近的地物进行合并,形成综合地物。减少灰度等级换取对比度的增大。
    直方图归一化:
    直方图归一化是把原图像的直方图变换为某种指定形态的直方图或某一参考图像的直方图,然后按着已知的指定形态的直方图调整原图像各像元的灰级,最后得到一个直方图匹配的图像。这种方法主要应用在有一幅很好的图像作为标准的情况下,对另一幅不满意的图像用标准图像的直方图进行匹配处理,以改善被处理图像的质量。如在数字镶嵌时,重叠区影像色调由于时相等原因差异往往很大,利用直方图匹配这一方法后可以改善重叠区影像色调过度,如果镶嵌图像时相相差不大,完全可以作到无缝镶嵌。
    C.数字图像的算术运算
    两幅或多幅单波段影像,完成空间配准后,通过一系列运算,可以实现图像增强,达到提取某些信息或去掉某些不必要信息的目的。
    2) 空域滤波增强
    空域变换增强是按像元逐点运算的,从整体上改善图像的质量,并不考虑周围像元影响。空间滤波增强则是以重点突出图像上的某些特征为目的的(如突出边缘或纹理等),通过像元与周围相邻像元的关系,采取空间域中的邻域处理方法进行图像增强。邻域法处理用于去噪声、图像平滑、锐化和相关运算。
    图像卷积运算是在空间域上对图像作局部检测的运算,以实现平滑和锐化的目的。具体作法是选定一卷积函数,又称为“M×N窗口”或“模板”,如3×3或5×5等。然后从图像左上角开始开一与模板同样大小的活动窗口,图像窗口与模板像元的亮度值对应相乘再相加。将计算结果赋予中心像元作为其灰度值,然后待移动后重新计算,将计算结果赋予另一个中心像元,以此类推直到全幅图像扫描一遍结束生成新的图像。
    平滑是指图像中出现某些亮度变化过大的区域,或出现不该有的亮点(“噪声”)时,采用平滑方法可以减小变化,使亮度平缓或去掉不必要“噪声”点。它实际上是使图像中高频成分消退,即平滑图像的细节,降低其反差,保存低频成分,在频域中称为低通滤波。具体方法有:均值平滑、中值滤波、锐化。
    锐化的作用在于提高边缘灰度值的变化率,使界线更加清晰。它是增强图像中的高频成分,在频域处理中称为高通滤波,也就是使图像细节的反差提高,也称边缘增强。要突出图像的边缘、线状目标或亮度变化率大的部分常采用锐化方法。一般有三种实现方法:
    A.梯度法
    梯度反映了相邻像元的亮度变化率,即图像中如果存在边缘,如湖泊、河流的边界,山脉和道路等,则边缘处有较大的梯度值。对于亮度值较平滑的部分,亮度梯度值较小。因此,找到梯度较大的位置,也就找到边缘,然后再用不同的梯度计算值代替边缘处像元的值,也就突出了边缘,实现了图像的锐化。通常有罗伯特梯度和索伯尔梯度方法。
    B.拉普拉斯算法
    拉普拉斯算法的意义与梯度法不同,它不检测均匀的亮度变化,而是检测变化率的变化率,相当于二阶微分。计算出的图像更加突出亮度值突变的位置。
    C.定向检测
    当有目的地检测某一方向的边、线或纹理特征时,可选择特定的模板卷积运算作定向检测。可以检测垂直边界、水平边界和对角线边界等,各使用的模板不同。
    (2) 频率域增强处理
    频域增强指在图像的频率域内,对图像的变换系数(频率成分)直接进行运算,然后通过Fourier逆变换以获得图像的增强效果。一般来说,图像的边缘和噪声对应Fourier变换中的高频部分,所以低通滤波能够平滑图像、去除噪声。图像灰度发生聚变的部分与频谱的高频分量对应,所以采用高频滤波器衰减或抑制低频分量,能够对图像进行锐化处理。频域,就是由图像f(x,y)的二维傅立叶变换和相应的频率变量(u,v)的值所组成的空间。在空间域图像强度的变化模式(或规律)可以直接在该空间得到反应。F(0,0)是频域中的原点,反应图像的平均灰度级,即图像中的直流成分;低频反映图像灰度发生缓慢变化的部分;而高频对应图像中灰度发生更快速变化的部分,如边缘、噪声等。但频域不能反应图像的空间信息。

    空域和频域滤波间的对应关系,卷积定理是空域和频域滤波的最基本联系纽带。二维卷积定理:

    基本计算过程:
    取函数h(m,n)关于原点的镜像,得到h(-m,-n)
    对某个(x,y),使h(-m,-n)移动相应的距离,得到h(x-m,y-n)
    对积函数f(m,n)h(x-m,y-n)在(m,n)的取值范围内求和
    位移是整数增量,对所有的(x,y)重复上面的过程,直到两个函数:f(m,n)和h(x-m,y-n)不再有重叠的部分。
    傅立叶变换是空域和频域的桥梁,关于两个域滤波的傅立叶变换对:

    频域与空域滤波的比较:
    1. 对具有同样大小的空域和频率滤波器:h(x,y), H(u,v),频域计算(由于FFT)往往更有效(尤其是图像尺寸比较大时)。但对在空域中用尺寸较小的模板就能解决的问题,则往往在空域中直接操作。
    2. 频域滤波虽然更直接,但如果可以使用较小的滤波器,还是在空域计算为好。 因为省去了计算傅立叶变换及反变换等步骤。
    3. 由于更多的直观性,频率滤波器设计往往作为空域滤波器设计的向导。
    平滑的频率域滤波器类型:
    1 、理想低通滤波器
    2 、巴特沃思低通滤波器
    3 、高斯低通滤波器
    频率域锐化滤波器类型:
    1 理想高通滤波器
    2 巴特沃思高通滤波器
    3 高斯型高通滤波器
    4 频率域的拉普拉斯算子
    5 钝化模板、高频提升滤波和高频加强滤波
    频率域图像增强处理的过程:

    1. 图像复原
      试图利用退化过程的先验知识,去恢复已被退化图像的本来面目。图像复原[wq9] 的基本思路:先建立退化的数学模型,然后根据该模型对退化图像进行拟合。
      图像复原模型可以用连续数学和离散数学处理,处理项的实现可在空间域卷积,或在频域相乘。
      七、图像压缩
      图像压缩是数据压缩技术在数字图像上的应用,它的目的是减少图像数据中的冗余信息从而用更加高效的格式存储和传输数据。图像压缩可以是有损数据压缩也可以是无损数据压缩。对于如绘制的技术图、图表或者漫画优先使用无损压缩,这是因为有损压缩方法,尤其是在低的位速条件下将会带来压缩失真。如医疗图像或者用于存档的扫描图像等这些有价值的内容的压缩也尽量选择无损压缩方法。有损方法非常适合于自然的图像,例如一些应用中图像的微小损失是可以接受的(有时是无法感知的),这样就可以大幅度地减小位速。编码是压缩技术中最重要的方法,它在图像处理技术中是发展最早且比较成熟的技术。
    2. 无损图像压缩方法
      A.行程长度编码
      B.熵编码法
      C.LZW算法
    3. 有损压缩方法
      A.将色彩空间化减到图像中常用的颜色。所选择的颜色定义在压缩图像头的调色板中,图像中的每个像素都用调色板中颜色索引表示。这种方法可以与 抖动(en:dithering)一起使用以模糊颜色边界。
      B.色度抽样,这利用了人眼对于亮度变化的敏感性远大于颜色变化,这样就可以将图像中的颜色信息减少一半甚至更多。
      C.变换编码,这是最常用的方法。首先使用如离散余弦变换(DCT)或者小波变换这样的傅立叶相关变换,然后进行量化和用熵编码法压缩。
      D.分形压缩(en:Fractal compression)。
      八、图像分割
      图像分割是数字图像处理中的关键技术之一。图像分割是将图像中有意义的特征部分提取出来,其有意义的特征有图像中的边缘、区域等,这是进一步进行图像识别、分析和理解的基础。虽然目前已研究出不少边缘提取、区域分割的方法,但还没有一种普遍适用于各种图像的有效方法。因此,对图像分割的研究还在不断深入之中,是目前图像处理中研究的热点之一。
      通常图像分割的实现方法是,将图像分为“黑”、“白”两类,这两类分别代表了两个不同的对象。
      图像分割方法:阈值分割、区域分割、数学形态学、模式识别方法
      A.阈值分割包括以下几种:
      (1)由直方图灰度分布选择阈值
      (2)双峰法选择阈值
      (3)迭代法选取阈值
      原理如下,很好理解。
      迭代法是基于逼近的思想,其步骤如下:
      1.求出图像的最大灰度值和最小灰度值,分别记为ZMAX和ZMIN,令初始阈值T0=(ZMAX+ZMIN)/2;
      2.根据阈值TK将图象分割为前景和背景,分别求出两者的平均灰度值ZO和ZB;
      3.求出新阈值TK+1=(ZO+ZB)/2;
      4.若TK=TK+1,则所得即为阈值;否则转2,迭代计算。
      (4)大津法选择阈值[wq10]
      大津法是属于最大类间方差法,它是自适应计算单阈值的简单高效方法,或者叫(Otsu)。大津法由大津于1979年提出,对图像Image,记t为前景与背景的分割阈值,前景点数占图像比例为w0,平均灰度为u0;背景点数占图像比例为w1,平均灰度为u1。图像的总平均灰度为:u=w0*u0+w1*u1。从最小灰度值到最大灰度值遍历t,当t使得值g=w0*(u0-u)2+w1*(u1-u)2最大时t即为分割的最佳阈值。对大津法可作如下理解:该式实际上就是类间方差值,阈值t分割出的前景和背景两部分构成了整幅图像,而前景取值u0,概率为 w0,背景取值u1,概率为w1,总均值为u,根据方差的定义即得该式。因方差是灰度分布均匀性的一种度量,方差值越大,说明构成图像的两部分差别越大, 当部分目标错分为背景或部分背景错分为目标都会导致两部分差别变小,因此使类间方差最大的分割意味着错分概率最小。直接应用大津法计算量较大,因此一般采用了等价的公式g=w0*w1*(u0-u1)2。
      (5)由灰度拉伸选择阈值
      大津法是较通用的方法,但是它对两群物体在灰度不明显的情况下会丢失一些整体信息。因此为了解决这种现象采用灰度拉伸的增强大津法。在大津法的思想上增加灰度的级数来增强前两群物体的灰度差。对于原来的灰度级乘上同一个系数,从而扩大了图像灰度的级数。试验结果表明不同的拉伸系数,分割效果差别比较大。
      B.区域的分割
      区域生长、区域分离与合并
      区域生长算法
      C.基于形态学分水岭的分割
      分水岭分割算法
      九、图像特征提取与匹配[wq11]
      常用的图像特征有颜色特征、纹理特征、形状特征、空间关系特征。
      A.颜色特征
      特点:颜色特征是一种全局特征,描述了图像或图像区域所对应的景物的表面性质。一般颜色特征是基于像素点的特征,此时所有属于图像或图像区域的像素都有各自的贡献。由于颜色对图像或图像区域的方向、大小等变化不敏感,所以颜色特征不能很好地捕捉图像中对象的局部特征。
      常用的特征提取与匹配方法:
      颜色直方图
      其优点在于:它能简单描述一幅图像中颜色的全局分布,即不同色彩在整幅图像中所占的比例,特别适用于描述那些难以自动分割的图像和不需要考虑物体空间位置的图像。其缺点在于:它无法描述图像中颜色的局部分布及每种色彩所处的空间位置,即无法描述图像中的某一具体的对象或物体。
      颜色直方图特征匹配方法:直方图相交法、距离法、中心距法、参考颜色表法、累加颜色直方图法。
      B.纹理特征
      纹理特征的提取方法比较简单,它是用一个活动的窗口在图像上连续滑动,分别计算出窗口中的方差、均值、最大值、最小值及二者之差和信息熵等,形成相应的纹理图像,当目标的光谱特性比较接近时,纹理特征对于区分目标可以起到积极的作用。选取适当的数据动态变化范围,进行纹理特征提取后,使影像的纹理特征得到突出,有利于提取构造信息。
      特点:纹理特征也是一种全局特征,它也描述了图像或图像区域所对应景物的表面性质。但由于纹理只是一种物体表面的特性,并不能完全反映出物体的本质属性,所以仅仅利用纹理特征是无法获得高层次图像内容的。与颜色特征不同,纹理特征不是基于像素点的特征,它需要在包含多个像素点的区域中进行统计计算。在模式匹配中,这种区域性的特征具有较大的优越性,不会由于局部的偏差而无法匹配成功。作为一种统计特征,纹理特征常具有旋转不变性,并且对于噪声有较强的抵抗能力。但是,纹理特征也有其缺点,一个很明显的缺点是当图像的分辨率变化的时候,所计算出来的纹理可能会有较大偏差。另外,由于有可能受到光照、反射情况的影响,从2-D图像中反映出来的纹理不一定是3-D物体表面真实的纹理。
      常用的特征提取与匹配方法:
      纹理特征描述方法分类
      (1)统计方法统计方法的典型代表是一种称为灰度共生矩阵的纹理特征分析方法Gotlieb 和 Kreyszig 等人在研究共生矩阵中各种统计特征基础上,通过实验,得出灰度共生矩阵的四个关键特征:能量、惯量、熵和相关性。统计方法中另一种典型方法,则是从图像的自相关函数(即图像的能量谱函数)提取纹理特征,即通过对图像的能量谱函数的计算,提取纹理的粗细度及方向性等特征参数
      (2)几何法
      所谓几何法,是建立在纹理基元(基本的纹理元素)理论基础上的一种纹理特征分析方法。纹理基元理论认为,复杂的纹理可以由若干简单的纹理基元以一定的有规律的形式重复排列构成。在几何法中,比较有影响的算法有两种:Voronio 棋盘格特征法和结构法。
      (3)模型法
      模型法以图像的构造模型为基础,采用模型的参数作为纹理特征。典型的方法是随机场模型法,如马尔可夫(Markov)随机场(MRF)模型法和 Gibbs 随机场模型法
      (4)信号处理法
      纹理特征的提取与匹配主要有:灰度共生矩阵、Tamura 纹理特征、自回归纹理模型、小波变换等。灰度共生矩阵特征提取与匹配主要依赖于能量、惯量、熵和相关性四个参数。Tamura 纹理特征基于人类对纹理的视觉感知心理学研究,提出6种属性,即:粗糙度、对比度、方向度、线像度、规整度和粗略度。自回归纹理模型(simultaneousauto-regressive, SAR)是马尔可夫随机场(MRF)模型的一种应用实例。
      C.形状特征
      特点:各种基于形状特征的检索方法都可以比较有效地利用图像中感兴趣的目标来进行检索,但它们也有一些共同的问题。
      常用的特征提取与匹配方法:
      通常情况下,形状特征有两类表示方法,一类是轮廓特征,另一类是区域特征。图像的轮廓特征主要针对物体的外边界,而图像的区域特征则关系到整个形状区域。
      几种典型的形状特征描述方法:
      (1) 边界特征法
      该方法通过对边界特征的描述来获取图像的形状参数。其中Hough 变换检测平行直线方法和边界方向直方图方法是经典方法。Hough 变换是利用图像全局特性而将边缘像素连接起来组成区域封闭边界的一种方法,其基本思想是点—线的对偶性;边界方向直方图法首先微分图像求得图像边缘,然后,做出关于边缘大小和方向的直方图,通常的方法是构造图像灰度梯度方向矩阵。
      (2)傅里叶形状描述符法
      傅里叶形状描述符(Fourier shapedescriptors)基本思想是用物体边界的傅里叶变换作为形状描述,利用区域边界的封闭性和周期性,将二维问题转化为一维问题。由边界点导出三种形状表达,分别是曲率函数、质心距离、复坐标函数。
      (3)几何参数法
      形状的表达和匹配采用更为简单的区域特征描述方法,例如采用有关形状定量测度(如矩、面积、周长等)的形状参数法(shape factor)。在 QBIC 系统中,便是利用圆度、偏心率、主轴方向和代数不变矩等几何参数,进行基于形状特征的图像检索。
      D.空间关系特征
      特点:所谓空间关系,是指图像中分割出来的多个目标之间的相互的空间位置或相对方向关系,这些关系也可分为连接/邻接关系、交叠/重叠关系和包含/包容关系等。通常空间位置信息可以分为两类:相对空间位置信息和绝对空间位置信息。前一种关系强调的是目标之间的相对情况,如上下左右关系等,后一种关系强调的是目标之间的距离大小以及方位。显而易见,由绝对空间位置可推出相对空间位置,但表达相对空间位置信息常比较简单。
      空间关系特征的使用可加强对图像内容的描述区分能力,但空间关系特征常对图像或目标的旋转、反转、尺度变化等比较敏感。另外,实际应用中,仅仅利用空间信息往往是不够的,不能有效准确地表达场景信息。为了检索,除使用空间关系特征外,还需要其它特征来配合。
      常用的特征提取与匹配方法:
      提取图像空间关系特征可以有两种方法:一种方法是首先对图像进行自动分割,划分出图像中所包含的对象或颜色区域,然后根据这些区域提取图像特征,并建立索引;另一种方法则简单地将图像均匀地划分为若干规则子块,然后对每个图像子块提取特征,并建立索引。
      十、图像分类(识别)
      图像分类(识别)属于模式识别的范畴,其主要内容是图像经过某些预处理(增强、复原、压缩)后,进行图像分割和特征提取,从而进行判决分类。图像分类常采用经典的模式识别方法,有统计模式分类和句法(结构)模式分类,近年来新发展起来的模糊模式识别和人工神经网络模式分类在图像识别中也越来越受到重视。
      模式识别是一种从大量信息和数据出发,在专家经验和已有认识的基础上,利用计算机和数学推理的方法对形状、模式、曲线、数字、字符格式和图形自动完成识别的过程。模式识别包括相互关联的两个阶段,即学习阶段和实现阶段,前者是对样本进行特征选择,寻找分类的规律,后者是根据分类规律对未知样本集进行分类和识别。广义的模式识别属计算机科学中智能模拟的研究范畴,内容非常广泛,包括声音和语言识别、文字识别、指纹识别、声纳信号和地震信号分析、照片图片分析、化学模式识别等等。计算机模式识别实现了部分脑力劳动自动化。
      模式识别--对表征事物或现象的各种形式的(数值的,文字的和逻辑关系的)信息进行处理和分析,以对事物或现象进行描述、辨认、分类和解释的过程,是信息科学和人工智能的重要组成部分。
      模式还可分成抽象的和具体的两种形式。前者如意识、思想、议论等,属于概念识别研究的范畴,是人工智能的另一研究分支。我们所指的模式识别主要是对语音波形、地震波、心电图、脑电图、图片、文字、符号、三位物体和景物以及各种可以用物理的、化学的、生物的传感器对对象进行测量的具体模式进行分类和辨识。
      模式识别问题指的是对一系列过程或事件的分类与描述,具有某些相类似的性质的过程或事件就分为一类。模式识别问题一般可以应用以下4种方法进行分析处理。
      模版比对:
      统计模式识别方法:统计模式识别方法是受数学中的决策理论的启发而产生的一种识别方法,它一般假定被识别的对象或经过特征提取向量是符合一定分布规律的随机变量。其基本思想是将特征提取阶段得到的特征向量定义在一个特征空间中,这个空间包含了所有的特征向量,不同的特征向量,或者说不同类别的对象都对应于空间中的一点。在分类阶段,则利用统计决策的原理对特征空间进行划分,从而达到识别不同特征的对象的目的。统计模式识别中个应用的统计决策分类理论相对比较成熟,研究的重点是特征提取。统计模式识别的基本原理是:有相似性的样本在模式空间中互相接近,并形成“集团”,即“物以类聚”。其分析方法是根据模式所测得的特征向量Xi=(xi1,xi2,…,xid)T(i=1,2,…,N),将一个给定的模式归入C个类ω1,ω2,…,ωc中,然后根据模式之间的距离函数来判别分类。其中,T表示转置;N为样本点数;d为样本特征数。
      统计模式识别的主要方法有:判别函数法,k近邻分类法,非线性映射法,特征分析法,主因子分析法等。
      在统计模式识别中,贝叶斯决策规则从理论上解决了最优分类器的设计问题,但其实施却必须首先解决更困难的概率密度估计问题。BP神经网络直接从观测数据(训练样本)学习,是更简便有效的方法,因而获得了广泛的应用,但它是一种启发式技术,缺乏指定工程实践的坚实理论基础。统计推断理论研究所取得的突破性成果导致现代统计学习理论——VC理论的建立,该理论不仅在严格的数学基础上圆满地回答了人工神经网络中出现的理论问题,而且导出了一种新的学习方法——支撑向量机。
      人工神经网络模式识别:人工神经网络的研究起源于对生物神经系统的研究。人工神经网络区别于其他识别方法的最大特点是它对待识别的对象不要求有太多的分析与了解,具有一定的智能化处理的特点。
      句法结构模式识别:又称结构方法或语言学方法。其基本思想是把一个模式描述为较简单的子模式的组合,子模式又可描述为更简单的子模式的组合,最终得到一个树形的结构描述,在底层的最简单的子模式称为模式基元。在句法方法中选取基元的问题相当于在决策理论方法中选取特征的问题。通常要求所选的基元能对模式提供一个紧凑的反映其结构关系的描述,又要易于用非句法方法加以抽取。显然,基元本身不应该含有重要的结构信息。模式以一组基元和它们的组合关系来描述,称为模式描述语句,这相当于在语言中,句子和短语用词组合,词用字符组合一样。基元组合成模式的规则,由所谓语法来指定。一旦基元被鉴别,识别过程可通过句法分析进行,即分析给定的模式语句是否符合指定的语法,满足某类语法的即被分入该类。
      在几种算法中,统计模式识别是最经典的分类识别方法,在图像模式识别中有着非常广泛的应用。

      [wq1]
      本文参考《数字图像处理》(第二版)
      作者:冈萨雷斯
      [wq2]
      参考第二章,掌握概念?
      [wq3]
      线性变换:如果变换函数是线性的或是分段线性,这种变换就是线性变换。以线性函数加大图像的对比度的效果是使整幅图像的质量改善。以分段线性函数加大图像中某个(或某几个)亮度区间的对比度的效果是使局部亮度区间的质量得到改善。
      非线性变换:当变换函数是非线性时,即为非线性变换。常用的有指数变换和对数变换。

      [wq4]
      参考《几种图像处理库的研究》:http://blog.csdn.net/byxdaz/article/details/3972293
      [wq5]
      以时间作为变量所进行的研究就是时域
      以频率作为变量所进行的研究就是频域
      以空间坐标作为变量进行的研究就是空间域
      以波数作为变量所进行的研究称为波数域
      [wq6]
      一阶微分
      [wq7]
      二次导数,其离散实现类似于二阶Sobel导数
      [wq8]
      1) 仿射变换
      2) 透视变换
      [wq9]
      参考
      http://download.csdn.net/source/1513324
      [wq10]
      OTSU
      [wq11]
      SIFT特征怎么用?

    展开全文
  • 刚开始认真接触数字图像处理,来了解一下数字图像处理的一个特别大体的框架。 1. 概论 数字图像处理的主要内容: 1⃣️ 图像获取、表示和表现;2⃣️ 图像复原;3⃣️ 图像增强; 4⃣️ 图像分割;5⃣️ 图像...

    刚开始认真接触数字图像处理,来了解一下数字图像处理的一个特别大体的框架。

    1. 概论

    数字图像处理的主要内容:

    1⃣️ 图像获取、表示和表现;2⃣️ 图像复原;3⃣️ 图像增强;4⃣️ 图像分割;5⃣️ 图像分析;6⃣️ 图像重建;7⃣️ 图像压缩编码

    2. 数字图像基础

    2.1 图像的采样与量化;

    2.2 空间分辨率(dpi)和灰度分辨率(位数);

    2.3 颜色模型(RGB,HSI,YUV,HSV,CHL,LAB,CMY,XYZ)

    1⃣️ RGB:Red Green Blue (0,0,0)为黑色,(1,1,1)为白色

    2⃣️ HSI:Hue(色调,用角度表示,0°红色,120°绿色,240°蓝色) Saturation(色饱和度,用半径长度表示,S=0最暗,S=1最鲜明)       Intensity(亮度,高度表示,I=0黑色,I=1白色)

    3⃣️ YUV:Y表示颜色亮度,U、V表示蓝色、红色的色度

    2.4 BMP 文件:位图文件头(14字节),位图信息头(40字节),颜色表(不确定),位图数据

    3. 灰度图像处理

    3.1 彩色图像灰度化:分量法;平均值法;最大值法;加权平均法

    3.2 灰度变换 : 反转变换;幂律变换;分段线性变换

    3.3 直方图处理

    3.4 空间滤波处理

    1⃣️ 平滑空间滤波器:均值滤波器;高斯滤波器;中值滤波器;K近邻均值滤波器

    2⃣️ 锐化空间滤波器:一阶微分(梯度,交叉梯度-Roberts,Sobel算子,Prewitt算子);二阶微分(拉普拉斯算子)

    3.5 灰度投影:积分投影;微分投影。人眼水平位置和垂直位置定位

    3.6 图像的分割

    3.7 图像的匹配

    4. 彩色图像处理

    4.1 颜色模型转换

    4.2 彩色变换:补色处理;分段线性变换;彩色图像的直方图均衡化

    4.3 彩色图像的空间滤波处理

    1⃣️ 图像的模糊处理:平滑处理(水平平滑,垂直平滑,四周平滑);镶嵌处理;扩散处理

    2⃣️ 边缘锐化处理:霓虹处理(可用灰度图像处理中的梯度,交叉梯度,Sobel算子分别处理RGB三个分量);浮雕处理(梯度)

    5. 图像几何变换

    5.1 平移变换

    5.2 镜像变换:水平镜像;垂直镜像

    5.3 旋转变换:正变换;逆变换;绕任意点旋转正变换

    5.4 比例变换:缩小变换(正,逆);放大变换(正,逆)

    5.5 变形变换:按照指定函数进行相应的变换

    6. 二值图像处理

    7. 图像频域变换

    由于直接在空域对图像进行处理的计算量很大,因此采用各种图像变换的方法,将空域的计算转换到频域的计算。图像的变换把图像变成了数据。

    7.1 傅里叶变换(Fourier Transform

    1⃣️ 连续函数的傅里叶变换

    2⃣️ 数字图像用离散傅里叶变换(Discrete Fourier Transform, DFT)

    取傅里叶变换后的直流中心低频区域,过滤掉四周高频区域(用0代替),可以达到平滑图像的效果,也称为低通滤波器。低频区域的选择不同就有不同的低通滤波器,如理想低通滤波器、高斯低通滤波器、布特沃斯低通滤波器等。

    过滤掉傅里叶变换后的直流中心低频区域,四周高频区域,可以达到锐化图像的效果,也称为高通滤波器。高频区域的选择不同就有不同的高通滤波器,如理想通滤波器、高斯通滤波器、布特沃斯通滤波器等。

    3⃣️ 快速傅里叶变换(Fast Fourier Transform):蝶形运算

    7.2 离散余弦变换(Discrete Cosine Transform, DCT)

    语音信号、图像信号的变换的准最佳变换;有一维变换和二维变换;经过余弦变换,主要信息集中在少量的左上角附近位置处。余弦变换也可用于图像压缩。

    7.3 离散沃尔什-哈达玛变换

    7.4 小波变换

    与基函数为正弦函数的傅里叶变换不同,小波变换基于一些小型波,简称小波,它具有变化的频率和有限的持续时间。傅里叶变换只有频率信息,没有时间信息。

    8. 图像压缩编码

    1⃣️ 无损压缩编码:

         霍夫曼(Huffman)编码:频繁使用的数据用较短的二进制码代替,较少使用的数据用较长的二进制码代替,每个数据的代码各不相同

         行程编码(Run Length Coding):在一个逐行存储的图像中,具有相同灰度值的一些像素组成的序列,成为行程。因此对于每一个行程,只存储行程中的灰度值和行程长度即可,而不必将相邻的同样的灰度值存储多次。

         LZW(Lempel-Ziv & Welch)编码,即字串表编码。

         熵编码法

         香农-范诺(Shannon-Fannon)编码:符号的码字长度由该符号出现的概率来决定     

         算术编码:信源概率统计的固定编码模式;针对未知信源的自适应模式。

    2⃣️ 有损压缩编码:

         JPEG(Joint Picture Expert Group)压缩编码

         变换编码

    9. 图像合成处理

    9.1 图像噪声:高斯噪声;均匀噪声;脉冲(椒盐)噪声

    9.2 图像水印:可见水印;不可见水印

    9.3 图像相减

    10. 图像复原

    10.1 图像退化/复原模型

    10.2 有噪声的图像复原

    1⃣️ 均值滤波法:算术均值滤波;几何均值滤波;谐波均值滤波;逆谐波均值滤波

    2⃣️ 统计排序滤波法:中值滤波器;最大值和最小值滤波器;中点滤波器

    10.3 几何畸变校正:空间几何坐标变换;三角形线性法;灰度值的确定


    空间域处理:

    1⃣️ 点处理:图像灰度变换,直方图均衡

    2⃣️ 邻域处理:线性、非线性平滑和锐化

    频率域处理:高、低通滤波,同态滤波


    频域与空域滤波的比较:

    1. 对具有同样大小的空域和频率滤波器:h(x,y), H(u,v),频域计算(由于FFT)往往更有效(尤其是图像尺寸比较大时)。但对在空域中用尺寸较小的模板就能解决的问题,则往往在空域中直接操作。

    2. 频域滤波虽然更直接,但如果可以使用较小的滤波器,还是在空域计算为好 。因为省去了计算傅立叶变换及反变换等步骤。

    3. 由于更多的直观性,频率滤波器设计往往作为空域滤波器设计的向导。



    参考资料

    1. Visual C++数字图像处理   陆玲 李金萍 中国电力出版社

    2. http://blog.csdn.net/hitwengqi/article/details/8292675

    3. http://blog.csdn.net/byxdaz/article/details/4375228




    展开全文
  • 计算机视觉和图像处理框架一、概述图像处理即传感器将图像信号转换为数字信号,再利用计算机对其进行加工处理的过程。其涉及到的方法主要有图像变换、图像编码、图像去噪、图像增强、图像恢复、图像分割、特征提取、...

    计算机视觉和图像处理框架


    一、概述

    图像处理即传感器将图像信号转换为数字信号,再利用计算机对其进行加工处理的过程。其涉及到的方法主要有图像变换、图像编码、图像去噪、图像增强、图像恢复、图像分割、特征提取、图像识别等。
    计算机视觉是一门研究如何让机器(计算机)像人一样看并理解周围世界的学科,其基本理论和研究方法,旨在从图像或者其他数据中获得相关信息。
    从直观的角度看,我们可以说计算机视觉处理视频,图像处理处理图像,而视频由图像构成,当然这个说法只能用作理解,不够严谨。二者更科学的区别是计算机视觉重点研究映射到单幅图像或者多幅图像上的三维场景,如三维重建就是计算机视觉研究的内容;图像处理主要研究一个二维的数字图像,主要针对的是像素级的操作,例如提高对比度、边缘提取、几何变换等。
    计算机视觉和图像处理有很大的交叉,之前我也会把机器学习和模式识别也加入到交叉部分,现在我倒觉得,把这两门学科总结为像数学和英语那样为基础服务更合适。

    二、计算机视觉基本流程

    一个信息处理系统,总对应着一个或多个Input和Output,计算机视觉系统也不例外,输入为从三维世界中采集到的数据,输出为系统对信息的理解。无外乎就以下几个部分:
    1、数据采集(输入)
    2、预处理: 去噪、增强
    3、特征提取;
    4、检测/跟踪/分割;
    5、高级操作(分类、识别等)(输出)
    关于图像检测与识别的区分:
    目标检测:首先我们已经知道目标是什么,然后去图像中定位它的位置。(人脸检测、行人检测、车辆检测等)
    图像识别:简单的说,是图像再认,从成千上万张图像中找到认识的那一张,犹如我们在大街上遇到一个一个人,然后就会去搜索我们见过的所有人,‘哦!我见过他’,如果再加上‘哦!我见他趟在天安门的水晶棺里!’,那么就等于识别系统识别到了一个图像的id和路径,这就是图像识别的过程,(对于一个从来没有出现过的目标,计算机是无法进行再认的,人也不行)。其处理过程主要包括:图像输入、预处理、特征提取、特征分类、匹配。
    计算机视觉中的识别:是计算机视觉系统处理的高级过程,从再认的角度上讲,它们是一样的,然而出发点和‘识别’过程是不同的两个方面,计算机视觉中的识别重点在某一个领域内,比如行人行为识别(拥抱、指路、打架、偷车等),那么这个系统我们研究的就是人,车辆行为识别(是否酒驾、是否超速等),那就是一个交通监控系统,我们需要定义一个行为:什么是拥抱(偷车)或者什么是酒驾;而图像识别旨在从某一个库中去‘匹配’一个相同或者相似的图像(当然匹配的是特征)。

    三、基本图像处理与分析

    基于计算机视觉系统的整条主线,总结一下现有的一些理论和方法。
    图像采集:(摄像机标定和矫正)
    预处理:(去噪、增强、金字塔等)
    特征提取:(BRIEF、颜色和直方图特征、FAST特征、Harris特征、HOG、SIFT、SURF等)
    检测:(背景建模、特征+分类器(SVM、Adaboost、Random forest)、显著性监测等)
    跟踪:(Mean-shift、TLD、粒子滤波、卡尔曼)
    高级操作:(BOW)
    上述主要介绍了整个系统中常用到的一些方法和理论,当然计算机视觉和图像处理的内容远不止这些,下面列一些主要的领域,然后再补充一点模式识别的内容:
    人脸检测、人脸识别、目标检测和跟踪、OCR、阴影检测、场景理解、SLAM、视频监控等。

    四、为我所用

    最后主要总结一下能够为计算机视觉使用的一些理论和方法。
    机器学习:用摄像机模拟人眼,cpu模拟人脑,对于‘白痴’cpu,告诉它学习的方法也就显得自然了。
    模式识别:理论极强的一门学科,和ML、CV相辅相成,基于神经网络的DL大红大紫
    Boosting、clustering、CS(Compressive Sensing)、DT(Decision Trees)、DP(Dynamical Programimg)、EM、GM(Graphical Model)、HMM、ICA、PCA、RF(random forest)、RANSAC、SVD(Singular Value Decomposition)、稀疏表示、SVM、小波、NN
    英语:谁让我们落后于人家呢,师夷长技以制夷
    数学:一切美好的基石,数学分析、概率、统计、矩阵、最优化等
    计算机基础理论和方法:可能像组成原理、体系结构、操作系统、编译原理对算法研究帮助不大,不过数据结构和基本算法的作用却是相当大的,如果是做工程,前面的基础知识就显得很重要了。
    产品:为什么提到产品,因为工业不等于研究,要想自己喜欢的学科真正能够服务于大众,理论和实际必须要结合起来。

    展开全文
  • Marvin 是一个Java开发的可扩展的图像处理框架,该框架主要提供以下几方面的功能:基本图像操作;从视频中捕获帧;多线程的图像处理;通过GUI界面集成插件;插件性能分析;通过插件进行功能扩展。授权协议: GPL开发...

    Java对图像的处理框架比较少,目前比较流行的有Jmagick以及Marvin,但Jmagick只能处理图像(上篇Java清除图片中的恶意信息(利用Jmagick)中对Jmagick已做过简略介绍),而Marvin不但可以处理图像,而且可以集成各种插件,操作视频,摄像头来达到各种效果。

     

    Marvin 是一个Java开发的可扩展的图像处理框架,该框架主要提供以下几方面的功能:

    • 基本图像操作;
    • 从视频中捕获帧;
    • 多线程的图像处理;
    • 通过GUI界面集成插件;
    • 插件性能分析;
    • 通过插件进行功能扩展。

    授权协议: GPL

     

    开发语言: Java

    操作系统: 跨平台 

     

    项目主页: http://marvinproject.sourceforge.net/en/index.html

     

    目前插件提供的效果:

     

    艺术化(马塞克,电视效果)、模糊、纹理、分割、变形、渲染、图案、直方图、边缘检测等等,

    具体参考:http://marvinproject.sourceforge.net/en/plugins.html

     

    截个电视效果的图大家看下:

    电视效果

     

    使用方法:

    1. 下载MarvinFramework_1.3.1(图像处理框架)和JMF1.2(Java媒体处理框架)

    2. 将marvin_1.3.1.jar拷贝到你的lib目录,marvin整个文件夹拷贝到工程根目录,该文件夹包含了各种图片处理插件。

    3. 若需要对视频处理,则将JMF1.2解压后的customizer.jar、jmf.jar、multiplayer.jar、mediaplayer.jar拷贝到你的工程lib目录,另外

        该框架中还有一个jmf-2_1_1e-windows-i586.exe需要安装,这样才能操作你的摄像头,并释放必要的dll文件。

     

    下面是个简单程序,演示了Marvin加载图片,修改大小后写重新生成图片的过程:

     

    可见Marvin的图片管理是通过类MarvinImageIO来完成的。

    具体API参考:http://marvinproject.sourceforge.net/javadoc/

    另外:发现个小秘密,在经过resize()函数后,如图片中有恶意信息,居然也会被清除的,这个功能不错,哈哈~~~

    展开全文
  • 数字图像处理框架大体分为如下8个部分   1. 图像变换 原理:有时候,直接对图像进行处理会遇到一些困难,为了有效和快速地对图像进行处理和分析,需要将原定义在图像空间的图像以某种形式转换到另外的空间,利用...
  • CoreImage图像处理框架
  • javascript图像处理框架

    2015-03-04 10:37:19
    canvas图像处理 canvas 绘图区域 var canvas1 = document.getElementById("canvas1"); var context1 = canvas1.getContext('2d'); image = new Image(); image.src = "z
  • 图像处理框架的功能简介: 作者:郑海波 2012-08-12 Email:zhb931706659@126.com 1.布局  有TextView、ImageView和Button三种控件 2.功能:  2.1 显示:系统初始化时,显示Lenna图像  2.2 打开图像:...
  • Android与OpenCV2.4.4(2013最新)搭建图像处理平台注意事项 一.环境搭建 详细可以参考官方提供的文档:官方介绍 1.首先是Android开发环境搭建: 操作系统:Windows7 开发环境:Eclipse+ADT+AVD+JDK1.6 注意:...
  • 本科毕设时,为了进行演示曾按照网上的方法搭建了一个基于MFC多文档视图界面(MDI)的图像处理框架程序。但是由于对于windows编程的原理不甚了解,过程中遇到了很多细节上的问题,因此整理一下整个过程,便于以后...
  • FPGA图像处理之路,从此开始,接下来,让我们把时间交给“图像处理”。一休哥在动笔之前,一直在犹豫,反复思考着一个问题,这个问题一直困扰着我,“FPGA在图像处理领域中的地位?” 按照惯例,我们先暂且不直说这...
  • c#.net图像处理WPF框架

    2017-03-31 13:44:00
    对图片的打开,保存,旋转,翻转,放大,缩小等,每个功能都写在独立的方法
  • Java图片处理开源框架

    2013-12-27 17:56:00
    图片处理是当今软件开发中非常重要的一环,然而处理图片的开源框架却并不多。现金网上流传的Java处理图片的代码,虽然可对图片进行简单处理,但效果并不理想。虽然也有些其他解决方案,但都摆脱不了繁琐,使用起来...
  • 图像处理之深度学习

    2018-05-05 22:02:57
    第一种 自我激发型 基于图像处理的方法,如图像增强和图像复原,以及曾经很火的超分辨率算法。都是在不增加额外信息的前提下的实现方式。 1. 图像增强 图像增强是图像预处理中非常重要且常用的一种方法,图像...
  • Core Image框架的使用,IOS图片处理框架
  • 接触图像处理、计算机视觉这个领域已经有两年了,感觉有必要对自己所了解的知识点进行简单的总结与概括,其实也就是复习一下,更好的面对找工作时可能问道的问题。 计算机视觉的知识点相对比较庞大,如果没有在特定...
  • 今天在工作中要解决一个前端图像处理的需求。
  • F-I-L是一个FPGA平台的开源的图像处理库,已经拥有了许多常用操作,并在不断更新中。这些操作被以IP核的形式进行了封装,遵循同一种规范化的接口,同时具有流水线和请求响应两种使用模式。大部分IP都拥有自己的软件...
  • Android开发常用开源框架:图片处理 框架名称 功能描述...
1 2 3 4 5 ... 20
收藏数 146,714
精华内容 58,685
关键字:

图像处理 框架