图像处理 生活例子_cuda图像处理例子 - CSDN
  • 图像处理常用公式-不错

    转自:http://blog.sina.com.cn/s/blog_4bdb170b01019atv.html

    图像处理-线性滤波-1 基础(相关算子、卷积算子、边缘效应)

    这里讨论利用输入图像中像素的小邻域来产生输出图像的方法,在信号处理中这种方法称为滤波(filtering)。其中,最常用的是线性滤波:输出像素是输入邻域像素的加权和。

     

    1.相关算子(Correlation Operator)

           定义:image,  即image ,其中h称为相关核(Kernel).

            

      步骤:

            1)滑动核,使其中心位于输入图像g的(i,j)像素上

            2)利用上式求和,得到输出图像的(i,j)像素值

            3)充分上面操纵,直到求出输出图像的所有像素值

     

      例:

    A = [17  24   1   8  15            h = [8   1   6
         23   5   7  14  16                     3   5   7
          4   6  13  20  22                     4   9   2]
         10  12  19  21   3           
         11  18  25   2   9]

    计算输出图像的(2,4)元素=image

    image

    Matlab 函数:imfilter(A,h)

     

    2.卷积算子(Convolution)

    定义:image image ,其中

       步骤:

            1)将核围绕中心旋转180度

            2)滑动核,使其中心位于输入图像g的(i,j)像素上

            3)利用上式求和,得到输出图像的(i,j)像素值

            4)充分上面操纵,直到求出输出图像的所有像素值

           例:计算输出图像的(2,4)元素=image

           image

    Matlab 函数:Matlab 函数:imfilter(A,h,'conv')% imfilter默认是相关算子,因此当进行卷积计算时需要传入参数'conv'

    3.边缘效应

    当对图像边缘的进行滤波时,核的一部分会位于图像边缘外面。

    image

    常用的策略包括:

    1)使用常数填充:imfilter默认用0填充,这会造成处理后的图像边缘是黑色的。

    2)复制边缘像素:I3 = imfilter(I,h,'replicate');

    image

       

    4.常用滤波

    fspecial函数可以生成几种定义好的滤波器的相关算子的核。

    例:unsharp masking 滤波

    1
    2
    3
    4
    5
    I = imread('moon.tif');
    h = fspecial('unsharp');
    I2 = imfilter(I,h);
    imshow(I), title('Original Image')
    figure, imshow(I2), title('Filtered Image')
     
     

    图像处理-线性滤波-2 图像微分(1、2阶导数和拉普拉斯算子)

    更复杂些的滤波算子一般是先利用高斯滤波来平滑,然后计算其1阶和2阶微分。由于它们滤除高频和低频,因此称为带通滤波器(band-pass filters)。

    在介绍具体的带通滤波器前,先介绍必备的图像微分知识。

    1 一阶导数

    连续函数,其微分可表达为image ,或image                         (1.1)

    对于离散情况(图像),其导数必须用差分方差来近似,有

                                       image,前向差分 forward differencing                  (1.2)

                                       image ,中心差分 central differencing                     (1.3)

    1)前向差分的Matlab实现

    1
    2
    3
    4
    5
    6
    7
    8
    9
    10
    11
    12
    13
    14
    15
    16
    17
    18
    19
    20
    21
    22
    23
    24
    25
    26
    27
    function dimg = mipforwarddiff(img,direction)
    % MIPFORWARDDIFF     Finite difference calculations 
    %
    %   DIMG = MIPFORWARDDIFF(IMG,DIRECTION)
    %
    %  Calculates the forward-difference for a given direction
    %  IMG       : input image
    %  DIRECTION : 'dx' or 'dy'
    %  DIMG      : resultant image
    %
    %   See also MIPCENTRALDIFF MIPBACKWARDDIFF MIPSECONDDERIV
    %   MIPSECONDPARTIALDERIV
      
    %   Omer Demirkaya, Musa Asyali, Prasana Shaoo, ... 9/1/06
    %   Medical Image Processing Toolbox
      
    imgPad = padarray(img,[1 1],'symmetric','both');%将原图像的边界扩展
    [row,col] = size(imgPad);
    dimg = zeros(row,col);
    switch (direction)   
    case 'dx',
       dimg(:,1:col-1) = imgPad(:,2:col)-imgPad(:,1:col-1);%x方向差分计算,
    case 'dy',
       dimg(1:row-1,:) = imgPad(2:row,:)-imgPad(1:row-1,:); 
    otherwise, disp('Direction is unknown');
    end;
    dimg = dimg(2:end-1,2:end-1);

    2)中心差分的Matlab实现

    1
    2
    3
    4
    5
    6
    7
    8
    9
    10
    11
    12
    13
    14
    15
    16
    17
    18
    19
    20
    21
    22
    23
    24
    25
    26
    27
    28
    function dimg = mipcentraldiff(img,direction)
    % MIPCENTRALDIFF     Finite difference calculations 
    %
    %   DIMG = MIPCENTRALDIFF(IMG,DIRECTION)
    %
    %  Calculates the central-difference for a given direction
    %  IMG       : input image
    %  DIRECTION : 'dx' or 'dy'
    %  DIMG      : resultant image
    %
    %   See also MIPFORWARDDIFF MIPBACKWARDDIFF MIPSECONDDERIV
    %   MIPSECONDPARTIALDERIV
      
    %   Omer Demirkaya, Musa Asyali, Prasana Shaoo, ... 9/1/06
    %   Medical Image Processing Toolbox
      
    img = padarray(img,[1 1],'symmetric','both');
    [row,col] = size(img);
    dimg = zeros(row,col);
    switch (direction)
        case 'dx',
            dimg(:,2:col-1) = (img(:,3:col)-img(:,1:col-2))/2;
        case 'dy',
            dimg(2:row-1,:) = (img(3:row,:)-img(1:row-2,:))/2;
        otherwise,
            disp('Direction is unknown');
    end
    dimg = dimg(2:end-1,2:end-1);
    1
      

    实例:技术图像x方向导数

    1
    2
    I = imread('coins.png'); figure; imshow(I);
    Id = mipforwarddiff(I,'dx'); figure, imshow(Id);

          image image

        原图像                                                   x方向1阶导数

     

    2 图像梯度(Image Gradient)

    图像I的梯度定义为image  ,其幅值为image 。出于计算性能考虑,幅值也可用image 来近似。

    Matlab函数

    1)gradient:梯度计算

    2)quiver:以箭头形状绘制梯度。注意放大下面最右侧图可看到箭头,由于这里计算横竖两个方向的梯度,因此箭头方向都是水平或垂直的。

    实例:仍采用上面的原始图像

    1
    2
    3
    4
    5
    I = double(imread('coins.png'));
    [dx,dy]=gradient(I);
    magnitudeI=sqrt(dx.^2+dy.^2);
    figure;imagesc(magnitudeI);colormap(gray);%梯度幅值
    hold on;quiver(dx,dy);%叠加梯度方向

            image image

                             梯度幅值                                   梯度幅值+梯度方向

     

    3 二阶导数

    对于一维函数,其二阶导数image ,即image 。它的差分函数为

                                     image                  (3.1)

     

    3.1 普拉斯算子(laplacian operator)

    3.1.2 概念

    拉普拉斯算子是n维欧式空间的一个二阶微分算子。它定义为两个梯度向量算子的内积

                              image       (3.2)

    其在二维空间上的公式为:    image                (3.3)

     

    对于1维离散情况,其二阶导数变为二阶差分

    1)首先,其一阶差分为image

    2)因此,二阶差分为

              image

    3)因此,1维拉普拉斯运算可以通过1维卷积核image 实现

     

    对于2维离散情况(图像),拉普拉斯算子是2个维上二阶差分的和(见式3.3),其公式为:

    image   (3.4)

    上式对应的卷积核为

                           image

    常用的拉普拉斯核有:

                          image

    3.1.2 应用

    拉普拉斯算子会突出像素值快速变化的区域,因此常用于边缘检测。

     

     

    Matlab里有两个函数

    1)del2

    计算公式:image image  

    2)fspecial:图像处理中一般利用Matlab函数fspecial

    h = fspecial('laplacian', alpha) returns a 3-by-3 filter approximating the shape of the two-dimensional Laplacian operator.
    The parameter alpha controls the shape of the Laplacian and must be in the range 0.0 to 1.0. The default value for alpha is 0.2.

     

    3.1.3 资源

    http://fourier.eng.hmc.edu/e161/lectures/gradient/node8.html (非常清晰的Laplacian Operator介绍,本文的主要参考)

    http://homepages.inf.ed.ac.uk/rbf/HIPR2/log.htm

     

     
     
     
     

    sift算法

     

    尺度不变特征转换(Scale-invariant feature transform 或 SIFT)是一种电脑视觉的算法用来侦测与描述影像中的局部性特征,它在空间尺度中寻找极值点,并提取出其位置、尺度、旋转不变量,此算法由 David Lowe 在1999年所发表,2004年完善总结。

    Sift算法就是用不同尺度(标准差)的高斯函数对图像进行平滑,然后比较平滑后图像的差别,
    差别大的像素就是特征明显的点。

    sift可以同时处理亮度,平移,旋转,尺度的变化,利用特征点来提取特征描述符,最后在特征描述符之间寻找匹配

     

    五个步骤

    1构建尺度空间,检测极值点,获得尺度不变性

    2特征点过滤并进行经确定位,剔除不稳定的特征点

    3 在特征点处提取特征描述符,为特征点分配方向直

    4声称特征描述子,利用特征描述符寻找匹配点

    5计算变换参数

    当2幅图像的sift特征向量生成以后,下一步就可以采用关键点特征向量的欧式距离来作为2幅图像中关键点的相似性判定量度

     

    尺度空间:

    尺度就是受delta这个参数控制的表示

    而不同的L(x,y,delta)就构成了尺度空间,实际上具体计算的时候即使连续的高斯函数,都要被离散为矩阵来和数字图像进行卷积操作

    L(x,y,delta)=G(x,y,e)*i(x,y)

    尺度空间=原始图像(卷积)一个可变尺度的2维高斯函数G(x,y,e)

     

    G(x,y,e) = [1/2*pi*e^2] * exp[ -(x^2 + y^2)/2e^2] 


    为了更有效的在尺度空间检测到稳定的关键点,提出了高斯差分尺度空间,利用不同尺度的高斯差分核与原始图像i(x,y)卷积生成

    D(x,y,e)=(G(x,y,ke)-G(x,y,e))*i(x,y)

    =L(x,y,ke)-L(x,y,e)

    (为避免遍历每个像素点)

     

    高斯卷积:

    在组建一组尺度空间后,再组建下一组尺度空间,对上一组尺度空间的最后一幅图像进行二分之一采样,得到下一组尺度空间的第一幅图像,然后进行像建立第一组尺度空间那样的操作,得到第二组尺度空间,公式定义为
             L(x,y,e) = G(x,y,e)*I(x,y)

        图像金字塔的构建:图像金字塔共O组,每组有S层,下一组的图像由上一组图像降采样得到、

    高斯差分

        在尺度空间建立完毕后,为了能够找到稳定的关键点,采用高斯差分的方法来检测那些在局部位置的极值点,即采用俩个相邻的尺度中的图像相减,即公式定义为:
            D(x,y,e) = ((G(x,y,ke) - G(x,y,e)) * I(x,y) 
                     = L(x,y,ke) - L(x,y,e)
     咱们再来具体阐述下构造D(x,y,e)的详细步骤:
        1、首先采用不同尺度因子的高斯核对图像进行卷积以得到图像的不同尺度空间,将这一组图像作为金子塔图像的第一层。
        2、接着对第一层图像中的2倍尺度图像(相对于该层第一幅图像的2倍尺度)以2倍像素距离进行下采样来得到金子塔图像的第二层中的第一幅图像,对该图像采用不同尺度因子的高斯核进行卷积,以获得金字塔图像中第二层的一组图像。
        3、再以金字塔图像中第二层中的2倍尺度图像(相对于该层第一幅图像的2倍尺度)以2倍像素距离进行下采样来得到金字塔图像的第三层中的第一幅图像,对该图像采用不同尺度因子的高斯核进行卷积,以获得金字塔图像中第三层的一组图像。这样依次类推,从而获得了金字塔图像的每一层中的一组图像,
     4、对上图得到的每一层相邻的高斯图像相减,就得到了高斯差分图像,如下述第一幅图所示。下述第二幅图中的右列显示了将每组中相邻图像相减所生成的高斯差分图像的结果,限于篇幅,图中只给出了第一层和第二层高斯差分图像的计算
     

     

    图像处理之卷积概念

     

    我们来看一下一维卷积的概念.
    连续空间的卷积定义是 f(x)与g(x)的卷积是 f(t-x)g(x) 在t从负无穷到正无穷的积分值.t-x要在f(x)定义域内,所以看上去很大的积分实际上还是在一定范围的.
    实际的过程就是f(x) 先做一个Y轴的反转,然后再沿X轴平移t就是f(t-x),然后再把g(x)拿来,两者乘积的值再积分.想象一下如果g(x)或者f(x)是个单位的阶越函数. 那么就是f(t-x)与g(x)相交部分的面积.这就是卷积了.
    把积分符号换成求和就是离散空间的卷积定义了.

     

    么在图像中卷积卷积地是什么意思呢,就是图像f(x),模板g(x),然后将模版g(x)在模版中移动,每到一个位置,就把f(x)与g(x)的定义域相交的元素进行乘积并且求和,得出新的图像一点,就是被卷积后的图像. 模版又称为卷积核.卷积核做一个矩阵的形状.


    卷积定义上是线性系统分析经常用到的.线性系统就是一个系统的输入和输出的关系是线性关系.就是说整个系统可以分解成N多的无关独立变化,整个系统就是这些变化的累加.
    如 x1->y1, x2->y2; 那么A*x1 + B*x2 -> A*y1 + B*y2 这就是线性系统. 表示一个线性系统可以用积分的形式 如 Y = Sf(t,x)g(x)dt S表示积分符号,就是f(t,x)表示的是A B之类的线性系数.
    看上去很像卷积呀,,对如果f(t,x) = F(t-x) 不就是了吗.从f(t,x)变成F(t-x)实际上是说明f(t,x)是个线性移不变,就是说 变量的差不变化的时候,那么函数的值不变化. 实际上说明一个事情就是说线性移不变系统的输出可以通过输入和表示系统线性特征的函数卷积得到.

     

    http://dept.wyu.edu.cn/dip/DIPPPT2005/����������ϵͳ.ppt


     
     
     
     
     
    谈起卷积分当然要先说说冲击函数—-这个倒立的小蝌蚪,卷积其实就是为它诞生的。”冲击函数”是狄拉克为了解决一些瞬间作用的物理现象而提出的符号。
    古人曰:”说一堆大道理不如举一个好例子”,冲量这一物理现象很能说明”冲击函数”。在t时间内对一物体作用F的力,我们可以让作用时间t很小,作用力F很大,但让Ft的乘积不变,即冲量不变。于是在用t做横坐标、F做纵坐标的坐标系中,就如同一个面积不变的长方形,底边被挤的窄窄的,高度被挤的高高的,在数学中它可以被挤到无限高,但即使它无限瘦、无限高、但它仍然保持面积不变(它没有被挤没!),为了证实它的存在,可以对它进行积分,积分就是求面积嘛!于是”卷积” 这个数学怪物就这样诞生了。说它是数学怪物是因为追求完美的数学家始终在头脑中转不过来弯,一个能瘦到无限小的家伙,竟能在积分中占有一席之地,必须将这个细高挑清除数学界。但物理学家、工程师们确非常喜欢它,因为它解决了很多当时数学家解决不了的实际问题。最终追求完美的数学家终于想通了,数学是来源于实际的,并最终服务于实际才是真。于是,他们为它量身定做了一套运作规律。于是,妈呀!你我都感觉眩晕的卷积分产生了。
    例子:
    有一个七品县令,喜欢用打板子来惩戒那些市井无赖,而且有个惯例:如果没犯大罪,只打一板,释放回家,以示爱民如子。
    有一个无赖,想出人头地却没啥指望,心想:既然扬不了善名,出恶名也成啊。怎么出恶名?炒作呗!怎么炒作?找名人呀!他自然想到了他的行政长官——县令。
    无赖于是光天化日之下,站在县衙门前撒了一泡尿,后果是可想而知地,自然被请进大堂挨了一板子,然后昂首挺胸回家,躺了一天,嘿!身上啥事也没有!第二天如法炮制,全然不顾行政长管的仁慈和衙门的体面,第三天、第四天……每天去县衙门领一个板子回来,还喜气洋洋地,坚持一个月之久!这无赖的名气已经和衙门口的臭气一样,传遍八方了!
    县令大人噤着鼻子,呆呆地盯着案子上的惊堂木,拧着眉头思考一个问题:这三十个大板子怎么不好使捏?……想当初,本老爷金榜题名时,数学可是得了满分,今天好歹要解决这个问题:
    ——人(系统!)挨板子(脉冲!)以后,会有什么表现(输出!)?
    ——费话,疼呗!
    ——我问的是:会有什么表现?
    ——看疼到啥程度。像这无赖的体格,每天挨一个板子啥事都不会有,连哼一下都不可能,你也看到他那得意洋洋的嘴脸了(输出0);如果一次连揍他十个板子,他可能会皱皱眉头,咬咬牙,硬挺着不哼
    (输出1);揍到二十个板子,他会疼得脸部扭曲,象猪似地哼哼(输出3);揍到三十个板子,他可能会象驴似地嚎叫,一把鼻涕一把泪地求你饶他一命(输出5);揍到四十个板子,他会大小便失禁,勉
    强哼出声来(输出1);揍到五十个板子,他连哼一下都不可能(输出0)——死啦!
    县令铺开坐标纸,以打板子的个数作为X轴,以哼哼的程度(输出)为Y轴,绘制了一条曲线:
    ——呜呼呀!这曲线象一座高山,弄不懂弄不懂。为啥那个无赖连挨了三十天大板却不喊绕命呀?
    —— 呵呵,你打一次的时间间隔(Δτ=24小时)太长了,所以那个无赖承受的痛苦程度一天一利索,没有叠加,始终是一个常数;如果缩短打板子的时间间隔(建议 Δτ=0.5秒),那他的痛苦程度可就迅速叠加了;等到这无赖挨三十个大板(t=30)时,痛苦程度达到了他能喊叫的极限,会收到最好的惩戒效果,再多打就显示不出您的仁慈了。
    ——还是不太明白,时间间隔小,为什么痛苦程度会叠加呢?
    ——这与人(线性时不变系统)对板子(脉冲、输入、激励)的响应有关。什么是响应?人挨一个板子后,疼痛的感觉会在一天(假设的,因人而异)内慢慢消失(衰减),而不可能突然消失。这样一来,只要打板子的时间间隔很小,每一个板子引起的疼痛都来不及完全衰减,都会对最终的痛苦程度有不同的贡献:
    t个大板子造成的痛苦程度=Σ(第τ个大板子引起的痛苦*衰减系数)
    [衰减系数是(t-τ)的函数,仔细品味]
    数学表达为:y(t)=∫T(τ)H(t-τ)
    ——拿人的痛苦来说卷积的事,太残忍了。除了人以外,其他事物也符合这条规律吗?
    ——呵呵,县令大人毕竟仁慈。其实除人之外,很多事情也遵循此道。好好想一想,铁丝为什么弯曲一次不折,快速弯曲多次却会轻易折掉呢?
    ——恩,一时还弄不清,容本官慢慢想来——但有一点是明确地——来人啊,将撒尿的那个无赖抓来,狠打40大板!
    卷积及拉普拉斯变换的通俗解释–对于我这类没学过信号系统的人来说太需要了
    卷积(convolution, 另一个通用名称是德文的Faltung)的名称由来,是在于当初定义它时,定义成 integ(f1(v)*f2(t-v))dv,积分区间在0到t之间。举个简单的例子,大家可以看到,为什么叫”卷积”了。比方说在(0,100)间积分,用简单的辛普生积分公式,积分区间分成100等分,那么看到的是f1(0)和f2(100)相乘,f1(1)和f2(99)相乘,f1(2)和f2 (98)相乘,……… 等等等等,就象是在坐标轴上回卷一样。所以人们就叫它”回卷积分”,或者”卷积”了。
    为了理解”卷积”的物理意义,不妨将那个问题”相当于它的时域的信号与系统的单位脉冲响应的卷积”略作变化。这个变化纯粹是为了方便表达和理解,不影响任何其它方面。将这个问题表述成这样一个问题:一个信号通过一个系统,系统的响应是频率响应或波谱响应,且看如何理解卷积的物理意义。
    假设信号函数为f, 响应函数为g。f不仅是时间的函数(信号时有时无),还是频率的函数(就算在某一固定时刻,还有的地方大有的地方小);g也是时间的函数(有时候有反应,有时候没反应),同时也是频率的函数(不同的波长其响应程度不一样)。那我们要看某一时刻 t 的响应信号,该怎么办呢?
    这就需要卷积了。
    要看某一时刻 t 的响应信号,自然是看下面两点:
    1。你信号来的时候正赶上人家”系统”的响应时间段吗?
    2。就算赶上系统响应时间段,响应有多少?
    响 应不响应主要是看 f 和 g 两个函数有没有交叠;响应强度的大小不仅取决于所给的信号的强弱,还取决于在某频率处对单位强度响应率。响应强度是信号强弱和对单位强度信号响应率的乘积。”交叠”体现在f(t1)和g(t-t1)上,g之所以是”(t-t1)”就是看两个函数错开多少。
    由于 f 和 g 两个函数都有一定的带宽分布(假若不用开头提到的”表述变化”就是都有一定的时间带宽分布),这个信号响应是在一定”范围”内广泛响应的。算总的响应信号,当然要把所有可能的响应加起来,实际上就是对所有可能t1积分了。积分范围虽然一般在负无穷到正无穷之间;但在没有信号或者没有响应的地方,积也是白积,结果是0,所以往往积分范围可以缩减。
    这就是卷积及其物理意义啊。并成一句话来说,就是看一个时有时无(当然作为特例也可以永恒存在)的信号,跟一个响应函数在某一时刻有多大交叠。
    *********拉普拉斯*********
    拉普拉斯(1729-1827) 是法国数学家,天文学家,物理学家。他提出拉普拉斯变换(Laplace Transform) 的目的是想要解决他当时研究的牛顿引力场和太阳系的问题中涉及的积分微分方程。
    拉普拉斯变换其实是一个数学上的简便算法;想要了解其”物理”意义 — 如果有的话 — 请看我举这样一个例子:
    问题:请计算十万乘以一千万。
    对于没学过指数的人,就只会直接相乘;对于学过指数的人,知道不过是把乘数和被乘数表达成指数形式后,两个指数相加就行了;如果要问究竟是多少,把指数转回来就是。
    “拉 普拉斯变换” 就相当于上述例子中把数转换成”指数” 的过程;进行了拉普拉斯变换之后,复杂的微分方程(对应于上例中”复杂”的乘法) 就变成了简单的代数方程,就象上例中”复杂”的乘法变成了简单的加减法。再把简单的代数方程的解反变换回去(就象把指数重新转换会一般的数一样),就解决了原来那个复杂的微分方程。
    所以要说拉普拉斯变换真有” 物理意义”的话,其物理意义就相当于人们把一般的有理数用指数形式表达一样。
    另外说两句题外话:
    1 。拉普拉斯变换之所以现在在电路中广泛应有,根本原因是电路中也广泛涉及了微分方程。
    2。拉普拉斯变换与Z变换当然有紧密联系;其本质区别在于拉氏变换处理的是时间上连续的问题,Z变换处理的是时间上分立的问题。
    Signals, Linear Systems, and Convolution
    Download from here
     
    我们都知道卷积公式,但是它有什么物理意义呢?平时我们用卷积做过很多事情,信号处理时,输出函数是输入函数和系统函数的卷积;在图像处理时,两组幅分辨率不同的图卷积之后得到的互相平滑的图像可以方便处理。卷积甚至可以用在考试作弊中,为了让照片同时像两个人,只要把两人的图像卷积处理即可,这就是一种平滑的过程,可是我们怎么才能真正把公式和实际建立起一种联系呢?生活中就有实例:
         比如说你的老板命令你干活,你却到楼下打台球去了,后来被老板发现,他非常气愤,扇了你一巴掌(注意,这就是输入信号,脉冲),于是你的脸上会渐渐地(贱贱地)鼓起来一个包,你的脸就是一个系统,而鼓起来的包就是你的脸对巴掌的响应。
          好,这样就和信号系统建立起来意义对应的联系。下面还需要一些假设来保证论证的严谨:假定你的脸是线性时不变系统,也就是说,无论什么时候老板打你一巴掌,打在你脸的同一位置(这似乎要求你的脸足够光滑,如果你说你长了很多青春痘,甚至整个脸皮处处连续处处不可导,那难度太大了,我就无话可说了),你的脸上总是会在相同的时间间隔内鼓起来一个相同高度的包来,并且假定以鼓起来的包的大小作为系统输出。好了,那么,下面可以进入核心内容——卷积了!
          如果你每天都到楼下去打台球,那么老板每天都要扇你一巴掌,不过当老板打你一巴掌后,你5分钟就消肿了,所以时间长了,你甚至就适应这种生活了……如果有一天,老板忍无可忍,以0.5秒的间隔开始不间断的扇你的过程,这样问题就来了:第一次扇你鼓起来的包还没消肿,第二个巴掌就来了,你脸上的包就可能鼓起来两倍高,老板不断扇你,脉冲不断作用在你脸上,效果不断叠加了,这样这些效果就可以求和了,结果就是你脸上的包的高度岁时间变化的一个函数了(注意理解)!
          如果老板再狠一点,频率越来越高,以至于你都辨别不清时间间隔了,那么,求和就变成积分了。可以这样理解,在这个过程中的某一固定的时刻,你的脸上的包的鼓起程度和什么有关呢?和之前每次打你都有关!但是各次的贡献是不一样的,越早打的巴掌,贡献越小,这就是说,某一时刻的输出是之前很多次输入乘以各自的衰减系数之后的叠加而形成某一点的输出,然后再把不同时刻的输出点放在一起,形成一个函数,这就是卷积。卷积之后的函数就是你脸上的包的大小随时间变化的函数。本来你的包几分钟就可以消肿,可是如果连续打,几个小时也消不了肿了,这难道不是一种平滑过程么?反映到公式上,f(a)就是第a个巴掌,g(x-a)就是第a个巴掌在x时刻的作用程度,乘起来再叠加就ok了,这就是卷积!
         最后提醒各位,请勿亲身尝试……

    卷积的物理意义?
    在信号与系统中,两个函数所要表达的物理含义是什么?例如,一个系统,其单位冲激响应为h(t),当输入信号为f(t)时,该系统的输出为y(t)。为什么y(t)是f(t)和h(t)的卷积?(从数学推导我明白,但其物理意义不明白。)y(t)是f(t)和h(t)的卷积表达了一个什么意思?

    卷积(convolution, 另一个通用名称是德文的Faltung)的名称由来,是在于当初定义它时,定义成 integ(f1(v)*f2(t-v))dv,积分区间在0到t之间。举个简单的例子,大家可以看到,为什么叫“卷积”了。比方说在(0,100)间积分,用简单的辛普生积分公式,积分区间分成100等分,那么看到的是f1(0)和f2(100)相乘,f1(1)和f2(99)相乘,f1(2)和f2(98)相乘,......... 等等等等,就象是在坐标轴上回卷一样。所以人们就叫它“回卷积分”,或者“卷积”了。
    为了理解“卷积”的物理意义,不妨将那个问题“相当于它的时域的信号与系统的单位脉冲响应的卷积”略作变化。这个变化纯粹是为了方便表达和理解,不影响任何其它方面。将这个问题表述成这样一个问题:一个信号通过一个系统,系统的响应是频率响应或波谱响应,且看如何理解卷积的物理意义。
    假设信号函数为f, 响应函数为g。f不仅是时间的函数(信号时有时无),还是频率的函数(就算在某一固定时刻,还有的地方大有的地方小);g也是时间的函数(有时候有反应,有时候没反应),同时也是频率的函数(不同的波长其响应程度不一样)。那我们要看某一时刻 t 的响应信号,该怎么办呢?
    这就需要卷积了。
    其实卷积积分应用广泛用在信号里面,一个是频域一个是时域
     

    卷积是个啥?我忽然很想从本质上理解它。于是我从抽屉里翻出自己珍藏了许多年,每每下决心阅读却永远都读不完的《应用傅立叶变换》。
     
    3.1 一维卷积的定义
     
    函数f(x)与函数h(x)的卷积,由函参量的无穷积分

      定义。这里参量x和积分变量α皆为实数;函数f和h可实可复。
     
    定义虽然找到了,但我还是一头雾水。卷积是个无穷积分吗?那它是干啥用的?再往后翻:几何说明、运算举例、基本性质,一堆的公式,就是没有说它是干啥用的。我于是坐在那呆想,忽然第二个困扰我的问题冒了出来:傅立叶变换是个啥?接着就是第三个、第四个、……、第N个问题。
     
    傅立叶变换是个啥?听说能将时域上的东东变到频域上分析?哎?是变到频域上还是空间域上来着?到底啥是时域,频域,空间域?
     
    上网查傅立叶变换的物理意义,没发现明确答案,倒发现了许多和我一样晕着问问题的人。结果又多出了许多名词,能量?功率谱?图像灰度域?……没办法又去翻那本教材。
     
    1.1 一维傅立叶变换的定义与傅立叶积分定理
     
    设f(x)是实变量x的函数,该函数可实可复,称积分

    为函数f(x)的傅立叶变换。
     
    吐血,啥是无穷积分来着?积分是啥来着?还能记起三角函数和差化积、积化和差公式吗?我忽然有种想把高中课本寻来重温的冲动。
     
    卷积主要是为了将信号运算从时域转换为频域。
    信号的时域的卷积等于频域的乘积。
    利用这个性质以及特殊的δ函数可以通过抽样构造简单的调制电路
     
     
    我比较赞同卷积的相关性的作用  在通信系统中的接收机部分MF匹配滤波器等就是本质上的相关
    匹配滤波器最简单的形式就是原信号反转移位相乘积分得到的近似=相关
    相关性越好得到的信号越强   这个我们有一次大作业做的  做地做到呕吐  呵呵
    还有解调中一些东西本质就是相关
     

    卷积公式  解释  卷积公式是用来求随机变量和的密度函数(pdf)的计算公式。  定义式:  z(t)=x(t)*y(t)= ∫x(m)y(t-m)dm.   已知x,y的pdf,x(t),y(t).现在要求z=x+y的pdf. 我们作变量替显,令  z=x+y,m=x. 雅可比行列式=1.那么,z,m联合密度就是f(z,m)=x(m)y(z-m)*1. 这样,就可以很容易求Z的在(z,m)中边缘分布  即fZ(z)=∫x(m)y(z-m)dm..... 由于这个公式和x(t),y(t)存在一一对应的关系。为了方便,所以记 ∫x(m)y(z-m)dm=x(t)*y(t)   长度为m的向量序列u和长度为n的向量序列v,卷积w的向量序列长度为(m+n-1),   u(n)与v(n)的卷积w(n)定义为: w(n)=u(n)@v(n)=sum(v(m)*u(n-m)),m from 负无穷到正无穷;   当m=n时w(1) = u(1)*v(1)   w(2) = u(1)*v(2)+u(2)*v(1)   w(3) = u(1)*v(3)+u(2)*v(2)+u(3)*v(1)   …   w(n) = u(1)*v(n)+u(2)*v(n-1)+ … +u(n)*v(1)   …   w(2*n-1) = u(n)*v(n)   当m≠n时,应以0补齐阶次低的向量的高位后进行计算  这是数学中常用的一个公式,在概率论中,是个重点也是一个难点。

      卷积公式是用来求随机变量和的密度函数(pdf)的计算公式。
      定义式:
      z(t)=x(t)*y(t)= ∫x(m)y(t-m)dm.
      已知x,y的pdf,x(t),y(t).现在要求z=x+y的pdf. 我们作变量替显,令
      z=x+y,m=x. 雅可比行列式=1.那么,t,m联合密度就是f(z,m)=x(m)y(z-m)*1. 这样,就可以很容易求Z的在(z,m)中边缘分布
      即fZ(z)=∫x(m)y(z-m)dm..... 由于这个公式和x(t),y(t)存在一一对应的关系。为了方便,所以记 ∫x(m)y(z-m)dm=x(t)*y(t)
     
    卷积是一种线性运算,图像处理中常见的mask运算都是卷积,广泛应用于图像滤波。castlman的书对卷积讲得很详细。
    高斯变换就是用高斯函数对图像进行卷积。高斯算子可以直接从离散高斯函数得到:
    for(i=0; i<N; i++)
    {
    for(j=0; j<N; j++)
    {
    g[i*N+j]=exp(-((i-(N-1)/2)^2+(j-(N-1)/2)^2))/(2*delta^2));
    sum += g[i*N+j];
    }
    }
    再除以 sum 得到归一化算子
    N是滤波器的大小,delta自选
    首先,再提到卷积之前,必须提到卷积出现的背景。卷积是在信号与线性系统的基础上或背景中出现的,脱离这个背景单独谈卷积是没有任何意义的,除了那个所谓褶反公式上的数学意义和积分(或求和,离散情况下)。
    信号与线性系统,讨论的就是信号经过一个线性系统以后发生的变化(就是输入输出和所经过的所谓系统,这三者之间的数学关系)。所谓线性系统的含义,就是,这个所谓的系统,带来的输出信号与输入信号的数学关系式之间是线性的运算关系。
    因此,实际上,都是要根据我们需要待处理的信号形式,来设计所谓的系统传递函数,那么这个系统的传递函数和输入信号,在数学上的形式就是所谓的卷积关系。
    卷积关系最重要的一种情况,就是在信号与线性系统或数字信号处理中的卷积定理。利用该定理,可以将时间域或空间域中的卷积运算等价为频率域的相乘运算,从而利用FFT等快速算法,实现有效的计算,节省运算代价
    展开全文
  • 生活图像处理的一个小应用上周六做了一个频闪实验来研究物体的运动,但是由于频闪图片的特点必须在暗室拍摄才有效果,由于一些原因图片有些地方过曝形成死白,而另一些地方由于光太少曝光太少,导致了黑乎乎的一片...

    生活中图像处理的一个小应用

    上周六做了一个频闪实验来研究物体的运动,但是由于频闪图片的特点必须在暗室拍摄才有效果,由于一些原因图片有些地方过曝形成死白,而另一些地方由于光太少曝光太少,导致了黑乎乎的一片。最终结果就是,很难看到物体的运动轨迹。
    上图
    这里写图片描述
    这张图乍眼一看几乎什么都看不出来,跟别说取物体的坐标点了。

    当时就想到了刚学了点数字图像处理,于是就想着怎么把这个图像处理一下让他的物体细节更加清晰,于是我尝试了很多方法。

    第一个想到的是把图像变成灰色图像然后再把它选择合适的值给二值化,后来发现结果不尽如人意,因为左边的图像亮度偏高,亮度分布复杂,很容易要么丢失白线(物体上的标志)要么白线跟其他的混为一块白色,进过多次试验发现没有能把它分分开的灰度值。

    试了很多次处理方法,终于发现了一个效果比较好的方法直方图均衡化
    先介绍一下直方图均衡化
    直方图均衡化处理的“中心思想”是把原始图像的灰度直方图从比较集中的某个灰度区间变成在全部灰度范围内的均匀分布。直方图均衡化就是对图像进行非线性拉伸,重新分配图像像素值,使一定灰度范围内的像素数量大致相同。直方图均衡化就是把给定图像的直方图分布改变成“均匀”分布直方图分布。
      缺点:
      1)变换后图像的灰度级减少,某些细节消失;
      2)某些图像,如直方图有高峰,经处理后对比度不自然的过分增强。
    最后反思一下,发现这种方法确实合适,我们拍的图在灰度值较大的的区域分布得很密集,直方图均衡化把他们分开,那么很多变化就突出了,就好比示波器把横坐标时间和纵坐标幅值放大来观察波形一样。
    经过直方图均衡化的效果如图

    matlab代码如下
    I=imread('DSC08020.jpg');
    I=rgb2gray(I);
    figure;
    subplot(2,2,1);
    imshow(I);
    subplot(2,2,2);
    imhist(I);
    I1=histeq(I);
    figure;
    subplot(2,2,1);
    imshow(I1);
    subplot(2,2,2);
    imhist(I1);
    imwrite(I1,'result.jpg');%保存到m文件的目录下


    这里写图片描述
    这样就能很清晰的看到,物体的运动了。



    做到这里我还是不满意,于是打算使用图像处理检测到白线。但是无论我用什么边缘检测又或者hough变换发现效果都很差,主要是检测到很多非白线的东西,根本没法判断。
    套用模式识别的知识,在这个特征空间中这个是很难分开的(直线 、边缘),或者这种算法不可分。
    这次就到这里关于图像处理我只懂皮毛,希望能够跟深入的了解图像处理的知识。

    展开全文
  • 什么是数字图像处理?历史、以及它所研究的内容。 说起图像处理,你会想到什么?你是否真的了解这个领域所研究的内容。纵向来说,数字图像处理研究的历史相当悠久;横向来说,数字图像处理研究的话题相当广泛。 ...

    什么是数字图像处理?历史、以及它所研究的内容。

     

    说起图像处理,你会想到什么?你是否真的了解这个领域所研究的内容。纵向来说,数字图像处理研究的历史相当悠久;横向来说,数字图像处理研究的话题相当广泛。

    数字图像处理的历史可以追溯到近百年以前,大约在1920年的时候,图像首次通过海底电缆从英国伦敦传送到美国纽约。图像处理的首次应用是为了改善伦敦和纽约之间海底电缆发送的图片质量,那时就应用了图像编码,被编码后的图像通过海底电缆传送至目的地,再通过特殊设备进行输出。这是一次历史性的进步,传送一幅图片的时间从原来的一个多星期减少到了3小时。

    1950年,美国的麻省理工学院制造出了第一台配有图形显示器的电子计算机——旋风I号(Whirlwind I)。旋风I号的显示器使用一个类似于示波器的阴极射线管(Cathode Ray Tube,CRT)来显示一些简单的图形。1958年美国Calcomp公司研制出了滚筒式绘图仪,GerBer公司把数控机床发展成为平板式绘图仪。在这一时期,电子计算机都主要应用于科学计算,而为这些计算机配置的图形设备也仅仅是作为一种简单的输出设备。

    随着计算机技术的进步,数字图像处理技术也得到了很大的发展。1962年,当时还在麻省理工学院攻读博士学位的伊凡·苏泽兰(Ivan Sutherland)成功开发了具有划时代意义的“画板”(Sketchpad)程式。而这正是有史以来第一个交互式绘图系统,同时这也是交互式电脑绘图的开端。从此计算机和图形图像被更加紧密地联系到了一起。鉴于伊凡·苏泽兰为计算机图形学创立所做出的杰出贡献,他于1988年被授予计算机领域最高奖——图灵奖。

    1964年,美国加利福尼亚的喷气推进实验室用计算机对“旅行者七号”太空船发回的大批月球照片进行处理,以校正航天器上摄影机中各种类型的图像畸变,收到了明显的效果。在后来的宇航空间技术中,数字图像处理技术都发挥了巨大的作用。

    到了20世纪60年代末期,数字图像处理已经形成了比较完善的学科体系,这套理论在20世纪70年代发展得十分迅速,并开始应用于医学影像和天文学等领域。1972年,美国物理学家阿伦·马克利奥德·柯麦科(Allan MacLeodCormack)和英国电机工程师戈弗雷·纽博尔德·豪恩斯弗尔德(Godfrey Newbold Housfield)发明了轴向断层术,并将其用于头颅诊断。世界第一台X射线计算机轴向断层摄影装置由EMI公司研制成功,这也就是人们通常所说的CT(Computer Tomograph)。CT可通过一些算法用感知到的数据去重建通过物体的“切片”图像。这些图像组成了物体内部的再现图像,也就是根据人的头部截面的投影,经计算机处理来进行图像重建。鉴于CT对于医学诊断技术的发展所起到的巨大推动作用,柯麦科和豪恩斯弗尔德于1979年获得了诺贝尔生理或医学奖。

    随后在2003年,诺贝尔生理或医学奖的殊荣再次授予了两位在医疗影像设备研究方面做出杰出贡献的科学家——美国化学家保罗·劳特伯尔(Paul Lauterbur)和英国物理学家彼得·曼斯菲尔(Peter Mansfield)。两位获奖者在利用磁共振成像(Magnetic Resonance Imaging,MRI)显示不同结构方面分别取得了开创性成就。瑞典卡罗林斯卡医学院称,这两位科学家在MRI领域的开创性工作,代表了医学诊疗和研究的重大突破。而事实上,核磁共振的成功同样也离不开数字图像处理方面的发展。即使在今天,诸如MRI图像降噪等问题依然是数字图像处理领域的热门研究方向。

    说到数字图像的发展历程,还有一项至关重要的成果不得不提,那就是电荷耦合元件(Charge-coupled Device,CCD)。CCD最初是由美国贝尔实验室的科学家维拉德·波义耳(Willard Sterling Boyle)和乔治·史密斯(George Elwood Smith)于1969年发明的。CCD的作用就像胶片一样,它能够把光学影像转化为数字信号。今天人们所广泛使用的数码照相机、数码摄影机和扫描仪都是以CCD为基础发展而来的。换句话说,我们现在所研究的数字图像主要也都是通过CCD设备获取的。由于波义耳和史密斯在CCD研发上所做出的巨大贡献,他们两人共同荣获了2009年度的诺贝尔物理学奖。

    数字图像处理在今天是非常热门的技术之一,生活中无处不存在着它的影子,可以说它是一种每时每刻都在改变着人类生活的技术。但长久以来,很多人对数字图像处理存在着较大的曲解,人们总是不自觉地将图像处理和Photoshop联系在一起。大名鼎鼎的Photoshop无疑是当前使用最为广泛的图像处理工具。类似的软件还有Corel公司生产的CorelDRAW等软件。

    尽管Photoshop是一款非常优秀的图像处理软件,但它的存在并不代表数字图像处理的全部理论与方法。它所具有的功能仅仅是数字图像处理中的一部分。总的来说,数字图像处理研究的内容主要包括如下几个方面:

    • 1)图像获取和输出
    • 2)图像编码和压缩
    • 3)图像增强与复原
    • 4)图像的频域变换
    • 5)图像的信息安全
    • 6)图像的区域分割
    • 7)图像目标的识别
    • 8)图像的几何变换

    但图像处理的研究内容,又不仅限于上述内容!所以说图像处理的研究话题是相当宽泛的。那现在图像处理都应用在哪些领域呢?或许我们可能熟知的例子有(当然,你应该还能举出更多例子):

    • 1)一些专业图像处理软件:Photoshop、CorelDRAW……
    • 2)一些手机APP应用:美图秀秀、玩图……
    • 3)一些医学图像处理应用:MRI、彩超图像处理……
    • 4)一些制造业上的应用:元器件检测、瑕疵检测……
    • 5)一些摄像头、相机上的应用:夜间照片的质量改善……
    • 6)一些电影工业上是应用:换背景、电影特技……

     

    什么样的人会去学(或者需要学)图像处理?

     

    1)如果你是我上述那些应用领域的从业者,你当然需要掌握图像方面的理论和技术;2)相关专业的研究人员、大专院校的博士生、研究生。

    所谓相关专业又是指什么呢?这个答案也可能相当宽泛,例如(但不仅限于此):Computer Science, Software Engineering, Electronic Engineering, Biomedical Engineering, Automation, Control, Applied Mathematics……

     

    如何学好图像处理——我的一些箴言

     

    1)对于初级入门者

     

    一个扎实的基础和对于图像处理理论的完整的、系统的整体认识对于后续的深入研究和实践应用具有非常非常重要的意义。

    我经常喜欢拿武侠小说《天龙八部》中的一段情节来向读者说明此中的道理,相信读者对这部曾经被多次搬上银幕的金庸作品已经耳熟能详了。书中讲到有个名叫鸠摩智的番僧一心想练就绝世武学,而且他也算是个相当勤奋的人了。但是,他错就错在太过于急功近利,甚至使用道家的小无相功来催动少林绝技。看上去威力无比,而且可以在短时间内“速成”,但实则后患无穷。最终鸠摩智走火入魔,前功尽废,方才大彻大悟。这个故事其实就告诉我们打牢基础是非常重要的,特别是要取得更长足的发展,就更是要对基本原理刨根问底,力求甚解,从而做到庖丁解牛,游刃有余。

    一些看似高深的算法往往是许多基础算法的组合提升。例如,令很多人望而却步的SIFT特征构建过程中,就用到了图像金字塔、直方图、高斯滤波这些非常非常基础的内容。但是,它所涉及的基础技术显然有好几个,如果缺乏对图像处理理论的系统认识,你可能会感觉事倍功半。因为所有的地方好像都是沟沟坎坎。

    关于课程——

    在这个阶段其实对于数学的要求并不高,你甚至可以从一些感性的角度去形象化的理解图像处理中很多内容(但不包括频域处理方面的内容)。具体到学习的建议,如果有条件(例如你还在高校里读书)你最好能选一门图像处理方面的课程,系统地完整的地去学习一下。这显然是入门的最好办法。如此一来,在建立一个完整的、系统的认知上相当有帮助。如果你没办法在学校里上一门这样的课,网上的一些公开课也可以试试。但现在中文MOOC上还没有这方面的优质课程推荐。英文的课程则有很多,例如美国加州伦斯勒理工学院Rich教授的数字图像处理公开课——https://www.youtube.com/channel/UCaiJlKxXamoODQtlx486qJA?spfreload=10。

    关于教材——

    显然,只听课其实还不太够,如果能一并读一本书就最好了。其实不用参考很多书,只要一本,你能从头读到尾就很好了。如果你没有条件去上一门课,那读一本来完整的自学一下就更有必要了。这个阶段,去网上到处找博客、看帖子是不行的。因为你特别需要在这个阶段对这门学问建立一个系统的完整的知识体系。东一块、西一块的胡拼乱凑无疑是坑你自己,你的知识体系就像一个气泡,可能看起来很大,但是又脆弱的不堪一击。

    现在很多学校采用冈萨雷斯的《数字图像处理》一书作为教材。这是一本非常非常经典的著作。但是我必须要提醒读者:

    1)这是一本专门为Electronic Engineering专业学生所写的书。它需要有信号与系统、数字信号处理这两门课作为基础。如果你没有这两门课的基础,你读这本书要么是看热闹,要么就是看不懂。

    下面是冈书中的一张插图。对于EE的学生来说,这当然不是问题。但是如果没有我说的那两门课的基础,其实你很难把握其中的精髓。H和h,一个大小一个小写,冈书中有的地方用H,有的地方用h,这都是有很深刻用意的。原作者并没有特别说明它们二者的区别,因为他已经默认你应该知道二者是不同的。事实上,它们一个表示频域信号,一个表示时域信号,这也导致有时候运算是卷积,有时候运算是乘法(当然这跟卷积定理有关)。所以我并不太建议那些没有这方面基础的学生在自学的时候读这本书。

     

    2)冈萨雷斯教授的《数字图像处理》第一版是在1977年出版的,到现在已经快40年了;现在国内广泛使用的第二版是2002年出版的(第三版是2007年但是其实二者差异并不大),到现在也有20年左右的时间了。事实上,冈萨雷斯教授退休也有快30年了。所以这本书的内容已经偏于陈旧。数字图像处理这个领域的发展绝对是日新月异,突飞猛进的。特别在最近二三十年里,很多新思路,新方法不断涌现。如果你看了我前面推荐的Rich教授的公开课(这也是当前美国大学正在教学的内容),你一下子就会发现,原来我们的教育还停留在改革开放之前外国的水平上。这其实特别可怕。所以我觉得冈萨雷斯教授的《数字图像处理》作为学习过程中的一个补充还是不错的,但是如果把它作为主参考,那真的就是:国外都洋枪洋炮了,我们还在大刀长矛。

     

    那么现在问题来了,对于图像处理学习者而言到底看什么书好呢?我的意见是你可以选择下面两本书中的任何一本《数字图像处理原理与实践(Matlab版)》,以及《数字图像处理:技术详解与Visual C++实践》,当然选择的标准之一就是到底你更擅长使用MATLAB还是C++。

       

     

     

     

    2)对于中级水平者

     

    纸上得来终觉浅,绝知此事要躬行。对于一个具有一定基础的,想更进一步的中级水平的人来说,这个阶段最重要的就是增强动手实践的能力。

    还是说《天龙八部》里面的一个角色——口述武功、叹为观止的王语嫣。王语嫣的脑袋里都是武功秘籍,但问题是她从来都没练过一招一式。结果是,然并卵。所以光说不练肯定不灵啊。特别是,如果你将来想从事这个行业,结果一点代码都不会写,那几乎是不可想象的。学习阶段,最常被用来进行算法开发的工具是Matlab和OpenCV。你可以把这两个东西都理解为一个相当完善的库。当然,在工业中C++用得更多,所以Matlab的应用还是很有限的。前面我们讲到,图像处理研究内容其实包括:图像的获取和编解码,但使用Matlab和OpenCV就会掩盖这部分内容的细节。你当然永远不会知道,JPEG文件到底是如何被解码的。

    如果你的应用永远都不会涉及这些话题,那么你一直用Matlab和OpenCV当然无所谓。例如你的研究领域是SIFT、SURF这种特征匹配,可以不必理会编解码方面的内容。但是如果你的研究话题是降噪或者压缩,可能你就绕不开这些内容。最开始学的时候,如果能把这部分内容也自己写写,可能会加深你的理解。以后做高级应用开发时,再调用那些库。所以具体用什么,要不要自己写,是要视你所处的阶段和自己的实际情况而定的。以我个人的经验,在我自学的时候,我就动手写了Magic House,我觉得这个过程为我奠定了一个非常夯实的基础,对于我后续的深入研究很有帮助。

     

    下面这个文中,我给出了一些这方面的资源,代码多多,很值得参考学习:图像处理与机器视觉网络资源收罗

    http://blog.csdn.net/baimafujinji/article/details/32332079

     

    3)对于高级进阶者

     

    到了这个程度的读者,编程实现之类的基本功应该不在话下。但是要往深,往高去学习、研究和开发图像处理应用,你最需要的内容就变成了数学。这个是拦在很多处于这个阶段的人面前的一大难题。如果你的专业是应用数学,当然你不会感觉有问题。但如果是其他专业背景的人就会越发感觉痛苦。

    如果你的图像处理是不涉及机器学习内容的,例如用Poisson方程来做图像融合,那你就要有PDE数值解方面的知识;如果你要研究KAZE特征,你就必须要知道AOS方面的内容。如果你研究TV降噪,你又要知道泛函分析中的BV空间内容……这些词你可能很多都没听过。总的来说,这块需要的内容包括:复变函数、泛函分析、偏微分方程、变分法、数学物理方法……

    如果你要涉足机器视觉方法的内容,一些机器学习和数据挖掘方法的内容就不可或缺。而这部分内容同样需要很强大的数学基础,例如最大似然方法、梯度下降法、欧拉-拉格朗日方程、最小二乘估计、凸函数与詹森不等式……

    当然,走到这一步,你也已经脱胎换骨,从小白到大神啦!路漫漫其修远兮,吾将上下而求索。

     

    (全文完)

     

     

    展开全文
  • 前言:这是在听完学院有关图像处理之后的一些感想,将技术用在现实当中。 关键词:图像处理,交通 主体: 在校学习期间,学院为了让新生接触更多领域,了解前沿科技,设立新生研讨课。其中,有一节课专门介绍了...

    电子科技大学 格拉斯哥学院 2017贺宸 ,同组同学 无

    前言:这是在听完学院有关图像处理之后的一些感想,将技术用在现实当中。

    关键词:图像处理,交通

    主体:
    在校学习期间,学院为了让新生接触更多领域,了解前沿科技,设立新生研讨课。其中,有一节课专门介绍了图像处理。
    图像处理(image processing),是用计算机对图像进行分析,以达到所需结果的技术。又称影像处理。图像处理一般指数字图像处理。数字图像是指用工业相机、摄像机、扫描仪等设备经过拍摄得到的一个大的二维数组,该数组的元素称为像素,其值称为灰度值。图像处理技术一般包括图像压缩,增强和复原,匹配、描述和识别3个部分。
    在讲座上,老师展示了几个图像处理技术在实际生活中的运用。第一个展示是一张很高像素的照片,再利用图像处理技术之后,一些关键的像素被选择,这部分被选择的像素重新组合,变成了一张缩略图——就是一张缩小版的原图。这是将图像处理技术用于生成预览图,在浏览一些大图的时候,用户可以根据预览图,选择是否查看原图。这种应用可以为用户节省流量。还有一个运用,是在小车,无人飞行器上装载摄像头,利用图像处理技术处理摄像头拍摄的画面。就可以得到稳定的图像。若有两个摄像头,在处理之后,两张图像可以较好的拼接在一起,晃动的图像可以通过拼接,使得拍摄物体的主体部分稳定不晃动且无明显拼接痕迹。在演示视频中,由无人飞行器拍摄的主楼,在屏幕上稳定的显示了出来。在拍摄体积较大的物体时,一个摄像设备无法完整的记录下影像,可以用几台小摄像设备,利用图像处理的技术,得到完整的像。
    我觉得,这种技术可以运用于道路监控。我父亲是一位警察,就我故乡的情况来看,目前城市中的监控大都是在交通要道上设立摄像头,对往来车辆监控。监控系统发展至今,其拍摄画面像素非常高,图像里大大小小的车牌,经过放大后,上面的数字和字母可以看的非常清楚。这种系统固然优秀,但是,在有些偏远地区,或者是在高速上,很难做到在很长的一段道路上设立监控摄像头,高成本低收益。可是,当高速公路上出现拥挤情况时,警察也非常需要实时的画面,以便突发事件发生后采取应对措施。在这种情况下,无人飞行器和图像处理技术可以起到至关重要的作用。高速公路上,拥挤地段的位置和地点都是不确定,随时都会发生变化的。在警署指挥中心的人员,可以利用无人机,拍摄现场的实时画面。经过图像处理技术,将拍摄到高分辨率的图像简单加工,变成较为模糊的图像,通过网络发送至指挥中心的系统里。经过加工的低分辨率视频不会使用太多流量,当需要看到高清画面,如查看车牌,分析纠纷,界定责任的时候,可以查看原录像。另外,如需要一整段公路的交通情况,可以将几台摄像机拍摄的图像进行处理,合并,得到一个整体的路段情况。
    During the school study period, the college set up a new seminar for the new students to contact more fields, understand cutting-edge technology. Among them, there is a class devoted to image processing. Image processing is a technique of analyzing an image with a computer to achieve a desired result. Also known as image processing. Image processing generally refers to digital image processing. A digital image is a large two-dimensional array taken with an industrial camera, camera, scanner, etc. The elements of the array are called pixels and their values are called gray values. Image processing techniques generally include image compression, enhancement and restoration, matching, description and recognition of three parts. In the lecture, the teacher showed the application of several image processing techniques in real life. The first display is a very high-resolution photo. After using image processing technology, some key pixels are selected. This part of the selected pixels is recombined into a thumbnail - a reduced version. Original picture. This is to use image processing technology to generate preview images. When browsing some large images, users can choose whether to view the original image according to the preview image. This kind of application can save traffic for users. Another application is to load a camera on a car or an unmanned aerial vehicle, and use image processing technology to process the picture taken by the camera. A stable image can be obtained. If there are two cameras, after processing, the two images can be better spliced ​​together, and the swaying images can be spliced so that the main part of the object is stable without shaking and no obvious splicing marks. In the demo video, the main building taken by the unmanned aerial vehicle is displayed on the screen stably. When shooting a large object, a camera device cannot record the image completely. You can use several small camera devices to obtain a complete image by using image processing technology. I think this technology can be applied to road monitoring. My father is a policeman. As far as the situation in my hometown is concerned, most of the current monitoring in the city is to set up a camera on the main road to monitor the traffic. Since the development of the monitoring system, the pixels of the shooting screen are very high. The large and small license plates in the image can be seen clearly after the enlarged numbers and letters. This kind of system is excellent, but in some remote areas, or at high speeds, it is difficult to set up surveillance cameras on a long road, high cost and low profit. However, when congestion occurs on the highway, the police also need a real-time picture to take countermeasures after an emergency. In this case, unmanned aerial vehicles and image processing techniques can play a crucial role. On the highway, the location and location of the crowded areas are uncertain and will change at any time. The personnel at the police command center can use the drone to take a live view of the scene. Through the image processing technology, the high-resolution image is simply processed into a more blurred image and sent to the command center system via the network. Processed low-resolution video does not use too much traffic. When you need to see high-definition images, such as viewing license plates, analyzing disputes, and defining responsibilities, you can view the original video. In addition, if you need a whole road traffic situation, you can process and combine the images taken by several cameras to get an overall road segment.

    结语:
    这是个人的一些畅想,未经过学术性的调研。

    展开全文
  • 针对遥感数字图像处理的三大内容(质量...本书特别强调从图像含义的角度来理解遥感数字图像处理各种算法的物理意义,因此本书尽量避免数学公式的罗列与推导,而是借助生活中一些通俗易懂的案例来引导读者理解各种算法。
  • 图像是人类获取和交换信息的主要来源,因此,图像处理的应用领域必然涉及到人类生活和工作的方方面面。随着人类活动范围的不断扩大,图像处理的应用领域也将随之不断扩大。 1)航天和航空方面 航天和航空技术方面的...
  • 图像处理实例

    2020-07-30 23:32:03
    图像处理骨架提取实例,图像处理骨架提取实例,图像处理骨架提取实例
  • 1.《图形图像处理-之-一个复杂度为常数的快速局部自适应算法 上篇  》 http://blog.csdn.net/housisong/article/details/2316924 2.《图形图像处理-之-误差扩散 中篇 》 ...3.《图形图像处理-之-误差扩散 下篇 -...
  • 电子科技大学 格拉斯哥学院 2017级 梁宇涵 随着人类正快速的进入了信息时代,计算机技术也因此...这都是图像处理技术的应用,在计算机功能日渐发达的今日,图像处理技术也慢慢的成为了我们生活中不可或缺的技术。 所...
  • 什么是数字图像处理?历史、以及它所研究的内容 本文引用地址:http://www.eepw.com.cn/article/201702/344072.htm  说起图像处理,你会想到什么?你是否真的了解这个领域所研究的内容。纵向来说,数字图像处理...
  • 【项目实战派】图像处理项目的硬件平台选型 一直以来我都对嵌入式系统比较感兴趣,因为感到图像处理最终还是要走向便携式、移动化的。这里讲自己对图像处理项目的硬件平台选型这块的想法进行交流,欢迎交流、批评。...
  • 针对遥感数字图像处理的三大内容(质量...本书特别强调从图像含义的角度来理解遥感数字图像处理各种算法的物理意义,因此本书尽量避免数学公式的罗列与推导,而是借助生活中一些通俗易懂的案例来引导读者理解各种算法。
  • 图像处理(以及机器视觉)在学校里是一个很大的研究方向,很多研究生、博士生都在导师的带领下从事着这方面的研究。另外,就工作而言,也确实有很多这方面的岗位和机会虚位以待。而且这种情势也越来越凸显。那么图像...
  • 数字图像处理的学习

    2016-10-17 21:46:44
    什么是数字图像处理?历史、以及它所研究的内容。 说起图像处理,你会想到什么?你是否真的了解这个领域所研究的内容。纵向来说,数字图像处理研究的历史相当悠久;横向来说,数字图像处理研究的话题相当广泛。...
  • 在我的理解里,要实现计算机视觉必须有图像处理的帮助,而图像处理倚仗与模式识别的有效运用,而模式识别是人工智能领域的一个重要分支,人工智能与机器学习密不可分。纵观一切关系,发现计算机视觉的应用服务于机器...
  • 一、 什么是卷积?  在图像处理中,卷积操作指的是使用一个卷积核对... 卷积核(算子)是用来做图像处理时的矩阵,图像处理时也称为掩膜,是与原图像做运算的参数。卷积核通常是一个四方形的网格结构(例如3*3的矩
  • 数字图像处理(Digital Image Processing)又称为计算机图像处理,它是指将图像信号转换成数字信号并利用计算机对其进行处理的过程。数字图像处理最早出现于20世纪50年代,当时的电子计算机已经发展到一定水平,人们...
  • 医学图像处理综述

    2019-07-10 19:38:06
    医学图像处理的对象是各种不同成像机理的医学影像,临床广泛使用的医学成像种类主要有X-射线成像 (X-CT)、核磁共振成像(MRI)、核医学成像(NMI)和超声波成像(UI)四类。在目前的影像医疗诊断中,主要是通过...
  • 图像处理界的标准图像Lena背后的故事  2009-06-15 01:04:27| 分类: 电脑技术|举报|字号 订阅 在数字图像处理中,Lena(Lenna)是一张被广泛使用的标准图片,特别在图像压缩的算法研究中。...
  • VC数字图像处理编程

    2013-12-04 17:31:01
    数字图像处理技术与理论是计算机应用的一个重要领域,许多工程应用都涉及到图像处理,一直有一个强烈的愿望,想系统的写一个关于数字图像处理的讲座,由于工作学习很忙,时至今日才得以实现。  “图”是物体...
1 2 3 4 5 ... 20
收藏数 21,331
精华内容 8,532
关键字:

图像处理 生活例子