图像处理的最近发展_图像处理与计算机视觉 最近发展 - CSDN
精华内容
参与话题
  • Last update: 2012-6-7 这一章是计算机视觉部分,主要侧重在底层特征提取,视频分析,跟踪,目标检测和识别方面等方面。对于自己不太熟悉的领域比如摄像机标定和立体视觉,仅仅列出上google上引用次数比较...

    Last update: 2012-6-7


    这一章是计算机视觉部分,主要侧重在底层特征提取,视频分析,跟踪,目标检测和识别方面等方面。对于自己不太熟悉的领域比如摄像机标定和立体视觉,仅仅列出上google上引用次数比较多的文献。有一些刚刚出版的文章,个人非常喜欢,也列出来了。


    本章的下载地址:

    http://iask.sina.com.cn/u/2252291285/ish?folderid=868772


    1. Active Appearance Models

    活动表观模型和活动轮廓模型基本思想来源Snake,现在在人脸三维建模方面得到了很成功的应用,这里列出了三篇最初最经典的文章。对这个领域有兴趣的可以从这三篇文章开始入手。

    [1998 ECCV] ActiveAppearance Models

    [2001 PAMI] ActiveAppearance Models

     

    2. Active Shape Models

    [1995 CVIU]Active ShapeModels-Their Training and Application

     

    3. Background modeling andsubtraction

    背景建模一直是视频分析尤其是目标检测中的一项关键技术。虽然最近一直有一些新技术的产生,demo效果也很好,比如基于dynamical texture的方法。但最经典的还是Stauffer等在1999年和2000年提出的GMM方法,他们最大的贡献在于不用EM去做高斯拟合,而是采用了一种迭代的算法,这样就不需要保存很多帧的数据,节省了buffer。Zivkovic在2004年的ICPR和PAMI上提出了动态确定高斯数目的方法,把混合高斯模型做到了极致。这种方法效果也很好,而且易于实现。在OpenCV中有现成的函数可以调用。在背景建模大家族里,无参数方法(2000 ECCV)和Vibe方法也值得关注。

    [1997 PAMI] PfinderReal-Time Tracking of the Human Body

    [1999 CVPR] Adaptivebackground mixture models for real-time tracking

    [1999 ICCV] WallflowerPrinciples and Practice of Background Maintenance

    [2000 ECCV] Non-parametricModel for Background Subtraction

    [2000 PAMI] LearningPatterns of Activity Using Real-Time Tracking

    [2002 PIEEE] Backgroundand foreground modeling using nonparametric kernel density estimation forvisual surveillance

    [2004 ICPR] Improvedadaptive Gaussian mixture model for background subtraction

    [2004 PAMI] Recursiveunsupervised learning of finite mixture models

    [2006 PRL] Efficientadaptive density estimation per image pixel for the task of backgroundsubtraction

    [2011 TIP] ViBe AUniversal Background Subtraction Algorithm for Video Sequences

     

    4.  Bag of Words

    词袋,在这方面暂时没有什么研究。列出三篇引用率很高的文章,以后逐步解剖之。

    [2003 ICCV] Video Google AText Retrieval Approach to Object Matching in Videos

    [2004 ECCV] VisualCategorization with Bags of Keypoints

    [2006 CVPR] Beyond bags offeatures Spatial pyramid matching for recognizing natural scene categories

     

    5.  BRIEF

    BRIEF是BinaryRobust Independent Elementary Features的简称,是近年来比较受关注的特征描述的方法。ORB也是基于BRIEF的。

    [2010 ECCV] BRIEF BinaryRobust Independent Elementary Features

    [2011 ICCV] ORB anefficient alternative to SIFT or SURF

    [2012 PAMI] BRIEFComputing a Local Binary Descriptor Very Fast

     

    6. Camera Calibration and StereoVision

    非常不熟悉的领域。仅仅列出了十来篇重要的文献,供以后学习。

    [1979 Marr] AComputational Theory of Human Stereo Vision

    [1985] Computationalvision and regularization theory

    [1987 IEEE] A versatilecamera calibration technique for high-accuracy 3D machine vision metrologyusing off-the-shelf TV cameras and lenses

    [1987] ProbabilisticSolution of Ill-Posed Problems in Computational Vision

    [1988 PIEEE] Ill-PosedProblems in Early Vision

    [1989 IJCV] KalmanFilter-based Algorithms for Estimating Depth from Image Sequences

    [1990 IJCV] RelativeOrientation

    [1990 IJCV] Usingvanishing points for camera calibration

    [1992 ECCV] Cameraself-calibration Theory and experiments

    [1992 IJCV] A theory ofself-calibration of a moving camera

    [1992 PAMI] Cameracalibration with distortion models and accuracy evaluation

    [1994 IJCV] TheFundamental Matrix Theory, Algorithms, and Stability Analysis

    [1994 PAMI] a stereomatching algorithm with an adaptive window theory and experiment

    [1999 ICCV] Flexiblecamera calibration by viewing a plane from unknown orientations

    [1999 IWAR] Markertracking and hmd calibration for a video-based augmented reality conferencingsystem

    [2000 PAMI] A flexible newtechnique for camera calibration

     

    7. Color and Histogram Feature

    这里面主要来源于图像检索,早期的图像检测基本基于全局的特征,其中最显著的就是颜色特征。这一部分可以和前面的Color知识放在一起的。

    [1995 SPIE] Similarity ofcolor images

    [1996 PR] IMAGE RETRIEVALUSING COLOR AND SHAPE

    [1996] comparing imagesusing color coherence vectors

    [1997 ] Image IndexingUsing Color Correlograms

    [2001 TIP] An EfficientColor Representation for Image Retrieval

    [2009 CVIU] Performanceevaluation of local colour invariants

     

    8. Deformable Part Model

    大红大热的DPM,在OpenCV中有一个专门的topic讲DPM和latent svm

    [2008 CVPR] ADiscriminatively Trained, Multiscale, Deformable Part Model

    [2010 CVPR] Cascade ObjectDetection with Deformable Part Models

    [2010 PAMI] ObjectDetection with Discriminatively Trained Part-Based Models

     

    9. Distance Transformations

    距离变换,在OpenCV中也有实现。用来在二值图像中寻找种子点非常方便。

    [1986 CVGIP] DistanceTransformations in Digital Images

    [2008 ACM] 2D EuclideanDistance Transform Algorithms A Comparative Survey

     

    10. Face Detection

    最成熟最有名的当属Haar+Adaboost

    [1998 PAMI] NeuralNetwork-Based Face Detection

    [2002 PAMI] Detectingfaces in images a survey

    [2002 PAMI] Face Detectionin Color Images

    [2004 IJCV] RobustReal-Time Face Detection

     

    11. Face Recognition

    不熟悉,简单罗列之。

    [1991] Face RecognitionUsing Eigenfaces

    [2000 PAMI] AutomaticAnalysis of Facial Expressions The State of the Art

    [2000] Face Recognition ALiterature Survey

    [2006 PR] Face recognitionfrom a single image per person A survey

    [2009 PAMI] Robust FaceRecognition via Sparse Representation

     

    12. FAST

    机器学习的方法来提取角点,号称很快很好。

    [2006 ECCV] Machinelearning for high-speed corner detection

    [2010 PAMI] Faster andBetter A Machine Learning Approach to Corner Detection

     

    13.  Feature Extraction

    这里的特征主要都是各种不变性特征,SIFT,Harris,MSER等也属于这一类。把它们单独列出来是因为这些方法更流行一点。关于不变性特征,王永明与王贵锦合著的《图像局部不变性特征与描述》写的还不错。Mikolajczyk在2005年的PAMI上的文章以及2007年的综述是不错的学习材料。

    [1989 PAMI] On thedetection of dominant points on digital curves

    [1997 IJCV] SUSAN—A NewApproach to Low Level Image Processing

    [2004 IJCV] MatchingWidely Separated Views Based on Affine Invariant Regions

    [2004 IJCV] Scale &Affine Invariant Interest Point Detectors

    [2005 PAMI] A performanceevaluation of local descriptors

    [2006 IJCV] A Comparisonof Affine Region Detectors

    [2007 FAT] Local InvariantFeature Detectors - A Survey

    [2011 IJCV] Evaluation ofInterest Point Detectors and Feature Descriptors

     

    14. Feature Matching

    [2012 PAMI] LDAHashImproved Matching with Smaller Descriptors

     

    15.  Harris

    虽然过去了很多年,Harris角点检测仍然广泛使用,而且基于它有很多变形。如果仔细看了这种方法,从直观也可以感觉到这是一种很稳健的方法。

    [1988 Harris] A combinedcorner and edge detector

     

    16.   Histograms of OrientedGradients

    HoG方法也在OpenCV中实现了:HOGDescriptor。

    [2005 CVPR] Histograms ofOriented Gradients for Human Detection

    NavneetDalalThesis.pdf

     

    17. Image Distance

    [1993 PAMI] ComparingImages Using the Hausdorff Distance

     

    18. Image Stitching

    图像拼接,另一个相关的词是Panoramic。在Computer Vision: Algorithms and Applications一书中,有专门一章是讨论这个问题。这里的两面文章一篇是综述,一篇是这方面很经典的文章。

    [2006 Fnd] Image Alignmentand Stitching A Tutorial

    [2007 IJCV] AutomaticPanoramic Image Stitching using Invariant Features

     

    19.  KLT

    KLT跟踪算法,基于Lucas-Kanade提出的配准算法。除了三篇很经典的文章,最后一篇给出了OpenCV实现KLT的细节。

    [1981] An Iterative ImageRegistration Technique with an Application to Stereo Vision full version

    [1994 CVPR] Good Featuresto Track

    [2004 IJCV]  Lucas-Kanade 20 Years On A Unifying Framework

    Pyramidal Implementationof the Lucas Kanade Feature Tracker OpenCV

     

    20. Local Binary Pattern

    LBP。OpenCV的Cascade分类器也支持LBP,用来取代Haar特征。

    [2002 PAMI]Multiresolution gray-scale and rotation Invariant Texture Classification withLocal Binary Patterns

    [2004 ECCV] FaceRecognition with Local Binary Patterns

    [2006 PAMI] FaceDescription with Local Binary Patterns

    [2011 TIP]Rotation-Invariant Image and Video Description With Local Binary PatternFeatures

     

    21. Low-Level Vision

    关于Low level vision的两篇很不错的文章

    [1998 TIP] A generalframework for low level vision

    [2000 IJCV] LearningLow-Level Vision

     

    22. Mean Shift

    均值漂移算法,在跟踪中非常流行的方法。Comaniciu在这个方面做出了重要的贡献。最后三篇,一篇是CVIU上的top download文章,一篇是最新的PAMI上关于Mean Shift的文章,一篇是OpenCV实现的文章。

    [1995 PAMI] Mean shift,mode seeking, and clustering

    [2002 PAMI] Mean shift arobust approach toward feature space analysis

    [2003 CVPR] Mean-shiftblob tracking through scale space

    [2009 CVIU] Objecttracking using SIFT features and mean shift

    [2012 PAMI] Mean ShiftTrackers with Cross-Bin Metrics

    OpenCV Computer VisionFace Tracking For Use in a Perceptual User Interface

     

    23.  MSER

    这篇文章发表在2002年的BMVC上,后来直接录用到2004年的IVC上,内容差不多。MSER在Sonka的书里面也有提到。

    [2002 BMVC] Robust WideBaseline Stereo from Maximally Stable Extremal Regions

    [2003] MSER AuthorPresentation

    [2004 IVC] Robustwide-baseline stereo from maximally stable extremal regions

    [2011 PAMI] Are MSERFeatures Really Interesting

     

    24. Object Detection

    首先要说的是第一篇文章的作者,Kah-Kay Sung。他是MIT的博士,后来到新加坡国立任教,极具潜力的一个老师。不幸的是,他和他的妻子都在2000年的新加坡空难中遇难,让人唏嘘不已。

    http://en.wikipedia.org/wiki/Singapore_Airlines_Flight_006

    最后一篇文章也是Fua课题组的,作者给出的demo效果相当好。

    [1998 PAMI] Example-basedlearning for view-based human face detection

    [2000 CVPR] A Statistical Method for 3D Object Detection Applied to Faces and Cars

    [2003 IJCV] Learning theStatistics of People in Images and Video

    [2011 PAMI] Learning toDetect a Salient Object

    [2012 PAMI] A Real-TimeDeformable Detector

     

    25. Object Tracking

    跟踪也是计算机视觉中的经典问题。粒子滤波,卡尔曼滤波,KLT,mean shift,光流都跟它有关系。这里列出的是传统意义上的跟踪,尤其值得一看的是2008的Survey和2003年的Kernel based tracking。

    [2003 PAMI] Kernel-basedobject tracking

    [2007 PAMI] TrackingPeople by Learning Their Appearance

    [2008 ACM] Object TrackingA Survey

    [2008 PAMI] Segmentationand Tracking of Multiple Humans in Crowded Environments

    [2011 PAMI] Hough Forestsfor Object Detection, Tracking, and Action Recognition

    [2011 PAMI] Robust ObjectTracking with Online Multiple Instance Learning

    [2012 IJCV] PWP3DReal-Time Segmentation and Tracking of 3D Objects

     

    26. OCR

    一个非常成熟的领域,已经很好的商业化了。

    [1992 IEEE] Historical reviewof OCR research and development

    Video OCR A Survey andPractitioner's Guide

     

    27. Optical Flow

    光流法,视频分析所必需掌握的一种算法。

    [1981 AI] DetermineOptical Flow

    [1994 IJCV] Performance ofoptical flow techniques

    [1995 ACM] The Computationof Optical Flow

    [2004 TR] TutorialComputing 2D and 3D Optical Flow

    [2005 BOOK] Optical FlowEstimation

    [2008 ECCV] LearningOptical Flow

    [2011 IJCV] A Database andEvaluation Methodology for Optical Flow

     

    28.  Particle Filter

    粒子滤波,主要给出的是综述以及1998 IJCV上的关于粒子滤波发展早期的经典文章。

    [1998 IJCV] CONDENSATION—ConditionalDensity Propagation for Visual Tracking

    [2002 TSP] A tutorial onparticle filters for online nonlinear non-Gaussian Bayesian tracking

    [2002 TSP] Particlefilters for positioning, navigation, and tracking

    [2003 SPM] particle filter

     

    29. Pedestrian and Human detection

    仍然是综述类,关于行人和人体的运动检测和动作识别。

    [1999 CVIU] Visualanalysis of human movement_ A survey

    [2001 CVIU] A Survey ofComputer Vision-Based Human Motion Capture

    [2005 TIP] Image changedetection algorithms a systematic survey

    [2006 CVIU] a survey ofavdances in vision based human motion capture

    [2007 CVIU] Vision-basedhuman motion analysis An overview

    [2007 IJCV] PedestrianDetection via Periodic Motion Analysis

    [2007 PR] A survey ofskin-color modeling and detection methods

    [2010 IVC] A survey onvision-based human action recognition

    [2012 PAMI] PedestrianDetection An Evaluation of the State of the Art

     

    30. Scene Classification

    当相机越来越傻瓜化的时候,自动场景识别就非常重要。这是比拼谁家的Auto功能做的比较好的时候了。

    [2001 IJCV] Modeling theShape of the Scene A Holistic Representation of the Spatial Envelope

    [2001 PAMI] Visual WordAmbiguity

    [2007 PAMI] A ThousandWords in a Scene

    [2010 PAMI] EvaluatingColor Descriptors for Object and Scene Recognition

    [2011 PAMI] CENTRIST AVisual Descriptor for Scene Categorization

     

    31. Shadow Detection

    [2003 PAMI] Detectingmoving shadows-- algorithms and evaluation

    32.  Shape

    关于形状,主要是两个方面:形状的表示和形状的识别。形状的表示主要是从边缘或者区域当中提取不变性特征,用来做检索或者识别。这方面Sonka的书讲的比较系统。2008年的那篇综述在这方面也讲的不错。至于形状识别,最牛的当属J Malik等提出的Shape Context。

    [1993 PR] IMPROVED MOMENTINVARIANTS FOR SHAPE DISCRIMINATION

    [1993 PR] PatternRecognition by Affine Moment Invariants

    [1996 PR] IMAGE RETRIEVALUSING COLOR AND SHAPE

    [2001 SMI] Shape matchingsimilarity measures and algorithms

    [2002 PAMI] Shape matchingand object recognition using shape contexts

    [2004 PR] Review of shaperepresentation and description techniques

    [2006 PAMI] IntegralInvariants for Shape Matching

    [2008] A Survey of ShapeFeature Extraction Techniques

     

    33.  SIFT

    关于SIFT,实在不需要介绍太多,一万多次的引用已经说明问题了。SURF和PCA-SIFT也是属于这个系列。后面列出了几篇跟SIFT有关的问题。

    [1999 ICCV] Objectrecognition from local scale-invariant features

    [2000 IJCV] Evaluation ofInterest Point Detectors

    [2003 CVIU] Speeded-UpRobust Features (SURF)

    [2004 CVPR] PCA-SIFT AMore Distinctive Representation for Local Image Descriptors

    [2004 IJCV] DistinctiveImage Features from Scale-Invariant Keypoints

    [2010 IJCV] ImprovingBag-of-Features for Large Scale Image Search

    [2011 PAMI] SIFTflow DenseCorrespondence across Scenes and its Applications

     

    34.  SLAM

    Simultaneous Localization and Mapping, 同步定位与建图。

    SLAM问题可以描述为: 机器人在未知环境中从一个未知位置开始移动,在移动过程中根据位置估计和地图进行自身定位,同时在自身定位的基础上建造增量式地图,实现机器人的自主定位和导航。

    [2002 PAMI] SimultaneousLocalization and Map-Building Using Active Vision

    [2007 PAMI] MonoSLAMReal-Time Single Camera SLAM

     

    35. Texture Feature

    纹理特征也是物体识别和检索的一个重要特征集。

    [1973] Textural featuresfor image classification

    [1979 ] Statistical andstructural approaches to texture

    [1996 PAMI] Texturefeatures for browsing and retrieval of image data

    [2002 PR] Brief review ofinvariant texture analysis methods

    [2012 TIP] Color LocalTexture Features for Color Face Recognition

     

    36.  TLD

    Kadal创立了TLD,跟踪学习检测同步进行,达到稳健跟踪的目的。他的两个导师也是大名鼎鼎,一个是发明MSER的Matas,一个是Mikolajczyk。他还创立了一个公司TLDVision s.r.o. 这里给出了他的系列文章,最后一篇是刚出来的PAMI。

    [2009] Online learning ofrobust object detectors during unstable tracking

    [2010 CVPR] P-N LearningBootstrapping Binary Classifiers by Structural Constraints

    [2010 ICIP] FACE-TLDTRACKING-LEARNING-DETECTION APPLIED TO FACES

    [2012 PAMI]Tracking-Learning-Detection

     

    37.  Video Surveillance

    前面两个是两个很有名的视频监控系统,里面包含了很丰富的信息量,比如CMU的那个系统里面的背景建模算法也是相当简单有效的。最后一篇是比较近的综述。

    [2000 CMU TR] A System forVideo Surveillance and Monitoring

    [2000 PAMI] W4-- real-timesurveillance of people and their activitie

    [2008 MVA] The evolutionof video surveillance an overview

     

    38.  Viola-Jones

    Haar+Adaboost的弱弱联手,组成了最强大的利器。在OpenCV里面有它的实现,也可以选择用LBP来代替Haar特征。

    [2001 CVPR] Rapid objectdetection using a boosted cascade of simple features

    [2004 IJCV] RobustReal-time Face Detection


    展开全文
  • 图像处理与计算机视觉:基础,经典以及最近发展(1) 序  1. 为什么要写这篇文章 从2002年到现在,接触图像快十年了。虽然没有做出什么很出色的工作,不过在这个领域摸爬滚打了十年之后,发现自己对图像...

    图像处理与计算机视觉:基础,经典以及最近发展(1

     

    1. 为什么要写这篇文章

    从2002年到现在,接触图像快十年了。虽然没有做出什么很出色的工作,不过在这个领域摸爬滚打了十年之后,发现自己对图像处理和计算机视觉的感情越来越深厚。下班之后看看相关的书籍和文献是一件很惬意的事情。平常的一大业余爱好就是收集一些相关的文章,尤其是经典的文章,到现在我的电脑里面已经有了几十G的文章。写这个文档的想法源于我前一段时间整理文献时的一个突发奇想,既然有这个多文献,何不整理出其中的经典,共享给大家呢。于是当时即兴写了一个《图像处理与计算机视觉中的经典论文》。现在来看,那个文档写得及其拙劣,所共享的论文也非常之有限。就算如此,还是得到了一些网友的夸奖,心里感激不尽。因此,一直想下定决心把这个文章给完善,力求做到尽量全面。

    本文是对现有的图像处理和计算机视觉的经典书籍(后面会有推荐)的一个补充。一般的图像处理书籍都是介绍性的介绍某个方法,在每个领域内都会引用几十上百篇参考文献。有时候想深入研究这个领域的时候却发现文献太多,不知如何选择。但实际上在每个领域都有那么三五篇抑或更多是非读不可的经典文献。这些文献除了提出了很经典的算法,同时他们的Introduction和Related work也是对所在的领域很好的总结。读通了这几篇文献也就等于深入了解了这个领域,比单纯的看书收获要多很多。写本文的目的就是想把自己所了解到的各个领域的经典文章整理出来,不用迷失在文献的汪洋大海里。

    2. 图像处理和计算机视觉的分类

    按照当前流行的分类方法,可以分为以下三部分:

    图像处理:对输入的图像做某种变换,输出仍然是图像,基本不涉及或者很少涉及图像内容的分析。比较典型的有图像变换,图像增强,图像去噪,图像压缩,图像恢复,二值图像处理等等。基于阈值的图像分割也属于图像处理的范畴。一般处理的是单幅图像。

    图像分析:对图像的内容进行分析,提取有意义的特征,以便于后续的处理。处理的仍然是单幅图像。

    计算机视觉:对图像分析得到的特征进行分析,提取场景的语义表示,让计算机具有人眼和人脑的能力。这时处理的是多幅图像或者序列图像,当然也包括部分单幅图像。

    关于图像处理,图像分析和计算机视觉的划分并没有一个很统一的标准。一般的来说,图像处理的书籍总会或多或少的介绍一些图像分析和计算机视觉的知识,比如冈萨雷斯的数字图像处理。而计算机视觉的书籍基本上都会包括图像处理和图像分析,只是不会介绍的太详细。其实图像处理,图像分析和计算机视觉都可以纳入到计算机视觉的范畴:图像处理->低层视觉(low level vision),图像分析->中间层视觉(middle level vision),计算机视觉->高层视觉(high level vision)。这是一般的计算机视觉或者机器视觉的划分方法。在本文中,仍然按照传统的方法把这个领域划分为图像处理,图像分析和计算机视觉。

    3. 图像处理和计算机视觉开源库以及编程语言选择

    目前在图像处理中有两种最重要的语言:c/c++和matlab。它们各有优点:c/c++比较适合大型的工程,效率较高,而且容易转成硬件语言,是工业界的默认语言之一。而matlab实现起来比较方便,适用于算法的快速验证,而且matlab有成熟的工具箱可以使用,比如图像处理工具箱,信号处理工具箱。它们有一个共同的特点:开源的资源非常多。在学术界matlab使用的非常多,很多作者给出的源代码都是matlab版本。最近由于OpenCV的兴起和不断完善,c/c++在图像处理中的作用越来越大。总的来说,c/c++和matlab都必须掌握,最好是精通,当然侧重在c/c++上对找工作会有很大帮助。

    至于开源库,个人非常推荐OpenCV,主要有以下原因:

    (1)简单易入手。opencv进入opencv2.x的时代后,使用起来越来越简单,接口越来越傻瓜化,越来越matlab化。只要会imread,imwrite,imshow和了解Mat的基本操作就可以开始入手了。

    (2)Opencv有一堆图像处理和计算机视觉的大牛在维护,bug在逐步减少,每个新的版本都会带来不同的惊喜。而且它已经或者逐步在移植到不同的平台,并提供了对Python的很好的支持。

    (3)在Opencv上可以尝试各种最新以及成熟的技术,而不需要自己从头去写,比如人脸检测(Harr,LBP),DPM(Latent SVM),高斯背景模型,特征检测,聚类,hough变换等等。而且它还支持各种机器学习方法(SVM,NN,KNN,决策树,Boosting等),使用起来很简单。

    (4)文档内容丰富,并且给出了很多示例程序。当然也有一些地方文档描述不清楚,不过看看代码就很清楚了。

    (5)完全开源。可以从中间抠出任何需要的算法。

    (6)从学校出来后,除极少数会继续在学术圈里,大部分还是要进入工业界。现在在工业界,c/c++仍是主流,很多公司都会优先考虑熟悉或者精通opencv的。事实上,在学术界,现在opencv也大有取代matlab之势。以前的demo或者sourcecode,很多作者都愿意给出matlab版本的,然后别人再呼哧呼哧改成c版本的。现在作者干脆给出c/c++版本,或者自己集成到opencv中去,这样能快速提升自己的影响力。

    如果想在图像处理和计算机视觉界有比较深入的研究,并且以后打算进入这个领域工作的话,建议把OpenCV作为自己的主攻方向。如果找工作的时候敢号称自己精通OpenCV的话,肯定可以找到一份满意的工作。

    4. 本文的特点和结构,以及适合的对象

    本文面向的对象是即将进入或者刚刚进入图像处理和计算机视觉领域的童鞋,可以在阅读书籍的同时参阅这些文献,能对书中提到的算法有比较深刻的理解。由于本文涉及到的范围比较广,如果能对计算机视觉的资深从业者也有一定的帮助,我将倍感欣慰。为了不至太误人子弟,每一篇文章都或多或少的看了一下,最不济也看了摘要(这句话实在整理之前写的,实际上由于精力有限,好多文献都只是大概扫了一眼,然后看了看google的引用数,一般在1000以上就放上来了,把这些文章细细品味一遍也是我近一两年之内的目标)。在成文的过程中,我本人也受益匪浅,希望能对大家也有所帮助。

    由于个人精力和视野的关系,有一些我未涉足过的领域不敢斗胆推荐,只是列出了一些引用率比较高的文章,比如摄像机标定和立体视觉。不过将来,由于工作或者其他原因,这些领域也会接触到,我会逐步增减这些领域的文章。同时文章的挑选也夹带了一些个人的喜好,比如我个人比较喜欢low level方向的,尤其是IJCV和PAMI上面的文章,因此这方面也稍微多点,希望不要引起您的反感。如果有什么意见或者建议,欢迎mail我。文章和资源我都会在我的csdn blog和sina ishare同步更新。在此申明:这些论文的版权归作者及其出版社所有,请勿用于商业目的。

     

    个人blog:

    http://blog.csdn.net/dcraw

    新浪iask地址:

    http://iask.sina.com.cn/u/2252291285/ish?folderid=868438

    本文的安排如下。第一部分是绪论。第二部分是图像处理中所需要用到的理论基础,主要是这个领域所涉及到的一些比较好的参考书籍。第三部分是计算机视觉中所涉及到的信号处理和模式识别文章。由于图像处理与图像分析太难区分了,第四部分集中讨论了它们。第五部分是计算机视觉部分。最后是小结。

    图像处理与计算机视觉:基础,经典以及最近发展(2

    图像处理与计算机视觉相关的书籍

    1. 数学

    我们所说的图像处理实际上就是数字图像处理,是把真实世界中的连续三维随机信号投影到传感器的二维平面上,采样并量化后得到二维矩阵。数字图像处理就是二维矩阵的处理,而从二维图像中恢复出三维场景就是计算机视觉的主要任务之一。这里面就涉及到了图像处理所涉及到的三个重要属性:连续性,二维矩阵,随机性。所对应的数学知识是高等数学(微积分),线性代数(矩阵论),概率论和随机过程。这三门课也是考研的三门课,构成了图像处理和计算机视觉最基础的数学基础。如果想要更进一步,就要到网上搜搜林达华推荐的数学数目了。

    2. 信号处理

    图像处理其实就是二维和三维信号处理,而处理的信号又有一定的随机性,因此经典信号处理和随机信号处理都是图像处理和计算机视觉中必备的理论基础。

    2.1经典信号处理

    信号与系统 (第2版) Alan V.Oppenheim等著 刘树棠译

    离散时间信号处理(第2版) A.V.奥本海姆等著刘树棠译

    数字信号处理:理论算法与实现 胡广书 (编者)

    2.2随机信号处理

    现代信号处理  张贤达著

    统计信号处理基础 :估计与检测理论Steven M.Kay等著 罗鹏飞等译

    自适应滤波器原理(第4版) Simon Haykin著郑宝玉等译

    2.3 小波变换

    信号处理的小波导引 :稀疏方法(原书第3版) tephaneMalla著, 戴道清等译

    2.4 信息论

    信息论基础 (原书第2版) Thomas M.Cover等著 阮吉寿等译

    3. 模式识别

    Pattern Recognition and MachineLearning Bishop, Christopher M. Springer

    模式识别(英文版) (第4版) 西奥多里德斯著

    Pattern Classification (2ndEdition) Richard O. Duda等著

    Statistical Pattern Recognition, 3rd Edition Andrew R. Webb等著

    模式识别(第3版) 张学工著

    4. 图像处理与计算机视觉的书籍推荐

    图像处理,分析与机器视觉 第三版Sonka等著 艾海舟等译

    Image Processing, Analysis and MachineVision

    这本书是图像处理与计算机视觉里面比较全的一本书了,几乎涵盖了图像视觉领域的各个方面。中文版的个人感觉也还可以,值得一看。

    数字图像处理 第三版 冈萨雷斯等著

    Digital Image Processing

    数字图像处理永远的经典,现在已经出到了第三版,相当给力。我的导师曾经说过,这本书写的很优美,对写英文论文也很有帮助,建议购买英文版的。

    计算机视觉:理论与算法 RichardSzeliski

    Computer Vision: Theory andAlgorithm

    微软的Szeliski写的一本最新的计算机视觉著作。内容非常丰富,尤其包括了作者的研究兴趣,比如一般的书里面都没有的Image Stitching和Image Matting等。这也从另一个侧面说明这本书的通用性不如Sonka的那本。不过作者开放了这本书的电子版,可以有选择性的阅读。

    Multiple View Geometry in Computer Vision 第二版Harley等著

    引用达一万多次的经典书籍了。第二版到处都有电子版的。第一版曾出过中文版的,后来绝版了。网上也可以找到电子版。

    计算机视觉:一种现代方法 DAForsyth等著

    Computer Vision: A ModernApproach

    MIT的经典教材。虽然已经过去十年了,还是值得一读。第二版已经在今年(2012年)出来了,在iask上可以找到非常清晰的版本,将近800页,补充了很多内容。期待影印版。

    Machine vision: theory,algorithms, practicalities 第三版 Davies著

    为数不多的英国人写的书,偏向于工业。

    Computer Vision:Algorithmsand Applications   Richard Szeliszi

    数字图像处理 第四版 Pratt著

    Digital Image Processing

    写作风格独树一帜,也是图像处理领域很不错的一本书。网上也可以找到非常清晰的电子版。

    小结

    罗嗦了这么多,实际上就是几个建议:

    (1)基础书千万不可以扔,也不能低价处理给同学或者师弟师妹。不然到时候还得一本本从书店再买回来的。钱是一方面的问题,对着全新的书看完全没有看自己当年上过的课本有感觉。

    (2)遇到有相关的课,果断选修或者蹭之,比如随机过程,小波分析,模式识别,机器学习,数据挖掘,现代信号处理甚至泛函。多一些理论积累对将来科研和工作都有好处。

    (3)资金允许的话可以多囤一些经典的书,有的时候从牙缝里面省一点都可以买一本好书。不过千万不要像我一样只囤不看。

    图像处理与计算机视觉:基础,经典以及最近发展(3

    计算机视觉中的信号处理与模式识别

    从本章开始,进入本文的核心章节。一共分三章,分别讲述信号处理与模式识别,图像处理与分析以及计算机视觉。与其说是讲述,不如说是一些经典文章的罗列以及自己的简单点评。与前一个版本不同的是,这次把所有的文章按类别归了类,并且增加了很多文献。分类的时候并没有按照传统的分类方法,而是划分成了一个个小的门类,比如SIFT,Harris都作为了单独的一类,虽然它们都可以划分到特征提取里面去。这样做的目的是希望能突出这些比较实用且比较流行的方法。为了以后维护的方法,按照字母顺序排的序。

    本章的下载地址在:

    http://iask.sina.com.cn/u/2252291285/ish?folderid=868770

    1. Boosting

    Boosting是最近十来年来最成功的一种模式识别方法之一,个人认为可以和SVM并称为模式识别双子星。它真正实现了“三个臭皮匠,赛过诸葛亮”。只要保证每个基本分类器的正确率超过50%,就可以实现组合成任意精度的分类器。这样就可以使用最简单的线性分类器。Boosting在计算机视觉中的最成功的应用无疑就是Viola-Jones提出的基于Haar特征的人脸检测方案。听起来似乎不可思议,但Haar+Adaboost确实在人脸检测上取得了巨大的成功,已经成了工业界的事实标准,并且逐步推广到其他物体的检测。

    Rainer Lienhart在2002 ICIP发表的这篇文章是Haar+Adaboost的最好的扩展,他把原始的两个方向的Haar特征扩展到了四个方向,他本人是OpenCV积极的参与着。现在OpenCV的库里面实现的Cascade Classification就包含了他的方法。这也说明了盛会(如ICIP,ICPR,ICASSP)也有好文章啊,只要用心去发掘。

    [1997]A Decision-Theoretic Generalization of on-Line Learning and an Application toBoosting

    [1998]Boosting the margin A new explanation for the effectiveness of voting methods

    [2002ICIP TR] Empirical Analysis of Detection Cascades of Boosted Classifiers forRapid ObjectDetection

    [2003]The Boosting Approach to Machine Learning An Overview

    [2004IJCV] Robust Real-time Face Detection

    2. Clustering

    聚类主要有K均值聚类,谱聚类和模糊聚类。在聚类的时候如果自动确定聚类中心的数目是一个一直没有解决的问题。不过这也很正常,评价标准不同,得到的聚类中心数目也不一样。不过这方面还是有一些可以参考的文献,在使用的时候可以基于这些方法设计自己的准则。关于聚类,一般的模式识别书籍都介绍的比较详细,不过关于cluster validity讲的比较少,可以参考下面的文章看看。

     

    [1989PAMI] Unsupervised Optimal Fuzzy Clustering

    [1991PAMI] A validity measure for fuzzy clustering

    [1995PAMI] On cluster validity for the fuzzy c-means model

    [1998]Some New Indexes of Cluster Validity

    [1999ACM] Data Clustering A Review

    [1999JIIS] On Clustering Validation Techniques

    [2001]Estimating the number of clusters in a dataset via the Gap statistic

    [2001NIPS] On Spectral Clustering

    [2002]A stability based method for discovering structure in clustered data

    [2007]A tutorial on spectral clustering

    3. Compressive Sensing

    最近大红大紫的压缩感知理论。

    [2006TIT] Compressed Sensing

    [2008SPM] An Introduction to Compressive Sampling

    [2011TSP] Structured Compressed Sensing From Theory to Applications

    4. Decision Trees

    对决策树感兴趣的同学这篇文章是非看不可的了。

    [1986]Introduction to Decision Trees

    5. Dynamical Programming

    动态规划也是一个比较使用的方法,这里挑选了一篇PAMI的文章以及一篇Book Chapter

    [1990PAMI] using dynamic programming for solving variational problems in vision

    [BookChapter] Dynamic Programming

    6. Expectation Maximization

    EM是计算机视觉中非常常见的一种方法,尤其是对参数的估计和拟合,比如高斯混合模型。EM和GMM在Bishop的PRML里单独的作为一章,讲的很不错。关于EM的tutorial,网上也可以搜到很多。

    [1977]Maximum likelihood from incomplete data via the EM algorithm

    [1996SPM] The Expectation-Maximzation Algorithm

    7. Graphical Models

    伯克利的乔丹大仙的Graphical Model,可以配合这Bishop的PRML一起看。

    [1999ML] An Introduction to Variational Methods for Graphical Models

    8. Hidden Markov Model

    HMM在语音识别中发挥着巨大的作用。在信号处理和图像处理中也有一定的应用。最早接触它是跟小波和检索相关的,用HMM来描述小波系数之间的相互关系,并用来做检索。这里提供一篇1989年的经典综述,几篇HMM在小波,分割,检索和纹理上的应用以及一本比较早的中文电子书,现在也不知道作者是谁,在这里对作者表示感谢。

    [1989] A tutorial on hidden markov models and selected applications in speechrecognition

    [1998TSP] Wavelet-based statistical signal processing using hidden Markov models

    [2001TIP] Multiscale image segmentation using wavelet-domain hidden Markov models

    [2002TMM] Rotation invariant texture characterization and retrieval using steerablewavelet-domain hiddenMarkov models

    [2003TIP] Wavelet-based texture analysis and synthesis using hidden Markov models

    HmmChinese book.pdf

    9. Independent Component Analysis

    同PCA一样,独立成分分析在计算机视觉中也发挥着重要的作用。这里介绍两篇综述性的文章,最后一篇是第二篇的TR版本,内容差不多,但比较清楚一些。

    [1999]Independent Component Analysis A Tutorial

    [2000NN] Independent component analysis algorithms and applications

    [2000]Independent Component Analysis Algorithms and Applications

    10. Information Theory

    计算机视觉中的信息论。这方面有一本很不错的书Information Theoryin Computer Vision and Pattern Recognition。这本书有电子版,如果需要用到的话,也可以参考这本书。

    [1995NC] An Information-Maximization Approach to Blind Separation and BlindDeconvolution

    [2010]An information theory perspective on computational vision

    11. Kalman Filter

    这个话题在张贤达老师的现代信号处理里面讲的比较深入,还给出了一个有趣的例子。这里列出了Kalman的最早的论文以及几篇综述,还有Unscented Kalman Filter。同时也有一篇Kalman Filter在跟踪中的应用以及两本电子书。

    [1960Kalman] A New Approach to Linear Filtering and Prediction Problems Kalman

    [1970]Least-squares estimation_from Gauss to Kalman

    [1997SPIE] A New Extension of the Kalman Filter to Nonlinear System

    [2000]The Unscented Kalman Filter for Nonlinear Estimation

    [2001Siggraph] An Introduction to the Kalman Filter_full

    [2003]A Study of the Kalman Filter applied to Visual Tracking

    12. Pattern Recognition and MachineLearning

    模式识别名气比较大的几篇综述

    [2000PAMI] Statistical pattern recognition a review

    [2004CSVT] An Introduction to Biometric Recognition

    [2010SPM] Machine Learning in Medical Imaging

    13. Principal Component Analysis

    著名的PCA,在特征的表示和特征降维上非常有用。

    [2001PAMI] PCA versus LDA

    [2001]Nonlinear component analysisas a kernel eigenvalue problem

    [2002]A Tutorial on Principal Component Analysis

    [2004PAMI] Two-dimensional PCA a new approach to appearance-based facerepresentation and recognition

    [2009]A Tutorial on Principal Component Analysis

    [2011]Robust Principal Component Analysis

    [BookChapter] Singular Value Decomposition and Principal Component Analysis

    14. Random Forest

    随机森林

    [2001ML] Random Forests

    15. RANSAC

    随机抽样一致性方法,与传统的最小均方误差等完全是两个路子。在Sonka的书里面也有提到。

    [2009BMVC] Performance Evaluation of RANSAC Family

    16. Singular Value Decomposition

    对于非方阵来说,就是SVD发挥作用的时刻了。一般的模式识别书都会介绍到SVD。这里列出了K-SVD以及一篇BookChapter

    [2006TSP] K-SVD An Algorithm for Designing Overcomplete Dictionaries for SparseRepresentation

    [BookChapter] Singular Value Decomposition and Principal Component Analysis

    17. Sparse Representation

    这里主要是Proceeding of IEEE上的几篇文章

    [2009PAMI] Robust Face Recognition via Sparse Representation

    [2009PIEEE] Image Decomposition and Separation Using Sparse Representations AnOverview

    [2010PIEEE] Dictionaries for Sparse Representation Modeling

    [2010PIEEE] It's All About the Data

    [2010PIEEE] Matrix Completion With Noise

    [2010PIEEE] On the Role of Sparse and Redundant Representations in Image Processing

    [2010PIEEE] Sparse Representation for Computer Vision and Pattern Recognition

    [2011SPM] Directionary Learning

    18. Support Vector Machines

    [1998]A Tutorial on Support Vector Machines for Pattern Recognition

    [2004]LIBSVM A Library for Support Vector Machines

    19. Wavelet

    在小波变换之前,时频分析的工具只有傅立叶变换。众所周知,傅立叶变换在时域没有分辨率,不能捕捉局部频域信息。虽然短时傅立叶变换克服了这个缺点,但只能刻画恒定窗口的频率特性,并且不能很好的扩展到二维。小波变换的出现很好的解决了时频分析的问题,作为一种多分辨率分析工具,在图像处理中得到了极大的发展和应用。在小波变换的发展过程中,有几个人是不得不提的,Mallat, Daubechies,Vetteri, M.N.Do, Swelden,Donoho。Mallat和Daubechies奠定了第一代小波的框架,他们的著作更是小波变换的必读之作,相对来说,小波十讲太偏数学了,比较难懂。而Mallat的信号处理的小波导引更偏应用一点。Swelden提出了第二代小波,使小波变换能够快速方便的实现,他的功劳有点类似于FFT。而Donoho,Vetteri,Mallat及其学生们提出了Ridgelet, Curvelet,Bandelet,Contourlet等几何小波变换,让小波变换有了方向性,更便于压缩,去噪等任务。尤其要提的是M.N.Do,他是一个越南人,得过IMO的银牌,在这个领域著作颇丰。我们国家每年都有5个左右的IMO金牌,希望也有一两个进入这个领域,能够也让我等也敬仰一下。而不是一股脑的都进入金融,管理这种跟数学没有多大关系的行业,呵呵。很希望能看到中国的陶哲轩,中国的M.N.Do。

    说到小波,就不得不提JPEG2000。在JPEG2000中使用了Swelden和Daubechies提出的用提升算法实现的9/7小波和5/3小波。如果对比JPEG和JPEG2000,就会发现JPEG2000比JPEG在性能方面有太多的提升。本来我以为JPEG2000的普及只是时间的问题。但现在看来,这个想法太Naive了。现在已经过去十几年了,JPEG2000依然没有任何出头的迹象。不得不说,工业界的惯性力量太强大了。如果以前的东西没有什么硬伤的话,想改变太难了。不巧的是,JPEG2000的种种优点在最近的硬件上已经有了很大的提升。压缩率?现在动辄1T,2T的硬盘,没人太在意压缩率。渐进传输?现在的网速包括无线传输的速度已经相当快了,渐进传输也不是什么优势。感觉现在做图像压缩越来越没有前途了,从最近的会议和期刊文档也可以看出这个趋势。不管怎么说,JPEG2000的Overview还是可以看看的。

    [1989PAMI] A theory for multiresolution signal decomposition__the waveletrepresentation

    [1996PAMI] Image Representation using 2D Gabor Wavelet

    [1998] FACTORING WAVELET TRANSFORMSIN TO LIFTING STEPS

    [1998]The Lifting Scheme_ A Construction Of Second Generation Wavelets

    [2000TCE] The JPEG2000 still image coding system_ an overview

    [2002TIP] The curvelet transform for image denoising

    [2003TIP] Gray and color imagecontrast enhancement by the curvelet transform

    [2003TIP] Mathematical Properties of the jpeg2000 wavelet filters

    [2003TIP] The finite ridgelet transform for image representation

    [2005TIP] Sparse Geometric Image Representations With Bandelets

    [2005TIP] The Contourlet Transform_ An Efficient Directional Multiresolution ImageRepresentation

    [2010SPM] The Curvelet Transform

    图像处理与计算机视觉:基础,经典以及最近发展(4

    图像处理与分析

    本章主要讨论图像处理与分析。虽然后面计算机视觉部分的有些内容比如特征提取等也可以归结到图像分析中来,但鉴于它们与计算机视觉的紧密联系,以及它们的出处,没有把它们纳入到图像处理与分析中来。同样,这里面也有一些也可以划归到计算机视觉中去。这都不重要,只要知道有这么个方法,能为自己所用,或者从中得到灵感,这就够了。

    本章的下载地址在:

    http://iask.sina.com.cn/u/2252291285/ish?folderid=868771

    1.Bilateral Filter

    Bilateral Filter俗称双边滤波器是一种简单实用的具有保持边缘作用的平缓滤波器,由Tomasi等在1998年提出。它现在已经发挥着重大作用,尤其是在HDR领域。

    [1998 ICCV]BilateralFiltering for Gray and Color Images

    [2008 TIP]AdaptiveBilateral Filter for Sharpness Enhancement and Noise Removal

    2.Color

    如果对颜色的形成有一定的了解,能比较深刻的理解一些算法。这方面推荐冈萨雷斯的数字图像处理中的相关章节以及Sharma在Digital Color Imaging Handbook中的第一章“Colorfundamentals for digital imaging”。跟颜色相关的知识包括Gamma,颜色空间转换,颜色索引以及肤色模型等,这其中也包括著名的EMD。

    [1991 IJCV] ColorIndexing

    [2000 IJCV] TheEarthMover's Distance as a Metric for Image Retrieval

    [2001 PAMI]Colorinvariance

    [2002 IJCV]StatisticalColor Models with Application to Skin Detection

    [2003] A review ofRGBcolor spaces

    [2007 PR]A surveyofskin-color modeling and detection methods

    Gamma.pdf

    GammaFAQ.pdf

    3.Compressionand Encoding

    个人以为图像压缩编码并不是当前很热的一个话题,原因前面已经提到过。这里可以看看一篇对编码方面的展望文章

    [2005 IEEE] Trendsandperspectives in image and video coding

    4.ContrastEnhancement

    对比度增强一直是图像处理中的一个恒久话题,一般来说都是基于直方图的,比如直方图均衡化。冈萨雷斯的书里面对这个话题讲的比较透彻。这里推荐几篇个人认为不错的文章。

    [2002 IJCV] Vision andtheAtmosphere

    [2003 TIP] Gray andcolorimage contrast enhancement by the curvelet transform

    [2006 TIP]Gray-levelgrouping (GLG) an automatic method for optimized imagecontrastenhancement-part II

    [2006 TIP]Gray-levelgrouping (GLG) an automatic method for optimized imagecontrastEnhancement-part I

    [2007 TIP]TransformCoefficient Histogram-Based Image Enhancement Algorithms UsingContrast Entropy

    [2009 TIP] AHistogramModification Framework and Its Application for Image ContrastEnhancement

    5.Deblur (Restoration)

    图像恢复或者图像去模糊一直是一个非常难的问题,尤其是盲图像恢复。港中文的jiaya jia老师在这方面做的不错,他在主页也给出了exe。这方面的内容也建议看冈萨雷斯的书。这里列出了几篇口碑比较好的文献,包括古老的Richardson-Lucy方法,几篇盲图像恢复的综述以及最近的几篇文章,尤以Fergus和Jiaya Jia的为经典。

    [1972]Bayesian-BasedIterative Method of Image Restoration

    [1974] an iterativetechniquefor the rectification of observed distributions

    [1990 IEEE]Iterativemethods for image deblurring

    [1996 SPM] BlindImageDeconvolution

    [1997 SPM] Digitalimagerestoration

    [2005] DigitalImageReconstruction - Deblurring and Denoising

    [2006 Siggraph]RemovingCamera Shake from a Single Photograph

    [2008Siggraph]High-quality Motion Deblurring from a Single Image

    [2011PAMI]Richardson-Lucy Deblurring for Scenes under a Projective Motion Path

    6.Dehazing and Defog

    严格来说去雾化也算是图像对比度增强的一种。这方面最近比较好的工作就是He kaiming等提出的Dark Channel方法。这篇论文也获得了2009的CVPR 最佳论文奖。2003年的广东高考状元已经于2011年从港中文博士毕业加入MSRA(估计当时也就二十五六岁吧),相当了不起。

    [2008 Siggraph]SingleImage Dehazing

    [2009 CVPR] SingleImageHaze Removal Using Dark Channel Prior

    [2011 PAMI] SingleImageHaze Removal Using Dark Channel Prior

    7.Denoising

    图像去噪也是图像处理中的一个经典问题,在数码摄影中尤其重要。主要的方法有基于小波的方法和基于偏微分方程的方法。

    [1992 SIAM]Imageselective smoothing and edge detection by nonlinear diffusion. II

    [1992 SIAM]Imageselective smoothing and edge detection by nonlinear diffusion

    [1992] Nonlineartotalvariation based noise removal algorithms

    [1994 SIAM] Signalandimage restoration using shock filters and anisotropic diffusion

    [1995 TIT] De-noisingbysoft-thresholding

    [1998 TIP]Orientationdiffusions

    [2000 TIP] Adaptivewaveletthresholding for image denoising and compression

    [2000 TIP]Fourth-orderpartial differential equations for noise removal

    [2001] Denoising throughwavelet shrinkage

    [2002 TIP] TheCurveletTransform for Image Denoising

    [2003 TIP] Noise removalusingfourth-order partial differential equation with applications to medicalmagneticresonance images in space and time

    [2008 PAMI]AutomaticEstimation and Removal of Noise from a Single Image

    [2009 TIP] IsDenoisingDead

    8.Edge Detection

    边缘检测也是图像处理中的一个基本任务。传统的边缘检测方法有基于梯度算子,尤其是Sobel算子,以及经典的Canny边缘检测。到现在,Canny边缘检测及其思想仍在广泛使用。关于Canny算法的具体细节可以在Sonka的书以及canny自己的论文中找到,网上也可以搜到。最快最直接的方法就是看OpenCV的源代码,非常好懂。在边缘检测方面,Berkeley的大牛J Malik和他的学生在2004年的PAMI提出的方法效果非常好,当然也比较复杂。在复杂度要求不高的情况下,还是值得一试的。MIT的Bill Freeman早期的代表作Steerable Filter在边缘检测方面效果也非常好,并且便于实现。这里给出了几篇比较好的文献,包括一篇最新的综述。边缘检测是图像处理和计算机视觉中任何方向都无法逃避的一个问题,这方面研究多深都不为过。

    [1980] theory ofedgedetection

    [1983 Canny Thesis]findedge

    [1986 PAMI]AComputational Approach to Edge Detection

    [1990 PAMI]Scale-spaceand edge detection using anisotropic diffusion

    [1991 PAMI] The designanduse of steerable filters

    [1995 PR]Multiresolutionedge detection techniques

    [1996 TIP] Optimaledgedetection in two-dimensional images

    [1998 PAMI] LocalScaleControl for Edge Detection and Blur Estimation

    [2003 PAMI]Statisticaledge detection_ learning and evaluating edge cues

    [2004 IEEE] EdgeDetectionRevisited

    [2004 PAMI] Designofsteerable filters for feature detection using canny-like criteria

    [2004 PAMI] LearningtoDetect Natural Image Boundaries Using Local Brightness, Color, and TextureCues

    [2011 IVC] Edge andlineoriented contour detection State of the art

    9.Graph Cut

    基于图割的图像分割算法。在这方面没有研究,仅仅列出几篇引用比较高的文献。这里又见J Malik,当然还有华人杰出学者Jianbo Shi,他的主页非常搞笑,在醒目的位置标注Do not flyChina Eastern Airlines ... 看来是被坑过,而且坑的比较厉害。这个领域,俄罗斯人比较厉害。

    [2000 PAMI]Normalizedcuts and image segmentation

    [2001 PAMI]Fastapproximate energy minimization via graph cuts

    [2004 PAMI] Whatenergyfunctions can be minimized via graph cuts

    10.HoughTransform

    虽然霍夫变换可以扩展到广义霍夫变换,但最常用的还是检测圆和直线。这方面同样推荐看OpenCV的源代码,一目了然。Matas在2000年提出的PPHT已经集成到OpenCV中去了。

    [1986 CVGIU] A Surveyofthe Hough Transform

    [1989] A Comparativestudyof Hough transform methods for circle finding

    [1992 PAMI]Shapesrecognition using the straight line Hough transform_ theory andgeneralization

    [1997 PR] Extractionofline features in a noisy image

    [2000 CVIU]RobustDetection of Lines Using the Progressive Probabilistic Hough Transform

    11.Image Interpolation

    图像插值,偶尔也用得上。一般来说,双三次也就够了

    [2000 TMI] Interpolationrevisited

    12.Image Matting

    也就是最近,我才知道这个词翻译成中文是抠图,比较难听,不知道是谁开始这么翻译的。没有研究,请看文章以及Richard Szeliski的相关章节。以色列美女Levin在这方面有两篇PAMI。

    [2008 Fnd] Image andVideoMatting A Survey

    [2008 PAMI] AClosed-FormSolution to Natural Image Matting

    [2008 PAMI]SpectralMatting

    13.Image Modeling

    图像的统计模型。这方面有一本专门的著作Natural Image Statistics

    [1994] The statisticsofnatural images

    [2003 JMIV] On AdvancesinStatistical Modeling of Natural Images

    [2009 IJCV] FieldsofExperts

    [2009 PAMI]Modelingmultiscale subbands of photographic images with fields of Gaussianscalemixtures

    14.Image Quality Assessment

    在图像质量评价方面,Bovik是首屈一指的。这位老师也很有意思,作为编辑出版了很多书。他也是IEEE的Fellow

    [2004 TIP] Imagequalityassessment from error visibility to structural similarity

    [2011 TIP] blindimagequality assessment From Natural Scene Statistics to Perceptual Quality

    15.Image Registration

    图像配准最早的应用在医学图像上,在图像融合之前需要对图像进行配准。在现在的计算机视觉中,配准也是一个需要理解的概念,比如跟踪,拼接等。在KLT中,也会涉及到配准。这里主要是综述文献。

    [1992 MIA] Image matchingasa diffusion process

    [1992 PAMI] A MethodforRegistration of 3-D shapes

    [1992] a survey ofimageregistration techniques

    [1998 MIA] A surveyofmedical image registration

    [2003 IVC]Imageregistration methods a survey

    [2003 TMI]Mutual-Information-BasedRegistration of Medical Survey

    [2011 TIP]Hairisregistration

    16.Image Retrieval

    图像检索曾经很热,在2000年之后似乎消停了一段时间。最近各种图像的不变性特征提出来之后,再加上互联网搜索的商业需求,这个方向似乎又要火起来了,尤其是在工业界。这仍然是一个非常值得关注的方面。而且图像检索与目标识别具有相通之处,比如特征提取和特征降维。这方面的文章值得一读。在最后给出了两篇Book chapter,其中一篇还是中文的。

    [2000 PAMI]Content-basedimage retrieval at the end of the early years

    [2000 TIP]PicToSeekCombining Color and Shape Invariant Features for Image Retrieval

    [2002] Content-BasedImageRetrieval Systems A Survey

    [2008] Content-Based ImageRetrieval-LiteratureSurvey

    [2010] PlantImageRetrieval Using Color,Shape and Texture Features

    [2012 PAMI] AMultimediaRetrieval Framework Based on Semi-Supervised Ranking and RelevanceFeedback

    CBIR Chinese

    fundament of cbir

    17.Image Segmentation

    图像分割,非常基本但又非常难的一个问题。建议看Sonka和冈萨雷斯的书。这里给出几篇比较好的文章,再次看到了J Malik。他们给出了源代码和测试集,有兴趣的话可以试试。

    [2004 IJCV]EfficientGraph-Based Image Segmentation

    [2008 CVIU]Imagesegmentation evaluation A survey of unsupervised methods

    [2011 PAMI]ContourDetection and Hierarchical Image Segmentation

    18.Level Set

    大名鼎鼎的水平集,解决了Snake固有的缺点。Level set的两位提出者Sethian和Osher最后反目,实在让人遗憾。个人以为,这种方法除了迭代比较费时,在真实场景中的表现让人生疑。不过,2008年ECCV上的PWP方法在结果上很吸引人。在重初始化方面,Chunming Li给出了比较好的解决方案

    [1995 PAMI] Shapemodelingwith front propagation_ a level set approach

    [2001 JCP] LevelSetMethods_ An Overview and Some Recent Results

    [2005 CVIU]Geodesicactive regions and level set methods for motion estimation and tracking

    [2007 IJCV] A ReviewofStatistical Approaches to Level Set Segmentation

    [2008 ECCV] RobustReal-TimeVisual Tracking using Pixel-Wise Posteriors

    [2010 TIP]DistanceRegularized Level Set Evolution and its Application to ImageSegmentation

    19.Pyramid

    其实小波变换就是一种金字塔分解算法,而且具有无失真重构和非冗余的优点。Adelson在1983年提出的Pyramid优点是比较简单,实现起来比较方便。

    [1983] TheLaplacianPyramid as a Compact Image Code

    20. Radon Transform

    Radon变换也是一种很重要的变换,它构成了图像重建的基础。关于图像重建和radon变换,可以参考章毓晋老师的书,讲的比较清楚。

    [1993 PAMI]Imagerepresentation via a finite Radon transform

    [1993 TIP] Thefastdiscrete radon transform I theory

    [2007 IVC]Generalisedfinite radon transform for N×N images

    21.Scale Space

    尺度空间滤波在现代不变特征中是一个非常重要的概念,有人说SIFT的提出者Lowe是不变特征之父,而Linderburg是不变特征之母。虽然尺度空间滤波是Witkin最早提出的,但其理论体系的完善和应用还是Linderburg的功劳。其在1998年IJCV上的两篇文章值得一读,不管是特征提取方面还是边缘检测方面。

    [1987]Scale-spacefiltering

    [1990 PAMI]Scale-Spacefor Discrete Signals

    [1994] Scale-spacetheoryA basic tool for analysing structures at different scales

    [1998 IJCV] EdgeDetectionand Ridge Detection with Automatic Scale Selection

    [1998 IJCV]FeatureDetection with Automatic Scale Selection

    22. Snake

    活动轮廓模型,改变了传统的图像分割的方法,用能量收缩的方法得到一个统计意义上的能量最小(最大)的边缘。

    [1987 IJCV] SnakesActiveContour Models

    [1996 ] deformablemodelin medical image A Survey

    [1997 IJCV]geodesicactive contour

    [1998 TIP] Snakes,shapes,and gradient vector flow

    [2000 PAMI] Geodesicactivecontours and level sets for the detection and tracking of moving objects

    [2001 TIP] Activecontourswithout edges

    23. Super Resolution

    超分辨率分析。对这个方向没有研究,简单列几篇文章。其中Yang Jianchao的那篇在IEEE上的下载率一直居高不下。

    [2002]Example-BasedSuper-Resolution

    [2003SPM] Super-Resolution Image Reconstruction A Technical Overview

    [2009 ICCV]Super-Resolutionfrom a Single Image

    [2010 TIP]ImageSuper-Resolution Via Sparse Representation

    24. Thresholding

    阈值分割是一种简单有效的图像分割算法。这个topic在冈萨雷斯的书里面讲的比较多。这里列出OTSU的原始文章以及一篇不错的综述。

    [1979 IEEE] OTSUAthreshold selection method from gray-level histograms

    [2001 JISE] A FastAlgorithmfor Multilevel Thresholding

    [2004 JEI] Surveyoverimage thresholding techniques and quantitative performance evaluation

    25. Watershed

    分水岭算法是一种非常有效的图像分割算法,它克服了传统的阈值分割方法的缺点,尤其是Marker-Controlled Watershed,值得关注。Watershed在冈萨雷斯的书里面讲的比较详细。

    [1991 PAMI] Watershedsindigital spaces an efficient algorithm based on immersion simulations

    [2001]TheWatershedTransform Definitions, Algorithms and Parallelizat on Strategies

    图像处理与计算机视觉:基础,经典以及最近发展(5

    计算机视觉

    这一章是计算机视觉部分,主要侧重在底层特征提取,视频分析,跟踪,目标检测和识别方面等方面。对于自己不太熟悉的领域比如摄像机标定和立体视觉,仅仅列出上google上引用次数比较多的文献。有一些刚刚出版的文章,个人非常喜欢,也列出来了。

    本章的下载地址:

    http://iask.sina.com.cn/u/2252291285/ish?folderid=868772

    1. Active Appearance Models

    活动表观模型和活动轮廓模型基本思想来源Snake,现在在人脸三维建模方面得到了很成功的应用,这里列出了三篇最初最经典的文章。对这个领域有兴趣的可以从这三篇文章开始入手。

    [1998 ECCV]ActiveAppearance Models

    [2001 PAMI]ActiveAppearance Models

    2. Active Shape Models

    [1995CVIU]Active ShapeModels-Their Training and Application

    3. Background modeling andsubtraction

    背景建模一直是视频分析尤其是目标检测中的一项关键技术。虽然最近一直有一些新技术的产生,demo效果也很好,比如基于dynamical texture的方法。但最经典的还是Stauffer等在1999年和2000年提出的GMM方法,他们最大的贡献在于不用EM去做高斯拟合,而是采用了一种迭代的算法,这样就不需要保存很多帧的数据,节省了buffer。Zivkovic在2004年的ICPR和PAMI上提出了动态确定高斯数目的方法,把混合高斯模型做到了极致。这种方法效果也很好,而且易于实现。在OpenCV中有现成的函数可以调用。在背景建模大家族里,无参数方法(2000 ECCV)和Vibe方法也值得关注。

    [1997 PAMI]PfinderReal-Time Tracking of the Human Body

    [1999 CVPR]Adaptivebackground mixture models for real-time tracking

    [1999 ICCV]WallflowerPrinciples and Practice of Background Maintenance

    [2000 ECCV]Non-parametricModel for Background Subtraction

    [2000 PAMI]LearningPatterns of Activity Using Real-Time Tracking

    [2002 PIEEE]Backgroundand foreground modeling using nonparametric kernel density estimationforvisual surveillance

    [2004 ICPR]Improvedadaptive Gaussian mixture model for background subtraction

    [2004 PAMI]Recursiveunsupervised learning of finite mixture models

    [2006 PRL]Efficientadaptive density estimation per image pixel for the task ofbackgroundsubtraction

    [2011 TIP] ViBeAUniversal Background Subtraction Algorithm for Video Sequences

    4. Bag of Words

    词袋,在这方面暂时没有什么研究。列出三篇引用率很高的文章,以后逐步解剖之。

    [2003 ICCV]Video Google AText Retrieval Approach to Object Matching in Videos

    [2004 ECCV]VisualCategorization with Bags of Keypoints

    [2006 CVPR]Beyond bags offeatures Spatial pyramid matching for recognizing natural scenecategories

    5. BRIEF

    BRIEF是BinaryRobust Independent ElementaryFeatures的简称,是近年来比较受关注的特征描述的方法。ORB也是基于BRIEF的。

    [2010 ECCV]BRIEF BinaryRobust Independent Elementary Features

    [2011 ICCV] ORBanefficient alternative to SIFT or SURF

    [2012 PAMI]BRIEFComputing a Local Binary Descriptor Very Fast

    6. Camera Calibration andStereoVision

    非常不熟悉的领域。仅仅列出了十来篇重要的文献,供以后学习。

    [1979 Marr]AComputational Theory of Human Stereo Vision

    [1985]Computationalvision and regularization theory

    [1987 IEEE] Aversatilecamera calibration technique for high-accuracy 3D machine visionmetrologyusing off-the-shelf TV cameras and lenses

    [1987]ProbabilisticSolution of Ill-Posed Problems in Computational Vision

    [1988 PIEEE]Ill-PosedProblems in Early Vision

    [1989 IJCV]KalmanFilter-based Algorithms for Estimating Depth from Image Sequences

    [1990 IJCV]RelativeOrientation

    [1990 IJCV]Usingvanishing points for camera calibration

    [1992 ECCV]Cameraself-calibration Theory and experiments

    [1992 IJCV] Atheory ofself-calibration of a moving camera

    [1992 PAMI]Cameracalibration with distortion models and accuracy evaluation

    [1994 IJCV]TheFundamental Matrix Theory, Algorithms, and Stability Analysis

    [1994 PAMI] astereomatching algorithm with an adaptive window theory and experiment

    [1999 ICCV]Flexiblecamera calibration by viewing a plane from unknown orientations

    [1999 IWAR]Markertracking and hmd calibration for a video-based augmented realityconferencingsystem

    [2000 PAMI] Aflexible newtechnique for camera calibration

    7. Color and Histogram Feature

    这里面主要来源于图像检索,早期的图像检测基本基于全局的特征,其中最显著的就是颜色特征。这一部分可以和前面的Color知识放在一起的。

    [1995 SPIE]Similarity ofcolor images

    [1996 PR] IMAGERETRIEVALUSING COLOR AND SHAPE

    [1996] comparingimagesusing color coherence vectors

    [1997 ] ImageIndexingUsing Color Correlograms

    [2001 TIP] AnEfficientColor Representation for Image Retrieval

    [2009 CVIU]Performanceevaluation of local colour invariants

    8. Deformable Part Model

    大红大热的DPM,在OpenCV中有一个专门的topic讲DPM和latent svm

    [2008 CVPR]ADiscriminatively Trained, Multiscale, Deformable Part Model

    [2010 CVPR]Cascade ObjectDetection with Deformable Part Models

    [2010 PAMI]ObjectDetection with Discriminatively Trained Part-Based Models

    9. Distance Transformations

    距离变换,在OpenCV中也有实现。用来在二值图像中寻找种子点非常方便。

    [1986 CVGIP]DistanceTransformations in Digital Images

    [2008 ACM] 2DEuclideanDistance Transform Algorithms A Comparative Survey

    10. Face Detection

    最成熟最有名的当属Haar+Adaboost

    [1998 PAMI]NeuralNetwork-Based Face Detection

    [2002 PAMI]Detectingfaces in images a survey

    [2002 PAMI] FaceDetectionin Color Images

    [2004 IJCV]RobustReal-Time Face Detection

    11. Face Recognition

    不熟悉,简单罗列之。

    [1991] FaceRecognitionUsing Eigenfaces

    [2000 PAMI]AutomaticAnalysis of Facial Expressions The State of the Art

    [2000] FaceRecognition ALiterature Survey

    [2006 PR] Facerecognitionfrom a single image per person A survey

    [2009 PAMI]Robust FaceRecognition via Sparse Representation

    12. FAST

    用机器学习的方法来提取角点,号称很快很好。

    [2006 ECCV]Machinelearning for high-speed corner detection

    [2010 PAMI]Faster andBetter A Machine Learning Approach to Corner Detection

    13. Feature Extraction

    这里的特征主要都是各种不变性特征,SIFT,Harris,MSER等也属于这一类。把它们单独列出来是因为这些方法更流行一点。关于不变性特征,王永明与王贵锦合著的《图像局部不变性特征与描述》写的还不错。Mikolajczyk在2005年的PAMI上的文章以及2007年的综述是不错的学习材料。

    [1989 PAMI] Onthedetection of dominant points on digital curves

    [1997 IJCV]SUSAN—A NewApproach to Low Level Image Processing

    [2004 IJCV]MatchingWidely Separated Views Based on Affine Invariant Regions

    [2004 IJCV]Scale &Affine Invariant Interest Point Detectors

    [2005 PAMI] Aperformanceevaluation of local descriptors

    [2006 IJCV] AComparisonof Affine Region Detectors

    [2007 FAT] LocalInvariantFeature Detectors - A Survey

    [2011 IJCV]Evaluation ofInterest Point Detectors and Feature Descriptors

    14. Feature Matching

    [2012 PAMI]LDAHashImproved Matching with Smaller Descriptors

    15. Harris

    虽然过去了很多年,Harris角点检测仍然广泛使用,而且基于它有很多变形。如果仔细看了这种方法,从直观也可以感觉到这是一种很稳健的方法。

    [1988 Harris] Acombinedcorner and edge detector

    16. Histograms of OrientedGradients

    HoG方法也在OpenCV中实现了:HOGDescriptor。

    [2005 CVPR]Histograms ofOriented Gradients for Human Detection

    NavneetDalalThesis.pdf

    17. Image Distance

    [1993 PAMI]ComparingImages Using the Hausdorff Distance

    18. Image Stitching

    图像拼接,另一个相关的词是Panoramic。在Computer Vision: Algorithms and Applications一书中,有专门一章是讨论这个问题。这里的两面文章一篇是综述,一篇是这方面很经典的文章。

    [2006 Fnd] ImageAlignmentand Stitching A Tutorial

    [2007 IJCV]AutomaticPanoramic Image Stitching using Invariant Features

    19. KLT

    KLT跟踪算法,基于Lucas-Kanade提出的配准算法。除了三篇很经典的文章,最后一篇给出了OpenCV实现KLT的细节。

    [1981] AnIterative ImageRegistration Technique with an Application to Stereo Vision fullversion

    [1994 CVPR] GoodFeaturesto Track

    [2004 IJCV]Lucas-Kanade 20 Years On A Unifying Framework

    PyramidalImplementationof the Lucas Kanade Feature Tracker OpenCV

    20. Local Binary Pattern

    LBP。OpenCV的Cascade分类器也支持LBP,用来取代Haar特征。

    [2002PAMI]Multiresolution gray-scale and rotation Invariant Texture ClassificationwithLocal Binary Patterns

    [2004 ECCV]FaceRecognition with Local Binary Patterns

    [2006 PAMI]FaceDescription with Local Binary Patterns

    [2011 TIP]Rotation-InvariantImage and Video Description With Local Binary PatternFeatures

    21. Low-Level Vision

    关于Low level vision的两篇很不错的文章

    [1998 TIP] Ageneralframework for low level vision

    [2000 IJCV]LearningLow-Level Vision

    22. Mean Shift

    均值漂移算法,在跟踪中非常流行的方法。Comaniciu在这个方面做出了重要的贡献。最后三篇,一篇是CVIU上的top download文章,一篇是最新的PAMI上关于Mean Shift的文章,一篇是OpenCV实现的文章。

    [1995 PAMI] Meanshift,mode seeking, and clustering

    [2002 PAMI] Meanshift arobust approach toward feature space analysis

    [2003 CVPR]Mean-shiftblob tracking through scale space

    [2009 CVIU]Objecttracking using SIFT features and mean shift

    [2012 PAMI] MeanShiftTrackers with Cross-Bin Metrics

    OpenCV ComputerVisionFace Tracking For Use in a Perceptual User Interface

    23. MSER

    这篇文章发表在2002年的BMVC上,后来直接录用到2004年的IVC上,内容差不多。MSER在Sonka的书里面也有提到。

    [2002 BMVC]Robust WideBaseline Stereo from Maximally Stable Extremal Regions

    [2003] MSERAuthorPresentation

    [2004 IVC]Robustwide-baseline stereo from maximally stable extremal regions

    [2011 PAMI] AreMSERFeatures Really Interesting

    24. Object Detection

    首先要说的是第一篇文章的作者,Kah-Kay Sung。他是MIT的博士,后来到新加坡国立任教,极具潜力的一个老师。不幸的是,他和他的妻子都在2000年的新加坡空难中遇难,让人唏嘘不已。

    http://en.wikipedia.org/wiki/Singapore_Airlines_Flight_006

    最后一篇文章也是Fua课题组的,作者给出的demo效果相当好。

    [1998 PAMI]Example-basedlearning for view-based human face detection

    [2000 CVPR] AStatistical Method for 3D Object Detection Applied to Faces and Cars

    [2003 IJCV]Learning theStatistics of People in Images and Video

    [2011 PAMI]Learning toDetect a Salient Object

    [2012 PAMI] AReal-TimeDeformable Detector

    25. Object Tracking

    跟踪也是计算机视觉中的经典问题。粒子滤波,卡尔曼滤波,KLT,mean shift,光流都跟它有关系。这里列出的是传统意义上的跟踪,尤其值得一看的是2008的Survey和2003年的Kernelbased tracking。

    [2003 PAMI]Kernel-basedobject tracking

    [2007 PAMI]TrackingPeople by Learning Their Appearance

    [2008 ACM]Object TrackingA Survey

    [2008 PAMI]Segmentationand Tracking of Multiple Humans in Crowded Environments

    [2011 PAMI]Hough Forestsfor Object Detection, Tracking, and Action Recognition

    [2011 PAMI]Robust ObjectTracking with Online Multiple Instance Learning

    [2012 IJCV]PWP3DReal-Time Segmentation and Tracking of 3D Objects

    26. OCR

    一个非常成熟的领域,已经很好的商业化了。

    [1992 IEEE]Historical reviewof OCR research and development

    Video OCR ASurvey andPractitioner's Guide

    27. Optical Flow

    光流法,视频分析所必需掌握的一种算法。

    [1981 AI]DetermineOptical Flow

    [1994 IJCV]Performance ofoptical flow techniques

    [1995 ACM] TheComputationof Optical Flow

    [2004 TR]TutorialComputing 2D and 3D Optical Flow

    [2005 BOOK]Optical FlowEstimation

    [2008 ECCV]LearningOptical Flow

    [2011 IJCV] ADatabase andEvaluation Methodology for Optical Flow

    28. Particle Filter

    粒子滤波,主要给出的是综述以及1998 IJCV上的关于粒子滤波发展早期的经典文章。

    [1998 IJCV]CONDENSATION—ConditionalDensity Propagation for Visual Tracking

    [2002 TSP] Atutorial onparticle filters for online nonlinear non-Gaussian Bayesian tracking

    [2002 TSP]Particlefilters for positioning, navigation, and tracking

    [2003 SPM]particle filter

    29. Pedestrian and Human detection

    仍然是综述类,关于行人和人体的运动检测和动作识别。

    [1999 CVIU]Visualanalysis of human movement_ A survey

    [2001 CVIU] ASurvey ofComputer Vision-Based Human Motion Capture

    [2005 TIP] Imagechangedetection algorithms a systematic survey

    [2006 CVIU] asurvey ofavdances in vision based human motion capture

    [2007 CVIU]Vision-basedhuman motion analysis An overview

    [2007 IJCV]PedestrianDetection via Periodic Motion Analysis

    [2007 PR] Asurvey ofskin-color modeling and detection methods

    [2010 IVC] Asurvey onvision-based human action recognition

    [2012 PAMI]PedestrianDetection An Evaluation of the State of the Art

    30. Scene Classification

    当相机越来越傻瓜化的时候,自动场景识别就非常重要。这是比拼谁家的Auto功能做的比较好的时候了。

    [2001 IJCV]Modeling theShape of the Scene A Holistic Representation of the SpatialEnvelope

    [2001 PAMI]Visual WordAmbiguity

    [2007 PAMI] AThousandWords in a Scene

    [2010 PAMI]EvaluatingColor Descriptors for Object and Scene Recognition

    [2011 PAMI]CENTRIST AVisual Descriptor for Scene Categorization

    31. Shadow Detection

    [2003 PAMI]Detectingmoving shadows-- algorithms and evaluation

    32. Shape

    关于形状,主要是两个方面:形状的表示和形状的识别。形状的表示主要是从边缘或者区域当中提取不变性特征,用来做检索或者识别。这方面Sonka的书讲的比较系统。2008年的那篇综述在这方面也讲的不错。至于形状识别,最牛的当属J Malik等提出的Shape Context。

    [1993 PR]IMPROVED MOMENTINVARIANTS FOR SHAPE DISCRIMINATION

    [1993 PR]PatternRecognition by Affine Moment Invariants

    [1996 PR] IMAGERETRIEVALUSING COLOR AND SHAPE

    [2001 SMI] Shapematchingsimilarity measures and algorithms

    [2002 PAMI]Shape matchingand object recognition using shape contexts

    [2004 PR] Reviewof shaperepresentation and description techniques

    [2006 PAMI]IntegralInvariants for Shape Matching

    [2008] A Surveyof ShapeFeature Extraction Techniques

    33. SIFT

    关于SIFT,实在不需要介绍太多,一万多次的引用已经说明问题了。SURF和PCA-SIFT也是属于这个系列。后面列出了几篇跟SIFT有关的问题。

    [1999 ICCV]Objectrecognition from local scale-invariant features

    [2000 IJCV]Evaluation ofInterest Point Detectors

    [2003 CVIU]Speeded-UpRobust Features (SURF)

    [2004 CVPR]PCA-SIFT AMore Distinctive Representation for Local Image Descriptors

    [2004 IJCV]DistinctiveImage Features from Scale-Invariant Keypoints

    [2010 IJCV]ImprovingBag-of-Features for Large Scale Image Search

    [2011 PAMI]SIFTflow DenseCorrespondence across Scenes and its Applications

    34. SLAM

    SimultaneousLocalization and Mapping, 同步定位与建图。

    SLAM问题可以描述为: 机器人在未知环境中从一个未知位置开始移动,在移动过程中根据位置估计和地图进行自身定位,同时在自身定位的基础上建造增量式地图,实现机器人的自主定位和导航。

    [2002 PAMI]SimultaneousLocalization and Map-Building Using Active Vision

    [2007 PAMI] MonoSLAMReal-TimeSingle Camera SLAM

    35. Texture Feature

    纹理特征也是物体识别和检索的一个重要特征集。

    [1973] Texturalfeaturesfor image classification

    [1979 ]Statistical andstructural approaches to texture

    [1996 PAMI]Texturefeatures for browsing and retrieval of image data

    [2002 PR] Briefreview ofinvariant texture analysis methods

    [2012 TIP] ColorLocalTexture Features for Color Face Recognition

    36. TLD

    Kadal创立了TLD,跟踪学习检测同步进行,达到稳健跟踪的目的。他的两个导师也是大名鼎鼎,一个是发明MSER的Matas,一个是Mikolajczyk。他还创立了一个公司TLDVisions.r.o. 这里给出了他的系列文章,最后一篇是刚出来的PAMI。

    [2009] Onlinelearning ofrobust object detectors during unstable tracking

    [2010 CVPR] P-NLearningBootstrapping Binary Classifiers by Structural Constraints

    [2010 ICIP]FACE-TLDTRACKING-LEARNING-DETECTION APPLIED TO FACES

    [2012PAMI]Tracking-Learning-Detection

    37. Video Surveillance

    前面两个是两个很有名的视频监控系统,里面包含了很丰富的信息量,比如CMU的那个系统里面的背景建模算法也是相当简单有效的。最后一篇是比较近的综述。

    [2000 CMU TR] ASystem forVideo Surveillance and Monitoring

    [2000 PAMI] W4--real-timesurveillance of people and their activitie

    [2008 MVA] Theevolutionof video surveillance an overview

    38. Viola-Jones

    Haar+Adaboost的弱弱联手,组成了最强大的利器。在OpenCV里面有它的实现,也可以选择用LBP来代替Haar特征。

    [2001 CVPR]Rapid objectdetection using a boosted cascade of simple features

    [2004 IJCV] RobustReal-timeFace Detection

    展开全文
  • 图像处理发展概述

    千次阅读 2013-12-18 15:05:42
    数字图像处理发展概况 数字图像处理(Digital Image Processing)又称为计算机图像处理,它是指将图像信号转换成数字信号并利用计算机对其进行处理的过程。数字图像处理最早出现于20世纪50年代,当时的电子计算机...
    数字图像处理发展概况 
    数字图像处理(Digital Image Processing)又称为计算机图像处理,它是指将图像信号转换成数字信号并利用计算机对其进行处理的过程。数字图像处理最早出现于20世纪50年代,当时的电子计算机已经发展到一定水平,人们开始利用计算机来处理图形和图像信息。数字图像处理作为一门学科大约形成于20世纪60年代初期。早期的图像处理的目的是改善图像的质量,它以人为对象,以改善人的视觉效果为目的。图像处理中,输入的是质量低的图像,输出的是改善质量后的图像,常用的图像处理方法有图像增强、复原、编码、压缩等。首次获得实际成功应用的是美国喷气推进实验室(JPL)。他们对航天探测器徘徊者7号在1964年发回的几千张月球照片使用了图像处理技术,如几何校正、灰度变换、去除噪声等方法进行处理,并考虑了太阳位置和月球环境的影响,由计算机成功地绘制出月球表面地图,获得了巨大的成功。随后又对探测飞船发回的近十万张照片进行更为复杂的图像处理,以致获得了月球的地形图、彩色图及全景镶嵌图,获得了非凡的成果,为人类登月创举奠定了坚实的基础,也推动了数字图像处理这门学科的诞生。在以后的宇航空间技术,如对火星、土星等星球的探测研究中,数字图像处理技术都发挥了巨大的作用。 数字图像处理取得的另一个巨大成就是在医学上获得的成果。

        1972年英国EMI公司工程师Housfield发明了用于头颅诊断的X射线计算机断层摄影装置,也就是我们通常所说的CT(Computer Tomograph)。CT的基本方法是根据人的头部截面的投影,经计算机处理来重建截面图像,称为图像重建。  1975年EMI公司又成功研制出全身用的CT装置,获得了人体各个部位鲜明清晰的断层图像。1979年,这项无损伤诊断技术获得了诺贝尔奖,说明它对人类作出了划时代的贡献。 与此同时,图像处理技术在许多应用领域受到广泛重视并取得了重大的开拓性成就,属于这些领域的有航空航天、生物医学工程、工业检测、机器人视觉、公安司法、军事制导、文化艺术等,使图像处理成为一门引人注目、前景远大的新型学科。 随着图像处理技术的深入发展,从70年代中期开始,随着计算机技术和人工智能、思维科学研究的迅速发展,数字图像处理向更高、更深层次发展。人们已开始研究如何用计算机系统解释图像,实现类似人类视觉系统理解外部世界,这被称为图像理解或计算机视觉。

       很多国家,特别是发达国家投入更多的人力、物力到这项研究,取得了不少重要的研究成果。其中代表性的成果是70年代末MIT的Marr提出的视觉计算理论,这个理论成为计算机视觉领域其后十多年的主导思想。图像理解虽然在理论方法研究上已取得不小的进展,但它本身是一个比较难的研究领域,存在不少困难,因人类本身对自己的视觉过程还了解甚少,因此计算机视觉是一个有待人们进一步探索的新领域。

     3.5.2 数字图像处理主要研究的内容
    数字图像处理主要研究的内容有以下几个方面:
    1) 图像变换 由于图像阵列很大,直接在空间域中进行处理,涉及计算量很大。因此,往往采用各种图像变换的方法,如傅立叶变换、沃尔什变换、离散余弦变换等间接处理技术,将空间域的处理转换为变换域处理,不仅可减少计算量,而且可获得更有效的处理(如傅立叶变换可在频域中进行数字滤波处理)。目前新兴研究的小波变换在时域和频域中都具有良好的局部化特性,它在图像处理中也有着广泛而有效的应用。

    2) 图像编码压缩 图像编码压缩技术可减少描述图像的数据量(即比特数),以便节省图像传输、处理时间和减少所占用的存储器容量。压缩可以在不失真的前提下获得,也可以在允许的失真条件下进行。编码是压缩技术中最重要的方法,它在图像处理技术中是发展最早且比较成熟的技术。

    3) 图像增强和复原 图像增强和复原的目的是为了提高图像的质量,如去除噪声,提高图像的清晰度等。图像增强不考虑图像降质的原因,突出图像中所感兴趣的部分。如强化图像高频分量,可使图像中物体轮廓清晰,细节明显;如强化低频分量可减少图像中噪声影响。图像复原要求对图像降质的原因有一定的了解,一般讲应根据降质过程建立"降质模型",再采用某种滤波方法,恢复或重建原来的图像。

    4) 图像分割 图像分割是数字图像处理中的关键技术之一。图像分割是将图像中有意义的特征部分提取出来,其有意义的特征有图像中的边缘、区域等,这是进一步进行图像识别、分析和理解的基础。虽然目前已研究出不少边缘提取、区域分割的方法,但还没有一种普遍适用于各种图像的有效方法。因此,对图像分割的研究还在不断深入之中,是目前图像处理中研究的热点之一。

    5) 图像描述 图像描述是图像识别和理解的必要前提。作为最简单的二值图像可采用其几何特性描述物体的特性,一般图像的描述方法采用二维形状描述,它有边界描述和区域描述两类方法。对于特殊的纹理图像可采用二维纹理特征描述。随着图像处理研究的深入发展,已经开始进行三维物体描述的研究,提出了体积描述、表面描述、广义圆柱体描述等方法。

    6) 图像分类(识别) 图像分类(识别)属于模式识别的范畴,其主要内容是图像经过某些预处理(增强、复原、压缩)后,进行图像分割和特征提取,从而进行判决分类。图像分类常采用经典的模式识别方法,有统计模式分类和句法(结构)模式分类,近年来新发展起来的模糊模式识别和人工神经网络模式分类在图像识别中也越来越受到重视。

     3.5.3 数字图像处理的基本特点
    (1)目前,数字图像处理的信息大多是二维信息,处理信息量很大。如一幅256×256低分辨率黑白图像,要求约64kbit的数据量;对高分辨率彩色512×512图像,则要求768kbit数据量;如果要处理30帧/秒的电视图像序列,则每秒要求500kbit~22.5Mbit数据量。因此对计算机的计算速度、存储容量等要求较高。

    (2)数字图像处理占用的频带较宽。与语言信息相比,占用的频带要大几个数量级。如电视图像的带宽约5.6MHz,而语音带宽仅为4kHz左右。所以在成像、传输、存储、处理、显示等各个环节的实现上,技术难度较大,成本亦高,这就对频带压缩技术提出了更高的要求。

    (3)数字图像中各个像素是不独立的,其相关性大。在图像画面上,经常有很多像素有相同或接近的灰度。就电视画面而言,同一行中相邻两个像素或相邻两行间的像素,其相关系数可达0.9以上,而相邻两帧之间的相关性比帧内相关性一般说还要大些。因此,图像处理中信息压缩的潜力很大。

    (4)由于图像是三维景物的二维投影,一幅图象本身不具备复现三维景物的全部几何信息的能力,很显然三维景物背后部分信息在二维图像画面上是反映不出来的。因此,要分析和理解三维景物必须作合适的假定或附加新的测量,例如双目图像或多视点图像。在理解三维景物时需要知识导引,这也是人工智能中正在致力解决的知识工程问题。

    (5)数字图像处理后的图像一般是给人观察和评价的,因此受人的因素影响较大。由于人的视觉系统很复杂,受环境条件、视觉性能、人的情绪爱好以及知识状况影响很大,作为图像质量的评价还有待进一步深入的研究。另一方面,计算机视觉是模仿人的视觉,人的感知机理必然影响着计算机视觉的研究。例如,什么是感知的初始基元,基元是如何组成的,局部与全局感知的关系,优先敏感的结构、属性和时间特征等,这些都是心理学和神经心理学正在着力研究的课题。
    展开全文
  • 数字图像处理发展概况(转)

    千次阅读 2006-11-27 08:19:00
    数字图像处理最早出现于20世纪50年代,当时的电子计算机已经发展到一定水平,人们开始利用计算机来处理图形和图像信息。数字图像处理作为一门学科大约形成于20世纪60年代初期。早期的图像处理的目的是改善图像的质量...

    数字图像处理(Digital Image Processing)又称为计算机图像处理,它是指将图
    像信号转换成数字信号并利用计算机对其进行处理的过程。数字图像处理最早出现于20世纪50年代,当时的电子计算机已经发展到一定水平,人们开始利用计算机来处理图形和图像信息。数字图像处理作为一门学科大约形成于20世纪60年代初期。早期的图像处理的目的是改善图像的质量,它以人为对象,以改善人的视觉效果为目的。图像处理中,输入的是质量低的图像,输出的是改善质量后的图像,常用的图像处理方法有图像增强、复原、编码、压缩等。首次获得实际成功应用的是美国喷气推进实验室(JPL)。他们对航天探测器徘徊者7号在1964年发回的几千张月球照片使用了图像处理技术,如几何校正、灰度变换、去除噪声等方法进行处理,并考虑了太阳位置和月球环境的影响,由计算机成功地绘制出月球表面地图,获得了巨大的成功。随后又对探测飞船发回的近十万张照片进行更为复杂的图像处理,以致获得了月球的地形图、彩色图及全景镶嵌图,获得了非凡的成果,为人类登月创举奠定了坚实的基础,也推动了数字图像处理这门学科的诞生。在以后的宇航空间技术,如对火星、土星等星球的探测研究中,数字图像处理技术都发挥了巨大的作用。 数字图像处理取得的另一个巨大成就是在医学上获得的成果。1972年英国EMI公司工程师Housfield发明了用于头颅诊断的X射线计算机断层摄影装置,也就是我们通常所说的CT(Computer Tomograph)。CT的基本方法是根据人的头部截面的投影,经计算机处理来重建截面图像,称为图像重建。1975年EMI公司又成功研制出全身用的CT装置,获得了人体各个部位鲜明清晰的断层图像。1979年,这项无损伤诊断技术获得了诺贝尔奖,说明它对人类作出了划时代的贡献。 与此同时,图像处理技术在许多应用领域受到广泛重视并取得了重大的开拓性成就,属于这些领域的有航空航天、生物医学工程、工业检测、机器人视觉、公安司法、军事制导、文化艺术等,使图像处理成为一门引人注目、前景远大的新型学科。 随着图像处理技术的深入发展,从70年代中期开始,随着计算机技术和人工智能、思维科学研究的迅速发展,数字图像处理向更高、更深层次发展。人们已开始研究如何用计算机系统解释图像,实现类似人类视觉系统理解外部世界,这被称为图像理解或计算机视觉。很多国家,特别是发达国家投入更多的人力、物力到这项研究,取得了不少重要的研究成果。其中代表性的成果是70年代末MIT的Marr提出的视觉计算理论,这个理论成为计算机视觉领域其后十多年的主导思想。图像理解虽然在理论方法研究上已取得不小的进展,但它本身是一个比较难的研究领域,存在不少困难,因人类本身对自己的视觉过程还了解甚少,因此计算机视觉是一个有待人们进一步探索的新领域。
     数字图像处理主要研究的内容有以下几个方面: 1) 图像变换 由于图像阵列很大,直接在空间域中进行处理,涉及计算量很大。因此,往往采用各种图像变换的方法,如傅立叶变换、沃尔什变换、离散余弦变换等间接处理技术,将空间域的处理转换为变换域处理,不仅可减少计算量,而且可获得更有效的处理(如傅立叶变换可在频域中进行数字滤波处理)。目前新兴研究的小波变换在时域和频域中都具有良好的局部化特性,它在图像处理中也有着广泛而有效的应用。 2) 图像编码压缩 图像编码压缩技术可减少描述图像的数据量(即比特数),以便节省图像传输、处理时间和减少所占用的存储器容量。压缩可以在不失真的前提下获得,也可以在允许的失真条件下进行。编码是压缩技术中最重要的方法,它在图像处理技术中是发展最早且比较成熟的技术。 3) 图像增强和复原 图像增强和复原的目的是为了提高图像的质量,如去除噪声,提高图像的清晰度等。图像增强不考虑图像降质的原因,突出图像中所感兴趣的部分。如强化图像高频分量,可使图像中物体轮廓清晰,细节明显;如强化低频分量可减少图像中噪声影响。图像复原要求对图像降质的原因有一定的了解,一般讲应根据降质过程建立"降质模型",再采用某种滤波方法,恢复或重建原来的图像。 4) 图像分割 图像分割是数字图像处理中的关键技术之一。图像分割是将图像中有意义的特征部分提取出来,其有意义的特征有图像中的边缘、区域等,这是进一步进行图像识别、分析和理解的基础。虽然目前已研究出不少边缘提取、区域分割的方法,但还没有一种普遍适用于各种图像的有效方法。因此,对图像分割的研究还在不断深入之中,是目前图像处理中研究的热点之一。5) 图像描述 图像描述是图像识别和理解的必要前提。作为最简单的二值图像可采用其几何特性描述物体的特性,一般图像的描述方法采用二维形状描述,它有边界描述和区域描述两类方法。对于特殊的纹理图像可采用二维纹理特征描述。随着图像处理研究的深入发展,已经开始进行三维物体描述的研究,提出了体积描述、表面描述、广义圆柱体描述等方法。 6) 图像分类(识别) 图像分类(识别)属于模式识别的范畴,其主要内容是图像经过某些预处理(增强、复原、压缩)后,进行图像分割和特征提取,从而进行判决分类。图像分类常采用经典的模式识别方法,有统计模式分类和句法(结构)模式分类,近年来新发展起来的模糊模式识别和人工神经网络模式分类在图像识别中也越来越受到重视。

    数字图像处理的基本特点
    (1)目前,数字图像处理的信息大多是二维信息,处理信息量很大。如一幅256×256低分辨率黑白图像,要求约64kbit的数据量;对高分辨率彩色512×512图像,则要求768kbit数据量;如果要处理30帧/秒的电视图像序列,则每秒要求500kbit~22.5Mbit数据量。因此对计算机的计算速度、存储容量等要求较高。 (2)数字图像处理占用的频带较宽。与语言信息相比,占用的频带要大几个数量级。如电视图像的带宽约5.6MHz,而语音带宽仅为4kHz左右。所以在成像、传输、存储、处理、显示等各个环节的实现上,技术难度较大,成本亦高,这就对频带压缩技术提出了更高的要求。 (3)数字图像中各个像素是不独立的,其相关性大。在图像画面上,经常有很多像素有相同或接近的灰度。就电视画面而言,同一行中相邻两个像素或相邻两行间的像素,其相关系数可达0.9以上,而相邻两帧之间的相关性比帧内相关性一般说还要大些。因此,图像处理中信息压缩的潜力很大。 (4)由于图像是三维景物的二维投影,一幅图象本身不具备复现三维景物的全部几何信息的能力,很显然三维景物背后部分信息在二维图像画面上是反映不出来的。因此,要分析和理解三维景物必须作合适的假定或附加新的测量,例如双目图像或多视点图像。在理解三维景物时需要知识导引,这也是人工智能中正在致力解决的知识工程问题。 (5)数字图像处理后的图像一般是给人观察和评价的,因此受人
    的因素影响较大。由于人的视觉系统很复杂,受环境条件、视觉性能、人的情绪爱好以及知识状况影响很大,作为图像质量的评价还有待进一步深入的研究。另一方面,计算机视觉是模仿人的视觉,人的感知机理必然影响着计算机视觉的研究。例如,什么是感知的初始基元,基元是如何组成的,局部与全局感知的关系,优先敏感的结构、属性和时间特征等,这些都是心理学和神经心理学正在着力研究的课题。

    数字图像处理的优点
    1. 再现性好 数字图像处理与模拟图像处理的根本不同在于,它不会因图像的存储、传输或复制等一系列变换操作而导致图像质量的退化。只要图像在数字化时准确地表现了原稿,则数字图像处理过程始终能保持图像的再现。 2.处理精度高 按目前的技术,几乎可将一幅模拟图像数字化为任意大小的二维数组,这主要取决于图像数字化设备的能力。现代扫描仪可以把每个像素的灰度等级量化为16位甚至更高,这意味着图像的数字化精度可以达到满足任一应用需求。对计算机而言,不论数组大小,也不论每个像素的位数多少,其处理程序几乎是一样的。换言之,从原理上讲不论图像的精度有多高,处理总是能实现的,只要在处理时改变程序中的数组参数就可以了。回想一下图像的模拟处理,为了要把处理精度提高一个数量级,就要大幅度地改进处理装置,这在经济上是极不合算的。 3.适用面宽 图像可以来自多种信息源,它们可以是可见光图像,也可以是不可见的波谱图像(例如X射线图像、 射线图像、超声波图像或红外图像等)。从图像反映的客观实体尺度看,可以小到电子显微镜图像,大到航空照片、遥感图像甚至天文望远镜图像。这些来自不同信息源的图像只要被变换为数字编码形式后,均是用二维数组表示的灰度图像(彩色图像也是由灰度图像组合成的,例如RGB图像由红、绿、蓝三个灰度图像组合而成)组合而成,因而均可用计算机来处理。即只要针对不同的图像信息源,采取相应的图像信息采集措施,图像的数字处理方法适用于任何一种图像。 4.灵活性高 图像处理大体上可分为图像的像质改善、图像分析和图像重建三大部分,
    每一部分均包含丰富的内容。由于图像的光学处理从原理上讲只能进行线性运算,这极大地限制了光学图像处理能实现的目标。而数字图像处理不仅能完成线性运算,而且能实现非线性处理,即凡是可以用数学公式或逻辑关系来表达的一切运算均可用数字图像处理实现。

    数字图像处理的应用
     图像是人类获取和交换信息的主要来源,因此,图像处理的应用领域必然涉及到人类生活和工作的方方面面。随着人类活动范围的不断扩大,图像处理的应用领域也将随之不断扩大。 1)航天和航空技术方面的应用 数字图像处理技术在航天和航空技术方面的应用,除了上面介绍的JPL对月球、火星照片的处理之外,另一方面的应用是在飞机遥感和卫星遥感技术中。许多国家每天派出很多侦察飞机对地球上有兴趣的地区进行大量的空中摄影。对由此得来的照片进行处理分析,以前需要雇用几千人,而现在改用配备有高级计算机的图像处理系统来判读分析,既节省人力,又加快了速度,还可以从照片中提取人工所不能发现的大量有用情报。从60年代末以来,美国及一些国际组织发射了资源遥感卫星(如LANDSAT系列)和天空实验室(如SKYLAB),由于成像条件受飞行器位置、姿态、环境条件等影响,图像质量总不是很高。因此,以如此昂贵的代价进行简单直观的判读来获取图像是不合算的,而必须采用数字图像处理技术。如LANDSAT系列陆地卫星,采用多波段扫描器(MSS),在900km高空对地球每一个地区以18天为一周期进行扫描成像,其图像分辨率大致相当于地面上十几米或100米左右(如1983年发射的LANDSAT-4,分辨率为30m)。这些图像在空中先处理(数字化,编码)成数字信号存入磁带中,在卫星经过地面站上空时,再高速传送下来,然后由处理中心分析判读。这些图像无论是在成像、存储、传输过程中,还是在判读分析中,都必须采用很多数字图像处理方法。现在世界各国都在利用陆地卫星所获取的图像进行资源调查(如森林调查、海洋泥沙和渔业调查、水资源调查等),灾害检测(如病虫害检测、水火检测、环境污染检测等),资源勘察(如石油勘查、矿产量探测、大型工程地理位置勘探分析等),农业规划(如土壤营养、水份和农作物生长、产量的估算等),城市规划(如地质结构、水源及环境分析等)。我国也陆续开展了以上诸方面的一些实际应用,并获得了良好的效果。在气象预报和对太空其它星球研究方面,数字图像处理技术也发挥了相当大的作用。
    2)生物医学工程方面的应用 数字图像处理在生物医学工程方面的应用十分广泛,而且很有成效。除了上面介绍的CT技术之外,还有一类是对医用显微图像的处理分析,如红细胞、白细胞分类,染色体分析,癌细胞识别等。此外,在X光肺部图像增晰、超声波图像处理、心电图分析、立体定向放射治疗等医学诊断方面都广泛地应用图像处理技术。 3)通信工程方面的应用 当前通信的主要发展方向是声音、文字、图像和数据结合的多媒体通信。具体地讲是将电话、电视和计算机以三网合一的方式在数字通信网上传输。其中以图像通信最为复杂和困难,因图像的数据量十分巨大,如传送彩色电视信号的速率达100Mbit/s以上。要将这样高速率的数据实时传送出去,必须采用编码技术来压缩信息的比特量。在一定意义上讲,编码压缩是这些技术成败的关键。除了已应用较广泛的熵编码、DPCM编码、变换编码外,目前国内外正在大力开发研究新的编码方法,如分行编码、自适应网络编码、小波变换图像压缩编码等。 4)工业和工程方面的应用 在工业和工程领域中图像处理技术有着广泛的应用,如自动装配线中检测零件的质量、并对零件进行分类,印刷电路板疵病检查,弹性力学照片的应力分析,流体力学图片的阻力和升力分析,邮政信件的自动分拣,在一些有毒、放射性环境内识别工件及物体的形状和排列状态,先进的设计和制造技术中采用工业视觉等等。其中值得一提的是研制具备视觉、听觉和触觉功能的智能机器人,将会给工农业生产带来新的激励,目前已在工业生产中的喷漆、焊接、装配中得到有效的利用。 5)军事公安方面的应用 在军事方面图像处理和识别主要用于导弹的精确末制导,各种侦察照片的判读,具有图像传输、存储和显示的军事自动化指挥系统,飞机、坦克和军舰模拟训练系统等;公安业务图片的判读分析,指纹识别,人脸鉴别,不完整图片的复原,以及交通监控、事故分析等。目前已投入运行的高速公路不停车自动收费系统中的车辆和车牌的自动识别都是图像处理技术成功应用的例子。 6)文化艺术方面的应用 目前这类应用有电视画面的数字编辑,动画的制作,电子图像游戏,纺织工艺品设计,服装设计与制作,发型设计,文物资料照片的复制和修复,运动员动作分析和评分等等,现在已逐渐形成一门新的艺术--计算机美术。

     
    展开全文
  • 数字图像处理的最早应用之一是在报纸业 20世纪20年代初期,Bartlane电缆图片传输系统(纽约和伦敦之间海底电缆,经过大西洋)传输一幅数字图像所需的时间由一周多减少到小于3个小时。为了用电缆传输图像,首先要...
  • 数字图像处理发展概况

    千次阅读 2006-10-13 16:47:00
    数字图像处理发展概况数字图像处理(Digital Image Processing)又称为计算机图像处理,它是指将图像信号转换成数字信号并利用计算机对其进行处理的过程。数字图像处理最早出现于20世纪50年代,当时的电子计算机...
  • 如何学好图像处理——从小白到大神?

    万次阅读 多人点赞 2020-04-17 02:28:38
    什么是数字图像处理?历史、以及它所研究的内容。 说起图像处理,你会想到什么?你是否真的了解这个领域所研究的内容。纵向来说,数字图像处理研究的历史相当悠久;横向来说,数字图像处理研究的话题相当广泛。 ...
  • 图像处理的前景

    千次阅读 2011-03-01 17:08:00
    2009-10-21 10:15就 ...好了图像处理的基本知识,就业时就可以向这些方向发展。目前的模式识别,大部分也都是图像模式识别。在实际应用场合,采集的信息很多都是图像信息,比如指 纹、条码、人脸、虹膜、车辆等
  • 图像处理入门教程

    万次阅读 多人点赞 2018-04-20 19:00:46
    最近有人问我图像处理怎么研究,怎么入门,怎么应用,我竟一时语塞。仔细想想,自己也搞了两年图像方面的研究,做个两个创新项目,发过两篇论文,也算是有点心得,于是总结总结和大家分享,希望能对大家有所帮助。在...
  • 虽然没有做出什么很出色的工作,不过在这个领域摸爬滚打了十年之后,发现自己对图像处理和计算机视觉的感情越来越深厚。下班之后看看相关的书籍和文献是一件很惬意的事情。平常的一大业余爱好就是收集一些相关的文章...
  • FPGA图像处理之路,从此开始

    万次阅读 多人点赞 2017-09-02 22:35:31
    FPGA图像处理之路,从此开始,接下来,让我们把时间交给“图像处理”。一休哥在动笔之前,一直在犹豫,反复思考着一个问题,这个问题一直困扰着我,“FPGA在图像处理领域中的地位?” 按照惯例,我们先暂且不直说这...
  • 图像处理最早出现于 20 世纪 50 年代,当时的电子计算机已经发展到一定水平,人们开始利用计算机来处理图形和图像信息。数字图像处理作为一门学科大约形成于 20 世纪 60 年代初期。早期的图像处理的目的是改善图像的...
  • FPGA的图像处理算法

    千次阅读 2019-02-25 15:07:47
    智能机器人、多媒体已经计算机的诞生都离不开数字图象处理技术,随着计算机智能化图像处理技术的不断发展,几乎所有领域当中都有数字图象技术的身影。例如军事、公共安全、工业、航天航空、卫星遥感以及生命科学等...
  • 数字图像处理 冈萨雷斯 第三版 中文版

    千次下载 热门讨论 2020-07-30 23:30:30
    《数字图像处理 第三版 》作为主要教材已有30多年 这一版本是作者在前两版的基础上修订而成的 是前两版的发展与延续 除保留了前两版的大部分内容外 根据读者的反馈 作者在13个方面对《数字图像处理 第三版 》进行了...
  • 数字图像处理应用领域

    千次阅读 2018-10-09 02:42:22
    数字图像处理应用领域 图像是人类获取和交换信息的主要来源,因此,图像处理的应用领域必然涉及到人类生活和工作的方方面面。随着人类活动范围的不断扩大,图像处理的应用领域也将随之不断扩大。 1)航天和航空方面 ...
  • 伴随着图像处理技术的发展,我们每天无时无刻都在接触着图像处理的一切,打开相机,设置美颜程度,伴随着快门键的按下,一张瘦脸磨皮的人像处理完成了。按下手机的解锁键,前置摄像头已经获取了你的人脸图像,并在你...
  • 深度学习笔记 深度学习(六十九)darknet 实现实验 Compressing Deep Neural Networks with Pruning, Trained Quantization and Huffma 深度学习(六十八)darknet使用 深度学习(六十七)metal forge深度学习库...
  • 数字图像处理就业前景--非常详细

    万次阅读 多人点赞 2015-10-30 22:12:22
    最近版上有不少人在讨论图像处理的就业方向,似乎大部分都持悲观的态度。我想结合我今年找工作的经验谈谈我的看法。就我看来,个人觉得图像处理的就业还是不错的。首先可以把图像看成二维、三维或者更高维的信号,从...
  • 数字图像处理发展 20世纪60年代随着计算机技术的发展发展起来的新兴技术。早期图像处理的目的是改善图像的质量,以人为对象,以改善人的视觉效果为目的;1964年美国最新喷气推进实验室对航天探测器“徘徊者7号”...
  • 数字图像处理的技术方法和应用

    万次阅读 2016-11-18 10:56:01
    20 世纪 50 年代,电子计算机已经发展到一定水平,人们开始利用计算机来处理图形和图像信息,这便是早期的图像处理。早期图像处理的目的是改善图像的质量,它以人为对象,以改善人的视觉效果为目的。数字图像处理...
1 2 3 4 5 ... 20
收藏数 118,105
精华内容 47,242
关键字:

图像处理的最近发展