图像处理 行业大牛

2011-09-20 09:25:10 tanqiwen1 阅读数 6095

 

浅谈图像处理方向的就业前景[转)

最近版上有不少人在讨论图像处理的就业方向,似乎大部分都持悲观的态度。我想结合我今年找工作的经验谈谈我的看法。

就我看来,个人觉得图像处理的就业还是不错的。首先可以把图像看成二维、三维或者更高维的信号,从这个意义上来说,图像处理是整个信号处理里面就业形势最好的,因为你不仅要掌握(一维)信号处理的基本知识,也要掌握图像处理(二维或者高维信号处理)的知识。其次,图像处理是计算机视觉和视频处理的基础,掌握好了图像处理的基本知识,就业时就可以向这些方向发展。目前的模式识别,大部分也都是图像模式识别。在实际应用场合,采集的信息很多都是图像信息,比如指纹、条码、人脸、虹膜、车辆等等。说到应用场合,千万不能忘了医学图像这一块,如果有医学图像处理的背景,去一些医疗器械公司或者医疗软件公司也是不错的选择。图像处理对编程的要求比较高,如果编程很厉害,当然就业也多了一个选择方向,并不一定要局限在图像方向。

下面谈谈我所知道的一些公司信息,不全,仅仅是我所了解到的或者我所感兴趣的,实际远远不止这么多。

搜索方向

基于内容的图像或视频搜索是很多搜索公司研究的热点。要想进入这个领域,必须有很强的编程能力,很好的图像处理和模式识别的背景。要求高待遇自然就不错,目前这方面的代表公司有微软、google、yahoo和百度,个个鼎鼎大名。

医学图像方向

目前在医疗器械方向主要是几个大企业在竞争,来头都不小,其中包括Simens、GE、飞利浦和柯达,主要生产CT和MRI等医疗器材。由于医疗器械的主要功能是成像,必然涉及到对图像的处理,做图像处理的很有机会进入这些公司。它们在国内都设有研发中心,simens的在上海和深圳,GE和柯达都在上海,飞利浦的在沈阳。由于医疗市场是一个没有完全开发的市场,而一套医疗设备的价格是非常昂贵的,所以在这些地方的待遇都还可以,前景也看好。国内也有一些这样的企业比如深圳安科和迈瑞

计算机视觉和模式识别方向

我没去调研过有哪些公司在做,但肯定不少,比如指纹识别、人脸识别、虹膜识别。还有一个很大的方向是车牌识别,这个我倒是知道有一个公司高德威智能交通似乎做的很不错的样子。目前视频监控是一个热点问题,做跟踪和识别的可以在这个方向找到一席之地。

上海法视特位于上海张江高科技园区,在视觉和识别方面做的不错。北京的我也知道两个公司:大恒和凌云,都是以图像作为研发的主体。

视频方向

一般的高校或者研究所侧重在标准的制定和修改以及技术创新方面,而公司则侧重在编码解码的硬件实现方面。一般这些公司要求是熟悉或者精通MPEG、H.264或者AVS,选择了这个方向,只要做的还不错,基本就不愁饭碗。由于这不是我所感兴趣的方向,所以这方面的公司的信息我没有收集,但平常在各个bbs或者各种招聘网站经常看到。

我所知道的两个公司:诺基亚和pixelworks

其他

其实一般来说,只要涉及到成像或者图像的基本都要图像处理方面的人。比方说一个成像设备,在输出图像之前需要对原始图像进行增强或者去噪处理,存储时需要对图像进行压缩,成像之后需要对图像内容进行自动分析,这些内容都是图像处理的范畴。下面列举一些与图像有关或者招聘时明确说明需要图像处理方面人才的公司:

上海豪威集成电路有限公司(www.ovt.com.cn)

中芯微

摩托罗拉上海研究院

威盛(VIA)

松下

索尼

清华同方

三星

所有与图像(静止或者运动图像)有关的公司都是一种选择。比如数码相机、显微镜成像、超声成像、工业机器人控制、显示器、电视、遥感等等,都可以作为求职方向。

要求:

1、外语。如果进外企,外语的重要性不言而喻。一般外企的第一轮面试都是英语口语面试。

2、编程。这方面尤以C++为重,很多公司的笔试都是考c++知识。

3、专业水平。如果要找专业相关的工作,研究生期间的研究经历和发表的论文就显的比较重要。

4、知识面的宽度。我觉得在研究生期间,除了做好自己的研究方向之外,扩宽一下知识面也有很大的帮助,当然这个知识面指的是图像处理、计算机视觉和模式识别,知识面越宽,就业时的选择就会越多。

图像处理方向毕业的就业面非常广,而且待遇在应届生应该是中上等。其实还是一句话,能力决定一切。只要研究生三年没有白过,根本不愁找不到好工作。祝所有正在读研或者即将读研的朋友将来都能有一份满意的工作。

 

我说点不好的 呵呵 版主的说法我同意 都是正面的

反面的来说:现在大学和研究机构 做图象的越来越多了,这里面老板自己懂图象的不知道有多少?!老板不懂,影响还是很大的

多数做图象的是用MATLAB,用别人的代码(如小波)。在研究生三年学好C++毕业的有多少?在公司C++是重要的。

图象其实就是信号处理,除了本科是学信号的以外,信号与系统、数字信号处理是一定要学好的,那相应的数学方面的概率,多元统计,甚至泛函也要了解。

外语的基本要求是看懂英文文献(不一定全看懂),相应的英文书。去外企做研发,这是必备的。然后是口语和听力。

说这些不是波冷水,希望大家了解清楚。

Compared to the number of jobs available each year in the imaging soceity, the people who are majoring on it are way too much. I have to say most of the people who studied the this area were not end up with working on this area anymore.

The most important thing here is to understand image processing, it requires a broad level of knowledge including, some math (algrebra, statistics, PDE), dsp, pattern recognition, programming skills...

It is all these background skills will find you a job, so prepare to have a deep understanding on all these areas related to image processing

我也是学模式识别的,但是研究方向是遥感图像处理和识别.总的来说这个方向是比较专,但也是目前图像处理中比较难做的一个方向,因为遥感图像的复杂性超过我们所见过的任何图像.

其实谈到就业问题,我觉得如果研究方向比较适合,特别是读研期间能到斑竹谈的那些牛比的公司实习,了解企业真正需要的方向可能做起来有目标性.

顺便提下:高德威公司还是不要考虑,因为本人在毕业面试过程中,虽然面试的人力资源人员很友善,但是通过他们老板写的一些文章可以发现他们还是一个比较自恋和自大的公司.

楼主是好人

不过此文更多是安慰

新手不可太当真

衡量专业好坏的标准有两个:应用前景和技术门槛

个人觉得图像处理应用前景一般,比通信,计算机差远了,而技术门槛,相信不是新手都清楚,比微波之类低不少

总的来说图像方向就业一般,在it业算较冷得,特别是模式识别,人工智能之类,看起来高深邪乎,其实就是博士都不好找工作(亲身所见)

1)说到图像处理比通信差,很大部分的原因是当前行业背景,但通信真正的研发在中国又有多少,我的朋友中很多做工程的,况且现在在通信领域,很大的一个难点,也是多媒体通信。

2)说到比计算机差,我觉得这与你怎么看待计算机专业有关,有人觉得是基础,是工具,有人觉得是专业。况且计算机那边,现在研究图像的也不少。

3)再者,说微波,RFID等入门难,但要做精又谈何容易,而且兴趣真的很重要,没有兴趣,再有前景的专业,你也不一定能做好,还有女生并不适合搞这个,就业时,单位一般会暗示。另外,就业面也较窄,好公司真的难进,找工的时候,真的很郁闷,特别对女生。或许将来很大发展前途,这个另当别论。

4)说回图像处理,我觉得还是较中肯的,略有好的嫌疑,关键还是在读研的时候能把方向做宽(一般做图像处理,需要何模式识别等相结合,拓宽知识面是必要的,在真正做研究的时候,也发现是必须的),研究点做深入,注重实现能力、创新能力和学习能力,通过论文。多培养自己的材料组织提炼能力,锻炼逻辑思维。如果真的能做到三年光阴不虚度,找工应该不是问题,到时真正要考虑的是定位问题。

5)当然,最后,找工的时候,包装是一种技巧,整合是一种需要。

我觉得做图像处理还是很有前途的。

有做图像三维重建的来找我,我们公司做医疗影像的。

可以跟我Email联系:yalee@sina.com

作图像处理方面的研究工作,最重要的两个问题:其一是要把握住国际上最前

沿的内容;其二是所作工作要具备很高的实用背景。解决第一个问题的办法就

是找出这个方向公认最牛的几个超级大拿(看看他们都在作什么)和最权威的

出版物(阅读上面最新的文献),解决第二个问题的办法是你最好能够找到一个

实际应用的项目,边做边写文章。

做好这几点的途径之一就是充分利用网络资源,特别是权威网站和大拿们的个人主页。下面是我收集的一些资源,希望对大家有用。(这里我要感谢SMTH AI版的alamarik和Graphics版的faintt)

导航栏:

[1]研究群体

[2]大拿主页

[3]前沿期刊

[4]GPL软件资源

[5]搜索引擎

一、研究群体

http://www-2.cs.cmu.edu/~cil/vision.html

这是卡奈基梅隆大学的计算机视觉研究组的主页,上面提供很全的资料,从发表文章的下载到演示程序、测试图像、常用链接、相关软硬件,甚至还有一个搜索引擎。

http://www.cmis.csiro.au/IAP/zimage.htm

这是一个侧重图像分析的站点,一般。但是提供一个Image Analysis环境---ZIMAGE and SZIMAGE。

http://www.via.cornell.edu/

康奈尔大学的计算机视觉和图像分析研究组,好像是电子和计算机工程系的。侧重医学方面的研究,但是在上面有相当不错资源,关键是它正在建设中,能够跟踪一些信息。

http://www2.parc.com/istl/groups/did/didoverview.shtml

有一个很有意思的项目:DID(文档图像解码)。

http://www-cs-students.stanford.edu/

斯坦福大学计算机系主页,自己找吧:(

http://www.fmrib.ox.ac.uk/analysis/

主要研究:Brain Extraction Tool,Nonlinear noise reduction,Linear Image Registration,

Automated Segmentation,Structural brain change analysis,motion correction,etc.

http://www.cse.msu.edu/prip/

这是密歇根州立大学计算机和电子工程系的模式识别--图像处理研究组,它的FTP上有许多的文章(NEW)。

http://pandora.inf.uni-jena.de/p/e/index.html

德国的一个数字图像处理研究小组,在其上面能找到一些不错的链接资源。

http://www-staff.it.uts.edu.au/~sean/CVCC.dir/home.html

CVIP(used to be CVCC for Computer Vision and Cluster Computing) is a research group focusing on cluster-based computer vision within the Spiral Architecture.

http://cfia.gmu.edu/

The mission of the Center for Image Analysis is to foster multi-disciplinary research in image, multimedia and related technologies by establishing links

between academic institutes, industry and government agencies, and to transfer key technologies to

help industry build next

generation commercial and military imaging and multimedia systems.

http://peipa.essex.ac.uk/info/groups.html

可以通过它来搜索全世界各地的知名的计算机视觉研究组(CV Groups),极力推荐。

二、图像处理GPL库

http://www.ph.tn.tudelft.nl/~klamer/cppima.html

Cppima 是一个图像处理的C++函数库。这里有一个较全面介绍它的库函数的文档,当然你也可以下载压缩的GZIP包,里面包含TexInfo格式的文档。

http://iraf.noao.edu/

Welcome to the IRAF Homepage! IRAF is the Image Reduction and Analysis Facility, a general purpose software

system for the reduction and analysis of astronomical data.

http://entropy.brni-jhu.org/tnimage.html

一个非常不错的Unix系统的图像处理工具,看看它的截图。你可以在此基础上构建自己的专用图像处理工具包。

http://sourceforge.net/projects/

这是GPL软件集散地,到这里找你想要得到的IP库吧。

三、搜索资源

当然这里基本的搜索引擎还是必须要依靠的,比如Google等,可以到我常用的链接看看。下面的链接可能会节省你一些时间:

http://sal.kachinatech.com/

http://cheminfo.pku.edu.cn/mirrors/SAL/index.shtml

四、大拿网页

http://www.ai.mit.edu/people/wtf/

这位可是MIT人工智能实验室的BILL FREEMAN。大名鼎鼎!专长是:理解--贝叶斯模型。

http://www.merl.com/people/brand/

MERL(Mitsubishi Electric Research Laboratory)中的擅长“Style Machine”高手。

http://research.microsoft.com/~ablake/

CV界极有声望的A.Blake 1977年毕业于剑桥大学三一学院并或数学与电子科学学士学位。之后在MIT,Edinburgh,Oxford先后组建过研究小组并成为Oxford的教授,直到1999年进入微软剑桥研究中心。主要工作领域是计算机视觉。

http://www-2.cs.cmu.edu/afs/cs.cmu.edu/user/har/Web/home.html

这位牛人好像正在学习汉语,并且搜集了诸如“两只老虎(Two Tigers)”的歌曲,嘿嘿:)

他的主页上面还有几个牛:Shumeet Baluja, Takeo Kanade。他们的Face Detection作的绝对是世界一流。他毕业于卡奈基梅隆大学的计算机科学系,兴趣是计算机视觉。

http://www.ifp.uiuc.edu/yrui_ifp_home/html/huang_frame.html

这位老牛在1963年就获得了MIT的博士学位!他领导的Image Lab比较出名的是指纹识别。

--------------------------------------------------------------------------------

下面这些是我搜集的牛群(大部分是如日中天的Ph.D们),可以学习的是他们的Study Ways!

Finn Lindgren(Sweden):Statistical image analysis http://www.maths.lth.se/matstat/staff/finn/

Pavel Paclik(Prague):statistical pattern recognition http://www.ph.tn.tudelft.nl/~pavel/

Dr. Mark Burge:machine learning and graph theory http://cs.armstrong.edu/burge/

yalin Wang:Document Image Analysis http://students.washington.edu/~ylwang/

Geir Storvik: Image analysis http://www.math.uio.no/~geirs/

Heidorn http://alexia.lis.uiuc.edu/~heidorn/

Joakim Lindblad:Digital Image Cytometry http://www.cb.uu.se/~joakim/index_eng.html

S.Lavirotte: http://www-sop.inria.fr/cafe/Stephane.Lavirotte/

Sporring:scale-space techniques http://www.lab3d.odont.ku.dk/~sporring/

Mark Jenkinson:Reduction of MR Artefacts http://www.fmrib.ox.ac.uk/~mark/

Justin K. Romberg:digital signal processing http://www-dsp.rice.edu/~jrom/

Fauqueur:Image retrieval by regions of interest http://www-rocq.inria.fr/~fauqueur/

James J. Nolan:Computer Vision http://cs.gmu.edu/~jnolan/

Daniel X. Pape:Information http://www.bucho.org/~dpape/

Drew Pilant:remote sensing technology http://www.geo.mtu.edu/~anpilant/index.html

五、前沿期刊(TOP10)

这里的期刊大部分都可以通过上面的大拿们的主页间接找到,在这列出主要是为了节省直接想找期刊投稿的兄弟的时间:)

IEEE Trans. On PAMI http://www.computer.org/tpami/index.htm

IEEE Transactionson Image Processing http://www.ieee.org/organizations/pubs/transactions/tip.htm

Pattern Recognition http://www.elsevier.com/locate/issn/00313203

Pattern Recognition Letters http://www.elsevier.com/locate/issn/01678655

 

神经网络

Neural Networks Tutorial Review

http://hem.hj.se/~de96klda/NeuralNetworks.htm

ftp://ftp.sas.com/pub/neural/FAQ.html

 

Image Compression with Neural Networks

http://www.comp.glam.ac.uk/digimaging/neural.htm

 

Backpropagator's Review

http://www.dontveter.com/bpr/bpr.html

 

Bibliographies on Neural Networks

http://liinwww.ira.uka.de/bibliography/Neural/

 

Intelligent Motion Control with an Artificial Cerebellum

http://www.q12.org/phd.html

 

Kernel Machines

http://www.kernel-machines.org/

 

Some Neural Networks Research Organizations

http://www.ieee.org/nnc/

http://www.inns.org/

 

Neural Network Modeling in Vision Research

http://www.rybak-et-al.net/nisms.html

 

Neural Networks and Machine Learning

http://learning.cs.toronto.edu/

 

Neural Application Software

http://attrasoft.com

 

Neural Network Toolbox for MATLAB

http://www.mathworks.com/products/neuralnet/

 

Netlab Software

http://www.ncrg.aston.ac.uk/netlab/

 

Kunama Systems Limited

http://www.kunama.co.uk/

 

Computer Vision

Computer Vision Homepage, Carnegie Mellon University

www.cs.cmu.edu/~cil/vision.html

Annotated Computer Vision Bibliography

http://iris.usc.edu/Vision-Notes/bibliography/contents.html

http://iris.usc.edu/Vision-Notes/rosenfeld/contents.html

Lawrence Berkeley National Lab Computer Vision and Robotics Applications

http://www-itg.lbl.gov/ITG.hm.pg.docs/VISIon/vision.html

CVonline by University of Edinburgh

The Evolving, Distributed, Non-Proprietary, On-Line Compendium of Computer Vision, www.dai.ed.ac.uk/CVonline

Computer Vision Handbook, www.cs.hmc.edu/~fleck/computer-vision-handbook

Vision Systems Courseware

www.cs.cf.ac.uk/Dave/Vision_lecture/Vision_lecture_caller.html

Research Activities in Computer Vision

http://www-syntim.inria.fr/syntim/analyse/index-eng.html

Vision Systems Acronyms

www.vision-systems-design.com/vsd/archive/acronyms.html

Dictionary of Terms in Human and Animal Vision

http://cns-web.bu.edu/pub/laliden/WWW/Visionary/Visionary.html

Metrology based on Computer Vision

www.cranfield.ac.uk/sme/amac/research/metrology/metrology.html

Digital Photography

Digital Photography, Scanning, and Image Processing

www.dbusch.com/scanners/scanners.html

 

Educational Resources, Universities

Center for Image Processing in Education

www.cipe.com

Library of Congress Call Numbers Related to Imaging Science by Rochester Institute of Technology

http://wally2.rit.edu/pubs/guides/imagingcall.html

Mathematical Experiences through Image Processing, University of Washington

www.cs.washington.edu/research/metip/metip.html

Vismod Tech Reports and Publications, MIT

http://vismod.www.media.mit.edu/cgi-bin/tr_pagemaker

Vision Lab PhD dissertation list, University of Antwerp

http://wcc.ruca.ua.ac.be/~visielab/theses.html

INRIA (France) Research Projects: Human-Computer Interaction, Image Processing, Data Management, Knowledge Systems

www.inria.fr/Themes/Theme3-eng.html

Image Processing Resources

http://eleceng.ukc.ac.uk/~rls3/Contents.htm

Publications of Carsten Steger

http://www9.informatik.tu-muenchen.de/people/steger/publications.html

FAQs

comp.dsp FAQ

www.bdti.com/faq/dsp_faq.htm

Robotics FAQ

www.frc.ri.cmu.edu/robotics-faq

Where's the sci.image.processing FAQ?

www.cc.iastate.edu/olc_answers/packages/graphics/sci.image.processing.faq.html

comp.graphics.algorithms FAQ, Section 3, 2D Image/Pixel Computations

www.exaflop.org/docs/cgafaq

Astronomical Image Processing System FAQ

www.cv.nrao.edu/aips/aips_faq.html

2019-06-19 22:14:02 qq_15029743 阅读数 6808

       伴随着图像处理技术的发展,我们每天无时无刻都在接触着图像处理的一切,打开相机,设置美颜程度,伴随着快门键的按下,一张瘦脸磨皮的人像处理完成了。按下手机的解锁键,前置摄像头已经获取了你的人脸图像,并在你的脸上打上了若干个点,与数据库的信息进行比对,一次人像比对完成了。车辆行驶到单位校园门口,你的车牌已经被切割成一个个字母、数字与汉字,随着栏杆的抬起,又一次图像处理完成了。伴随着图像处理的广泛应用以及目前人工智能在图像领域的应用,更多的图像处理技术爆发式的增长,也更多的人投入到了这个领域的研究。作为一名行业从业者,如何学好图像处理就显得甚为棘手。博主作为一名“半路出家”的图像处理入门者,在这里也给各位读者分享一下一直以来的一些思考,因为本人水平有限,不妥之处还望见谅。

1、高山平顶上,尽是采樵翁。人人各怀刀斧意,未见山花映水红。        ——何权峰《眼界,决定你的世界》

        其实很多时候,我们都局限在自己的小平台里,沾沾自喜,而忽略了你身边技术的飞速发展,也许这种沉浸对于一些传统行业来说,淘汰一个人的速度是十几年甚至几十年,但是对于计算机领域来说,这一淘汰也许就是一瞬间,这也是为什么企业在招聘应届生事,一方面关注你的技能,但也非常关注你的学习能力(简单说就是你可以什么都不会,但你学的快不?但你愿意学不?),而这种学习能力往往是需要长时间培养锻炼的,举个例子:清华北大的学生永远不愁找不到工作,而去清华北大招聘的企业也往往最不看重你的专业,因为他们知道,这里有着国内学习能力最强的人。说的有点远了,回到刚刚的话题,其实给博主触动最深的还是看到了CSDN某大神的一篇博客《阿里巴巴(菜鸟) - 算法工程师(机器学习)提前批笔试面试总结》中面试环节面试官问的一个问题:介绍CVPR2018你最感兴趣一篇论文的工作?看到这里博主犹如当头一棒。自己也只是听说过CVPR,当然也会留意一些媒体的报道或者是推送,但是从来都没有认真的甚至说大致的浏览过每一年会议的文章内容甚至是会议目录。而自己也“井底之蛙”般的只能感叹自己也许将是接下来就被淘汰的那个。其实广一点说,我们的本科生或者研究生期间,可能你的实验室做的东西很low,亦或是你是一个“半路出家者”,或者我们的“出身”不是很好,这些都或多或少的会限制我们的眼界。但是我们自己不应该允许自己做那只“井底之蛙”,我们更应该关注或者说拥抱我们所处这个行业最新、最前沿的技术(比如2018CVPR的最佳论文《Taskonomy: Disentangling Task Transfer Learning》);关注我们这个领域的大牛(比如做计算机视觉我们一定绕不开李飞飞教授、做相机标定一定离不开张正友教授)。眼界决定我们的视野,这也是为什么很多顶尖的公司在招聘的时候一定会加上如下两条:1、所在实验室为国家重点实验室或者在国内顶尖的科研机构有过实习经历  2、在顶级会议发表过相关文章。会当凌绝顶,方能一览众山小!

这里,博主附上计算机视觉领域的CCF推荐会议:计算机视觉及图像处理领域会议,CCF推荐(A类,B类,C类),感兴趣的读者可以选取和你研究课题相关的较高水平的会议关注查看。

2、知其然与知其所以然。 ——《朱子语类》卷九《论知行》

        这里我们要说,很多人在从事图像处理工作的时候更多的是被动的被推着走,只知其然而不知其所以然,还是举个例子,我们都知道,图像处理的前期操作就是获取图像,而获取图像的一个重要途径就是通过相机获取图片,相机获取到的图片更多程度需要去标定矫正。好了,问题来了,很多人知道,我获取图像了,按照“前人所述”我需要进行相机标定,设置标定板、计算内外参数...一些列工作完成了,我们也得到了“前人所述”的内外参数,那接下来呢?我们怎么矫正呢?为什么要做矫正呢?不矫正对我的图像处理过程有什么影响呢?想必这个问题是很多读者没有考虑过的,博主也看了很多的博客,相机标定写内外参矩阵的大有人在,图像生动、推导详尽。但说获取这些参数只会该干什么的博客却是凤毛麟角。反观之,我们其实很多时候也都停留在这样的阶段,就是只知道,这个事情该这样,但是为什么要这样却知之甚少。

3、一门科学,只有当它成功地运用数学时,才能达到真正完善的地步。  ——马克思

        其实博主本人也是一个讨厌数学且数学不好的人,但是越是从事图像处理工作越深,越发觉得数学的重要性。数学也许就像是你的导师,你很多时候很讨厌,但是却绕不开。图像处理时我们会发现,图像在计算机内其实就是一个个矩阵,图像的处理很多时候就是数学变换,比如去噪(数学上的均值或者中值处理),比如放大缩小图像(数学上的插值和采样)等等,这里我们还是举一个例子:从事图像处理的人应该大部分都知道(最起码听说过)SIFT特征点检测算法,这里不展开论述,我们只拿其中的一个关键部分来说,SIFT算法中有两种方法,分别是:

a、使用LOG图像(高斯拉普拉斯变换图像):其步骤是:先将照片降采样,得到了不同分辨率下的图像金字塔。再对每层图像进行高斯卷积。这样一来,原本的图像金字塔每层只有一张图像,而卷积后,每层又增加了多张不同模糊程度下的照片。大概就是下图这样:

b、使用(DOG图像):DOG即高斯差分。构造高斯差分图像的步骤是:在获得LOG图像后,用其相邻的图像进行相减,得到所有图像重新构造的金字塔就是DOG金字塔。大概就是下图这样子:

        好了,问题来了,这一数学上的改进,能有多大的差距呢?我们可以看到,就是这样一个“看似简单”的改进可以使我们的运算量小一个数量级!数学有多重要!

        也许上面的过程有一些读者没看明白,什么又是高斯卷积又是图像相减的,太麻烦,那我们再介绍一种非常“简单”的特征点检测算法(FAST) ,有多“简单”呢?这里先放一张图:

        为了让大家简单易懂,这里我们简单的说原理,可能与实际不相符,简单说,就是你要找特征点P,那我在p周边画个圈,设置一个阈值,如果有若干个点大于这一阈值,我们就理解为p是特征点(阈值为9就是FAST9,阈值为11就是FAST11)。惊不惊喜,意不意外,就是这么好理解,而且这一算法的速度快,效果也不差。其实这种方法博主更多的理解为是一种数学上的改进。而我们纵观众多划时代的文章、方法、算法,其实其本质大多为数学方法在各个领域上应用的改进。学好数理化,走遍天下都不怕,数学,可怕却重要! 

4、如果我能看得更远一点的话,是因为我站在巨人的肩膀上。  ——牛顿

        伴随着计算机网络的发展,开源的趋势化(强调专利的微软收购了Github并主动开源了众多代码),我们可以找到更多的资源与资料(BaiDu,Google一键直达),一个个的开放图形库和开放图形软件(最常见的OpenGL、OpenCV),我们有着比以往任何时候更多的资源,也有着比以往人更多的机会接触到科技的最前沿(顶级会议大部分都是开源的,我们可以随意下载),这里博主特别强调,大胆的去使用这些工具,抱着书本往死里啃,问周边同学或老师有效,但这样的时代终将过去,信息交互的年代,每一个人都是一个信息源(有点像众包的概念),站在巨人肩膀上引领科技进步的人也许不是你我,但是你我可以更容易找到这个世界上的巨人在哪里了,我们的获取信息的渠道更多了,我们身边的信息源更多了(比如MOOC,我们可以倾听最好的老师讲课),这里说点题外话,推荐一部纪录片《互联网时代》,当时博主看的热血沸腾!回到主题,不主动拥抱这个时代的人一定会被时代所抛弃。能活到最后的人一定不是闭门造车的,一定是那个敢于攀登,寻找巨人的人。

5、工欲善其事,必先利其器。  ——《论语·卫灵公》

这里其实博主还是老生常谈的强调你的编程能力,我们都知道,一切的图像处理的最终实现都是程序,更是算法(硬件处理也有硬件程序、算法),而编程能力就好比士兵的枪、老师的粉笔。再好的想法如果不能付诸于一行行“冰冷”的算法最后都只能是镜中花、水中月。而选择哪门语言作为你的“枪”这里博主就不再赘述,直接放上之前写的一篇博客的内容:

Python?JAVA?C/C++?
      其实实验室也会有一些师弟师妹问我这个问题,我该选一门什么语言呢?当然,我在这里不去评论哪门语言的优劣好坏,仅仅针对每一门语言在找工作时选择的机会跟大家做一些分享,首先,如果你需要找工作时自己能多一些机会和选择,那么仅仅会MATLAB或者Python可能还是远远不够的,毕竟找工作时需求量最大的依旧是JAVA\C\C++相关的工程师,如果你仅仅会MATLAB或者Pyrthon,那么你找工作时可能只能选择算法相关类的工作,而这类工作,我们都知道,和你竞争的往往都是一些大佬,算法岗也因为其相对的高工资和低劳动强度而成为近两年来淘汰人数最多的岗位之一。

      所以,这里强烈建议如果有可能,请抽出时间选择JAVA\C\C++其中一门语言进行系统化的学习(这里我们只谈最常见的,PHP,GO等语言博主没有学过,也没有具体了解,就不在这里献丑了),当然选择JAVA你还可以转向安卓开发,C\C++则更加偏底层一些。这一切的选择基础需要你综合衡量,博主特别讨厌一些鼓吹某某语言万能无敌之类的话,举个例子C++的确可以坐界面,但显然,做界面C++不是最好的选择,合适的才是最好的,不是么?

6、你看江面平如镜,要看水底万丈深。  ——谚语

        我们很多人,其实也包括博主本人都有这个问题,就是用一个东西的时候想的不够深入,直至其表,不知其里,还是举个例子,我们每个人都应该知道的边缘检测算法,博主相信,用起来不难,网上搜一下代码,一搜一大片,有一定程序基础的人都可以轻松实现,但是深入思考,我们知道他的原理么?这里,博主将所有人分为几个等级,大家可以以边缘检测算法作为作为自己的对照,看看自己停留在哪个级别:

a、还没入门的“行外汉”:什么是边缘检测算法?不会怎么办?问周边人吧!

b、已经入门的“小菜鸟”:emm,好像有印象,去网上搜一下现成的程序,改一下图片输入就行了!

c、有思考的“程序猿”:算法每一个参数什么意思啊?我改一下会怎样?

d、负责任的“熟练工”:这个算法的原理究竟是什么样的?怎么就找到边缘了?找个博客看看!

e、企业抢着要的“大牛”:算法原理我看懂了,自己手撕代码试一下!

f、“大佬、科研工作者”:数学公式可能需要自己推一下,看能不能改进!

看看,一个简单的边缘检测算法我们就可以看到不同人的不同水平,你的思维深度更多时候可以决定你的高度!

7、思考可以构成一座桥,让我们通向新知识。 ——普朗克

      小时候爸爸妈妈就教会我们多问一问为什么,那时候最喜欢看的书也是《十万个为什么》,但是越长大越发现自己丧失了这种质疑和思考能力,我们更多时候的想法是“哪有那么多为什么!”。做项目,搞科研其实更多时候需要我们这种问问题的能力,就好比之前的例子:相机标定,为什么要标定?其实道理大家都懂,做到的却太少了,包括博主本人,这里写出这条大家共勉!

8、亡羊补牢,犹未迟也。  ——《战国策·楚策四》

        可能很多人看到博主写了这么多会觉得可能自己再某个或者某些领域的欠缺有点大,有些失落甚至灰心丧气。其实博主需要在文章的最后和大家打打气,我们发现了问题和漏洞只要积极去改变,就会发现事情就会朝着好的方向发展。谁能想到《三体》作者刘慈欣若干年前还在水电站工作?又有谁能想到阿里云的头头是一个哲学博士呢?最后一句话赠与自己也赠与能看到这篇文章的读者们共勉:改变,从当下开始!

2014-05-04 19:03:15 guangmingsky 阅读数 4104

最近版上有不少人在讨论图像处理的就业方向,似乎大部分都持悲观的态度。我想结合我今年找工作的经验谈谈我的看法。就我看来,个人觉得图像处理的就业还是不错的。首先可以把图像看成二维、三维或者更高维的信号,从这个意义上来说,图像处理是整个信号处理里面就业形势最好的,因为你不仅要掌握一维信号处理的基本知识,也要掌握图像处理的知识。其次,图像处理是计算机视觉和视频处理的基础,掌握好了图像处理的基本知识,就业时就可以向这些方向发展。目前的模式识别,大部分也都是图像模式识别。在实际应用场合,采集的信息很多都是图像信息,比如指纹、条码、人脸、虹膜、车辆等等。说到应用场合,千万不能忘了医学图像这一块,如果有医学图像处理的背景,去一些医疗器械公司或者医疗软件公司也是不错的选择。图像处理对编程的要求比较高,如果编程很厉害,当然就业也多了一个选择方向,并不一定要局限在图像方向。
下面谈谈我所知道的一些公司信息,不全,仅仅是我所了解到的或者我所感兴趣的,实际远远不止这么多。
搜索方向
基于内容的图像或视频搜索是很多搜索公司研究的热点。要想进入这个领域,必须有很强的编程能力,很好的图像处理和模式识别的背景。要求高待遇自然就不错,目前这方面的代表公司有微软、googleyahoo和百度,个个鼎鼎大名。
医学图像方向
目前在医疗器械方向主要是几大企业在竞争,来头都不小,其中包括西门子、飞利浦和柯达,主要生产CTMRI等医疗器材。由于医疗器械的主要功能是成像,必然涉及到对图像的处理,做图像处理的很有机会进入这些公司。它们在国内都设有研发中心,simens的在上海和深圳,GE和柯达都在上海,飞利浦的在沈阳。由于医疗市场是一个没有完全开发的市场,而一套医疗设备的价格是非常昂贵的,所以在这些地方的待遇都还可以,前景也看好。国内也有一些这样的企业比如深圳安科和迈瑞。
模式识别方向
我没去调研过有哪些公司在做,但肯定不少,比如指纹识别、人脸识别、虹膜识别。还有一个很大的方向是车牌识别,这个我倒是知道有一个公司高德威智能交通似乎做的很不错的样子。目前视频监控是一个热点问题,做跟踪和识别的可以在这个方向找到一席之地。上海法视特位于上海张江高科技园区,在视觉和识别方面做的不错。北京的我也知道两个公司:大恒和凌云,都是以图像作为研发的主体。
视频方向
一般的高校或者研究所侧重在标准的制定和修改以及技术创新方面,而公司则侧重在编码解码的硬件实现方面。一般这些公司要求是熟悉或者精通MPEGH.264或者AVS,选择了这个方向,只要做的还不错,基本就不愁饭碗。由于这不是我所感兴趣的方向,所以这方面的公司的信息我没有收集,但平常在各个论坛或者各种招聘网站经常看到。我所知道的两个公司:诺基亚和pixelworks。


其实一般来说,只要涉及到成像或者图像的基本都要图像处理方面的人。比方说一个成像设备,在输出图像之前需要对原始图像进行增强或者去噪处理,存储时需要对图像进行压缩,成像之后需要对图像内容进行自动分析,这些内容都是图像处理的范畴。下面列举一些与图像有关或者招聘时明确说明需要图像处理方面人才的公司:上海豪威集成电路有限公司、中芯微、摩托罗拉上海研究院、威盛、松下、索尼、清华同方、三星。所有与图像(静止或者运动图像)有关的公司都是一种选择。比如数码相机、显微镜成像、超声成像、工业机器人控制、显示器、电视、遥感等等,都可以作为求职方向。
要求:
1
、外语。如果进外企,外语的重要性不言而喻。一般外企的第一轮面试都是英语口语面试。
2
、编程。这方面尤以C++为重,很多公司的笔试都是考c++知识。
3
、专业水平。如果要找专业相关的工作,研究生期间的研究经历和发表的论文就显的比较重要。
4
、知识面的宽度。我觉得在研究生期间,除了做好自己的研究方向之外,扩宽一下知识面也有很大的帮助,当然这个知识面指的是图像处理、计算机视觉和模式识别,知识面越宽,就业时的选择就会越多。
图像处理方向毕业的就业面非常广,而且待遇在应届生应该是中上等。其实还是一句话,能力决定一切。只要研究生三年没有白过,根本不愁找不到好工作。祝所有正在读研或者即将读研的朋友将来都能有一份满意的工作。
我说点不好的,版主的说法我同意都是正面的,反面的来说:现在大学和研究机构做图象的越来越多了,这里面老板自己懂图象的不知道有多少?!老板不懂,影响还是很大的。多数做图象的是用MATLAB,用别人的代码。在研究生三年学好C++毕业的有多少?在公司C++是重要的。图象其实就是信号处理,除了本科是学信号的以外,信号与系统、数字信号处理是一定要学好的,那相应的数学方面的概率,多元统计,甚至泛函也要了解。外语的基本要求是看懂英文文献(不一定全看懂),相应的英文书。去外企做研发,这是必备的。然后是口语和听力。说这些不是波冷水,希望大家了解清楚。
Compared to the number of jobs available each year in the imaging soceity, the people who are majoring on it are way too much. I have to say most of the people who studied the this area were not end up with working on this area anymore.
The most important thing here is to understand image processing, it requires a broad level of knowledge including, some math (algrebra, statistics, PDE), dsp, pattern recognition, programming skills...
It is all these background skills will find you a job, so prepare to have a deep understanding on all these areas related to image processing
我也是学模式识别的,但是研究方向是遥感图像处理和识别.总的来说这个方向是比较专,但也是目前图像处理中比较难做的一个方向,因为遥感图像的复杂性超过我们所见过的任何图像.
其实谈到就业问题,我觉得如果研究方向比较适合,特别是读研期间能到斑竹谈的那些牛比的公司实习,了解企业真正需要的方向可能做起来有目标性.
顺便提下:高德威公司还是不要考虑,因为本人在毕业面试过程中,虽然面试的人力资源人员很友善,但是通过他们老板写的一些文章可以发现他们还是一个比较自恋和自大的公司.
楼主是好人,不过此文更多是安慰,新手不可太当真
衡量专业好坏的标准有两个:应用前景和技术门槛。个人觉得图像处理应用前景一般,比通信,计算机差远了,而技术门槛,相信不是新手都清楚,比微波之类低不少。总的来说图像方向就业一般,it业算较冷得,特别是模式识别,人工智能之类,看起来高深邪乎,其实就是博士都不好找工作(亲身所见)

1)说到图像处理比通信差,很大部分的原因是当前行业背景,但通信真正的研发在中国又有多少,我的朋友中很多做工程的,况且现在在通信领域,很大的一个难点,也是多媒体通信。
2
)说到比计算机差,我觉得这与你怎么看待计算机专业有关,有人觉得是基础,是工具,有人觉得是专业。况且计算机那边,现在研究图像的也不少。
3
)再者,说微波,RFID等入门难,但要做精又谈何容易,而且兴趣真的很重要,没有兴趣,再有前景的专业,你也不一定能做好,还有女生并不适合搞这个,就业时,单位一般会暗示。另外,就业面也较窄,好公司真的难进,找工的时候,真的很郁闷,特别对女生。或许将来很大发展前途,这个另当别论。
4
)说回图像处理,我觉得还是较中肯的,略有好的嫌疑,关键还是在读研的时候能把方向做宽。一般做图像处理,需要何模式识别等相结合,拓宽知识面是必要的,在真正做研究的时候,也发现是必须的。研究点做深入,注重实现能力、创新能力和学习能力,通过论文多培养自己的材料组织提炼能力,锻炼逻辑思维。如果真的能做到三年光阴不虚度,找工应该不是问题,到时真正要考虑的是定位问题。
5
)当然,最后,找工的时候,包装是一种技巧,整合是一种需要。
我觉得做图像处理还是很有前途的。

 

作图像处理方面的研究工作,最重要的两个问题:其一是要把握住国际上最前沿的内容;其二是所作工作要具备很高的实用背景。解决第一个问题的办法就是找出这个方向公认最牛的几个超级大拿(看看他们都在作什么)和最权威的出版物(阅读上面最新的文献),解决第二个问题的办法是你最好能够找到一个实际应用的项目,边做边写文章。

做好这几点的途径之一就是充分利用网络资源,特别是权威网站和大拿们的个人主页。下面是我收集的一些资源,希望对大家有用。(这里我要感谢SMTH AI版的alamarik和Graphics版的faintt)

导航栏: [1]研究群体、[2]大拿主页、[3]前沿期刊、[4]GPL软件资源、[5]搜索引擎。

一、研究群体
http://www-2.cs.cmu.edu/~cil/vision.html
这是卡奈基梅隆大学的计算机视觉研究组的主页,上面提供很全的资料,从发表文章的下载到演示程序、测试图像、常用链接、相关软硬件,甚至还有一个搜索引擎。

http://www.cmis.csiro.au/IAP/zimage.htm
这是一个侧重图像分析的站点,一般。但是提供一个Image Analysis环境---ZIMAGE and SZIMAGE。

http://www.via.cornell.edu/
康奈尔大学的计算机视觉和图像分析研究组,好像是电子和计算机工程系的。侧重医学方面的研究,但是在上面有相当不错资源,关键是它正在建设中,能够跟踪一些信息。

http://www2.parc.com/istl/groups/did/didoverview.shtml
有一个很有意思的项目:DID(文档图像解码)。

http://www-cs-students.stanford.edu/
斯坦福大学计算机系主页,自己找吧:(

http://www.fmrib.ox.ac.uk/analysis/
主要研究:Brain Extraction Tool,Nonlinear noise reduction,Linear Image Registration,

Automated Segmentation,Structural brain change analysis,motion correction,etc.

http://www.cse.msu.edu/prip/
这是密歇根州立大学计算机和电子工程系的模式识别--图像处理研究组,它的FTP上有许多的文章(NEW)。

http://pandora.inf.uni-jena.de/p/e/index.html
德国的一个数字图像处理研究小组,在其上面能找到一些不错的链接资源。

http://www-staff.it.uts.edu.au/~sean/CVCC.dir/home.html
CVIP(used to be CVCC for Computer Vision and Cluster Computing) is a research group focusing on cluster-based computer vision within the Spiral Architecture.

http://cfia.gmu.edu/
The mission of the Center for Image Analysis is to foster multi-disciplinary research in image, multimedia and related technologies by establishing links

between academic institutes, industry and government agencies, and to transfer key technologies to

help industry build next

generation commercial and military imaging and multimedia systems.

http://peipa.essex.ac.uk/info/groups.html
可以通过它来搜索全世界各地的知名的计算机视觉研究组(CV Groups),极力推荐。

二、图像处理GPL库
http://www.ph.tn.tudelft.nl/~klamer/cppima.html
Cppima 是一个图像处理的C++函数库。这里有一个较全面介绍它的库函数的文档,当然你也可以下载压缩的GZIP包,里面包含TexInfo格式的文档。

http://iraf.noao.edu/
Welcome to the IRAF Homepage! IRAF is the Image Reduction and Analysis Facility, a general purpose software

system for the reduction and analysis of astronomical data.

http://entropy.brni-jhu.org/tnimage.html
一个非常不错的Unix系统的图像处理工具,看看它的截图。你可以在此基础上构建自己的专用图像处理工具包。

http://sourceforge.net/projects/
这是GPL软件集散地,到这里找你想要得到的IP库吧。

三、搜索资源
当然这里基本的搜索引擎还是必须要依靠的,比如Google等,可以到我常用的链接看看。下面的链接可能会节省你一些时间:

http://sal.kachinatech.com/
http://cheminfo.pku.edu.cn/mirrors/SAL/index.shtml
四、大拿网页
http://www.ai.mit.edu/people/wtf/
这位可是MIT人工智能实验室的BILL FREEMAN。大名鼎鼎!专长是:理解--贝叶斯模型。

http://www.merl.com/people/brand/
MERL(Mitsubishi Electric Research Laboratory)中的擅长“Style Machine”高手。

http://research.microsoft.com/~ablake/
CV界极有声望的A.Blake 1977年毕业于剑桥大学三一学院并或数学与电子科学学士学位。之后在MIT,Edinburgh,Oxford先后组建过研究小组并成为Oxford的教授,直到1999年进入微软剑桥研究中心。主要工作领域是计算机视觉。

http://www-2.cs.cmu.edu/afs/cs.cmu.edu/user/har/Web/home.html
这位牛人好像正在学习汉语,并且搜集了诸如“两只老虎(Two Tigers)”的歌曲,嘿嘿:)
他的主页上面还有几个牛:Shumeet Baluja, Takeo Kanade。他们的Face Detection作的绝对是世界一流。他毕业于卡奈基梅隆大学的计算机科学系,兴趣是计算机视觉。

http://www.ifp.uiuc.edu/yrui_ifp_home/html/huang_frame.html
这位老牛在1963年就获得了MIT的博士学位!他领导的Image Lab比较出名的是指纹识别。

五、前沿期刊(TOP10)
这里的期刊大部分都可以通过上面的大拿们的主页间接找到,在这列出主要是为了节省直接想找期刊投稿的兄弟的时间:)

IEEE Trans. On PAMIhttp://www.computer.org/tpami/index.htm
IEEE Transactionson Image Processing http://www.ieee.org/organizations/pubs/transactions/tip.htm
Pattern Recognition http://www.elsevier.com/locate/issn/00313203
Pattern Recognition Letters http://www.elsevier.com/locate/issn/01678655

2016-02-26 17:48:13 baimafujinji 阅读数 69723

什么是数字图像处理?历史、以及它所研究的内容。

 

说起图像处理,你会想到什么?你是否真的了解这个领域所研究的内容。纵向来说,数字图像处理研究的历史相当悠久;横向来说,数字图像处理研究的话题相当广泛。

数字图像处理的历史可以追溯到近百年以前,大约在1920年的时候,图像首次通过海底电缆从英国伦敦传送到美国纽约。图像处理的首次应用是为了改善伦敦和纽约之间海底电缆发送的图片质量,那时就应用了图像编码,被编码后的图像通过海底电缆传送至目的地,再通过特殊设备进行输出。这是一次历史性的进步,传送一幅图片的时间从原来的一个多星期减少到了3小时。

1950年,美国的麻省理工学院制造出了第一台配有图形显示器的电子计算机——旋风I号(Whirlwind I)。旋风I号的显示器使用一个类似于示波器的阴极射线管(Cathode Ray Tube,CRT)来显示一些简单的图形。1958年美国Calcomp公司研制出了滚筒式绘图仪,GerBer公司把数控机床发展成为平板式绘图仪。在这一时期,电子计算机都主要应用于科学计算,而为这些计算机配置的图形设备也仅仅是作为一种简单的输出设备。

随着计算机技术的进步,数字图像处理技术也得到了很大的发展。1962年,当时还在麻省理工学院攻读博士学位的伊凡·苏泽兰(Ivan Sutherland)成功开发了具有划时代意义的“画板”(Sketchpad)程式。而这正是有史以来第一个交互式绘图系统,同时这也是交互式电脑绘图的开端。从此计算机和图形图像被更加紧密地联系到了一起。鉴于伊凡·苏泽兰为计算机图形学创立所做出的杰出贡献,他于1988年被授予计算机领域最高奖——图灵奖。

1964年,美国加利福尼亚的喷气推进实验室用计算机对“旅行者七号”太空船发回的大批月球照片进行处理,以校正航天器上摄影机中各种类型的图像畸变,收到了明显的效果。在后来的宇航空间技术中,数字图像处理技术都发挥了巨大的作用。

到了20世纪60年代末期,数字图像处理已经形成了比较完善的学科体系,这套理论在20世纪70年代发展得十分迅速,并开始应用于医学影像和天文学等领域。1972年,美国物理学家阿伦·马克利奥德·柯麦科(Allan MacLeodCormack)和英国电机工程师戈弗雷·纽博尔德·豪恩斯弗尔德(Godfrey Newbold Housfield)发明了轴向断层术,并将其用于头颅诊断。世界第一台X射线计算机轴向断层摄影装置由EMI公司研制成功,这也就是人们通常所说的CT(Computer Tomograph)。CT可通过一些算法用感知到的数据去重建通过物体的“切片”图像。这些图像组成了物体内部的再现图像,也就是根据人的头部截面的投影,经计算机处理来进行图像重建。鉴于CT对于医学诊断技术的发展所起到的巨大推动作用,柯麦科和豪恩斯弗尔德于1979年获得了诺贝尔生理或医学奖。

随后在2003年,诺贝尔生理或医学奖的殊荣再次授予了两位在医疗影像设备研究方面做出杰出贡献的科学家——美国化学家保罗·劳特伯尔(Paul Lauterbur)和英国物理学家彼得·曼斯菲尔(Peter Mansfield)。两位获奖者在利用磁共振成像(Magnetic Resonance Imaging,MRI)显示不同结构方面分别取得了开创性成就。瑞典卡罗林斯卡医学院称,这两位科学家在MRI领域的开创性工作,代表了医学诊疗和研究的重大突破。而事实上,核磁共振的成功同样也离不开数字图像处理方面的发展。即使在今天,诸如MRI图像降噪等问题依然是数字图像处理领域的热门研究方向。

说到数字图像的发展历程,还有一项至关重要的成果不得不提,那就是电荷耦合元件(Charge-coupled Device,CCD)。CCD最初是由美国贝尔实验室的科学家维拉德·波义耳(Willard Sterling Boyle)和乔治·史密斯(George Elwood Smith)于1969年发明的。CCD的作用就像胶片一样,它能够把光学影像转化为数字信号。今天人们所广泛使用的数码照相机、数码摄影机和扫描仪都是以CCD为基础发展而来的。换句话说,我们现在所研究的数字图像主要也都是通过CCD设备获取的。由于波义耳和史密斯在CCD研发上所做出的巨大贡献,他们两人共同荣获了2009年度的诺贝尔物理学奖。

数字图像处理在今天是非常热门的技术之一,生活中无处不存在着它的影子,可以说它是一种每时每刻都在改变着人类生活的技术。但长久以来,很多人对数字图像处理存在着较大的曲解,人们总是不自觉地将图像处理和Photoshop联系在一起。大名鼎鼎的Photoshop无疑是当前使用最为广泛的图像处理工具。类似的软件还有Corel公司生产的CorelDRAW等软件。

尽管Photoshop是一款非常优秀的图像处理软件,但它的存在并不代表数字图像处理的全部理论与方法。它所具有的功能仅仅是数字图像处理中的一部分。总的来说,数字图像处理研究的内容主要包括如下几个方面:

  • 1)图像获取和输出
  • 2)图像编码和压缩
  • 3)图像增强与复原
  • 4)图像的频域变换
  • 5)图像的信息安全
  • 6)图像的区域分割
  • 7)图像目标的识别
  • 8)图像的几何变换

但图像处理的研究内容,又不仅限于上述内容!所以说图像处理的研究话题是相当宽泛的。那现在图像处理都应用在哪些领域呢?或许我们可能熟知的例子有(当然,你应该还能举出更多例子):

  • 1)一些专业图像处理软件:Photoshop、CorelDRAW……
  • 2)一些手机APP应用:美图秀秀、玩图……
  • 3)一些医学图像处理应用:MRI、彩超图像处理……
  • 4)一些制造业上的应用:元器件检测、瑕疵检测……
  • 5)一些摄像头、相机上的应用:夜间照片的质量改善……
  • 6)一些电影工业上是应用:换背景、电影特技……

 

什么样的人会去学(或者需要学)图像处理?

 

1)如果你是我上述那些应用领域的从业者,你当然需要掌握图像方面的理论和技术;2)相关专业的研究人员、大专院校的博士生、研究生。

所谓相关专业又是指什么呢?这个答案也可能相当宽泛,例如(但不仅限于此):Computer Science, Software Engineering, Electronic Engineering, Biomedical Engineering, Automation, Control, Applied Mathematics……

 

如何学好图像处理——我的一些箴言

 

1)对于初级入门者

 

一个扎实的基础和对于图像处理理论的完整的、系统的整体认识对于后续的深入研究和实践应用具有非常非常重要的意义。

我经常喜欢拿武侠小说《天龙八部》中的一段情节来向读者说明此中的道理,相信读者对这部曾经被多次搬上银幕的金庸作品已经耳熟能详了。书中讲到有个名叫鸠摩智的番僧一心想练就绝世武学,而且他也算是个相当勤奋的人了。但是,他错就错在太过于急功近利,甚至使用道家的小无相功来催动少林绝技。看上去威力无比,而且可以在短时间内“速成”,但实则后患无穷。最终鸠摩智走火入魔,前功尽废,方才大彻大悟。这个故事其实就告诉我们打牢基础是非常重要的,特别是要取得更长足的发展,就更是要对基本原理刨根问底,力求甚解,从而做到庖丁解牛,游刃有余。

一些看似高深的算法往往是许多基础算法的组合提升。例如,令很多人望而却步的SIFT特征构建过程中,就用到了图像金字塔、直方图、高斯滤波这些非常非常基础的内容。但是,它所涉及的基础技术显然有好几个,如果缺乏对图像处理理论的系统认识,你可能会感觉事倍功半。因为所有的地方好像都是沟沟坎坎。

关于课程——

在这个阶段其实对于数学的要求并不高,你甚至可以从一些感性的角度去形象化的理解图像处理中很多内容(但不包括频域处理方面的内容)。具体到学习的建议,如果有条件(例如你还在高校里读书)你最好能选一门图像处理方面的课程,系统地完整的地去学习一下。这显然是入门的最好办法。如此一来,在建立一个完整的、系统的认知上相当有帮助。如果你没办法在学校里上一门这样的课,网上的一些公开课也可以试试。但现在中文MOOC上还没有这方面的优质课程推荐。英文的课程则有很多,例如美国加州伦斯勒理工学院Rich教授的数字图像处理公开课——https://www.youtube.com/channel/UCaiJlKxXamoODQtlx486qJA?spfreload=10。

关于教材——

显然,只听课其实还不太够,如果能一并读一本书就最好了。其实不用参考很多书,只要一本,你能从头读到尾就很好了。如果你没有条件去上一门课,那读一本来完整的自学一下就更有必要了。这个阶段,去网上到处找博客、看帖子是不行的。因为你特别需要在这个阶段对这门学问建立一个系统的完整的知识体系。东一块、西一块的胡拼乱凑无疑是坑你自己,你的知识体系就像一个气泡,可能看起来很大,但是又脆弱的不堪一击。

现在很多学校采用冈萨雷斯的《数字图像处理》一书作为教材。这是一本非常非常经典的著作。但是我必须要提醒读者:

1)这是一本专门为Electronic Engineering专业学生所写的书。它需要有信号与系统、数字信号处理这两门课作为基础。如果你没有这两门课的基础,你读这本书要么是看热闹,要么就是看不懂。

下面是冈书中的一张插图。对于EE的学生来说,这当然不是问题。但是如果没有我说的那两门课的基础,其实你很难把握其中的精髓。H和h,一个大小一个小写,冈书中有的地方用H,有的地方用h,这都是有很深刻用意的。原作者并没有特别说明它们二者的区别,因为他已经默认你应该知道二者是不同的。事实上,它们一个表示频域信号,一个表示时域信号,这也导致有时候运算是卷积,有时候运算是乘法(当然这跟卷积定理有关)。所以我并不太建议那些没有这方面基础的学生在自学的时候读这本书。

 

2)冈萨雷斯教授的《数字图像处理》第一版是在1977年出版的,到现在已经快40年了;现在国内广泛使用的第二版是2002年出版的(第三版是2007年但是其实二者差异并不大),到现在也有20年左右的时间了。事实上,冈萨雷斯教授退休也有快30年了。所以这本书的内容已经偏于陈旧。数字图像处理这个领域的发展绝对是日新月异,突飞猛进的。特别在最近二三十年里,很多新思路,新方法不断涌现。如果你看了我前面推荐的Rich教授的公开课(这也是当前美国大学正在教学的内容),你一下子就会发现,原来我们的教育还停留在改革开放之前外国的水平上。这其实特别可怕。所以我觉得冈萨雷斯教授的《数字图像处理》作为学习过程中的一个补充还是不错的,但是如果把它作为主参考,那真的就是:国外都洋枪洋炮了,我们还在大刀长矛。

 

那么现在问题来了,对于图像处理学习者而言到底看什么书好呢?我的意见是你可以选择下面两本书中的任何一本《数字图像处理原理与实践(Matlab版)》,以及《数字图像处理:技术详解与Visual C++实践》,当然选择的标准之一就是到底你更擅长使用MATLAB还是C++。

   

 

 

 

2)对于中级水平者

 

纸上得来终觉浅,绝知此事要躬行。对于一个具有一定基础的,想更进一步的中级水平的人来说,这个阶段最重要的就是增强动手实践的能力。

还是说《天龙八部》里面的一个角色——口述武功、叹为观止的王语嫣。王语嫣的脑袋里都是武功秘籍,但问题是她从来都没练过一招一式。结果是,然并卵。所以光说不练肯定不灵啊。特别是,如果你将来想从事这个行业,结果一点代码都不会写,那几乎是不可想象的。学习阶段,最常被用来进行算法开发的工具是Matlab和OpenCV。你可以把这两个东西都理解为一个相当完善的库。当然,在工业中C++用得更多,所以Matlab的应用还是很有限的。前面我们讲到,图像处理研究内容其实包括:图像的获取和编解码,但使用Matlab和OpenCV就会掩盖这部分内容的细节。你当然永远不会知道,JPEG文件到底是如何被解码的。

如果你的应用永远都不会涉及这些话题,那么你一直用Matlab和OpenCV当然无所谓。例如你的研究领域是SIFT、SURF这种特征匹配,可以不必理会编解码方面的内容。但是如果你的研究话题是降噪或者压缩,可能你就绕不开这些内容。最开始学的时候,如果能把这部分内容也自己写写,可能会加深你的理解。以后做高级应用开发时,再调用那些库。所以具体用什么,要不要自己写,是要视你所处的阶段和自己的实际情况而定的。以我个人的经验,在我自学的时候,我就动手写了Magic House,我觉得这个过程为我奠定了一个非常夯实的基础,对于我后续的深入研究很有帮助。

 

下面这个文中,我给出了一些这方面的资源,代码多多,很值得参考学习:图像处理与机器视觉网络资源收罗

http://blog.csdn.net/baimafujinji/article/details/32332079

 

3)对于高级进阶者

 

到了这个程度的读者,编程实现之类的基本功应该不在话下。但是要往深,往高去学习、研究和开发图像处理应用,你最需要的内容就变成了数学。这个是拦在很多处于这个阶段的人面前的一大难题。如果你的专业是应用数学,当然你不会感觉有问题。但如果是其他专业背景的人就会越发感觉痛苦。

如果你的图像处理是不涉及机器学习内容的,例如用Poisson方程来做图像融合,那你就要有PDE数值解方面的知识;如果你要研究KAZE特征,你就必须要知道AOS方面的内容。如果你研究TV降噪,你又要知道泛函分析中的BV空间内容……这些词你可能很多都没听过。总的来说,这块需要的内容包括:复变函数、泛函分析、偏微分方程、变分法、数学物理方法……

如果你要涉足机器视觉方法的内容,一些机器学习和数据挖掘方法的内容就不可或缺。而这部分内容同样需要很强大的数学基础,例如最大似然方法、梯度下降法、欧拉-拉格朗日方程、最小二乘估计、凸函数与詹森不等式……

当然,走到这一步,你也已经脱胎换骨,从小白到大神啦!路漫漫其修远兮,吾将上下而求索。

 

(全文完)

 

 

2015-12-06 21:23:51 qq_22657193 阅读数 7301

Tony F. Chan

加州大学数学系教授,(似乎是香港出生的华人,待确认?)。在水平集图像分割方面,其论文《Active contourswithout edges》提出的 C-V 模型,Google学术上显示被引用 5153 次之多。

http://www.math.ucla.edu/~chan/index.html

 

Chunming Li

本科福建师范大学数学系,硕士复旦大学数学系,博士则在University of Connecticut电子工程专业。在水平集图像分割方面颇有成绩,其最有名的论文《Level Set Evolution Without Re-initialization: A New Variational Formulation》,Google学术显示被引用1128次之多。

http://www.engr.uconn.edu/~cmli/

http://scholar.google.com/citations?user=tpAgWBwAAAAJ&hl=en

 


Daniel Cremers

http://vision.in.tum.de/members/cremers

http://scholar.google.com/citations?user=cXQciMEAAAAJ&hl=en

研究领域在:计算机视觉,数字图像处理,模式识别。


Mikael Rousson

http://scholar.google.com/citations?user=SPKqz2kAAAAJ&hl=en


Michael Leventon

麻省理工人工智能实验室

http://www.leventon.com/mit/


Bernhard Schölkopf

主要研究方向是机器学习,他在 Kernel方法,尤其是 Kernel PCA 方面成就很大。

http://www.is.tuebingen.mpg.de/employee/details/bs.html 

他的文章大都在:http://www.is.tuebingen.mpg.de/research/dep/bs/publication-list-schoelkopf.html

www.kernel-machines.org 

http://scholar.google.com/citations?user=DZ-fHPgAAAAJ&hl=en

 

(说明:以下部分时转载自http://blog.sciencenet.cn/blog-672874-665865.html)

CV人物1:Jianbo Shi史建波毕业于UC Berkeley,导师是Jitendra Malik。其最有影响力的研究成果:图像分割。其于2000年在PAMI上多人合作发表”Noramlized cuts and image segmentation”。这是图像分割领域内最经典的算法。主页:www.cis.upenn.edu/~jshi/ 和 www.cs.cmu.edu/~jshi/

244x126



CV人物2:Kristen Grauman毕业于MIT,导师是Trevor Darrell。其最有影响力的研究成果:Pyramid Match Kernel,用于图像匹配。她和Darrell在2005年CVPR合作发表了”The Pyramid Match Kernel: Discriminative Classification with Sets of Image Features”。金字塔匹配核函数可快速搜索两个特征集合之间匹配的特征,可应用于图像匹配、物体识别,是该领域经典算法之一。2011年Marr奖得主。主页:www.cs.utexas.edu/~grauman/

194x244



CV人物3:Irfan Essa现任教于Georgin Tech佐治亚理工大学,毕业于MIT,其最有影响力的研究成果:人脸表情识别。Essa和Alex Penland 在1997年PAMI合作发表了”Coding, analysis,interpretation,and recognition of facial expression”, 结合了几何模型和面部肌肉无力模型,用来描述脸部结构。主页:www.ic.gatech.edu/people/irfan-essa

155x232 

CV人物4:Matthew Turk毕业于MIT,最有影响力的研究成果:人脸识别。其和Alex Pentland在1991年发表了”Eigenfaces for Face Recognition”.该论文首次将PCA(Principal Component Analysis)引入到人脸识别中,是人脸识别最早期最经典的方法,且被人实现,开源在OpenCV了。主页:www.cs.ucsb.edu/~mturk/

CV人物5:David Lowe毕业于斯坦福大学,导师是Thomas Binfold,最有影响力的研究成果:SIFT。他是SIFT特征点检测的发明人。由于SIFT具有对于图像平移、旋转和尺度变化不变性的优点,使得SIFT成为近十年来最流行的图像特征点检测方法,被广泛用于图像匹配、物体识别、分类等领域。主页:http://www.cs.ubc.ca/~lowe/

244x212


CV人物6:Pascal Fua毕业于Orsay,导师是O.D.Faugera。最有影响力的研究成果:立体视觉。其在1993年发表了”A parallel stereo algorithm that produces dense depth maps and preserves image features”,提出了利用相关性来估计dense深度图的快速并行立体视觉算法,是立体视觉领域内经典算法之一。主页:http://cvlab.epfl.ch/~fua/和 http://people.epfl.ch/pascal.fua

144x204


CV人物7:Luc Van Gool毕业于Katholieke Universiteit Leuven.最有影响力的研究成果:图像特征点检测和摄像机标定。Gool等发蒙的Surf(speeded up robust features)是除SIFT外,应用最广泛的特征点检测算法,surf具有提取速度更快、维度更低的优点,也被广泛用于物体检测、识别等。Opencv开源。Marc Pollefeys, Koch和Goolz 1999年IJCV上发表了”self-calibration and metric reconstruction inspite of varying and unknown intrinsic camera parameters”,是摄像机自标定领域内最经典论文,并获1998年Marr奖。主页:http://www.vision.ee.ethz.ch/~vangool/

CV人物8:Michal Irani毕业于Hebrew大学,最有影响力的研究成果:超分辨率。她和Peleg于1991年在Graphical Models and Image Processing发表了”Improving resolution by image registration”,提出了用迭代的、反向投影的方法来解决图像放大的问题,是图像超分辨率最经典的算法。我在公司实现的产品化清晰化增强算法就参考了该算法思想哈哈。主页:http://www.wisdom.weizmann.ac.il/~irani/

154x244


CV人物9: Jean Ponce毕业于Paris Orsay,最有影响力的研究成果:计算机视觉教育、物体识别。他和David Forsyth合写的”Computer Vision: A Modern Approach”被视为现代计算机视觉领域最经典教科书之一。其近年来的研究重点是物体识别,是Spatial Pyramid Matching算法发明人之一,比起之前广泛使用的bag-of-words方法相比,该方法考虑了一些局部特征之间的空间关系,因此更有效地描述物体特征。是目前最普遍使用的算法之一。主页:http://www.di.ens.fr/~ponce/

185x216


CV人物10: Andrew Blake毕业于Edinburgh,最有影响力的研究成果:目标跟踪、图像分割、人体姿态跟踪与分析。他是世界知名CV专家,两次荣获ECCV最佳论文奖和1次Marr奖。他和Michael Isard在1998年IJCV中合写的”Condensation—conditional density propagation for visual tracking”,将粒子滤波器用于目标跟踪,该领域的经典论文。二人1998年合写的另一篇”Active Contours”是图像分割领域经典算法,该算法用spline函数,通过最小化能量函数,是的样条逼近物体轮廓,在该算法基础上,衍生出了著名的Active shape model。Blake领导的微软剑桥研究院在人体姿态跟踪与分析上去的突破,用于Kinect中。主页:http://research.microsoft.com/~ablake

146x179

CV人物11: Antonio Criminisi毕业于牛津大学,导师是Andrew Zisserman 和 Ian Reid。最有吸影响力的研究成果:Image Inpaiting.他在2004年发表”Region filling and object removal by exemplar-based image inpainting”,该方法用于去除图像中大的遮挡物或小的刮痕,结合了采样纹理生成和结构传递的图像修补技术,获得不错效果。主页:http://research.microsoft.com/en-us/people/antcrim/

129x129


CV人物12: Paul Viola毕业于MIT,研究领域:目标检测;最有影响力的研究成果:人脸检测;他和Michael Jones在2001年CVPR发表了”Rapid object detection using a boosted cascade of simple features”,真正意义上解决了人脸检测的问题,并开启了boosting算法的一个时代,很多学者受到boosting cascade算法的影响,扩展了该算法的应用领域,牛逼的影响力。主页:http://research.microsoft.com/en-us/um/people/viola/

CV人物13: Henry Rowley毕业于CMU,导师:Takeo Kanade;研究领域:大规模图像识别和机器学习;最有影响力的研究成果:人脸检测;他使用人工神经网络用于人脸检测,该算法是Paul Viola的boosting cascade人脸检测算法出现前,最经典的人脸检测算法。主页:http://www.cs.cmu.edu/~har/

164x217


CV人物14: Dorin Comaniclu毕业于Rutgers;最有影响力的研究成果:目标跟踪、图像分割;他在2000年发表了”Real-time tracking of non-rigid objects using mean shift”。该算法首次将mean shift用于目标跟踪,并在2002年PAMI发表了”Mean shift: A robust approach toward feature space analysis”,并将Meanshift拓展应用于图像分割中。主页:http://coewww.rutgers.edu/riul/FORMER/comanici/

237x244


CV人物15: Henry Schneiderman毕业于CMU,导师:Takeo Kanade;研究领域:目标检测和识别;最有影响力的研究成果:目标检测;他在2000年CVPR上发表了”A statistical method for 3D object detection applied to faces and cars”。该算法采用多视角训练样本,可用于检测不同视角下的物体,如人脸和车,是第一个能够检测侧脸的算法。他创建了PittPatt公司,后被Google收购。主页:http://www.cs.cmu.edu/~hws/

213x244

CV人物16: William T.Freeman毕业于MIT;研究领域:应用于CV的ML、可视化感知的贝叶斯模型、计算摄影学;最有影响力的研究成果:图像纹理合成;Alex Efros和Freeman在2001年SIGGRAPH上发表了”Image quilting for texture synthesis and transfer”,其思想是从已知图像中获得小块,然后将这些小块拼接mosaic一起,形成新的图像。该算法是图像纹理合成中经典中的经典。主页:http://people.csail.mit.edu/billf/
173x150

CV人物17: Feifei Li李菲菲,毕业于Caltech;导师:Pietro Perona;研究领域:Object Bank、Scene Classification、ImageNet等;最有影响力的研究成果:图像识别;她建立了图像识别领域的标准测试库Caltech101/256。是词包方法的推动者。主页:http://vision.stanford.edu/~feifeili/

244x176


CV人物18:Jitendra Malik毕业于斯坦福大学;导师:Thomas O.Binford;研究领域:轮廓检测、图像/视频分割、图形匹配、目标识别等;最有影响力的研究成果:边缘检测、图像分割和形状匹配;Malik培养了众多牛人,牛人的导师,你说牛不牛。培养了Alexie Efros, Jianbo Shi, Paul Debevec, Pietro Perona, Serge J.Belongie, Yair Weiss等知名专家。主页:http://www.cs.berkeley.edu/~malik/

164x244

CV人物19:Alexie Efros毕业于Berkeley大学;导师:Jitendra Malik;研究领域:Qualitative Reasoning for Image Understanding、Building the Visual Memex等;最有影响力的研究成果:图像纹理合成;他在1999年ICCV发表了”Texture Synthesis by non-parametric sampling”。该论文将MRF引入到纹理合成中。该方法最大限度保留了纹理的局部结构。主页:https://www.cs.cmu.edu/~efros/

243x244


CV人物20:Andrew Zisserman毕业于剑桥大学;最有影响力的研究成果:视觉几何、目标识别、可视化搜索;他牛逼了,三次获得Marr奖。是CV界权威中的权威。搞CV的人没读过他的多视几何学一书,枉为搞CV的。我2007年起,花了2年时间阅读、编码实现了其中所有两视几何学内容。主页:http://www.robots.ox.ac.uk/~az/

CV人物21:Ian D.Reid毕业于牛津大学;最有影响力的研究成果:目标跟踪;他在2007年PAMI发表了”MonoSLAM: real-time single camera SLAM”,是跟踪和机器人导航领域经典论文。在2011年CVPR上,和Ben Benfold发表了”Stable Multi-Target Tracking in Real-time survillance video”。主页:http://www.robots.ox.ac.uk/~ian/

199x244

...                    


 

 

图像处理专业公司

阅读数 4381