图像处理好发论文吗

2018-01-11 19:03:30 wzy_zju 阅读数 5293


      一: 去雾方面的论文

           1、Efficient Image Dehazing with Boundary Constraint and Contextual Regularization,下载地址:

           http://lab.datatang.com/1984DA173065/WebFile/DocWeb/2014012053738649.pdf

 

          效果:

    

     2、 Fast image dehazing using guided joint bilateral filter

         http://graphvision.whu.edu.cn/papers/cgi2012.pdf

      效果:

      3、Fast Haze Removal Algorithm for Surveillance Video   这是一篇讲如何对视频进行快速去雾的文章,没涉及到具体的算法,不过可以看看。

     二、双边滤波

   1、Recursive Bilateral Filtering ,这个在杨庆雄的网站里有下载:http://www.cs.cityu.edu.hk/~qiyang/,他的个人网站下还有好多其他的论文和算法下载。

        该算法速度非常快,但是效果有点瑕疵。

    三、单幅图像的高光去除

  1、Real-Time Specular Highlight Removal Using Bilateral Filtering

      2、Real-time highlight removal using intensity ratio

      3、Separating Reflection Components of Textured Surfaces Using a Single Image

    四、水下图像增强

  1、Enhancing Underwater Images and Videos by Fusion,这是一篇通过融合技术来增强图像的文章,虽然不是很复杂,但是文章的思路应该能广泛应用,这也是我今年重点研究何实现的文章之一。

      下载:http://research.edm.uhasselt.be/~oancuti/Underwater_CVPR_2012/

      效果:

   

 

    如上图所示,该算法还具有较强的去雾能力。

2019-05-21 08:15:00 weixin_30268921 阅读数 237

TF-Slim

TF-Slim是tensorflow中定义、训练和评估复杂模型的轻量级库。tf-slim中的组件可以轻易地和原生tensorflow框架以及例如tf.contrib.learn这样的框架进行整合。

在使用时先导入库:

import tensorflow.contrib.slim as slim

优势:

1、代码更紧凑

2、封装了很多流行模型,如vgg等,可以当做黑盒用,减少代码错误

训练过程:

训练一个tensorflow模型,需要一个网络模型,一个损失函数,梯度计算方式和用于迭代计算模型权重的训练过程。TF-Slim提供了损失函数,同时也提供了一批运行训练和评估模型的帮助函数

 

微调

通过tf.train.Saver()从checkpoint中加载模型

当我们想把已训练好的模型用在不同的数据集上时,可以恢复除全连接层以外的所有层。

 

评估

slim.metrics用于计算评估指标

 

转载于:https://www.cnblogs.com/wmy-ncut/p/10897727.html

2017-12-21 10:47:36 IT_job 阅读数 4191

近期在准备研究生选题资料查找,在网上看到有人推荐了一些文章,自己以前看过下面的两篇,然后把其他的也下载下来大致看了一下,后续准备仔细看下下面这些大牛的文章,这些都是中文的,后面再找英文文献。

 

博士论文

 

1《图像去雾方法和评价及其应用研究》作者郭璠,指导老师蔡自兴 中南大学,2012年5月答辩论文

文章框架为单幅图像去雾处理、视频去雾处理、构建去雾效果的客观评价体系、去雾技术在实际中的应用(交通环境)展开研究。提出了一种基于传播图梯度优先规律的去雾方法。提出了一种基于傅里叶振幅谱特性雾天检测方法,提出了两种基于雾气理论的视频去雾算法。

 

2《图像快速去雾与清晰度恢复技术研究》作者嵇晓强,指导老师戴明,中国科学院,2012年5月答辩论文

文章针对雾天图像的退化问题,详细分析了雾天图像退化原因和模糊机理,对雾天降质图像去雾处理的基础理论和关键技术进行了深入的研究,并从非模型和基于模型两个方面对图像进行去雾处理。论文对已有的图像去雾方法进行完善、改进和引入新思路(改进了retinex算法、暗原色算法、提出自己的方法以及搭建了基于FPGA的系统硬件平台)。

 

3《图像去雾算法研究》作者任福东,指导老师于银辉,吉林大学,2015年12月答辩论文

文章总结了图像去雾技术的国内外研究现状,分析了图像增强的去雾算法中各种算法的优势和不足,进行了仿真实验,以及这些算法对雾天图像处理的适用范围。基于大气散射模型的图像去雾的优点与不足,进行了仿真实验。

 

4《图像实时复原技术的研究与应用》作者贾格,指导老师付承毓、彭先蓉,中国科学院大学,2016年5月答辩论文。

文章主要基于快速复原算法和高速实现两个方向展开。研究常见的降质模型和快速复原算法,研究基于概率模型的图像盲复原算法,提出了基于SeDDaRA算法的乘性迭代方法,提出基于双尺度的暗通道去雾复原算法,研究用高级语言进行FPGA设计的开发工具Impluse C,研究OpenCL技术,利用GPU平台提高图像复原算法的速度。

 

期刊

 

1《图像去雾的最新研究进展》作者吴迪,朱青松,中国科学院,发表时间2015年2月

文章归纳总结了两大类图像去雾方法: 基于图像增强和基于物理模型的方法, 深入探讨了其中的典型算法和研究成果, 并对这些算法的测试结果进行了定性和定量的分析比较,最后总结了图像去雾技术目前的研究状况和未来的发展方向.

 

2《图像去雾技术研究进展》作者禹晶,徐东彬,廖庆敏,清华大学,发表时间2015年2月

本文归纳和总结了图像去雾技术的国内外研究现状。将现有的方法分为基于物理模型和非物理模型两类,分别详细阐述了这两类方法,分析它们各自的优势和不足,并总结了算法性能评价的无参考客观质量评测准则。最后,指出该技术的研究难点和发展趋势。

 

3《图像去雾技术研究综述与展望》作者郭璠,蔡自兴,谢斌,唐琎,发表时间2010年9月

文章通过从图像处理和物理模型的研究角度对图像去雾技术进行综述,综合了近年来提出的典型的图像去雾方法的基本原理和最新研究进展,并对一些典型的及最新提出的去雾方法,给出了其视觉上的去雾效果和客观的评估数据。最后展望了图像去雾技术的未来研究方向,并给出了一些建议。她的博士论文中提过本文中的相关内容。

2015-04-03 21:45:09 zy122121cs 阅读数 14690

Colorization and Color Transfer(图像上色和颜色迁移)

Semantic Colorization with Internet Images, Chia et al. SIGGRAPH ASIA 2011
Color Harmonization, Cohen-Or, Sorkine, Gal, Leyvand, and Xu. Web Page
Computing the alpha-Channel with Probabilistic Segmentation for Image Colorization, Dalmau-Cedeno, Rivera, and Mayorga
Bayesian Color Constancy Revisited, Gehler, Rother, Blake, Minka, and Sharp
Color2Gray: Salience-Preserving Color Removal, Gooch, Olsen, Tumblin, and Gooch
Color Conceptualization, Hou and Zhang
Light Mixture Estimation for Spatially Varying White Balance, Hsu, Mertens, Paris, Avidan, and Durand. Web Page
Bayesian Correction of Image Intensity with Spatial Consideration, Jia, Sun, Tang, and Shum
Robust Color-to-gray via Nonlinear Global Mapping, Kim, Jang, Demouth, and Lee. SIGGRAPH Asia 2009 Web Page
Variational Models for Image Colorization via Chromaticity and Brightness Decomposition, Kang and March
Colorization using Optimization, Levin, Lischinski, and Weiss
Intrinsic Colorization, Liu et al. SIGGRAPH ASIA 2008 Web Page
N-Dimensional Probability Density Function Transfer and Its Application to Colour Transfer, Pitie et al.
Automated Colour Grading using Colour Distribution Transfer, Pitie et al.
Color by Linear Neighborhood Embedding, Qiu and Guan
Manga Colorization, Qu, Wong, and Heng
Color Transfer between Images, Reinhard, Ashikhmin, Gooch, and Shirley
Local Color Transfer via Probabilistic Segmentation by Expectation-Maximization, Tai, Jia, and Tang
Data-Driven Image Color Theme Enhancement, Wang, Yu, Wong, Chen, and Xu. SIGGRAPH Asia 2010 Web Page
Color Transfer in Correlated Color Space, Xiao and Ma
Fast Image and Video Colorization using Chrominance Blending, Yatziv and Sapiro

Texture Synthesis and Inpainting(纹理和成和修复)

Seam Carving for Content-Aware Image Resizing, Avidan and Shamir. Wikipedia
Synthesizing Natural Textures, Ashikhmin
PatchMatch: A Randomized Correspondence Algorithm for Structural Image Editing, Barnes, Shechtman, Finkelstein, and Goldman. SIGGRAPH 2009. Web Page
Image Inpainting, Bertalmio, Sapiro, Caselles, and Ballester
Video Watercolorization using Bidirectional Texture Advection, Bousseau, Neyret, Thollot, and Salesin
Camouflage Images, Chu et al. SIGGRAPH 2010 Web Page
Object Removal by Exemplar-Based Inpainting, Criminisi, Perez, and Toyama
Weiming DONG's web page contains useful information about texture synthesis and image resizing
Image Quilting for Texture Synthesis and Transfer, Efros and Freeman
Texture Synthesis by Non-parametric Sampling, Efros and Leung
RotoTexture: Automated Tools for Texturing Raw Video, Fang and Hart
Textureshop: Texture Synthesis as a Photograph Editing Tool, Fang and Hart
Multiscale Texture Synthesis, Han, Risser, Ramamoorthi, and Grinspun
Scene Completion Using Millions of Photographs, Hays and Efros
Image Analogies, Hertzmann, Jacobs, Oliver, Curless, and Salesin
Graphcut Textures: Image and Video Synthesis Using Graph Cuts, Kwatra , Schodl , Essa , Turk, and Bobick
Improved Seam Carving for Video Retargeting, Rubinstein, Shamir, and Avidan. Video
Multi-operator Media Retargeting, Rubinstein, Shamir, and Avidan. SIGGRAPH 2009. Web Page
Fields of Experts: A Framework for Learning Image Priors, Roth and Black
Curvature Regularity for Region-based Image Segmentation and Inpainting: A Linear Programming Relaxation, Schoenemann, Kahl, and Cremers. ICCV 2009.
Fast Texture Synthesis using Tree-structured Vector Quantization, Wei and Levoy
Non-homogeneous Content-driven Video-retargeting, Wolf, Guttmann, and Cohen-Or
Feature Matching and Deformation for Texture Synthesis, Wu and Yu

HDR and Tone Mapping(高动态范围成像和色调映射)

Do HDR Displays Support LDR Content? A Psychophysical Evaluation, Akyu"z, Reinhard, Fleming, Riecke, Bu"lthoff
Two-scale Tone Management for Photographic Look, Bae, Paris, and Durand
Real-time Edge-Aware Image Processing with the Bilateral Grid, Chen, Paris, Durand
Recovering High Dynamic Range Radiance Maps from Photographs, Debevec and Malik
Fast Bilateral Filtering for the Display of High-Dynamic-Range Images, Durand and Dorsey
Edge-Preserving Decompositions for Multi-Scale Tone and Detail Manipulation, Farbman, Fattal, Lischinski, and Szeliski. SIGGRAPH 2009. Web Page
Optimal HDR reconstruction with linear digital cameras, Granados et al., CVPR 2010.
Gradient Domain High Dynamic Range Compression, Fattal, Lischinski, and Werman
Modeling Human Color Perception under Extended Luminance Levels, Kim, Weyrich, and Kautz. SIGGRAPH 2009. Web Page
Perceptually Based Tone Mapping for Low-Light Conditions, Kirk and O'Brien. SIGGRAPH 2011. Web Page
Compressing and Companding High Dynamic Range Images with Subband Architectures, Li, Sharan, and Adelson
Radiometric Calibration Using a Single Image Lin, Gu, Yamazaki, and Shum
Determining the Radiometric Response Function from a Single Grayscale Image, Lin and Zhang
Interactive Local Adjustment of Tonal Values, Lischinski, Farbman, Uyttendaele, and Szeliski. Web Page
Exposure Fusion, Mertens, Kautz, Van Reeth
Radiometric Self Calibration, Mitsunaga and Nayar
Photographic Tone Reproduction for Digital Images, Reinhard, Stark, Shirley and Ferwerda
Ldr2Hdr: On-the-Fly Reverse Tone Mapping of Legacy Video and Photographs, Rempel, Trentacoste, Seetzen, Young, Heidrich, Whitehead, and Ward
High Dynamic Range Image Hallucination, Wang, Wei, Zhou, Guo, and Shum
Fast, Robust Image Registration for Compositing High Dynamic Range Photographs from Hand-Held Exposures, Ward

Intrinsic Images(本征图像)

Removing Photography Artifacts using Gradient Projection and Flash-Exposure Sampling, Agrawal, Raskar, Nayar, and Li
User-Assisted Intrinsic Images, Bousseau, Paris, and Durand. SIGGRAPH Asia 2009. Web Page
Flash Photography Enhancement via Intrinsic Relighting, Eisemann and Durand
Bayesian Model of Surface Perception, Freeman and Viola
Detecting Illumination in Images, Finlayson, Fredembach, and Drew
Ground Truth Dataset and Baseline Evaluations for Intrinsic Image AlgorithmsGrosse, Johnson, Adelson, and Freeman. ICCV 2009.
A Variational Framework for Retinex, Kimmel, Elad, Shaked, Keshet, and Sobel
Dark Flash Photography, Krishnan amd Fergus. SIGGRAPH 2009. Web Page
Lightness and Retinex Theory, Land and McCann
Estimating Intrinsic Images from Image Sequenceswith Biased Illumination, Matsushita, Lin, Kang, Shum. ECCV 2004
Post-production Facial Performance Relighting using Reflectance Transfer, Peers, Tamura, Matusik, and Debevec
Separation of Highlight Reflections from Textured Surfaces, Tan, Lin, and Quan
Recovering Intrinsic Images from a Single Image, Tappen, Freeman, and Adelson
Estimating Intrinsic Component Images using Non-Linear Regression, Tappen, Adelson, and Freeman
Deriving Intrinsic Images from Image Sequences, Weiss

Deblurring, Denoising, and Super-Resolution(图像去模糊,去噪和超分辨率)

Reinterpretable Imager: Towards Variable Post Capture Space, Angle & Time Resolution in Photography, Agrawal, Veeraraghavan, and Raskar. Eurographics 2010.
Invertible Motion Blur in Video, Agrawal, Xu, and Raskar. SIGGRAPH 2009.
Optimal Single Image Capture for Motion Deblurring, Agrawal and Raskar. CVPR 2009.
Coded Exposure Deblurring: Optimized Codes for PSF Estimation and Invertibility, Agrawal and Xu. CVPR 2009.
A Non-local Algorithm for Image Denoising, Buades, Coll, and Morel.
Analyzing Spatially-varying Blur, Chakrabarti, Zickler, and Freeman. CVPR 2010.
Fast Motion Deblurring, Cho and Lee. SIGGRAPH Asia 2009. Web Page
Motion Blur Removal with Orthogonal Parabolic Exposures, Cho, Levin, Durand, and Freeman. CVPR 2010. Web Page
Handling Outliers in Non-Blind Image Deconvolution, Cho, Wang, and Lee. ICCV 2011. Web Page
Display supersampling, Damera-Venkata and Chang
Image Upsampling Via Imposed Edge Statistics, Fattal
Single Image Dehazing, Fattal.    Web Page   Demo Code
Multiscale Shape and Detail Enhancement from Multi-light Image Collections, Fattal, Agrawala, and Rusinkiewicz
Removing Camera Shake from a Single Image, Fergus, Singh, Hertzmann, Roweis, and Freeman
Example-Based Super-Resolution, Freeman, Jones, and Pasztor
Space-Variant Single-Image Blind Deconvolution for Removing Camera Shake, Harmeling, Hirsch, and Scholkopf
Multiframe Blind Deconvolution, Super-Resolution, and Saturation Correction via Incremental EM, Harmeling, Sra, Hirsch, and Scholkopf
Single Image Haze Removal Using Dark Channel Prior, He, Sun, Tang. CVPR 2009.
Image Deblurring and Denoising using Color Priors, Joshi, Zitnick, Szeliski, and Kriegman. CVPR 2009. Web Page
Image Deblurring using Inertial Measurement Sensors, Joshi, Kang, Zitnick, and Szeliski. SIGGRAPH 2010. Web Page
Joint Bilateral Upsampling, Kopf, Cohen, Lischinski, Uyttendaele
Blind Deconvolution using a Normalized Sparsity Measure, Krishnan, Tay, and Fergus. CVPR 2011. Web Page
Blind Motion Deblurring Using Image Statistics, Levin
Image and Depth from a Conventional Camera with a Coded Aperture, Levin, Fergus, Durand, Freeman 
Sparse Deconvolution
4D Frequency Analysis of Computational Cameras for Depth of Field Extension, Levin, Hasinoff, Green, Durand, and Freeman. SIGGRAPH 2009. Web Page
Motion-Invariant Photography, Levin, Sand, Cho, Durand, Freeman. SIGGRAPH 2008. Web Page
Noise Estimation from a Single Image, Liu, Freeman, Szeliski, and Kang
Image Magnification Using Level-Set Reconstruction, Morse and Schwartzwald
Bayesian Image Super-Resolution, Continued, Pickup, Capely, Roberts, and Zisserman
Fast Image/Video Upsampling, Shan, Li, Jia, and Tang. Web Page
High-quality Motion Deblurring from a Single Image, Shan, Jia, and Argarwala. Web Page
Image Super-resolution using Gradient Profile Prior, Sun, Sun, Xu, and Shum.
Deblurring Using Regularized Locally-Adaptive Kernel Regression, Takeda, Farsiu, and Milanfar. Web Page
Kernel Regression for Image Processing and Reconstruction, Takeda, Farsiu, Milanfar. Web Page
Exploiting the Sparse Derivative Prior for Super-Resolution and Image Demosaicing, Tappen, Russell, and Freeman
Bayesian Image Super-Resolution, Tipping and Bishop
Non-uniform Deblurring for Shaken Images, Whyte, Sivic, Zisserman, and Ponce. CVPR 2010
Deblurring Shaken and Partially Saturated Images, Whyte, Sivic, and Zisserman. ICCP 2012
Image Super-Resolution via Sparse Representation, Yang, Wright, Huang, and Ma 
Image Super-resolution as Sparse Representation of Raw Image Patches Code
Image Deblurring with Blurred/Noisy Image Pairs, Yuan, Sun, Quan, and Shum
Progressive Inter-scale and intra-scale Non-blind Image Deconvolution, Yuan, Sun, Quan, and Shum
Denoising vs. Deblurring: HDR Imaging Techniques Using Moving Cameras, Zhang, Deshpande, and Chen. CVPR 2010. Web Page
Robust Flash Deblurring, Zhuo and Sim. CVPR 2010. Web Page


Matting and Editing(抠图和图像编辑)

Interactive Digital Photomontage, Agarwala, Dontcheva, Agrawala, Drucker, Colburn, Curless, Salesin, and Cohen
Video SnapCut: Robust Video Object Cutout Using Localized Classifiers, Bai, Wang, Simons, and Saprio. SIGGRAPH 2009. Web Page
PatchMatch: A Randomized Correspondence Algorithm for Structural Image Editing, Barnes, Shechtman, Finkelstein, and Goldman. SIGGRAPH 2009. Web Page
Face Swapping: Automatically Replacing Faces in Photographs, Bitouk, Kumar, Dhillon, Belhumeur, and Nayar. SIGGRAPH 2008. Web Page
The Patch Transform and Its Applications to Image Editing, Cho, Butman, Avidan, and Freeman. Web Page
A Bayesian Approach to Digital Matting, Chuang, Curless, Salesin, and Szeliski
Geodesic Image and Video Editing, Criminisi, Sharp, Rother, and Perez. SIGGRAPH 2011.
Coordinates for Instant Image Cloning, Farbman, Hoffer, Lipman, Cohen-Or, and Lischinski. SIGGRAPH 2009. Web Page
Shared Sampling for Real-Time Alpha Matting, Gastal and Oliveira. Eurographics 2010. Web Page
Geodesic Star Convexity for Interactive Image Segmentation, Gulshan, Rother, Criminisi, Blake, and Zisserman. CVPR 2010. Web Page and Code
A Global Sampling Method for Alpha Matting, He, Rhemann, Rother, Tang, Sun. CVPR 2011.
Guided Image Filtering, He, Sun, Tang. ECCV 2011. Code
Light Mixture Estimation for Spatially Varying White Balance, Hsu, Mertens, Paris, Avidan, and Durand. Web Page
Arcimboldo-like Collage Using Internet Images, Huang, Zhang, and Zhang. Web Page
Drag-and-Drop Pasting, Jia, Sun, Tang, and Shum. Web Page
Exploring Photobios, Kemelmacher-Shlizerman, Shechtman, Garg, Seitz. SIGGRAPH 2011. Web Page
Seamless Image Stitching in the Gradient Domain, Levin, Zomet, Peleg, and WeissPhoto Clip Art, Lalonde, Hoiem, Efros, Rother, Winn, and Criminisi
A Closed Form Solution to Natural Image Matting, Levin, Lischinski, and Weiss Code
Spectral Matting, Levin, Rav-Acha, and Lischinski
Paint Selection, Liu, Sun, and Shum. SIGGRAPH 2009.
Poisson Image Editing, Perez, Gangnet, and Blake
A Perceptually Motivated Online Benchmark for Image Matting, Rhemann, Rother, Wang, Gelautz, Kohli, and Rott. Web Page
A Spatially Varying PSF-based Prior for Alpha Matting, Rhemann, Rother, Kohli, and Gelautz. CVPR 2010.
AutoCollage, Rother, Bordeaux, Hamadi, and Blake
Alpha Estimation in Natural Images, Ruzon and Tomasi
New Appearance Models for Natural Image Matting, Singaraju, Rother, and Rhemann
Interactive Editing of Massive Imagery Made Simple: Turning Atlanta into Atlantis, Summa, Scorzelli, Jiang, Bremer, and Pascucci. SIGGRAPH 2011. Web Page
Flash Matting, Sun, Li, Kang, and Shum
Fast Poisson Blending Using Multi-splines, Szeliski, Uyttendaele, and Steedly. ICCP 2011.
Soft Scissors : An Interactive Tool for Realtime High Quality Matting, Wang, Agrawala, and Cohen
Image and Video Matting: A Survey, Wang and Cohen

Warping and Morphing(图像扭曲和变形)

As-Rigid-As-Possible Shape Interpolation, Alexa, Cohen-Or, and Levin
Feature-Based Image Metamorphosis, Beier and Neely
Optimizing Content-Preserving Projections for Wide-Angle Images, Carroll, Agrawala, and Agarwala. SIGGRAPH 2009. Web Page
Detail Preserving Shape Deformation in Image Editing, Fang and Hart
Feature-Aware Texturing, Gal, Sorkine, and Cohen-Or
As-Rigid-As-Possible Shape Manipulation, Igarashi, Moscovich, and Hughes
Polymorph: Morphing Among Multiple Images , Lee, Wolberg, and Shin
Content-Preserving Warps for 3D Video Stabilization, Liu, Gleicher, Jin and Agarwala. SIGGRAPH 2009. Web Page
Moving Gradients: A Path-Based Method for Plausible Image Interpolation, Mahajan, Huang, Matusik, Ramamoorthi, and Belhumeur. SIGGRAPH 2009
Multi-operator Media Retargeting, Rubinstein, Shamir, and Avidan. SIGGRAPH 2009. Web Page
Regenerative Morphing, Shechtman, Rav-Acha, Irani, and Seitz. CVPR 2010. Web Page
Image Morphing: A Survey , Wolberg

Useful Techniques(其他相关技术)

Gaussian KD-Trees for Fast High-Dimensional Filtering, Adams, Gelfand, Dolson, and Levoy. SIGGRAPH 2009. Web Page
Fast High-Dimensional Filtering Using the Permutohedral Lattice, Adams, Baek, and Davis. Eurographics 2010. Web Page
Fast Approximate Energy Minimization via Graph Cuts, Boykov, Veksler, and Zabih
Edge-Avoiding Wavelets and thier Applications, Fattal Web Page
Graphical Models: Probabilistic Inference , Jordan and Weiss
Loopy Belief Propagation for Approximate Inference: An Empirical Study , Murphy, Weiss, and Jordan
Bilateral Filtering: Papers, Resources, Applications, Paris and Durand
Constant time O(1) bilateral filtering Porikli
Image Alignment and Stitching: A Tutorial, Szeliski
Bilateral Filtering for Gray and Color Images, Tomasi and Manduchi
Image Smoothing via L0 Gradient Minimization, Xu, Lu, Xu, and Jia. SIGGRAPH Asia 2011. Web Page
Real-Time O(1) Bilateral Filtering, Yang, Tan and Ahuja Source Code
SVM for Edge-Preserving Filtering, Yang, Wang and Ahuja

... and Beyond

Photographing long scenes with multi-viewpoint panoramas, Agarwala, Agrawala, Cohen, Salesin, and Szeliski
Video Face Replacement, Dale et al. SIGGRAPH ASIA 2011. Web Page
Convolution Pyramids, Farbman, Fattal, and Lischinski. SIGGRAPH ASIA 2011.
Candid Portrait Selection from Video, Fiss, Argarwala, and Curless. SIGGRAPH ASIA 2011. Web Page
Image-Based Rendering Using Image-Based Priors, Fitzgibbon, Wexler, and Zisserman
"GrabCut"--Interactive Foreground Extraction using Iterated Graph Cuts, Rother, Kolmogorov, and Blake Web Page
Photo Tourism: Exploring Photo Collections in 3D, Snavely, Seitz, and Szeliski Web Page

Books for General Reference

Digital Image Processing, Second Edition, Gonzalez and Woods
Computer Vision: A Modern Approach, Forsyth and Ponce
The Art and Science of Digital Compositing, Brinkmann
Multiple View Geometry in Computer Vision, Hartley and Zisserman
Linear Algebra and Its Applications, Strang
Computer Vision: Algorithms and Applications, Richard Szeliski
2014-05-26 20:17:40 xiaqunfeng123 阅读数 12970

        最近在找图像处理模式识别方面的实习,顺便就这个方向的前景什么的查了下,将网上的相关资料整理了一下,便于自己参考,顺便写了下自己的感悟。

        

下面是比较火的那篇文章《 浅谈图像处理方向的就业前景》具体出处不知道在哪~

       最近版上有不少人在讨论图像处理的就业方向,似乎大部分都持悲观的态度。我想结合我今年找工作的经验谈谈我的看法。

    就我看来,个人觉得图像处理的就业还是不错的。首先可以把图像看成二维、三维或者更高维的信号,从这个意义上来说,图像处理是整个信号处理里面就业形势最好的,因为你不仅要掌握(一维)信号处理的基本知识,也要掌握图像处理(二维或者高维信号处理)的知识。其次,图像处理是计算机视觉和视频处理的基础,掌握好了图像处理的基本知识,就业时就可以向这些方向发展。目前的模式识别,大部分也都是图像模式识别。在实际应用场合,采集的信息很多都是图像信息,比如指纹、条码、人脸、虹膜、车辆等等。说到应用场合,千万不能忘了医学图像这一块,如果有医学图像处理的背景,去一些医疗器械公司或者医疗软件公司也是不错的选择。图像处理对编程的要求比较高,如果编程很厉害,当然就业也多了一个选择方向,并不一定要局限在图像方向。
    下面谈谈我所知道的一些公司信息,不全,仅仅是我所了解到的或者我所感兴趣的,实际远远不止这么多。

搜索方向
    基于内容的图像或视频搜索是很多搜索公司研究的热点。要想进入这个领域,必须有很强的编程能力,很好的图像处理和模式识别的背景。要求高待遇自然就不错,目前这方面的代表公司有微软、google、yahoo和百度,个个鼎鼎大名。

医学图像方向
    目前在医疗器械方向主要是几个大企业在竞争,来头都不小,其中包括Simens、GE、飞利浦和柯达,主要生产CT和MRI等医疗器材。由于医疗器械的主要功能是成像,必然涉及到对图像的处理,做图像处理的很有机会进入这些公司。它们在国内都设有研发中心,simens的在上海和深圳,GE和柯达都在上海,飞利浦的在沈阳。由于医疗市场是一个没有完全开发的市场,而一套医疗设备的价格是非常昂贵的,所以在这些地方的待遇都还可以,前景也看好。国内也有一些这样的企业比如深圳安科和迈瑞

计算机视觉和模式识别方向
    我没去调研过有哪些公司在做,但肯定不少,比如指纹识别、人脸识别、虹膜识别。还有一个很大的方向是车牌识别,这个我倒是知道有一个公司高德威智能交通似乎做的很不错的样子。目前视频监控是一个热点问题,做跟踪和识别的可以在这个方向找到一席之地。
    上海法视特位于上海张江高科技园区,在视觉和识别方面做的不错。北京的我也知道两个公司:大恒和凌云,都是以图像作为研发的主体。

视频方向
    一般的高校或者研究所侧重在标准的制定和修改以及技术创新方面,而公司则侧重在编码解码的硬件实现方面。一般这些公司要求是熟悉或者精通MPEG、H.264或者AVS,选择了这个方向,只要做的还不错,基本就不愁饭碗。由于这不是我所感兴趣的方向,所以这方面的公司的信息我没有收集,但平常在各个bbs或者各种招聘网站经常看到。
    我所知道的两个公司:诺基亚和pixelworks

其他
    其实一般来说,只要涉及到成像或者图像的基本都要图像处理方面的人。比方说一个成像设备,在输出图像之前需要对原始图像进行增强或者去噪处理,存储时需要对图像进行压缩,成像之后需要对图像内容进行自动分析,这些内容都是图像处理的范畴。

下面列举一些与图像有关或者招聘时明确说明需要图像处理方面人才的公司:
上海豪威集成电路有限公司
中芯微
摩托罗拉上海研究院
威盛(VIA)
松下
索尼
清华同方
三星
     所有与图像(静止或者运动图像)有关的公司都是一种选择。比如数码相机、显微镜成像、超声成像、工业机器人控制、显示器、电视、遥感等等,都可以作为求职方向。


要求:
1、外语。如果进外企,外语的重要性不言而喻。一般外企的第一轮面试都是英语口语面试。

2、编程。这方面尤以C++为重,很多公司的笔试都是考c++知识。
3、专业水平。如果要找专业相关的工作,研究生期间的研究经历和发表的论文就显的比较重要。
4、知识面的宽度。我觉得在研究生期间,除了做好自己的研究方向之外,扩宽一下知识面也有很大的帮助,当然这个知识面指的是图像处理、计算机视觉和模式识别,知识面越宽,就业时的选择就会越多。


    图像处理方向毕业的就业面非常广,而且待遇在应届生应该是中上等。其实还是一句话,能力决定一切。只要研究生三年没有白过,根本不愁找不到好工作。祝所有正在读研或者即将读研的朋友将来都能有一份满意的工作。
 
    反面的来说:现在大学和研究机构做图象的越来越多了,这里面老板自己懂图象的不知道有多少?!老板不懂,影响还是很大的
    多数做图象的是用MATLAB,用别人的代码(如小波)。在研究生三年学好C++毕业的有多少?在公司C++是重要的。
    图象其实就是信号处理,除了本科是学信号的以外,信号与系统、数字信号处理是一定要学好的,那相应的数学方面的概率,多元统计,甚至泛函也要了解。
    外语的基本要求是看懂英文文献(不一定全看懂),相应的英文书。去外企做研发,这是必备的。然后是口语和听力。
    说这些不是波冷水,希望大家了解清楚。
Compared to the number of jobs available each year in the imaging soceity, the people who are majoring on it are way too much. I have to say most of the people who studied the this area were not end up with working on this area anymore.
The most important thing here is to understand image processing, it requires a broad level of knowledge including, some math (algrebra, statistics, PDE), dsp, pattern recognition, programming skills...
It is all these background skills will find you a job, so prepare to have a deep understanding on all these areas related to image processing
    我也是学模式识别的,但是研究方向是遥感图像处理和识别.总的来说这个方向是比较专,但也是目前图像处理中比较难做的一个方向,因为遥感图像的复杂性超过我们所见过的任何图像.
    其实谈到就业问题,我觉得如果研究方向比较适合,特别是读研期间能到斑竹谈的那些牛比的公司实习,了解企业真正需要的方向可能做起来有目标性.
    顺便提下:高德威公司还是不要考虑,因为本人在毕业面试过程中,虽然面试的人力资源人员很友善,但是通过他们老板写的一些文章可以发现他们还是一个比较自恋和自大的公司.
楼 主是好人,不过此文更多是安慰,新手不可太当真
    衡量专业好坏的标准有两个:应用前景和技术门槛。个人觉得图像处理应用前景一般,比通信,计算机差远了,而技术门槛,相信不是新手都清楚,比微波之类低不少。总的来说图像方向就业一般,在it业算较冷得,特别是模式识别,人工智能之类,看起来高深邪乎,其实就是博士都不好找工作(亲身所见)

    1)说到图像处理比通信差,很大部分的原因是当前行业背景,但通信真正的研发在中国又有多少,我的朋友中很多做工程的,况且现在在通信领域,很大的一个难点,也是多媒体通信。
    2)说到比计算机差,我觉得这与你怎么看待计算机专业有关,有人觉得是基础,是工具,有人觉得是专业。况且计算机那边,现在研究图像的也不少。
    3)再者,说微波,RFID等入门难,但要做精又谈何容易,而且兴趣真的很重要,没有兴趣,再有前景的专业,你也不一定能做好,还有女生并不适合搞这个,就业时,单位一般会暗示。另外,就业面也较窄,好公司真的难进,找工的时候,真的很郁闷,特别对女生。或许将来很大发展前途,这个另当别论。
    4)说回图像处理,我觉得还是较中肯的,略有好的嫌疑,关键还是在读研的时候能把方向做宽(一般做图像处理,需要何模式识别等相结合,拓宽知识面是必要的,在真正做研究的时候,也发现是必须的),研究点做深入,注重实现能力、创新能力和学习能力,通过论文。多培养自己的材料组织提炼能力,锻炼逻辑思维。如果真的能做到三年光阴不虚度,找工应该不是问题,到时真正要考虑的是定位问题。
    5)当然,最后,找工的时候,包装是一种技巧,整合是一种需要。
我觉得做图像处理还是很有前途的。


      单独说图像处理,的确没什么好说的。可图像处理是目前最为火热的一个方向,技术发展更迭迅速。图像处理大分可分四个行业:工控、医疗、遥感、监控。把图像处理独立出来,并不能算是一个行业。图像处理应用性非常强,所有算法也都是基于应用的。所以,要找工作可以考虑从这四个行业开始。每个行业都有各自特色:工控,重在控制,用机器视觉来控制机器,要求速度和精度;医疗,位数高,色彩要求高,算法效率高,稳定;遥感,数据量大,重在分析;监控,涉及智能算法。

      我觉得其实图像处理这部分大体分为工控、消费电子、互联网这三个大块,工控这边是以实时性和工程实施为基础,不太需要特别前沿的一些算法,消费电子和互联网这边做的图像主要是基于用户和需求的,创新性较强,技术变化也快。


下面是某学长给出的一些建议:

我根据《浅谈图像处理方向的就业前景》和自己找工作的一些经验简单介绍一下图像处理方向就业前景,希望能对后来者有所帮助!

1、请学好图像基本理论知识,笔试会遇到很多基础的题;

2、请学好c++语言,99%以上的公司在招图像岗位的人员时都会笔试c++;

3、请多做一些实际的项目,少一些理论的研究(针对中小企业而言);

4、请不要只局限于的课题,因为可能你的课题只是图像处理领域的一些皮毛;

5、请多了解一些相关的前沿知识;

6、请不要迷信自己的算法,比如BP神经网络(可能理论研究时用的很多,可是实际呢?

7、请尽量与企业的相关人士探讨该领域的问题,那样的收获比书本大很多;


       表示不能同意更多,很多时候光看些理论的东西不去实践是不行的,一定要就某一个具体的问题落实到实处,深入的去挖掘它。芍药学姐也说,在面试的时候一般是通过你对做过某一个问题的深度来了解你的个人能力,是否可以快速去学习,并且在对你自己做的事情,为什么这么做,调研过什么等等要非常的清楚,这就是考察一个应届毕业生的是否优秀的标准。


下面是一些关于图像处理和计算机视觉方面的期刊:

     好不好投与文章质量有很大关系,如果是第一次投,而又不是急着要文章的话,我建议投比文章质量相当期刊稍好一点的期刊,这样能学到更多。比PAMI,IJCV稍差点的期刊有TIP,IET Image Processing, computer vision and image understanding, image and vision computing之类的,比PR稍差的有PRL之类的。
数字图像处理领域可以投稿的期刊:
Computer Vision and Image Processing    
IEEE Transactions on Pattern Analysis and Machine Intelligence (PAMI) IEEE 
International Journal of Computer Vision (IJCV)  Springer 
Vision Research Elsevier 
IEEE Transactions on Image Processing (IEEE-T-IP) IEEE 
ACM Transactions on Applied Perception  ACM 
Computer Vision and Image Understanding (CVIU) Elsevier 
Image and Vision Computing Elsevier 
Journal of Vision JV 
Journal of Visual Communication and Image Representation (JVCIR) Elsevier 
Journal of Mathematical Imaging and Vision  Springer  
Journal of Electronic Imaging  SPIE 
ICGST International Journal on Graphics, Vision and Image Processing (GVIP) ICGST  
MGV: Machine GRAPHICS & VISION Institute of Computer Science 
International Journal of Imaging Systems and Technology Wiley InterScience  
Electronic Letters on Computer Vision and Image Analysis  Elcvia 
The Visual Computer Springer 
IET Image Processing IET 
IET Computer Vision IET 
International Journal of Image and Graphics (IJIG) World Scientific 
International Journal of Remote Sensing  Taylor & Francis 
SIAM Journal on Imaging Sciences  SIAM 
Signal, Image and Video Processing  Springer 
Pattern Recognition    
Pattern Recognition Elsevier 
Pattern Recognition Letters (PRL) Elsevier 
International Journal of Pattern Recognition and Artificial Intelligence  World Scientific  
Pattern Analysis & Applications  Springer  
Journal of Pattern Recognition Research (JPRR) JPRR 
Signal Processing    
IEEE Signal Processing Letters IEEE 
IEEE Signal Processing Magazine IEEE 
Signal Processing  Elsevier 
EURASIP Journal on Applied Signal Processing EURASIP 
Signal Processing : Image Communication Elsevier 
IET Signal Processing IET 
Neurophysical Journals in Computer Vision    
Nature Neuroscience. Nature 
Visual Neuroscience. Cambridge 
IEEE Transactions on Neural Networks. IEEE 
Neural Networks Elsevier 
Perception and Psychophysics. Psychonomic Society 
Perception. Pion Ltd. 
Journal of Experimental Psychology: Human Perception and Performance. Elsevier 
Computer Graphics    
ACM Transactions on Graphics ACM 
IEEE Computer Graphics and Applications (CG&A)  IEEE 
IEEE Transactions on Visualization and Computer Graphics IEEE 
ACM SIGGRAPH Computer Graphics ACM 
Computers and Graphics Science Direct 
Computer Graphics Forum (including Eurographics) Eurographics 
Graphics Interface Graphics Interface  
Journal of Graphics Tools ACM 
Journal of Visualization and Computer Animation Wiley 
Symposium on Interactive 3D (I3D) ACM 
Virtual Reality    
Virtual Reality Software and Technology (VRST)  ACM 
Machine Vision Applications    
Machine Vision and Applications Springer 
Real-Time Imaging Elsevier 
Vision Interface Vision Interface 
IEEE Transactions on Geoscience and Remote Sensing  IEEE 
International Journal of Applied Earth Observation and Geoinformation  Elsevier 
Remote Sensing of Environment  Elsevier 
ISPRS JOURNAL OF PHOTOGRAMMETRY AND REMOTE SENSING  ISPRS 
Journal of Applied Remote Sensing  SPIE 
Journal of the Indian Society of Remote Sensing  Springer 
Multimedia    
IEEE Transactions on Circuits and Systems for Video Technology IEEE 
IEEE Transactions on Multimedia IEEE 
Optics    
Journal Optical Society of America OSA 
Optometry and Vision Science LW&W 
Information Fusion    
Information Fusion Elsevier 
Information Processing Letters Elsevier 
Information Sciences Elsevier 
Information Sciences - Applications Elsevier 
Information Systems Elsevier 
Soft Computing    
Applied Soft Computing  Elsevier 
Journal of Soft Computing  Springer 
Others    
Medical Image Analysis Elsevier 
ACM Transactions on Information Systems ACM 
Swarm Intelligence Springer 
IET Information Security IET 
Numerical Functional Analysis and Optimization  Taylor & Francis 
Sadhana - Academy Proceedings in Engineering Sciences  Springer 
International Journal of Wavelets, Multiresolution and Information Processing (IJWMIP)  World Scientific 
IETE Technical Review IETE 
IETE Journal of Research IETE 
IEEE Transactions on Information Forensics and Security  IEEE

图像处理入门教程

阅读数 32632

图像处理入门必看

阅读数 12791