2017-01-16 11:01:35 Lebronze 阅读数 11335

计算机视觉相当于是人工智能的大门,如果这个门不打开,就没有办法真的研究真实世界的人工智能。因为视觉信息与听觉触觉相比要重要得多,人的大脑皮层70%的活动都在处理视觉信息,如果没有视觉信息的话,整个人工智能只是一个空架子,只能做符号推理(下棋,定理证明等)。

计算机视觉相当于一个研究领域,有很多问题要研究。而机器学习更像是一个方法和工具。
本身应当叫统计学习,方法都是从概率领域拿来的,但是机器学习领军人物把统计和物理的数理模型,改名叫做机器,比如某某模型(model)叫某某机(machine);把一些层次模型(hierarchical model)说成网(net),搞出了许多机和网,就成了新的领域。
机器:统计模型。 学习:用数据来拟合模型。是计算机的人将统计的理论与方法应用到视觉、语音等领域,形成了机器学习这个模型。

机器学习与计算机视觉大概有60~70%的是重合的。

人工智能是终极目标,让机器像人那样的思考、处理事情。

解决问题的过程:抽象成问题(表达),寻找算法,实现。视觉是受任务驱动的,而任务是时刻在改变之中,我怎样通过这千千万万的任务,而不是简单一个分类,来驱动我的计算的过程,来找到我的需求,来支持我目前的任务,这是一个巨大的研究的方向 。

当你要去识别、分析一个模式,比如一个动物、人脸、 一个事件, 你首先要建立一个数理模型,这个模型通过数据来拟合,也就是当前的机器学习。那么,判断这个模型好坏,或者模型是否充分的一个依据是什么?产生式建模的方法就是对这个模型随机抽样,也就是合成(synthesis)。

2019-03-25 20:13:03 tomy2426214836 阅读数 101450

在我的理解里,要实现计算机视觉必须有图像处理的帮助,而图像处理倚仗与模式识别的有效运用,而模式识别是人工智能领域的一个重要分支,人工智能与机器学习密不可分。纵观一切关系,发现计算机视觉的应用服务于机器学习。各个环节缺一不可,相辅相成。

计算机视觉(computer vision):用计算机来模拟人的视觉机理获取和处理信息的能力。就是指用摄影机和电脑代替人眼对目标进行识别、跟踪和测量等机器视觉,并进一步做图形处理,用电脑处理成为更适合人眼观察或传送给仪器检测的图像。

计算机视觉研究相关的理论和技术,试图建立能够从图像或者多维数据中获取‘信息’的人工智能系统。计算机视觉的挑战是要为计算机和机器人开发具有与人类水平相当的视觉能力。

机器视觉需要图象信号,纹理和颜色建模,几何处理和推理,以及物体建模。一个有能力的视觉系统应该把所有这些处理都紧密地集成在一起。

图像处理(image processing):用计算机对图像进行分析,以达到所需结果的技术。又称影像处理。

图像处理一般指数字图像处理。数字图像是指用数字摄像机、扫描仪等设备经过采样和数字化得到的一个大的二维数组,该数组的元素称为像素,其值为一整数,称为灰度值。

图像处理技术的主要内容包括图像压缩,增强和复原,匹配、描述和识别3个部分。常见的处理有图像数字化、图像编码、图像增强、图像复原、图像分割和图像分析等。

模式识别(Pattern Recognition)是指对表征事物或现象的各种形式的(数值的、文字的和逻辑关系的)信息进行处理和分析,以对事物或现象进行描述、辨认、分类和解释的过程,是信息科学和人工智能的重要组成部分。

模式识别又常称作模式分类,从处理问题的性质和解决问题的方法等角度,模式识别分为有监督的分类(Supervised Classification)和无监督的分类(Unsupervised Classification)两种。模式还可分成抽象的和具体的两种形式。前者如意识、思想、议论等,属于概念识别研究的范畴,是人工智能的另一研究分支。我们所指的模式识别主要是对语音波形、地震波、心电图、脑电图、图片、照片、文字、符号、生物传感器等对象的具体模式进行辨识和分类。

模式识别研究主要集中在两方面:

一是研究生物体(包括人)是如何感知对象的,属于认识科学的范畴;

二是在给定的任务下,如何用计算机实现模式识别的理论和方法。

应用计算机对一组事件或过程进行辨识和分类,所识别的事件或过程可以是文字、声音、图像等具体对象,也可以是状态、程度等抽象对象。这些对象与数字形式的信息相区别,称为模式信息。

模式识别与统计学、心理学、语言学、计算机科学、生物学、控制论等都有关系。它与人工智能、图像处理的研究有交叉关系。

机器学习(Machine Learning)是研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能。它是人工智能的核心,是使计算机具有智能的根本途径,其应用遍及人工智能的各个领域,它主要使用归纳、综合而不是演绎。

机器学习在人工智能的研究中具有十分重要的地位。一个不具有学习能力的智能系统难以称得上是一个真正的智能系统,但是以往的智能系统都普遍缺少学习的能力。随着人工智能的深入发展,这些局限性表现得愈加突出。正是在这种情形下,机器学习逐渐成为人工智能研究的核心之一。它的应用已遍及人工智能的各个分支,如专家系统、自动推理、自然语言理解、模式识别、计算机视觉、智能机器人等领域。

机器学习的研究是根据生理学、认知科学等对人类学习机理的了解,建立人类学习过程的计算模型或认识模型,发展各种学习理论和学习方法,研究通用的学习算法并进行理论上的分析,建立面向任务的具有特定应用的学习系统。这些研究目标相互影响相互促进。

人类研究计算机的目的,是为了提高社会生产力水平,提高生活质量,把人从单调复杂甚至危险的工作中解救出来。今天的计算机在计算速度上已经远远超过了人,然而在很多方面,特别是在人类智能活动有关的方面例如在视觉功能、听觉功能、嗅觉功能、自然语言理解能力功能等等方面,还不如人。

这种现状无法满足一些高级应用的要求。例如,我们希望计算机能够及早地发现路上的可疑情况并提醒汽车驾驶员以避免发生事故,我们更希望计算机能帮助我们进行自动驾驶,目前的技术还不足以满足诸如此类高级应用的要求,还需要更多的人工智能研究成果和系统实现的经验。

什么是人工智能呢?

人工智能,是由人类设计并在计算机环境下实现的模拟或再现某些人智能行为的技术。一般认为,人类智能活动可以分为两类:感知行为与思维活动。模拟感知行为的人工智能研究的一些例子包括语音识别、话者识别等与人类的听觉功能有关的“计算机听觉”,物体三维表现的形状知识、距离、速度感知等与人类视觉有关的“计算机视觉”,等等。模拟思维活动的人工智能研究的例子包括符号推理、模糊推理、定理证明等与人类思维有关的“计算机思维”,等等。

从图像处理和模式识别发展起来的计算机视觉研究对象之一是如何利用二维投影图像恢复三维景物世界。计算机视觉使用的理论方法主要是基于几何、概率和运动学计算与三维重构的视觉计算理论,它的基础包括射影几何学、刚体运动力学、概率论与随机过程、图像处理、人工智能等理论。

计算机视觉要达到的基本目的有以下几个:

(1) 根据一幅或多幅二维投影图像计算出观察点到目标物体的距离;

(2) 根据一幅或多幅二维投影图像计算出目标物体的运动参数;

(3) 根据一幅或多幅二维投影图像计算出目标物体的表面物理特性;

(4) 根据多幅二维投影图像恢复出更大空间区域的投影图像。

计算机视觉要达到的最终目的是实现利用计算机对于三维景物世界的理解,即实现人的视觉系统的某些功能。

在计算机视觉领域里,医学图像分析、光学文字识别对模式识别的要求需要提到一定高度。又如模式识别中的预处理和特征抽取环节应用图像处理的技术;图像处理中的图像分析也应用模式识别的技术。在计算机视觉的大多数实际应用当中,计算机被预设为解决特定的任务,然而基于机器学习的方法正日渐普及,一旦机器学习的研究进一步发展,未来“泛用型”的电脑视觉应用或许可以成真。

人工智能所研究的一个主要问题是:如何让系统具备“计划”和“决策能力”?从而使之完成特定的技术动作(例如:移动一个机器人通过某种特定环境)。这一问题便与计算机视觉问题息息相关。在这里,计算机视觉系统作为一个感知器,为决策提供信息。另外一些研究方向包括模式识别和机器学习(这也隶属于人工智能领域,但与计算机视觉有着重要联系),也由此,计算机视觉时常被看作人工智能与计算机科学的一个分支。

机器学习是研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能。它是人工智能的核心,是使计算机具有智能的根本途径,其应用遍及人工智能的各个领域,它主要使用归纳、综合而不是演译。

为了达到计算机视觉的目的,有两种技术途径可以考虑。

第一种是仿生学方法,即从分析人类视觉的过程入手,利用大自然提供给我们的最好参考系——人类视觉系统,建立起视觉过程的计算模型,然后用计算机系统实现之。

第二种是工程方法,即脱离人类视觉系统框框的约束,利用一切可行和实用的技术手段实现视觉功能。此方法的一般做法是,将人类视觉系统作为一个黑盒子对待,实现时只关心对于某种输入,视觉系统将给出何种输出。

这两种方法理论上都是可以使用的,但面临的困难是,人类视觉系统对应某种输入的输出到底是什么,这是无法直接测得的。而且由于人的智能活动是一个多功能系统综合作用的结果,即使是得到了一个输入输出对,也很难肯定它是仅由当前的输入视觉刺激所产生的响应,而不是一个与历史状态综合作用的结果。

不难理解,计算机视觉的研究具有双重意义。

其一,是为了满足人工智能应用的需要,即用计算机实现人工的视觉系统的需要。这些成果可以安装在计算机和各种机器上,使计算机和机器人能够具有“看”的能力。
其二,视觉计算模型的研究结果反过来对于我们进一步认识和研究人类视觉系统本身的机理,甚至人脑的机理,也同样具有相当大的参考意义。

2018-07-18 16:38:17 mvcreating 阅读数 3053

让计算机'看'是一个不小的壮举。为了让机器像人或动物一样真正地观察世界,它依赖于计算机视觉和图像识别。

计算机视觉是条形码扫描仪能够“看到”UPC中的一堆条纹的能力。这也是Apple的Face ID可以判断出它的相机正在看的脸是否是你的。基本上,只要机器处理原始视觉输入(例如JPEG文件或摄像机馈送),它就会使用计算机视觉来理解它所看到的内容。一般来讲计算机视觉视为处理眼睛接收到的信息的人类大脑的一部分 - 而不是眼睛本身。

从人工智能的角度来看,计算机视觉最有趣的用途之一是图像识别,它使机器能够解释通过计算机视觉接收的输入并对其“看到”进行分类。

以下是工作中图像识别的一些示例:

Ebay应用程序允许您使用相机搜索项目

利用神经网络将漆黑的照片变成明亮的图像

Facebook的AI对你的照片了解很多

人工智能可以读懂你的想法怎么样?

例如,还有一款应用程序使用智能手机相机来确定对象是否是热狗。它利用计算机视觉和图像识别来做出判断。这可能看起来并不令人印象深刻,毕竟一个小孩子也可以告诉你某个东西是否是热狗。但是,在人脑和计算机中,训练神经网络进行图像识别的过程非常复杂。

在这一点上,AI就像一个小孩子。计算机视觉赋予它视觉感,但这并不是对物理宇宙的继承理解。为此,AI需要像孩子一样进行培训。如果您给孩子一个数字或字母足够的时间,它将学习识别该数字。

令人惊讶的是,许多幼儿在他们正确地学习它们后,可以立即识别字母和数字。我们的生物神经网络非常擅长解释视觉信息,即使我们正在处理的图像看起来并不完全符合我们的预期。

使计算机识别特定图像(如QR码)很容易,但是他们很难识别出他们不期望的状态 - 进入图像识别。

通常,图像识别的工作方式涉及创建处理图像的各个像素的神经网络。研究人员尽可能多地为这些网络提供预先标记的图像,以“教导”他们如何识别相似的图像。

人工智能初学者指南:计算机视觉和图像识别

在上面的热狗示例中,开发人员可以为AI提供数千张热狗照片。然后,人工智能会对热狗应该拥有的图片进行全面的了解。当你给它提供一些东西的图像时,它会将该图像的每个像素与它所见过的热狗的每张图像进行比较。如果输入满足类似像素的最小阈值,则AI将其声明为热狗。

处理视觉信息的任何AI系统通常依赖于计算机视觉,并且能够识别特定对象或基于其内容对图像分类的那些系统正在执行图像识别。

这对于需要快速准确地识别和分类环境中不同对象的机器人来说非常重要。例如,无人驾驶汽车使用计算机视觉和图像识别来识别行人,标志和其他车辆。(新图智 www.vision123.cn)

人工智能初学者指南:计算机视觉和图像识别

2016-03-30 14:18:12 szfhy 阅读数 12408

图像处理是将输入图像转换为输出图像的过程,人是图像处理的效果的最终解释者;

在计算机视觉中,计算机是图像的解释者;图像处理仅仅是计算机视觉系统中的一个模块;

计算机图形学的主要工作是从三维描述到二维图像显示的过程;

计算机视觉则是从二维图像数据到三维描述的过程,计算机视觉是计算机图形学的逆问题。

模式识别主要解决分类的问题,是计算机视觉中的一个模块;


总体来说他们有如下的关系:

不要把几个相关的概念混为一谈

2019-07-06 10:43:30 weixin_43559676 阅读数 852

**最近做了一份计算机视觉及图像处理领域的知名期刊统计。

国内外计算机视觉及图像处理领域知名期刊**

在这里插入图片描述

国内五种知名期刊近十年收录情况

计算机学报近十年有关计算机视觉及图像处理的文章
序号 篇名
1 深度卷积神经网络的发展及其在计算机视觉领域的应用
2 基于瞬态成像技术的穿透散射介质成像
3 基于视频的人机交互中动作在线发现与时域分割
4 基于局部自相似性和奇异值分解的超采样图像细节增强
5 面向目标检测与姿态估计的联合文法模型
6 图像物体分类与检测算法综述
7 基于视觉的人体动作识别综述
8 基于双域信息融合的鲁棒二值文本图像水印

9 基于特征点模板的Contourlet域抗几何攻击水印算法研究

10 基于FPGA的嵌入式多核处理器及SUSAN算法并行化
11 面向多兴趣区域图像处理应用的高效无冲突并行访问存储模型

计算机辅助设计与图形学学报近十年有关计算机视觉及图像处理的文章
序号 篇名
1 基于樽海鞘群体优化非负矩阵分解的高光谱图像解混算法
2 基于改进K-Means的腹内脂肪自动定量检测算法
3 融合模糊色彩思维建模的马赛克风格渲染技术
4 基于仿射方法的图像抠图算法综述
5 数据驱动的图像智能分析和处理综述
6 双通道局部处理的自适应图像增强方法
7 基于二维局部均值分解的图像多尺度分析处理
8 基于推广的IHS变换和压缩传感的遥感图像融合
9 改进共振峰提取的语音端点检测
10 对数域中自动色彩均衡化快速算法
11 分形拼贴画
12 彩色图像的纹理力/触觉渲染方法
13 应用改进的弹簧质点模型进行图像滤波的算法
14 视频中的实时降雪与积雪模拟
15 快速注意力选择计算及其在图像质量评价中的应用
16 一种基于Hough变换的损伤检测方法
17 勾画式局部颜色迁移

自动化学报近十年有关计算机视觉及图像处理的文章
序号 篇名
1 基于点对相似度的深度非松弛哈希算法
2 带时变计算时间和计算误差的倒立摆视觉H_∞控制研究
3 实验小鼠运动参数的模板匹配及粒子滤波提取方法
4 图像去雾的最新研究进展
5 压缩感知及其图像处理应用研究进展与展望
6 超分辨率图像重建方法综述
7 数字抠像的最新研究进展
8 回转窑烧成带状态混合智能识别方法
9 光学遥感图像舰船目标检测与识别综述
10 基于多尺度压缩感知金字塔的极化干涉SAR图像分类
11 基于脉冲耦合神经网络的图像NMI特征提取及检索方法
12 二维直方图θ-划分最大平均离差阈值分割算法
13 改进型脉冲耦合神经网络在图像处理中的动态行为分析

中国图象图形学报近十年有关计算机视觉及图像处理的文章
序号 篇名
1 多层感知分解的全参考图像质量评估
2 《中国图象图形学报》2018年第23卷总目次
3 结构相似性的水下偏振图像复原
4 图像处理中的格子玻尔兹曼方法研究综述
5 机器视觉表面缺陷检测综述
6 局部均值噪声估计的盲3维滤波降噪算法
7 照片水印自动排版与配色
8 区域拟合的背景去除图像分割模型
9 基于网格面积保持的图像智能适配显示
10 自适应的快速人脸肤色转移
11 CRT显示图像的色彩管理新模型
12 复杂自然环境下感兴趣区域检测
13 英文字母特征的双面碎纸拼接
14 面向对象的高分辨率SAR图像处理及应用
15 基于放缩系数和均值的多参数颜色迁移
16 各向异性的均衡化网状扩散模型

模式识别与人工智能 近十年有关计算机视觉及图像处理的文章
序号 篇名
1 目标跟踪算法综述
2 视觉认知计算模型综述
3 活动轮廓模型的图像分割方法综述
4 距离图像局部特征提取方法综述
5 基于改进动态纹理模型的人体运动分析
6 基于灵长类视觉皮层的目标识别模型综述
7 二阶运动现象及其分析研究
8 基于区域收缩和DIRECT算法的运动分割
9 全变差与曲波联合稀疏表示模型与原对偶算法
10 改进遗传算法在差分像运动图像实时处理中的应用
11 基于图切割的图像自动分割方法
12 一种改进的分数阶微分掩模算子
13 基于Cascade结构的代价敏感的医学图像ROI检测方法
14 基于径向基概率神经网络的植物叶片自动识别方法

国外五种顶级知名期刊近十年收录情况

TPAMI 近来较流行的文章
序号 篇名
1 The ApolloScape Open Dataset for Autonomous Driving and its Application
2 Simultaneous Fidelity and Regularization Learning for Image Restoration
3 Local LDA: Open-Ended Learning of Latent Topics for 3D Object Recognition
4 Variational Context: Exploiting Visual and Textual Context for Grounding Referring Expressions
5 Community Detection Using Restrained Random-walk Similarity
6 Providing a Single Ground-truth for Illuminant Estimation for the ColorChecker Dataset
7 A General Decoupled Learning Framework for Parameterized Image Operators
8 Border-Peeling Clustering
9 Asymmetric Mapping Quantization for Nearest Neighbor Search
10 A Framework of Composite Functional Gradient Methods for Generative Adversarial Models
11 Revisiting Video Saliency Prediction in the Deep Learning Era
12 Ranking-Preserving Cross-Source Learning for Image Retargeting Quality Assessment
13 Bayesian Low-Tubal-Rank Robust Tensor Factorization with Multi-Rank Determination
14 Photometric Depth Super-Resolution

Transactions on Image Processing 近来较流行的文章
序号 篇名
1 The Multimodal Brain Tumor Image Segmentation Benchmark (BRATS)
2 Deep Convolutional Neural Networks for Computer-Aided Detection:
3 Deep De-Aliasing Generative Adversarial Networks for Fast Compressed Sensing MRI Reconstruction
4 Interactive Medical Image Segmentation Using Deep Learning With Image-Specific Fine Tuning
5 Brain Tumor Segmentation Using Convolutional Neural Networks in MRI Images
6 Lung Pattern Classification for Interstitial Lung Diseases Using a Deep Convolutional Neural Network
7 Anatomically Constrained Neural Networks (ACNNs)
8 Convolutional Neural Networks for Medical Image Analysis: Full Training or Fine Tuning?
9 H-DenseUNet: Hybrid Densely Connected UNet for Liver and Tumor Segmentation From CT Volumes
10 HyperDense-Net: A Hyper-Densely Connected CNN for Multi-Modal Image Segmentation
11 A Deep Cascade of Convolutional Neural Networks for Dynamic MR Image Reconstruction

Computational Intelligence Magazine 近来较流行的文章
序号 篇名
1 Recent Trends in Deep Learning Based Natural Language Processing [Review Article]
2 Time Series Prediction Using Support Vector Machines: A Survey
3 Deep Machine Learning - A New Frontier in Artificial Intelligence Research [Research Frontier]
4 PlatEMO: A MATLAB Platform for Evolutionary Multi-Objective Optimization [Educational Forum]
5 Learning in Nonstationary Environments: A Survey
6 Evolutionary Fuzzy Systems for Explainable Artificial Intelligence: Why, When, What for, and Where to?
7 Fuzzy Sets in Data Analysis: From Statistical Foundations to Machine Learning
8 An Evolutionary Strategy For Concept-Based Multi-Domain Sentiment Analysis
9 Ant colony optimization
10 Adaptive Dynamic Programming: An Introduction
11 Adaptive Dynamic Programming: An Introduction

Transactions on Circuits and Systems for Video Technology 近来较流行的文章
序号 篇名
1 Overview of the High Efficiency Video Coding (HEVC) Standard
2 A Simple Algorithm of Superpixel Segmentation With Boundary Constraint
3 Automatic License Plate Recognition (ALPR): A State-of-the-Art Review
4 Large-Scale Video Retrieval Using Image Queries
5 A Survey of Content-Aware Video Analysis for Sports
6 An introduction to biometric recognition
7 Reversible data embedding using a difference expansion
8 T-CNN: Tubelets With Convolutional Neural Networks for Object Detection From Videos
9 Overview of the Multiview and 3D Extensions of High Efficiency Video Coding
10 An Efficient SVD-Based Method for Image Denoising
11 Color-Sensitivity-Based Combined PSNR for Objective Video Quality Assessment

Signal Processing Magazine 近几年较流行的的文章
序号 篇名
1 Highlights of statistical signal and array processing
2 The Discipline of Signal Processing [Reflections]
3 Digital signal processing
4 Signal processing: A view of the future, Part 2 [Exploratory DSP]
5 Signal processing hardware and software
6 Faster Subband Signal Processing [dsp Tips&Tricks]
7 A hardware signal processing platform for sensor systems
8 Sensor systems signal processing platform
9 Speech, audio, and acoustic processing for multimedia
10 Recent developments in the core of digital signal processing
11 Signal processing for networked multimedia