2017-10-27 14:10:50 weixin_33709609 阅读数 221

机器视觉是指利用相机、摄像机等传感器,配合机器视觉算法赋予智能设备人眼的功能,从而进行物体的识别、检测、测量等功能。按照应用的领域与细分技术的特点,机器视觉进一步可以分为工业视觉、计算机视觉两类,相应地,其应用领域可以划分为智能制造和智能生活两类。

机器视觉与计算机视觉.jpg

因为工业视觉和计算机视觉在功能目标、硬件需求、算法侧重、产业成熟度上有一定差异。在功能目标上,工业视觉主要解决以往需要人眼进行的工件的定位、测量、检测等重复性劳动;

计算机视觉的主要任务是赋予智能机器人视觉,利用测距、物体标定与识别等功能实现对于外界位置信息、图像信息等的识别与判断。在硬件需求上,工业视觉相对较高,需要对工业相机的帧频、分辨率等指标依据自身的需求进行筛选;而计算机视觉则除少部分特殊情况外,大部分对于相机或摄像头的要求并不高。

在算法侧重上,工业视觉的算法往往侧重于精确度的提高;而计算机视觉的算法难度相对较高,侧重于或采用数学逻辑或采用深度学习方法进行物体的标定与识别。在产业成熟度上,工业视觉已经相对较为成熟,在半导体、包装等行业的测量检测已有较为广泛的应用;而计算机视觉整体来讲还是一个刚起步的状态,初创企业层出不穷。

机器视觉作为人工智能领域的重要分支,已经协同其他技术开始对社会产生重大影响。虽然人工智能领域内的各个前沿技术存在着不同程度的交叉,难以细分,但依据主要采用的技术类别,可以将人工智能行业分为:深度学习、机器视觉、自然语言处理、语音识别、情境感知计算、模式识别等等。其中,深度学习、机器视觉、自然语言处理是优质企业参与最多的三大领域,也是人们在人工智能领域付诸探索实践最多、获得应用成果最为丰厚的主要领域。

深度学习、机器视觉、自然语言处理这三大方向是计算机智能化发展的三大功能,分别代表着教会机器思考、教会机器观察外界、教会机器理解文字。朗锐智科(www.lrist.com)认为,机器视觉作为一种基础功能性技术,是机器人自主行动的前提,能够实现计算机系统对于外界环境的观察、识别以及判断等功能,相当于赋予了机器人视觉,对于人工智能的发展具有极其重要的作用。

2011-09-21 14:17:17 xwolfs 阅读数 1721

http://www.cs.ubc.ca/~lowe/vision.html

本人是计算机视觉方向的研究生,偶然发现这个网页,列举了一些计算机视觉在工业上的应用,觉得比较受用,拿来分享。原网址见上面连接。


Automobile driver assistance

Iteris (Santa Ana, California). Lane departure and collision warning systems for trucks and cars. Used in over 100,000 vehicles (2009). Also creates traffic monitoring systems.

MobilEye (Jerusalem, Israel). Vision systems that warn automobile drivers of danger, provide adaptive cruise control, and give driver assistance.


Eye and Head Tracking

Mirametrix (Montreal, Quebec). Free-head eye-tracker using computer vision technologies.

Smart Eye (Göteborg, Sweden). Systems to track eye and gaze position. Applications include detection of drowsiness or inattention in drivers.

SMI (Berlin, Germany). Eye and gaze tracking systems.


Film and Video: Sports analysis

Hawkeye (Winchester, UK). Uses multiple cameras to provide precise tracking in tennis, cricket, and other sports for refereeing and commentary.

LiberoVision (Zurich, Switzerland). Creates photorealistic 3D visualization of sporting events for sports broadcasting and analysis.

QuesTec (Deer Park, New York). Systems for tracking sports action to provide enhanced broadcasts.

Red Bee Media (London, UK). Develops Piero system for sports analysis and augmentation.

Amisco (Nice, France). Systems for tracking sports players and the ball in real time, using some human assistance.

Sportvision (New York, NY). Vision systems to provide real-time graphics augmentaion for sports broadcasts.


Film and Video

2d3 (Oxford, UK). Systems for tracking objects in video or film and solving for 3D motion to allow for precise augmentation with 3D computer graphics.

Image Metrics (Manchester, England). A markerless tracking system for the human face that can be used to map detailed motion and facial expressions to synthetic characters.

Imagineer Systems (Guildford, UK). Computer vision software for the film and video industries.

MirriAd (London, UK). Uses computer vision methods to track consistent regions in video and insert virtual advertising.

Mova (San Francisco, California). Provides 3D tracking of points on the human face or other surfaces for character annimation. Uses invisible phosphorescent makeup to provide a random texture for stereo matching.

Orad (Kfar Saba, Israel). Systems for creating virtual television sets, sports analysis, and other applications of real-time augmented reality.

Ooyala (Mountain View, California). Video content management and delivery, including object identification and tracking.

VideoSurf (San Mateo, California) Uses computer vision to search and classify online video.


Games and Gesture Recognition

GestureTek (Toronto, Canada). Tracks human gestures for playing grames or interacting with computers.

Microsoft Kinect (Redmond, Washington). Provides motion sensing and gesture recogntion for the Xbox gaming system. Creates 3D depth maps and registed images in real time using projected infrared light patterns and a single camera. Sold over 8 million units in the first 60 days, which makes it the fastest selling consumer electronics device (Wikipedia).

Reactrix (Redwood City, California). Interactive advertising for projected displays that tracks human gestures.

Sony EyeToy uses computer vision to track the hand and body motions of players to control the Sony Playstation. Sales were over 10 million units by 2008. (Wikipedia)


General purpose vision systems

Cognex (Natick, Massachusetts) is one of the largest machine vision companies (800 employees, 2010). Develops systems for inspection and localization tasks, people counting, and many other areas. (Hoover's)

Evolution Robotics (Pasadena, California). Vision systems for object recognition and navigation. Applications include mobile robotics and grocery retail. Develops integrated vision and navigation solutions for household robots.

Matrox Imaging (Dorval, Quebec, Canada). Software and hardware for machine vision applications.

National Instruments (Austin, Texas). Vision software and systems used for many applications, including inspection, biomedical, and security.

Neptec (Ottawa, Canada). Laser-based 3D vision systems for use on the space shuttles and other applications.

Newton Research Labs (Renton, Washington). Vision systems for high-speed tracking and mobile robots.

Point Grey Research (Vancouver, Canada). Real-time stereo vision systems, spherical vision systems, and imaging hardware.

Sarnoff (Princeton, New Jersey). Vision systems for tracking, registration, navigation, biometrics, and other applications.

Seeing Machines (Canberra, Australia). Systems for tracking head position and eye gaze direction.

Soliton (Bangalore, India). Smart cameras for industrial inspection and other applications.

SpikeNet (Toulouse, France). Trainable vision systems for performing recognition.

Supercomputing Systems (Zurich, Switzerland). Developed the leanXcam, a low-cost intelligent camera using open source software.

TYZX (Menlo Park, California). Produces real-time stereo vision systems that use a custom chip for fast stereo matching.

ViSSee (Lugano, Switzerland). Developing a low-cost real-time sensor for measuring speed using an approach modeled on vision in the fruit fly.

VISIONx (Pointe-Claire, Quebec, Canada). Vision systems for high accuracy measurement and other applications.

Vitronic (Wiesbaden, Germany). Vision systems for inspection, manufacturing, logistics, traffic management, and other applications.


Industrial automation and inspection: Automotive industry

CogniTens (Ramat-Hasharon, Israel). Has developed a system for accurate scanning of 3D objects for the automotive and other industries. The system uses a 4-camera head with projection of textured illumination to enable accurate stereo matching.

Perceptron (Plymouth, Michigan). Creates 3D laser scanning systems for automotive and other applications.


Industrial automation and inspection: Electronics industry

KLA-Tencor (San Jose, California). Systems for inspection and process control in semiconductor manufacturing.

Orbotech (Yavne, Israel). Automated inspection systems for printed circuit boards and flat panel displays. (Hoover's)


Industrial automation and inspection: Food and agriculture

Montrose Technologies (Ottawa, Canada). Vision systems for the baked goods industry. Systems monitor bake color, shape, and size of bread, cookies, tortillas, etc.

Ellips (Eindhoven, The Netherlands). Vision systems for inspecting and grading fruits and vegetables.


Industrial automation and inspection: Printing and textiles

Advanced Vision Technology (Hod Hasharon, Israel). Systems to inspect output from high-speed printing presses.

Elbit Vision Systems Ltd. (Yoqneam, Israel). Vision systems for textile inspection and other applications.

Mnemonics (Mt. Laurel, New Jersey). Vision systems for print quality inspection and other applications.

Xiris Automation (Burlington, Ontario, Canada). Inspection for the printing and packaging industries.


Industrial automation and inspection: Other

Adept (Pleasanton, California). Industrial robots with vision for part placement and inspection.

Avalon Vision Solutions (Lithia Springs, Georgia). Vision systems for the plastics industry.

Basler (Ahrensburg, Germany). Inspection systems for optical media, sealants, displays, and other industries.

Hermary Opto Electronics (Coquitlam, BC, Canada). Develops 3D scanners for sawmills and other applications.

JLI vision (Soborg, Denmark). Vision systems for industrial inspection tasks, including food processing, glassware, medical devices, and the steel industry.

LMI Technologies (Vancouver, Canada). Develops 3D vision systems using laser sensors for inspection of wood products, roads, automotive manufacturing, and other areas.

MVTec (Munich, Germany). Vision systems for inspection and other applications.

NeuroCheck GmbH (Remseck, Germany). Inspection systems for quality control.

PPT Vision (Eden Prairie, Minnesota). Vision systems for automotive, pharmaceutical, electronics, and other industries.

Seegrid (Pittsburgh, PA). Industrial mobile robots that use vision for mapping and navigation.

SIGHTech (San Jose, California). Trainable computer vision systems for inspection and automation.

Virtek Vision International (Waterloo, Ontario, Canada). Laser-based inspection and templating systems.

Wintriss Engineering (San Diego, California). Vision systems for suface inspection and sports vision applications.


Medical and biomedical

Claron Technology (Toronto, Canada). Uses real-time stereo vision to detect and track the pose of markers for surgical applications.

Noesis (St. Laurent, Quebec, Canada). Software for biomedical and other scientific image analysis.


Object Recogntion for Mobile Devices

Kooaba (Zurich, Switzerland). Visual search for smartphones, photo management, and other applications.

SnapTell (Palo Alto, California). Image recognition and product search for camera phones. Owned by Amazon A9.


Panoramic Photography

Cloudburst Research (Vancouver, Canada). Develops AutoStitch Panorama, which provides fully automated image stitching for the iPhone platform (disclosure: the author of this list is a founder of the company).

HumanEyes (Jerusalem, Israel). Develops software for creating 3D stereo views, including stereo mosaicing.

Kolor (Challes les eaux, France). Develops the Autopano Pro software for automated panorama stitching of digital images. Also provides high-dynamic-range imaging by combining multiple exposures.


People tracking

Brickstream (Atlanta, GA). Tracking people within stores for sales, marketing, and security.

Reveal (Auckland, New Zealand). Systems for counting and tracking pedestrians using overhead cameras.

VideoMining (State College, PA). Tracking people in stores to improve marketing and service.


Safety monitoring

MG International (Boulogne, France). The Poseidon System monitors swimming pools to warn of accidents and drowning victims.


Security and Biometrics

Aimetis (Waterloo, Ontario, Canada). Systems for intelligent video surveillance.

Aurora (Northampton, UK). Systems for biometric face recognition.

AuthenTec (Melbourne, Florida). Fingerprint recognition systems with a novel sensor.

Briefcam (Jerusalem, Israel). Develops software for summarization of long surveillance video in a short summary video.

Cernium (Reston, Virginia). Systems for behavior recognition in real-time video surveillance.

Digital Persona (Redwood City, California). Fingerprint recognition systems.

EVITECH (Paris, France). Smart video surveillance systems.

Equinox (New York, NY). Security systems using novel sensors, such as registered visible and thermal infrared images and use of polarized lighting.

Genetec (Montreal, Canada). Security systems for license plate recognition, surveillance, and access control.

Honeywell (Morristown, New Jersey). Range of video surveillance systems and analysis software.

Imagemetry (Prague, Czech Republic). Image processing and computer vision for image forensics.

IntelliVision (San Jose, California). Automated monitoring systems, including face and object recognition.

L-1 Identity Solutions (Stamford, Connecticut). Fingerprint, iris, and face recognition systems as well as other security applications. (Hoover's)

ObjectVideo (Reston, Virginia). Automated video surveillance products for tracking, classification, and activity recognition.

Viion Systems (Montreal, Canada). Detection and identification of computer users.

Vitamin D (Menlo Park, California). Detection and monitoring of people in video streams.


Three-dimensional modeling

Creative Dimension Software (Guildford, UK). Creates 3D models from a set of images. Objects are imaged on a calibration mat.

Eos Systems (Vancouver, Canada). PhotoModeler software allows creation of texture-mapped 3-D models from a small number of photographs. Also provides accurate photogrammetric 3D measurements from multiple images of a scene.

Creaform (Quebec City, Canada). Develops 3D scanners for the human body and other applications.


Traffic and road management

Image Sensing Systems (St. Paul, Minnesota). Created the Autoscope system that uses roadside video cameras for real-time traffic management. Over 100,000 cameras are in use.

Yotta (Leamington Spa, UK). Imaging and scanning solutions for road network surveying.


Web Applications

Face.com (Tel Aviv, Israel). Image retrieval based on face recognition.

Incogna (Ottawa, Canada). Develops a system for image search on the web. Uses GPUs for increased performance.

LTU Technologies (Paris, France). Image retrieval based on content.

Photometria (San Diego, California). Virtual makeover website, TAAZ.com uses computer vision methods to allow users to try on makeup, hair styles, sunglasses, and jewelery.


2019-01-24 08:22:29 weixin_42137700 阅读数 228

https://www.toutiao.com/a6646959085440729608/

 

行业级最先进的 计算机视觉技术

  • 如今,人工智能在工业领域有着蓬勃发展趋势,因为自动化以及优化仍是数字革命的主要焦点。
  • 在本文中,我们将回顾近几年在AI社区中那些令人兴奋的最先进的计算机视觉技术,这些技术被认为是工业就绪的,而且对工业用例产生重大而又实际的影响。
  • 其中一些技术对性能的提升达到了令人难以置信的程度,超越了人类能达到的性能水平,从而超出了大多数行业所期望的精度和可靠性标准。
  • 在基本的计算机视觉任务(例如图像分类)中取得的惊人进步,使得可靠地结合多种技术来创建新的复合技术从而实现之前从未在工业环境中探索过的全新用例成为可能。
  • 话虽如此,这些新技术已经证明其结果可与那些只能通过非常密集的硬件专用系统才能获得的精度和可靠性结果相媲美。虽然在实现这些专用系统和安装与之相关的硬件方面存在实际的困难和限制,但相机是很容易买到的,从而极大地扩大了用例范围。
  • AI赋能的计算机视觉系统使得有可能跨入到一个新的领域,加速了工业4.0,真正数字化和物理现实增强的进程。
  • 在我们深入了解计算机视觉领域的最新进展之前,让我们先介绍一些基本概念以及深度学习和计算机视觉这方面的历史事件。

计算机视觉是什么?

  • 计算机视觉是一门科学,旨在使计算机能够理解并从图形和视频中洞悉信息。计算机视觉,即自动执行视觉任务的能力,例如从图形或视频中提取和分析有用的信息。

机器学习和深度学习的关系!

  • 机器学习是算法和统计模型的科学研究,它依赖于数据驱动的方法来做决策而不是基于规则的方法。给定大量高质量数据并通过改进算法,机器学习系统能够逐步提高其在特定任务上的性能。
  • 深度学习是机器学习的子类,完全侧重于一组可描述为网络的数学算法。它们起初受到人脑中发现的生物神经网络的启发,同样,人工神经网络具有数百万个人工突触,数学上由数百万个简单的线性代数方程表示。

深度学习驱动计算机视觉

  • 自2012年深度学习神经网络一直是计算机视觉的主要关注点是有理由的。由深度学习驱动的计算机视觉系统的优点是它们具有更高准确性,更灵活,且对大量的光线条件变化,视点,尺度,方向,与背景融合,类内差异,变形以及视觉遮挡等情况具有更高容忍度。但最重要的是,它们启发了新的用例。
  • 早期的计算机视觉模型依赖于原始像素数据作为机器学习模型的输入。然而,单独的原始像素数据不足以包含图像中对象的千变万化。
  • 深度学习驱动的计算机视觉基于深度神经网络可在训练阶段自动提取和创建特定任务的特征,然后将其用于执行计算机视觉任务。

下图突出了深度学习和计算机视觉近6年历史中最重要的一些事件。

  1. 2012年引入深度神经网络所带来的突破使得图像分类误差减少了约10%(从2011年的25.8%降至2012年的16.4%)。
  2. 2015年最先进的算法在图像分类方面的表现超过了人类水平(5.1%,Russakovsky et al.),准确率为3.57%。
  3. 总体而言,深度神经网络的引入导致图像分类误差减少10倍(从2011年的25.8%将至2017年的2.3%)。

最先进的计算机视觉|AI和工业4.0之间,还有多远的差距?

 

值得注意的是,上述结果是在ImageNet数据集上实现的,其中20,000个类别具有典型类别,例如“气球”或“草莓”,由数百个低分辨率469x387像素图像组成。计算机视觉系统应用于具有较少类别,较少变化和较多数量的较高分辨率图像的特定任务时,其准确度可以高达99.9%。这使得完全独立自信地运行一个系统成为可能。

详细了解计算机视觉技术

现在我们已经介绍了基础知识,我们可以更详细地了解这些技术了。

图像分类

在本节中,我们将介绍图像分类,这是将一组固定类别中的一个标签分配给图像的任务。这是计算机视觉中的核心问题之一,尽管其简单,但其具有各种各样的实际应用。许多其它看似不同的计算机视觉任务(例如图像 字幕,目标检测,关键点检测和分割)可以简化为图像分类,其它任务利用全新的神经网络架构。以下视频片段说明了一个非常简单的分类事例。

最先进的计算机视觉|AI和工业4.0之间,还有多远的差距?

 

图像关键字和字幕

该技术处于计算机视觉和自然语言处理(NLP)这两AI中最有趣领域的交点。关键字是用于描述照片或图像元素的单词。关键字是对照片添加描述性术语的过程。

图像字幕是指基于图像中的对象和动作从图像或视频生成文本描述的过程。在下图中可以看到这方面的一个例子。

最先进的计算机视觉|AI和工业4.0之间,还有多远的差距?

 

目标检测

目标检测是一种计算机视觉技术,用于识别和定位图像或视频中的对象。这通常通过带边框标记的框包围对象来完成。目标检测是自动驾驶汽车背后的关键技术,使它们能够识别其他汽车或区分行人与灯柱。它还可以用于各种应用,例如工业检测和机器人视觉。由于ImageNet竞赛,仅2010年至2014年间,定位误差(从42.5%降至25.3%)就减少了1.7倍。下面的视频片段显示了该技术的实时实施结果,用于检测城市中发现的与一辆自动驾驶视觉系统相关的车,人以及其他常见物体。

 

最先进的计算机视觉|AI和工业4.0之间,还有多远的差距?

 

关键点检测和姿态估计

关键点被视为图像有趣或重要部分的特征。它们是图像中的空间位置或点,定义图像中有趣的内容或突出的内容。关键点之所以特殊,是因为它使得跟踪修改后的图像中的相同关键点成为可能,其中图像或图像中的对象会发生旋转、收缩/膨胀或变形。

姿态估计是计算机视觉中的一个普遍问题,其目的是检测物体的位置和方向。这通常意味着检测对象的关键点位置。这种技术可以用来创建一个非常精确的二维/三维模型,描述对象关键点的位置,然后可以用来创建一个数字孪生兄弟。

例如,在姿态估计问题中,可以检测到常见的方形家居对象的角点,从而可以深入了解对象在环境中的三维位置。

最先进的计算机视觉|AI和工业4.0之间,还有多远的差距?

 

同样的方法也可以用于检测人体姿势,人体上的关键点如肩膀、肘部、手、膝盖和脚都会被检测到。

最先进的计算机视觉|AI和工业4.0之间,还有多远的差距?

 

语义分割

下一种技术称为语义分割(也称为对象掩蔽),它解决了计算机视觉领域的一个关键问题:直观地分离图像中的物体。从大的图像上看,语义分割为完全理解场景铺平了道路。这是非常有用的,因为它使计算机能够精确地识别不同物体的边界。场景理解作为一个计算机视觉的核心问题,其重要性在于从语义分割中所获得的知识使得越来越多的应用程序的健壮性得以提升。在下面所示的自动驾驶汽车示例中,它帮助汽车识别道路和其他物体的准确位置。

最先进的计算机视觉|AI和工业4.0之间,还有多远的差距?

 

图像到图像转化

下面提到的技术属于图像到图像转化的范畴。对于下面的技术,网络通过提高质量而不是提取见解或得出结论来增强图像和视频。

超分辨率:

此任务的目标是在同时提高细节级别的同时提高图像的分辨率。一个非常深的神经网络最近在图像超分辨率方面取得了巨大的成功。放大倍数适用于2倍放大,如下图所示。

最先进的计算机视觉|AI和工业4.0之间,还有多远的差距?

超分辨率图像残留的密集网络(Zhang等人,2018日三月)

夜视

在弱光下成像是一项挑战。短曝光图像会产生噪声,长曝光时间会导致动态模糊。后者通常也不切实际,尤其是对于手持摄影。人们已经提出了各种去噪、去模糊和增强技术,但它们的效果在极端条件下是有限的,例如夜间高速摄影。为了提高目前的标准,研究人员引入了一种基于深度网络端到端训练的低光图像处理技术。该网络直接利用原始传感器数据,取代了许多传统的图像处理技术。这可以在下面的图像中清楚地看到,暗噪声图像得到了显著的增强。

最先进的计算机视觉|AI和工业4.0之间,还有多远的差距?

在黑暗中学会看东西(Chen等人,2018年五月)

Super SloMo

视频插值旨在在两个连续帧之间生成中间帧。这些人工生成的画面与原始图像有着不可区分的视觉特征。这项技术是放大摄像系统性能的理想方法。对多个数据集的实验结果表明,深度学习方法比现有的方法具有更好的一致性。这项技术的结果可以在下面的视频剪辑中看到,在原始帧之间添加7个中间帧来创建平滑的慢动作视频。

最先进的计算机视觉|AI和工业4.0之间,还有多远的差距?

Super SloMo:视频插值多中间帧的高质量估计(Jiang等人,2018年7月)

在本文中,我们研究了许多计算机视觉技术,这些技术是由最近几个月开发的深入学习提供动力的,并且已经展示了令人难以置信的结果,并准备在行业中实施。这些技术处于技术的前沿,通过提高速度、准确性、可靠性和灵活性,表现出明显的优于以前的技术。

创新的关键驱动因素是近年来人工智能研究论文的数量激增,特别是在计算机视觉领域,使充分利用技术进步来改善工业运营的最新趋势变得更加重要。

谢谢你的阅读!希望,你学到了一些新的和有用的关于最先进的计算机视觉技术的东西,这些技术已经为工业上的实际应用做好了准备。

如果你想了解更多,请一定要为这篇文章鼓掌,并跟随我。

2018-12-09 10:05:19 Dhane 阅读数 5420

    近年来,我们随处可以听到一个词,“人工智能”。机器的智能化成为了现今的一大研究热点,而机器要变得更加智能,必然少不了对外界环境的感知。有研究表明,人对外界的环境的感知70%以上来自人类的视觉系统,机器也是如此,大多数的信息都包含在图像中,人工智能的实现少不了计算机视觉。那么计算机视觉具体有哪些应用呢?

  1. 无人驾驶

    无人驾驶又称自动驾驶,是目前人工智能领域一个比较重要的研究方向,让汽车可以进行自主驾驶,或者辅助驾驶员驾驶,提升驾驶操作的安全性。目前已经有一些公司研发出了自动泊车等辅助驾驶功能并得以应用。目前这方面做得比较好的是谷歌的无人驾驶汽车。国内也有一些比较好的公司,如百度无人驾驶车已经在一些园区得以应用,还有图森未来的货运车也完成了多次路测,并已经投入市场使用。

    计算机视觉在无人驾驶中起到了非常关键的作用,比如道路的识别,路标的识别,红绿灯的识别,行人识别等等平常驾驶过程中需要注意的。另外还包括三维重建及自主导航,通过激光雷达或者视觉传感器可以重建三维模型,辅助汽车进行自主定位及导航,进行合理的路径规划和相关决策。

2.人脸识别

   人脸识别技术目前已经研究得相对比较成熟,并在很多地方得到了应用,且人脸识别准确率目前已经高于人眼的识别准确率,很多高铁站及门禁的地方都用到了人脸识别,很多都有刷脸系统,有些城市甚至在银行取钱都可以直接刷脸。

3.无人安防

   安防一直是我国比较重视的问题,也是人们特别重视的问题,在很多重要地点都安排有巡警巡查,在居民小区以及公司一般也都有保安巡查来确保安全。随着计算机视觉的发展,计算机视觉技术已经能够很好的应用到安防领域,目前很多智能摄像头都已经能够自动识别出异常行为以及可疑危险人物,及时提醒相关安防人员或者报警,加强安全防范。

4.车辆车牌识别

    车辆车牌识别目前已经是一种非诚成熟的技术了,高速路上的违章检测,车流分析,安全带识别,智能红绿灯,还有停车场的车辆身份识别等都用到了车辆车牌识别,不仅能识别出车牌的号码,目前车辆识别技术已经能对道路上的车辆车型进行识别,通过识别摄像头获取的图像,能获取到车辆的型号及颜色等特征。

5.智能识图

    智能识图是我们生活中比较常见的计算机视觉的应用了。看到一个纸质文档,想要把其转换成电子文档,直接把文档拍下来,用相关软件进行文字识别,就能把图像中的文字自动转换成电子文档,甚至还能自动翻译成其他语言。看到一件衣服或一个物品,想在网上找他的来源等其他相关信息,直接输入图片,以图搜图,很快就能找到很多该图片出现的地方以及很多类似的图片。甚至还有些能直接告诉你图片中的物体是个什么东西,或者大概判断图片中的人像的大概年龄等比较好玩的功能。

6.3D重构

    3D重构之前在工业领域应用比较多,可以用于对三维物体进行建模,方便测量出物体的各种参数,或者对物体进行简单复制。最近也慢慢开始应用到民用领域了,比如新出的华为mate20系列手机,就已经可以对玩偶进行三维建模,并能够设置一些特定的动作,让玩偶“活”起来,甚至可以与人进行一些互动。当然这里与人互动还用到AR技术。

7.VR/AR

    VR/AR技术相信大家都已经比较熟悉了。VR眼睛在前两年卖得特别火爆,还有一些9D游戏机,就是利用VR技术让人能够有一种身临其境的感觉。而AR技术目前比较常见的可能是双十一时候淘宝的天猫,还有之前比较火爆的宠物捕获游戏,可以在现实场景中加入一些其他元素,目前这个领域还在快速发展中。很多方便人们生活的应用也在不断推出,比如智能翻译,用手机对着需要翻译的字,在这个界面上就自动显示出相关的翻译,或者后面可能实现的虚拟试衣间等,将大大的方便人们的生活。

 

8.智能拍照

    这个相信是大家很熟悉的一个名词了,基本每个智能手机都开始配有这个功能。最基础的功能包括自动曝光,自动白平衡,自动对焦等,还有一些去燥算法,能很好的提高手机拍照的图像质量。随着计算机视觉技术的进步,一些自动美颜算法,自动挂件,自动滤镜,场景切换等越来越多有趣的功能都被开发出来。还有一些图像处理软件,像专业的Photoshop,还有比较民用化的美图秀秀,美颜相机等,基本也都是利用计算机视觉的技术。

9.医学图像处理

    常见的医学成像,比如B超,核磁共振,X光拍片等。随着AI技术的发展,还开始有一些AI诊断的功能,AI根据图像的特征对相关疾病的可能性进行分析。

10.无人机

    随着无人机技术的发展,计算机视觉技术在无人机上的应用必不可少,军用无人机中,可以对目标进行自动识别并自主导航,精确制导等,民用的无人机也类似,例如大疆的无人机,能够跟踪人进行实时的拍照,还有一些手势控制等。还有一些特殊场景的应用,例如电力巡检,农作物分析等。

11.工业检测

    工业领域计算机视觉也得到了充分应用,例如产品缺陷检测,工业机器人姿态控制,利用立体视觉来获得工件和机器人之间的相对位置姿态。

12.其他

    计算机视觉还有很多应用,随着技术的发展,应用领域也会越来越多。在工业领域的应用,在机器人技术方面的应用,这里就不一一的赘述了。相信随着计算机视觉技术的不断发展,我们的生活能够越来越智能化,便捷化。

    因为机器视觉课程刚好布置了这门作业,所以大概总结了一下,自己之前一段时间也在找计算机视觉相关的工作,所以多数还是根据自己对这个行业的了解来写的,难免和其他相关的总结有点类似。转载请注明出处。

参考文献:

https://36kr.com/p/5074487.html

http://wb.qdqss.cn/html/qdwb/20180226/qdwb303829.html

2018-09-12 11:34:05 cszn6666 阅读数 807

机器视觉,智造之眼!

1.机器视觉解读

 

什么是机器视觉

 

机器视觉技术是计算机科学的一个重要分支,它涉及到计算机、图像处理、模式识别、人工智能、信号处理、光学、机械等多个领域,其目的就是给机器或者自动生产线添加一套视觉系统。机器视觉是采用机器代替人眼来做测量与判断,通过计算机摄取图像来模拟人的视觉功能,实现人眼视觉的延伸。

 

 

机器视觉系统构成

 

一个完整的工业机器视觉系统是由众多功能模块共同组成,一般由光学系统(光源、镜头、工业相机)、图像采集单元、图像处理单元、执行机构及人机界面等模块组成,所有功能模块相辅相成,缺一不可。好的机器视觉系统能够为制造业提供更多有利于提高产品质量和生产效率的硬件支持。

 

 

机器视觉工作原理

 

机器视觉的目的是给机器或自动生产线添加一套视觉系统,用机器视觉系统 代替人眼来做测量和判断。  

 

 

通过机器视觉产品(即工业相机)将待检测目标转换成图像信号,传送给图像处理分析系统,得到被摄目标的形态信息,根据像素分布和亮度、颜色等信息,转变成数字化信号;图像系统对这些信号进行各种运算来抽取目标的特征,进而根据判别的结果来控制现场设备的动作。

 

机器视觉功能优势

 

 

2.机器视觉系统工作流程

 

工件到达检测位置→ 向传感器触发脉冲→ 图像采集卡感应物件并开始工作→ 零件照明→工业摄像机等待扫描并输出→ 图像采集卡将数字图像存放到计算机内存中→处理器获取图像并把资料数据化→ 视觉软件对图像进行分析、识别→ 获取测量结果→ 离散输出,显示不良产品画面→控制流水线的动作或纠正误差。

 

▲字小点击放大看图

 

从上述的工作流程可以看出,机器视觉系统是一种比较复杂的系统,因为大多数系统的监控对象都是运动物体,系统与运动物体的匹配和协调动作尤为重要,这些给系统各部分的动作时间和处理速度带来了严格的要求。

 

在一些应用领域,例如机器人、飞行物制导等,整个系统或者系统的一些部件的重量、体积和耗电量都会有严格的要求。所以说,机器视觉是图像处理系统中最复杂的系统,需要在开发和设计中投入更多的精力。

 

3.机器视觉系统的优势

 

在工业生产的过程中,机器视觉相对于人眼识别体现了较大优势。机器视觉具有自动化、客观、非接触和高精度等特点。特别是在工业生产领域,机器视觉强调生产的精度和速度,以及工业现场环境下的可靠性与安全性,在重复和机械性的工作中具有较大的应用价值。

 

 

精确性——由于人眼有物理条件的限制,在精确性上机器有明显的优点。即使人眼依靠放大镜或显微镜来检测产品,机器仍然会更加精确,因为它的精度能够达到千分之一英寸。特别是检测生产线上高速运动的物体时,机器视觉更具优势。

 

重复性——机器可以以相同的方法一次一次的完成检测工作而不会感到疲倦。与此相反,人眼每次检测产品时都会有细微的不同,即使产品时完全相同的。

 

客观性——人眼检测还有一个致命的缺陷,就是情绪带来的主观性,检测结果会随工人心情的好坏产生变化,而机器没有喜怒哀乐,检测的结果自然非常可观可靠。

 

效率高——机器视觉系统可以快速获取大量信息,实现更为快速的产品检测,同时也易于加工过程中的信息集成,尤其是在大批量工业生产过程中,用人工视觉检查产品质量效率低且精度不高,用机器视觉检测方法可以大大提高生产效率和生产的自动化程度。

 

成本低——由于机器比人快,一台自动检测机器能够承担多人的任务。而且机器不需要停顿、能够连续工作,所以能够极大的提高生产效率从而降低生产成本。

 

4.

 机器视觉典型应用场景

 

生产车间组装

 

机器人在机器视觉技术的作用下,可以精确地按照视觉技术使机械手臂拥有3D视觉能力,可以靠视觉导引、定位,成为夹取物件的要件。除了视觉定位,手眼力协调机器人的关键技术还有矩阵的感测器,可以协助机器人知道抓取的位置与力量大小。

 

 

电子焊接制造

 

在焊线技术中,因为芯片维度的缩小,需要较强大的影像放大功能。在此环境中,高质量的成像镜头系统必须满足特殊的最佳化需求。由于机器视觉工具绝佳的操作模式、可靠度及视觉算法的高准确度,从而很好地解决了芯片焊接过程中的诸多问题。

 

 

空瓶检测

 

机器视觉空瓶检测系统主要由相机、镜头、光源、图像采集卡、PC平台和控制单元等六部分组成,各个部分之间相互配合,最终完成对酒瓶的质量检测和剔除。

 

 

汽车零部件装配

 

汽车零部件具有品质要求高、批量大、形状各异的特点,每一个零件都涉及到整车的质量,故其测量的尺寸多,精度要求高,需要根据不同的零部件特征与类型进行逐一测量。目前大部分汽车制造商,已使用机器视觉系统取代了普通的三坐标测量机。

 

 

产品自动化分拣

 

自动化分拣是工业生产、特别是产品批量生产中的必需环节之一。工业生产中需要根据产品特性及其生产/出厂质量要求进行分拣,它可以代替人工进行货物的分类、搬运和装卸工作,提高生产和工作效率,从而实现自动化、智能化、无人化。

 

 

药品质量检测

 

机器视觉在医疗领域的应用已经从传统的药品包装、药瓶、标签等视觉检测到目前对生物芯片的检测,放射科的X放射等,通过引入机器视觉系统,完成对图像信息的采集、存储、管理、处理及传输等功能。

 

5.机器视觉未来发展趋势

 

▲字小点击放大看图

 

6.机器视觉主流供应商

 

 

深圳辰视智能科技有限公司是一家集机器视觉、工业智能化于一体的高新技术企业,是由一支中国科学院机器视觉技术研究的精英团队在深圳创立。

辰视智能拥有基于深度学习的三维视觉引导、机器人运动控制、视觉检测、三维建模等方面的核心技术,并研发了机器人三维视觉引导系统 、机器人二维视觉引导系统、三维检测系统、产品外观检测系统等可根据客户需求定制化的智能产品。以高效·低成本·模块化的方式为自动化集成商、自动化设备厂商、机器人厂家提供机器视觉的相关解决方案。