精华内容
参与话题
问答
  • 计算机视觉分很多方向,个人比较熟悉的是图像方面的,包括:图像分类、目标检测、图像分割、视频处理等,这些小的方面每一个也要很长的一段时间去学习. 入门这个东西很难定义,如果只是对一个方向看一下,了解...

    计算机视觉分很多方向,个人比较熟悉的是图像方面的,包括:图像分类、目标检测、图像分割、视频处理等,这些小的方面每一个也学要很长的一段时间去学习.

    入门这个东西很难定义,如果只是对一个方向看一下,了解一点东西,有一点谈资的话不算入门,我认为入门至少代表你对这个领域的某些东西进行过处理实践才可以,所以我比较喜欢的一种学习新知识的方式就是:先找一个综述的书随便翻一翻,对目录有个印象就行,然后针对自己喜欢的部分,去查资料,做实例,看论文,一段时间后,自然就会有自己的理解了.

    需要哪些数学编程工具等知识?

    数学知识的话,大概基础的就是概率论、数理统计、矩阵论

    编程基础的是python、matlab工具上,现在一般是用框架,我常用caffe,还有一些其他常用的框架tensorflow、pytorch、mxnet等入门的话,本科的数学知识基本就够了,然后开始看论文吧。

    基本现在搞计算机视觉(ComputerVision,CV)都是基于深度学习的。第一篇推荐alexnet,算是深度学习搞CV的开山之作,接着基本就是需要先把分类的看一看,现在的CV大多数任务都是基于分类任务的深度网络进行扩展的。
      人工智能、大数据、云计算和物联网的未来发展值得重视,均为前沿产业,有兴趣的朋友,可以查阅多智时代,在此为你推荐几篇优质好文:
    1.模式识别应用于哪些领域,模式识别技术的发展趋势
    http://www.duozhishidai.com/article-15389-1.html
    2.计算机视觉与图像处理、模式识别和机器学习,之间有什么关系?
    http://www.duozhishidai.com/article-4119-1.html
    3.语音的识别过程主要分哪几步,常用的识别方法是什么?
    http://www.duozhishidai.com/article-1739-1.html
    自然语言理解过程主要有哪些层次,各层次的功能是怎么样?
    http://www.duozhishidai.com/article-1726-1.html


    多智时代-人工智能大数据学习入门网站|人工智能、大数据、物联网云计算的学习交流网站

    多智时代-人工智能大数据学习入门网站|人工智能、大数据、云计算、物联网的学习服务的好平台

    展开全文
  • 最新计算机视觉学习路线教程

    千次阅读 2020-05-12 15:14:53
    这篇文章主要是基于我自己的经验,侧重于计算机视觉学习资源的介绍,如果大家按照这个路线去,相信这将在很大程度上促进提高你的计算机视觉知识水平。 在开始学习计算机视觉之前,我们先来了解有关机器学习和...

    这篇文章主要是基于我自己的经验,侧重于计算机视觉学习资源的介绍,如果大家按照这个路线去学,相信这将在很大程度上促进提高你的计算机视觉知识水平。

    在开始学习计算机视觉之前,我们先来了解有关机器学习和python基础知识。

    框架(Frameworks)

    虽然你不必从一开始就去考虑选择何种框架,但是实践应用新的知识是必要的。

    对应框架并没有太多选择,主要为:pytorchkeras(TensorFlow)。Pytorch可能需要编写更多代码,但在返回方面具有很大的灵活性,因此我们可以先学习如何使用pytorch。此外,大多数深度学习研究人员也普遍使用pytoch。

    Albumentation (图像增强库)和 catalyst (框架,pytorch顶部的高级API)在我们学习计算机视觉的过长中也是很常用的工具,我们也可以先学习和使用它们,尤其是第一个。

    硬件

    理论与实践

    在线课程
    • CS231n是非常好的在线教学课程,涵盖了计算机视觉的所有必要基础,是YouTube的在线视频。这门课程还包含了课后练习,对于新手来说,可以先不用完成练习。(免费)
    • Fast.ai是我们应该学习的另一门课程。fast.ai是pytorch之上的高级框架,但是它们过于频繁地更改其API,并且缺乏文档使其使用不方便。但是,花些时间看这门课程的理论和有用的技巧是不错的选择。(免费)

    在学习这些课程时,我建议你将理论付诸实践,将其应用于其中一个框架。

    文章和代码
    书籍

    虽然需要读的书籍不多,但是我相信这两本书都是有用的,无论你选择使用pytorch还是keras

    Kaggle
    • https://www.kaggle.com/competitions kaggle是各种机器学习竞赛的著名在线平台,其中很多是关于计算机视觉的。即使没有完成课程,你也可以开始参加比赛,因为从比赛中会有很多开放的内核(端对端代码),你可以直接从浏览器中运行它们。(免费)

    有挑战的学习方式(推荐)

    另一种替代方法可能很难,但是这种方法可以让你获得计算机视觉不同领域的知识,大家可以针对自己的研究方向选择具体的计算机视觉领域进行学习。(小博主提醒:大批干货来袭,视觉各个领域经典代表性项目列表如下所示。)

    尝试阅读和复现如下文章,你将受益匪浅。助前行,希望对大家有所帮助。

    网络架构
    语义分割
    生成对抗网络
    目标检测
    姿态估计

    原文链接:https://towardsdatascience.com/guide-to-learn-computer-vision-in-2020-36f19d92c934

    欢迎关注磐创AI博客站: http://panchuang.net/

    sklearn机器学习中文官方文档: http://sklearn123.com/

    欢迎关注磐创博客资源汇总站: http://docs.panchuang.net/

    展开全文
  • 计算机视觉新手入门:大佬推荐我这样学习

    万次阅读 多人点赞 2018-03-21 14:29:22
    1.1 计算机视觉到底是什么计算机视觉是一门研究如何让机器“看”的科学 更进一步的说,就是使用摄像机和电脑代替人眼对目标进行识别、跟踪和测量等机器视觉,并进一步做图形处理,使电脑处理成为更适合人眼观察...

    计算机视觉从入门到放肆

    一、基础知识

    1.1 计算机视觉到底是什么?

    计算机视觉是一门研究如何让机器“看”的科学

    更进一步的说,就是使用摄像机和电脑代替人眼对目标进行识别、跟踪和测量等机器视觉,并进一步做图形处理,使电脑处理成为更适合人眼观察或传送给仪器检测的图像。

    作为一门科学学科,计算机视觉研究相关的理论和技术,视图建立能够从图像或者多维数据中获取’信息’的人工智能系统。

    1.2 图像
    当程序在读取一张图片时,需要考虑以下数据:

    • 高度、宽度

      假如一张照片的分辨率为:1920*1080(单位为dpi,全称为 dot per inch),1920 就是照片的宽度,1080 就是图片的高度。

    • 深度

      存储每个像素所用的位数,比如正常RGB的深度就是 2^8 * 3 = 256 * 3 = 768 , 那么此类图片中的深度为768,每个像素点都能够代表768中颜色。

    • 通道数

      RGB图片就是有三通道,RGBA类图片就是有四通道

    • 颜色格式

      是将某种颜色表现为数字形式的模型,或者说是一种记录图像颜色的方式。比较常见的有:RGB模式、RGBA模式、CMYK模式、位图模式、灰度模式、索引颜色模式、双色调模式和多通道模式。

    • more
      图像中的知识点太多,做基本图像处理,了解以上知识个人感觉可以了。等到以后如果做深入研究,或许有机会做更多的学习

    1.3 视频

    原始视频 = 图片序列,视频中的每张有序图片被称为“帧(frame)”。压缩后的视频,会采取各种算法减少数据的容量,其中IPB就是最常见的。

    • 码率

      数据传输时单位时间传送的数据位数,通俗一点的理解就是取样率,单位时间取样率越大,精度就越高,即分辨率越高

    • 帧率

      每秒传输的帧数,fps(有没有一种似曾相识的感觉~~~),全称为 frames per second

    • 分辨率

      每帧图片的分辨率

    • 清晰度

      平常看片中,有不同清晰度,实际上就对应着不同的分辨率

    • IPB

      在网络视频流中,并不是把每一帧图片全部发送到客户端来展示,而是传输每一帧的差别数据(IPB),客户端然后对其进行解析,最终补充每一帧完整图片

    1.4 摄像机

    在实际应用当中,基本上都是通过不同种类的摄像机来获取数据,然后发送给服务端(AI Server)进行处理,分类有:

    • 监控摄像机(网络摄像机和模拟摄像机)
    • 行业摄像机(超快动态摄像机、红外摄像机、热成像摄像机等)
    • 智能摄像机
    • 工业摄像机

    1.5 CPU和GPU

    我想大家肯定是知道,目前很多人工智能计算都迁移到GPU上进行,tensorflow甚至还有cpu和gpu版本,所以其两者的差别和使用方法,这是绕不开的问题。

    废话少说,先来上图:

    • 架构上的对比

      这里写图片描述

      • 绿色:计算单元
      • 橙红色:存储单元
      • 橙黄色:控制单元
    • 整体对比
      这里写图片描述

      • Cache、Local Memory : CPU > GPU
      • Threads(线程数):GPU > CPU
      • Registers(寄存器):GPU > CPU
      • SIMD Unit(单指令多数据流):GPU > CPU

    CPU在设计上,低延迟,可是低吞吐量,CPU的ALU(算数运算单元)虽然少,可是很强大,可以在很少的时钟周期内完成算数计算,或许数量少,就可以任性的减少时钟周期,所以其频率非常高,能够达到1.532 ~ 3 (千兆,10的9次方)。
    大缓存容量、复杂的逻辑控制单元也可以减低延迟。

    GPU在设计上,高延迟,可是高吞吐量。GPU的特点是有很多的ALU和很少的cache. 缓存的目的不是保存后面需要访问的数据的,这点和CPU不同,而是为thread提高服务的。如果有很多线程需要访问同一个相同的数据,缓存会合并这些访问,然后再去访问dram(因为需要访问的数据保存在dram中而不是cache里面),获取数据后cache会转发这个数据给对应的线程,这个时候是数据转发的角色。但是由于需要访问dram,自然会带来延时的问题。

    参考链接

    • Cuda (Compute Unified Device Architecture)

      是显卡厂商NVIDIA推出的运算平台,采用并行计算架构,是GPU能够解决复杂的计算问题。包含了CUDA指令集架构以及GPU内部的并行计算引擎。

      安装教程自行搜索脑补就行。

    1.6 编程语言 + 数学基础

    • python

      推荐作为入门语言,简单容易上手,需要了解一些库:numpy、pandas、matplotlib等。

    • C++

      作为深入了解并尝试进行优化,C++必不可少,也是编写并修改的最佳语言。当然,如果你了解C、Matlab等语言那也是甚好的。

    • 线性代数

      可以把重点放在矩阵运算上。

    • 概率统计

      了解基本概率统计知识、高斯分布、中值、标准差和方差等概念。

    • MachineLearning

      能够用公式表示代价函数、使用低度下降法来优化模型。当然机器学习内容实在是很多,建议能够完整走一遍,也可以看斯坦福的CS229课程

    1.7 计算机视觉的应用

    计算机视觉之于未来人工智能,就好比眼睛之于人的重要性一样。是未来很多领域自动化获取数据的主要渠道之一,也是处理数据的重要工具之一。目前可以预想到的应用主要有如下:
    - 无人驾驶
    - 无人安防
    - 人脸识别
    - 文字识别
    - 车辆车牌识别
    - 以图搜图
    - VR/AR
    - 3D重构
    - 医学图像分析
    - 无人机
    - more ……

    二、推荐参考书和公开课

    2.1 参考书籍

    2.2 公开课

    这两门课我觉得经典的课程,如果认真学完的话,基本上是已经入门了,找一般的工作工作应该是没有问题。

    2.3 网站

    • Visionbib

      这个网站是国外大佬从1994年开始专注于计算机视觉研究,上面收录了很多与此相关文献,大家可以看一些里程碑文献,让自己能够更好地理解视觉发展历程。

    • vision.stanford

      没事上斯坦福大学计算机视觉研究团队官网看看,大佬们有没有发表一些研究成果文章,学习一番之后,将其翻译成blog也不失为一个好的学习方法(装逼方法)。

    这两个网站已经足够了,不要太多,学好才是最关键的。

    三、你还是需要学习一些深度学习知识

    关于深度学习,评价最高的莫过于:《Deep Learning》Written by lan Goodfellow and YoshuaBengio

    这里写图片描述

    购买链接,这本AI圣经我就不多废话了,攒钱买回去好好修炼吧!

    四、开源框架必不可少

    关于开源框架,仁者见仁智者见智,我也免得引起战争,所以就罗列给一下个人不成熟的小建议。

    • Caffe

      深度学习卷积神经网络开源框架。

    • Tensorflow

      开源机器学习深度学习框架。

    • (Torch and Maxnet)

      其他深度学习开源框架

    • ffmpeg

      强大的视频处理工具

      流行框架的对比图:

      这里写图片描述

      参考链接

    五、深入,则必须阅读相关文献

    当我们需要学习各种经典模型的时候,到哪里去找资料呢?一般大家都会直接wikipedia,可是我只想说,上面的也只是英文版汉译过来的,最好还是找一手资料,不然你吸收的知识,就不知道是被多少人消化过多少遍后得来的。当然也是有好的,不过那些大牛都是直接看原版才能得出更加深刻的结论,所以看原版文献是一件很重要的学习途径,不然就永远装不了*(学习不到最纯正的knowledge)。

    5.1 里程碑式的文献

    先熟悉所在方向的发展历程,历程中的里程碑式的文献必须要精读。
    
    例如,深度学习做目标检测,RCNN、Fast RCNN、Fater RCNN、SPPNET、SSD和YOLO等模型;又例如,深度学习做目标跟踪,DLT、SO-DLT等等;再例如,对抗网络GAN、CGAN、DCGAN、LAPGAN等等。
    

    5.2 文献网站

    [arxiv](https://arxiv.org/list/cs.CV/recent) :每天去更新一下别人最新的工作
    

    5.3 计算视觉的顶会

    • ICCV:国际计算机视觉大会
    • CVPR:国际计算机视觉与模式识别大会
    • ECCV:欧洲计算机视觉大会

    5.4 计算机视觉的顶刊

    • PAMI:IEEE 模式分析与机器智能杂志
    • IJCV:国际计算机视觉杂志

    六:总结

    无论别人给出多好的资料,最终还是要靠自己踏实下来,对各种知识点细嚼慢咽。AI 不易,且行且珍惜


    ~_~


    我个人对计算机视觉非常感兴趣,接下来会不断的分享各种关于CV的学习心得和干货。小白上路,大家如果能施舍一些star或者follow将会是给我最大的动力。
    - Blog
    - Github

    展开全文
  • 如何学习计算机视觉

    万次阅读 多人点赞 2017-12-22 19:07:50
    本文的内容主要借鉴CSDN博主NodYoung的一篇文章,但是不知道什么原因,该博主的文章现已删除,这里,我根据自己的理解大致说明一下,对于一个初学小白来说,该如何学习计算机视觉。(有关计算机视觉入门的其它只是,...

    本文的内容主要借鉴CSDN博主NodYoung的一篇文章,但是不知道什么原因,该博主的文章现已删除,这里,我根据自己的理解大致说明一下,对于一个初学小白来说,该如何学习计算机视觉。(有关计算机视觉入门的其它知识,可以阅读另一篇文章计算机视觉入门必读

    1.编程能力

    1.1 编程语言(C++, python)

      刚接触CV(computer vision)(注:本文偏向于图像学而非图形学)时,大家一般都会不假思索地选择使用C++:装个VS(Visual Studio),配置下opencv,撸起袖子就上了。这样做非常合理,几乎所有人都是这么入门的。 不过,当你知识面扩展开后,你会感觉到很多时候C++都显得有些力不从心。比如:当你要画一些图表或做一些分析,就还得把数据导入MATLAB里做进一步处理;当你要非常快捷方便地学习或测试一个算法,C++会是你最糟糕的选择;或者当你要学习深度学习时,你绝对不会再选择使用C++….总之,有太多理由会促使你再学习一门编程语言,最好的选择没有之一:python。

    1.1.1 简单介绍一下C++和python的各自特点:

    • C++:偏底层,执行效率高,适合嵌入式等平台上使用;在视觉领域,C++生态好,用的人多,网上找资源很方便。 缺点是开发效率实在太低了,关于这一点如果你只是专注于图像处理的话可能感受不是那么真切,因为opencv库做得足够好。但是当你做到机器学习后,opencv就显得有些力不从心了,虽然它也包含一些SVM、神经网络等的简单实现,但毕竟不擅长。

    • python:全能语言,干啥都行,并且都相对擅长。图像处理,opencv支持有python接口;科学计算,其功能类似于matlab了:机器学习及深度学习,python是最好用的,没有之一;爬虫等网络应用,豆瓣就是用python写的;简而言之,方便,实在太方便了。
      当然python也有自己的另一面。执行效率不高,这一点做嵌入式开发的可能比较忌讳。但如今手机的内存都升到6G了,tensorflow都可以在移动端跑了,Python也都可以用来控制STM32了,未来很难说。

      顺便说一句也有人使用MATLAB等做图像方面的研究,如果你只是偶尔用图像处理辅助一下你的研究,可以这么做,一般情况下不建议使用。

    1.1.2 C++和python学习资源推荐

    • C++
      • 初级入门
        如果你是一个无编程经验的C++初学者,或者有其它语言经验的C++初学者,那强烈推荐下面的书籍。
        • C++ Primer作者:Stanley Lippman, Josée Lajoie, and Barbara E. Moo (更新到C++11) (不要和 C++ Primer Plus–Stephen Prata搞混了)近1千页,本书透彻的介绍了C++,以浅显和详细的方式讲到C++语言差不多所有内容。2012年8月发行的第五版包含C++11的内容
          电子书第三版(中文)第四版(中文)第五版(英文版)
        • Accelerated C++ 作者:Andrew Koenig and Barbara Moo 这本书覆盖了和C++ Primer一样的内容,但厚度只有C++ Primer的四分之一。这主要是因为本书面向的不是编程的初学者,而是有其它语言经验的C++初学者。对于初学者,本书学习曲线稍显陡峭,但对于能克服这一点的学习者而言,它确实非常紧凑的介绍了C++这门语言。
          电子书中文版英文版
        • C++编程思想(Thinking in C++) 作者:Bruce Eckel 共两卷,第二卷主要将标准库,但还是不错的。
          电子书第二版V2(英文版)第二版V2(中文版)
      • 最实用
        • Effective C++ 作者:Scott Meyers 本书以瞄准成为C++程序员必读的第二本书籍而写,Scott Meyers成功了。早期的版本面向从C语言转过来的程序员。第三版修改为面向从类似Jave等语言转来的程序员。内容覆盖了50多个很容易记住的条款,每个条款深入浅出(并且有趣)讲到了你可能没有考虑过的C++规则。
          电子书第三版(英文)第三版(中文)
        • C++程序设计原理与实践 (Programming: Principles and Practice Using C++ )作者:Bjarne Stroustrup C++之父写的C++入门书籍。本书面向没有编程经验的初学者,但相信有编程经验的人也能从本书中学到不少东西。
          电子书中文版
    • python
        基础部分看廖雪峰的python教程就可以了,然后就是用哪一块学哪一块了。python学起来很简单,看别人代码的过程就是学习的过程。对于不熟悉的用法多搜下官方文档,如python, numpy,pandas, matplot, scikit-learn。这里有几张python各种库的小抄表其实直接在网上搜这几张表也都比较方便。课程的话,我之前上过一些七月算法的课程,讲得不好,多少会给你一些知识体系和各种学习资料,总体不推荐或跳着看。python的开发环境值得说一下,因为有太多选择,这里比较建议使用pycharm和jupyter notebook吧,具体参考python入门环境搭建。下面,推荐一些入门和进阶的书籍

    1.2 编程平台(windows, linux)

      新手肯定都用windows了,学习过程中发现在windows上搞不定了,先忍几次,然后掉头就去学linux了。一定是这样。 哪些在windows上真的搞不定呢?比如:deeplearning,或最新论文中提出的视觉开源算法。 不过对我们而言,linux并不需要了解太深。装个ubuntu系统,常用的文件操作、程序编译等知道就OK了。我完全是在使用的过程中现用现学,手边常备一本书《鸟哥的linux私房菜》。

    2.视觉知识

      计算机视觉实在很广了,目前比较热门的方向总体上分为两大块:一块是深度学习,一块做SLAM。它们的研究点区别在哪呢?深度学习这一群体侧重于解决识别感知(是什么)问题,SLAM侧重于解决几何测量(在哪里)问题ICCV研讨会:实时SLAM的未来以及深度学习与SLAM的比较。拿机器人来说,如果你想要它走到你的冰箱面前而不撞到墙壁,那就需要使用 SLAM;如果你想要它能识别并拿起冰箱中的物品,那就需要用到深度学习机器人抓取时怎么定位的?用什么传感器来检测?。当然这两方面在research上也有互相交叉融合的趋势。 不过在学习这些之前,一般都会先掌握下传统的计算机视觉知识,也就是图像处理这一部分了。我之前大致总结过一次:
    计算机视觉初级部分知识体系。这些基础知识的理解还是挺有必要的,有助于你理解更高层知识的本质,比如为什么会出现deeplearning等这些新的理论知识(感觉有点像读史了,给你智慧和自由)。这一部分学习资料的话还是挺推荐浅墨的《OpenCV3编程入门》 也可以看他的博客。当然他的书有一个问题就是涉及理论知识太少,所以推荐自己再另备一本偏理论一点的图像处理相关的书,我手边放的是《数字图像处理:原理与实践》,差强人意吧。个人之前看浅墨书的时候做了一份《OpenCV3编程入门》学习笔记,里边包含一些理论知识和个人见解。
    下面说一下两个大的方向:基于深度学习的视觉和SLAM技术。

      基于深度学习的视觉:机器学习包括深度学习里的大部分算法本质上都是用来做“分类”的。具体到计算机视觉领域一般就是物体分类(Object Classification)、目标检测(Object Detection)、语义分割(Image Semantic Segmentation)等,当然也有一些很酷又好玩的东西比如edges2cats、deepart。本人主要做一些Object Detection相关的东西。其实一般是直接跑别人的代码了,稍微做一些修改和参数调整,前期的预处理才是主要工作。这些程序基本都是在linux下跑的。好,深度学习为什么这么强?它主要解决了什么问题呢?我比较认同以下三点:学习特征的能力很强,通用性强,开发优化维护成本低 参见为什么深度学习几乎成了计算机视觉研究的标配?。
    关于这一部分的学习,主要就是deeplearning了。关于deeplearning,漫天飞的各种资源。可以看一看李宏毅的一天搞懂深度学习课件 youtube上有一个一天搞懂深度學習–學習心得;李飞飞的CS231n课程,网易云课堂有大数据文摘翻译的中文字幕版课程,知乎专栏智能单元有CS231N课程翻译(非常好);三巨头之一Yoshua Bengio的新作《DEEP LEARNING》,目前已有中译版本 。
      SLAM技术:这一部分了解不多,不做太多评价,有兴趣的可以自己谷歌一下

    3.机器学习

      计算机视觉中使用的机器学习方法个人感觉不算多,早期的时候会用SVM做分类,现在基本都用深度学习选特征+分类。原因在于统计机器学习这一块虽然方法不少,但是基本都无法应对图像这么大的数据量。 不过大家在学习过程中很容易接触到各种机器学习方法的名字因为现在大数据分析、机器学习、语音识别、计算机视觉等这些其实分得不是很开,然后不自觉地就会去了解和学习。这样我感觉总体来说是好的。不过在学习一些暂时用不着的算法时,个人感觉没必要做的太深:重在理解其思想,抓住问题本质,了解其应用方向。
    下面分开介绍一下传统机器学习算法和深度神经网络

      传统机器学习一般也就决策树、神经网络、支持向量机、boosting、贝叶斯网等等吧。方法挺多的,同一类方法不同的变形更多。除了这些监督式学习,还有非监督学习、半监督学习、强化学习。当然还有一些降维算法(如PCA)等。对这些个人整体把握的也不是特别好,太多了。
    学习资料,吴恩达的coursera课程《Machine Learning》,他正在出一本新书《MACHINE LEARNING YEARNING》,说好陆续更新的,刚更新一点就没了,本来想翻译学习一下。个人比较喜欢他的课程风格话说今天中午传出新闻,吴恩达从百度离职了。——执笔于2017.03.22,简单易懂。还有李航的《统计学习方法》和周志华的《机器学习》,两本在国内机器学习界成为经典的书。
      深度学习主要的发展就是CNN、RNN;从去年起GAN火起来了,现在如日中天;增强学习现在发展也非常快,有些名校如CMU都开这方面课程了。
    资料上面说过就不说了喜欢高雅的人也可以看看这个深度学习论文阅读路线图 ,说说在使用deeplearning时用哪个库吧。目前为止还没有大一统的趋势,连各个大公司都是自己用自己开发的,一块大肥肉大家都不舍得放弃。感觉在这方面没必要太计较,用相对简单的和大家都用的(生态好) 。

    4.数学

      一切工程问题归根结底都是数学问题,这里说说计算机视觉和机器学习所涉及的数学问题。

      微积分:比如图像找边缘即求微分在数字图像里是做差分(离散化)啦,光流算法里用到泰勒级数啦,空间域转频域的傅立叶变换啦,还有牛顿法、梯度下降、最小二乘等等这些都用的特别普遍了。
      概率论与统计:这个比较高深,是应用在机器学习领域里最重要的数序分支。应用比如:条件概率、相关系数、最大似然、大数定律、马尔可夫链等等。 浙大的《概率论与数理统计》感觉还行,够用。
      线性代数与矩阵:数字图像本身就是以矩阵的形式呈现的,多个向量组成的样本也是矩阵这种形式非常常见,大多机器学习算法里每个样本都是以向量的形式存在的,多个矩阵叠加则是以张量(tensor)的形式存在google深度学习库tensorflow的字面意思之一。具体应用,比如:世界坐标系->相机坐标系->图像坐标系之间的转换,特征值、特征向量,范数等。 推荐国外的上课教材《线性代数》。因为浙大的那本教材感觉实在不太行,买过之后还是又买了这本。
      凸优化:这个需要单独拎出来说一下。因为太多问题(尤其机器学习领域)都是优化问题(求最优),凸优化是里面最简单的形式,所以大家都在想办法怎么把一般的优化问题转化为凸优化问题。至于单纯的凸优化理论,好像已经比较成熟了。在机器学习里,经常会看到什么求对偶问题、KKT条件等,潜下心花两天学一学。 建议备一份高校关于凸优化的教学课件,大家对这一块毕竟比较生,缺乏系统感。比如北大的《凸优化》课程。这些数学知识没必要系统学习,效率低又耗时。毕竟大家都有本科的基础,够了。一般用到的时候学,学完之后总结一下。

    展开全文
  • 计算机视觉,图像处理的研发人员需要什么技能,看看sensetime的招聘要求就清楚了:
  • 计算机视觉(Computer vision)是一门研究如何使机器“看”的科学,更进一步的说,就是指用摄影机和计算机代替人眼对目标进行识别、跟踪和测量等机器视觉,并进一步做图像处理,用计算机处理成更适合人眼观察或进行...
  • 计算机视觉入门

    万次阅读 多人点赞 2018-05-18 21:42:00
    在机器学习大热的前景之下,计算机视觉与自然语言处理(Natural Language Process, NLP)及语音识别(Speech Recognition)并列为机器学习方向的三大热点方向。而计算机视觉也由诸如梯度方向直方图(Hi...
  • 从装Python、装OpenCV、入门深度学习,到人脸识别、目标检测、语义分割等等各种应用,都有进阶路线,里面包含了教程、案例、注意事项。甚至怎样把算法部署到树莓派之类的硬件上,也能找到经验。 推特发出12小...
  • 计算机视觉如何入门

    万次阅读 多人点赞 2017-12-23 19:54:56
    当前计算机视觉作为人工智能的一个分支,它不可避免的要跟深度学习做结合,而深度学习也可以说是融合到了计算机视觉、图像处理,包括我们说的自然语言处理,整个人工智能领域都会涉及到对深度学习的知识。
  • 计算机视觉学习建议

    千次阅读 2019-06-15 10:42:34
    目录简介方向热点简介计算机视觉(Computer Vision)又称为机器视觉(Machine Vision),顾名思义是一门“教”会计算机如何去“看”世界的学科。在机器学习大热的前景之下,计算机视觉与自然语言处理(Natural ...
  • 零基础小白,如何入门计算机视觉

    万次阅读 多人点赞 2018-03-13 20:12:05
    计算机视觉其实是一个很宏大的概念,下图是有人总结的计算机视觉需要的技能树。 如果你是一个对计算机视觉一无所知的小白,千万不要被这棵技能树吓到。没有哪个人能够同时掌握以上所有的技能,这棵树只是让你对...
  • 讲真在计算机这个庞大的体系下挑选出一个方向来确实蛮难,自己挑来挑去,有种乱花渐欲迷人眼的感觉,不过就目前自己的兴趣、性格和学习能力,远景规划来看,计算机视觉这个方向目前来看对我自己来说确实是一个十分...
  •   刚接触CV(computer vision)(注:本文偏向于图像而非图形)时,大家一般都会不假思索地选择使用C++:装个VS(Visual Studio),配置下opencv,撸起袖子就上了。这样做非常合理,几乎所有人都是这么入门的。 ...
  • 在我的理解里,要实现计算机视觉必须有图像处理的帮助,而图像处理倚仗与模式识别的有效运用,而模式识别是人工智能领域的一个重要分支,人工智能与机器学习密不可分。纵观一切关系,发现计算机视觉的应用服务于机器...
  • 整理了走CV这条路的一些干货,有我学习过的,也有我没学习过的,打算后面遇到了好的资源或者资料就更新过来,方便自己保存后面看,也可以提供给其他人一同学习,资料连接我都放出来了,数学那部分我把pdf放在云盘...
  • 搞了CV一段时间,仍时不时因为概念问题而困惑,搞不清楚计算机视觉(Computer Vision),计算机图形(Computer Graphics)和图像处理(Image Processing)的区别和联系。在知乎上看到了一个帖子,觉得解释的很好,结合...
  • 计算机视觉学习感悟

    千次阅读 2017-05-29 11:10:49
    一、前言 最近听了邹耀斌老师的数字图像处理新技术的专题课程,觉得数字图像处理真是一个比较新鲜的...后来查找相关资料我才了解到计算机视觉,图像处理,图像分析,机器人视觉和机器视觉是彼此紧密关联的学科。...
  •  本博文乃自学为主,转载需要声明,并且我也不知道能坚持编写多久,故而尽力为之,最近进行计算机视觉学习的研究生阶段,时间上委实不多。   学习的书采用了《计算机视觉:模型、学习和推理》,这本书的英文名...
  • 计算机视觉学习路线

    2019-09-10 06:18:54
    深度学习算法工程师的基本要求 熟练掌握python和c++编程,至少熟悉 Caffe 和 Tensorflow/Pytorch 两种框架。 熟练玩转深度学习各类模型架构使用和设计。 熟练玩转数据的整理和使用,必须深刻理解数据在深度学习...
  • 深度学习计算机视觉 看这一篇就够了

    万次阅读 多人点赞 2016-05-18 10:14:37
    人工智能是人类一个非常美好的梦想,跟星际漫游和长生不老一样。我们想制造出一种机器,使得它跟人一样具有一定的对外界事物感知能力,比如看见世界。 在上世纪50年代,数学家图灵提出判断机器是否具有人工智能的...
  • 计算机视觉简介

    2019-04-19 16:02:46
    计算机简介 ...计算机图形计算机视觉的区别: 简单的来说,计算机视觉侧重于对图像的识别,得到一些结论,而计算机图形侧重于如何从其他数据产生到图像。具体来说:计算机图形(Computer Graphi...
  • 2019计算机视觉-包揽所有前沿论文源码

    万次阅读 多人点赞 2019-10-23 11:36:33
    大家是否遇到过这种情况,就是在工作或者学习的时候,想去某些方向的网络,但是呢,尴尬的是,老旧的网络里不想要,前沿的网络又不知道有哪些。为了解决大家的这个困扰,本人收集了2019年大部分前沿的网络相关链接,...
  • 个人对于计算机视觉方向比较感兴趣(方向有待更加细化)由于是个人自学,在网上收集各种信息和资料,就像无头的苍蝇一样,四处乱撞,导致学习效果比较差。所以需要制定一份具体的学习规划,同样是借助网络资料,比如...
  • 计算机视觉:模型、学习和推理》包含了中英文版本,非常清晰。
  • 伴随着图像处理技术的发展,我们每天无时无刻都在接触着图像处理的一切,打开相机,设置美颜程度,伴随着快门键的按下,一张瘦脸磨皮的人像处理完成了。按下手机的解锁键,前置摄像头已经获取了你的人脸图像,并在你...
  • 计算机视觉学习步骤

    千次阅读 2017-05-02 15:55:07
    具备一点如概率、统计学、线性代数、微积分(微分与积分)等相关课程的学术背景,对学习计算机视觉大有裨益。要是想在日后更容易理解计算机视觉的一些概念,提早对矩阵计算和数字信号处理进行学习,会得更加轻松...
  • 学习计算机视觉的入门书籍

    千次阅读 2016-08-24 14:41:30
    计算机视觉入门书籍总结,包括书名和部分作者名字,作者名字有漏写和错写。。
  • MATLAB计算机视觉与深度学习实战-运行代码 涉及雾霾去噪、答题卡自动阅卷、肺部图像分割、小波数字水印、图像检索、人脸二维码识别、车牌定位及识别、霍夫曼图像压缩、手写数字识别、英文字符文本识别、眼前节组织...
  • 计算机视觉入门系列(一) 综述

    万次阅读 多人点赞 2017-01-19 18:01:31
    计算机视觉入门系列(一) 综述自大二下学期以来,学习计算机视觉及机器学习方面的各种课程和论文,也亲身参与了一些项目,回想起来求学过程中难免走了不少弯路和坎坷,至今方才敢说堪堪入门。因此准备写一个计算机...
  • 计算机视觉:算法与应用》探索了用于分析和解释图像的各种常用技术,描述了具有一定挑战性的视觉应用方面的成功实例,兼顾专业的医学成像和图像编辑与拼接之类有趣的大众应用,以便学生能够将其应用于自己的照片和...

空空如也

1 2 3 4 5 ... 20
收藏数 172,298
精华内容 68,919
关键字:

计算机视觉需要学什么