精华内容
下载资源
问答
  • 基于机器视觉的鸡蛋体积与表面积计算方法 基于机器视觉的菊花生长自动无损监测技术 基于机器视觉的农业车辆路径跟踪 基于机器视觉的田间杂草定位技术 基于机器视觉的细水雾液滴尺寸测量与分析 基于机器视觉的液体...
  • 本文深入研究了机器视觉的产生 发展 和应用 . 并设计了相应的实例以供参考,同时 本文章也是一篇本科的毕业论文.
  • 我自己搜集的关于机器视觉中仿射不变矩研究论文
  • 这是关于机器视觉的论文,托朋友在清华的数据库中下载的
  • 这是一篇基于matlab关于基本图像处理的论文,论文中有相应的程序代码及其算法。
  • ML-VT 关于视觉测试和检查中利用机器学习方法学士学位论文的资料库。
  • 机器视觉 图像显著性代码。 saliency object or region detection,机器视觉,图像处理方面关于显著性的论文和详细代码 显著性
  • 本世纪关于机器视觉的期刊论文,值得研究,对该领域的研究者很珍贵!
  • 最近在看一些论文,这是从论文中总结一个关于labview机器视觉颜色分量来改变灰度值以及对比直方图小程序,适合机器视觉图像处理初级学员(菜鸟级别)
  • 国内比较早研究机器视觉的上海交大博士关于机器视觉的毕业论文
  • 读硕士快2年,读了上百篇...论文方向有图像分割,视频分类,机器翻译,GAN,CNN等。 1.title: Spatial Pyramid Pooling in Deep ConvolutionalNetworks for Visual Recognition link:[1406.4729] Spatial Pyramid...

    读硕士快2年,读了上百篇顶会论文,有泛读有精读,挑其中几十篇做个概括,并附上链接,希望给新人一点指点吧。论文方向有图像分割,视频分类,机器翻译,GAN,CNN等。

    1.title: Spatial Pyramid Pooling in Deep ConvolutionalNetworks for Visual Recognition

    link:[1406.4729] Spatial Pyramid Pooling in Deep Convolutional Networks for Visual Recognition

    这是有关多尺度特征表示的论文。主要解决问题图像分类网络受限于全连接层而不能接受任意尺度图像的问题,同时实验征明,多尺度特征表示在图像分类和目标检测任务中能更好的提升模型的性能

    2.title: Pyramid Scene Parsing Network

    link:[1612.01105] Pyramid Scene Parsing Network

    这是有关图像语义分割的论文。好像是第一个将图像金字塔池化用在图像语义分割的论文,该论文在语义分割pascal voc2012数据取得85左右的好成绩,同时估计还启发了deeplab 实验室研究员提出膨胀卷积金字塔池化网络架构

    3.title: Semantic Image Segmentation with Deep Convolutional Nets and Fully Connected CRFs

    link:[1412.7062] Semantic Image Segmentation with Deep Convolutional Nets and Fully Connected CRFs

    title Semantic Image Segmentation with Deep Convolutional Nets, Atrous Convolution, and Fully Connected CRFs

    link:Semantic Image Segmentation with Deep Convolutional Nets, Atrous Convolution, and Fully Connected CRFs

    tile Rethinking Atrous Convolution for Semantic Image Segmentation

    link:https://arxiv.org/abs/1706.05587

    title Encoder-Decoder with Atrous Separable Convolution for Semantic Image Segmentation

    link:[1802.02611v1] Encoder-Decoder with Atrous Separable Convolution for Semantic Image Segmentation

    这是图像语义分割方向最重要的几篇论文。这几篇论文均为deeplab 实验室杰作,这些研究成果已经成为语义分割新高峰,而且论文中的实验方法细节详细,让人受益匪浅

    4 title: Dynamic Routing Between Capsules

    link:[1710.09829] Dynamic Routing Between Capsules

    hinton 和他学生的论文,放在2017年nips上,想要取代CNN,提出了胶囊网络输,提出挤压损失函数以及动态路由算法。

    5.title: Unsupervised Representation Learning with Deep Convolutional Generative Adversarial Networks

    link:[1511.06434] Unsupervised Representation Learning with Deep Convolutional Generative Adversarial Networks

    这是一篇有关GAN的论文。提出DCGAN的论文,好像是该论文首次提出采用CNN做无监督学习提取特征,并且该论文为GAN的训练提出了很多指导性建议,采用adam优化,网络最后一层的激活函数采用有界函数。当然现在的Cyclegan 很值得学习以下,想法非常好,而且github上有非常健全的代码,clone下就可以用。 附上论文链接:[1703.10593] Unpaired Image-to-Image Translation using Cycle-Consistent Adversarial Networks

    6.title:Neural Machine Translation by Jointly Learning to Align and Translate

    link:[1409.0473v2] Neural Machine Translation by Jointly Learning to Align and Translate

    这是一篇有关神经机器翻译的论文,当时知识粗略的看过,对其中具体讲述的内容已经忘了

    7.title: Understanding Convolution for Semantic Segmentation

    link:[1702.08502] Understanding Convolution for Semantic Segmentation

    这是一篇有关语义分割的论文。好像是2017年的论文,在pascal voc 上的语义分割结果大概82左右,主要指出了deeplab提出空洞卷积池化卷积核的设计问题(gridding issue),但是,在deeplab 实验室随后的论文中反击道:并没有发现所谓的gridding issue真的存在问题

    8.title: Fully Convolutional Instance-aware Semantic Segmentation

    link:[1611.07709] Fully Convolutional Instance-aware Semantic Segmentation

    title: Mask R-CNN

    link:[1703.06870] Mask R-CNN

    title:Path Aggregation Network for Instance Segmentation

    link:[1803.01534] Path Aggregation Network for Instance Segmentation

    这三篇论文都是实例分割方向。其中Mask-rcnn在github上有开源代码,而PAnet是2018年论文,是腾讯与香港中文大学联合提出的一种实例分割方法,据说分割精度超过Mask rcnn

    9.title: Visualizing and Understanding Convolutional Network

    link [1311.2901] Visualizing and Understanding Convolutional Networks

    这篇论文是神经网络可视化方向,解读神经网络在训练过程中到底学习到了什么,在很大程度上打开了神经网络这个充满神奇力量的黑箱子。

    10.title:Learning Spatio-Temporal Representation with Pseudo-3D Residual Networks

    link:[1711.10305] Learning Spatio-Temporal Representation with Pseudo-3D Residual Networks

    这篇论文方向是3D卷积在视频分类上的应用。论文里主要介绍了3Dresnet 在大量视频预训练后,可以在小数据集上取得不错的分类精度。

    展开全文
  • 编辑:zero关注 搜罗最好玩的计算机视觉论文和应用,AI算法与图像处理 微信公众号,获得第一手计算机视觉相关信息本文转载自:公众号:AI公园导读干货挺多,非常有用。介绍既然你已经在阅读这篇文章了,那么你可能...

    09805aed84152f9879c1f05bcd6ec527.png
    编辑:zero
    关注 搜罗最好玩的计算机视觉论文和应用,AI算法与图像处理 微信公众号,获得第一手计算机视觉相关信息
    本文转载自:公众号:AI公园

    导读

    干货挺多的,非常有用。

    介绍

    既然你已经在阅读这篇文章了,那么你可能已经知道该领域的先驱之一Andrew Ng是谁,并且你可能对会对他关于如何建立机器学习职业生涯的建议感兴趣。

    本博客总结了斯坦福大学CS230深度学习课程在YouTube上的演讲:对职业发展的一些建议以及阅读研究论文的方法,链接:https://www.youtube.com/watch?v=733m6qBH-jI&list=PLoROMvodv4rOABXSygHTsbvUz4G_YQhOb&index=9&t=0s

    我建议大家多看看这堂课,内容很丰富。不过,我想不管你看不看,你都会发现这篇文章很有帮助。因此,我试图在这里概述这些建议。

    跳到关键的要点部分。

    Andrew特别提出两项主要建议:

    1. 阅读研究论文:他使用的非常有效的技巧,当他试图在深度学习中掌握一个新主题时,他会阅读研究论文。
    2. 在机器学习领域开创事业的建议

    读研究论文

    你如何通过阅读研究论文来高效和相对快速地学习?所以,如果你想从学术文献中学习,你应该做什么,无论是你想学习建立一个感兴趣的机器学习系统/项目,还是仅仅停留在事情的顶端,获得更多的知识,成为一个深入学习的人。

    以下是清单:

    1. 编写一份论文列表:尝试创建一份研究论文列表、包括你拥有的任何文本或学习资源。
    2. 过一遍列表:基本上,你应该以一种并行的方式阅读研究论文,意思是一次处理多篇论文。具体地说,试着快速浏览并理解每一篇文章,而不是全部读完,也许你读了每一篇文章的10-20%,也许这足以让你对手头的文章有一个高水平的理解。在那之后,你可能会决定删除其中的一些论文,或者只是浏览一两篇论文,把它们通读一遍。

    他还提到,如果你读到:

    5-20篇论文(在选择的领域,比如语音识别)=>这可能是足够的知识,你可以实现一个语音识别系统,但可能不够研究或让你处于前沿。

    50-100篇论文=>你可能会对这个领域的应用(语音识别)有很好的理解。

    如何读论文?

    不要从头读到尾。相反,需要多次遍历论文,下面是具体如何做的:

    1. 阅读文章标题、摘要和图:通过阅读文章标题、摘要、关键网络架构图,或许还有实验部分,你将能够对论文的概念有一个大致的了解。在深度学习中,有很多研究论文都是将整篇论文总结成一两个图形,而不需要费力地通读全文。
    2. 读介绍+结论+图+略过其他:介绍、结论和摘要是作者试图仔细总结自己工作的地方,以便向审稿人阐明为什么他们的论文应该被接受发表。
      此外,略过相关的工作部分(如果可能的话),这部分的目的是突出其他人所做的工作,这些工作在某种程度上与作者的工作有关。因此,阅读它可能是有用的,但如果你不熟悉这个主题,有时很难理解。
    3. 通读全文,但跳过数学部分
    4. 通读全文,但略过没有意义的部分:出色的研究意味着我们发表的东西是在我们的知识和理解的边界上。
      他还解释说,当你阅读论文时(即使是最有影响力的论文),你可能也会发现有些部分没什么用,或者没什么意义。因此,如果你读了一篇论文,其中一些内容没有意义(这并不罕见),那么你可以先略读。除非你想要掌握它,那就花更多的时间。

    当你阅读一篇论文时,试着回答以下问题:

    1. 作者试图完成什么
    2. 这个方法的关键要素是什么
    3. 你自己能做什么
    4. 你还想要什么其他的参考资料

    如果你能回答这些问题,就很有希望的能反映出你对论文有很好的理解。

    事实证明,当你读更多的论文时,通过练习你会变得更快。因为,很多作者在写论文时使用的是通用格式。

    例如,这是作者用来描述网络架构的一种常见格式,特别是在计算机视觉中:

    f3e371e72559f274fcc024025fc90791.png

    理解一篇论文需要花多少时间?

    对于刚接触机器学习的人来说,理解一篇相对简单的论文可能需要一个小时,这并不罕见。但是,有时你可能会偶然发现需要3个小时甚至更长时间才能真正理解的论文。

    论文的来源

    网上有很多很棒的资源。例如,如果你是新手,列出语音识别领域中最重要的论文的博客文章将非常有用。

    随着深度学习的快速发展,很多人都试图跟上它的最新进展。所以,你应该这样做:

    1. Twitter:令人惊讶的是,Twitter正成为研究人员发现新事物的重要场所。
    2. ML subreddithttps://www.reddit.com/r/MachineLearning/
    3. 重要的机器学习会议:NIPS/ICML/ICLR。
    4. 朋友:找一个对该领域感兴趣的社区或一群朋友,分享有趣的研究论文。

    更加深入的理解文中的数学部分

    试着从头开始重新推导。虽然,这需要一些时间,但这是一个很好的练习。

    代码练习

    1. 下载开源代码(如果你能找到的话)并运行它。
    2. 从头开始重新实现:如果你能够做到这一点,那么这是一个强烈的信号,表明你已经真正理解了手头的算法。

    持续进步

    最重要的是不断学习,变得更好是指更加稳定的学习,而不是集中一段时间内读大量的论文。与其在短时间内死记硬背,不如从明年开始每周读两篇论文。

    对机器学习职业生涯的一些建议

    无论你的目标是找一份工作(大公司、初创公司和教职员工的职位),还是进行更高级的研究生学习(也许参加一个博士项目)。

    只要专注于做重要的工作,把你的工作看作是一种策略,一个做有用工作的机会。

    招聘人员要的是什么?

    1. 机器学习能力。
    2. 有意义的工作:表明你能胜任这份工作的项目。

    对于成功的机器学习工程师(优秀的求职者)来说,一个非常常见的模式是开发一个T型知识库。意思是对人工智能中许多不同的主题有广泛的理解,并在至少一个领域有非常深刻的理解。

    2a03e41e1ff1e92718286290ff67f8f0.png

    构建横向能力

    在这些领域建立基本技能的一个非常有效的方法是通过课程和阅读研究论文。

    构建纵向能力

    你可以通过做相关的项目、开源贡献、研究和实习来构建它。

    选择一份工作

    如果你想不断学习新东西,下面是影响你成功的一些因素:

    1. 无论你是和伟大的人/项目一起工作:被勤奋的人包围会影响你。
    2. 除了经理之外,还要关注你将与之共事的团队(10-30人,你将与他们互动最多),并对他们进行评估
    3. 不要关注“品牌”:公司的品牌与你的个人经历并没有太大的关联。

    所以,如果你得到了一份工作,问问你将和哪个团队一起工作,不要接受“加入我们,之后我们会组建一个团队”的工作邀请,因为你可能会和一个团队一起做你不感兴趣的事情,这不利于自己有效地进化。

    另一方面,如果你能找到一个好的团队(即使是在一家不知名的公司)并加入他们,你实际上可以学到很多东西。

    一些通用的建议

    1. 学得最多:倾向于选择能让你学到最多东西的工作。
    2. 做重要的工作:从事有价值的项目,推动世界向前发展。
    3. 尝试将机器学习带到传统行业:我们在科技行业已经改变了很多,但我认为最令人兴奋的工作之一可能是在传统行业(科技行业之外),因为你可以在那里创造更多的价值。

    要点

    我试着将Andrew的建议总结如下:

    1. 养成阅读研究论文的习惯:每周阅读两篇论文作为开始。
    2. 高效阅读:编制一份论文清单,一次阅读多篇论文,每篇论文都要经过多次阅读。
    3. 阅读论文时:首先阅读题目/摘要/图表(尤其是)/引言/结论。
    4. 尝试理解算法时:尝试重新推导数学并通过重新实现来练习编程。
    5. 尽量掌握最新信息,通过查看ML会议和其他在线资源中的资料。
    6. 在AI中构建一个t型知识库。
    7. 尝试加入一个好的团队(在大公司或初创公司),这将帮助你高效成长。
    8. 从事有用的项目可以帮助你学到更多,推动世界前进。
    9. 尝试将机器学习应用到其他行业:医疗、天文学、气候变化等。

    f5bbc2019ca6422ad22b1fc2bf8a6e5d.png

    —END—

    英文原文:https://medium.com/@mohamedalihabib7/advice-on-building-a-machine-learning-career-and-reading-research-papers-by-prof-andrew-ng-f90ac99a0182

    ---我是可爱的分割线---
    关注 搜罗最好玩的计算机视觉论文和应用,AI算法与图像处理 微信公众号,获得第一手计算机视觉相关信息

    651197b475e33f17bfb283df8c35934d.png
    展开全文
  • 文章目录0 前言1 实现效果2 技术原理2.1 手部检测2.1.1 基于肤色空间手势检测方法2.1.2 基于运动手势检测方法2.1.3 基于边缘手势检测方法2.1.4 基于模板手势检测方法2.1.5 基于机器学习手势检测方法3 手部...


    0 前言

    今天学长向大家介绍一个关于深度学习在图像识别领域应用的又一个课题,基于深度学习的手势检测与识别算法,该课题十分适合用于毕业设计哦~

    计算机相关毕设(论文)需要帮助的同学及时联系学长~

    1 实现效果

    废话不多说,先看看学长实现的效果吧
    在这里插入图片描述
    在这里插入图片描述
    在这里插入图片描述
    在这里插入图片描述
    在这里插入图片描述
    在这里插入图片描述

    2 技术原理

    2.1 手部检测

    主流的手势分割方法主要分为静态手势分割和动态手势分割两大类方法。

    • 静态手势分割方法: 单张图片利用手和背景的差异进行分割,

    • 动态手势分割方法: 利用了视频帧序列的信息来分割。

    2.1.1 基于肤色空间的手势检测方法

    肤色是手和其他背景最明显的区分特征,手的颜色范围较统一并且有聚类性,基于肤色的分割方法还有处理速度快,对旋转、局部遮挡、姿势变换具有不变性,因此利用不同的颜色空间来进行手势分割是现在最常用的方法。

    肤色分割的方法主要有以下几种:基于参数、非参数的显式肤色聚类方法。参数模型使用高斯颜色分布,非参数模型则是从训练数据中获得肤色直方图来对肤色区间进行估计。肤色聚类显式地在某个特定的颜色空间中定义了肤色的边界,广义上看是一种静态的肤色滤波器,如Khan根据检测到的脸部提出了一种自适应的肤色模型。

    肤色是一种低级的特征,对计算的消耗很少,感知上均匀的颜色空间如CIELAB,CIELUV等已经被用于进行肤色检测。正交的颜色空间如,YCbCr,YCgCr,YIQ,YUV等也被用与肤色分割,如Julilian等使用YCrCb颜色空间,利用其中的CrCb分量来建立高斯模型进行分割。使用肤色分割的问题是误检率非常高,所以需要通过颜色校正,图像归一化等操作来降低外界的干扰,提高分割的准确率。

    基于YCrCb颜色空间Cr, Cb范围筛选法手部检测,实现代码如下:

    # 肤色检测之二: YCrCb中 140<=Cr<=175 100<=Cb<=120
    img = cv2.imread(imname, cv2.IMREAD_COLOR)
    ycrcb = cv2.cvtColor(img, cv2.COLOR_BGR2YCrCb) # 把图像转换到YUV色域
    (y, cr, cb) = cv2.split(ycrcb) # 图像分割, 分别获取y, cr, br通道分量图像
    
    skin2 = np.zeros(cr.shape, dtype=np.uint8) # 根据源图像的大小创建一个全0的矩阵,用于保存图像数据
    (x, y) = cr.shape # 获取源图像数据的长和宽
    
    # 遍历图像, 判断Cr和Br通道的数值, 如果在指定范围中, 则置把新图像的点设为255,否则设为0
    for i in  range(0, x): 
    	for j in  range(0, y):
    		if (cr[i][j] >  140) and (cr[i][j] <  175) and (cb[i][j] >  100) and (cb[i][j] <  120):
    			skin2[i][j] =  255
    		else:
    			skin2[i][j] =  0
    
    cv2.imshow(imname, img)
    cv2.imshow(imname +  " Skin2 Cr+Cb", skin2)
    

    检测效果:

    在这里插入图片描述
    在这里插入图片描述

    2.1.2 基于运动的手势检测方法

    基于运动的手势分割方法将运动的前景和静止的背景分割开,主要有背景差分法、帧间差分法、光流法等。

    帧间差分选取视频流中前后相邻的帧进行差分,设定一定的阈值来区分前景和后景,从而提取目标物体。帧差法原理简单,计算方便且迅速,但是当前后景颜色相同时检测目标会不完整,静止目标则无法检测。

    背景差分需要建立背景图,利用当前帧和背景图做差分,从而分离出前后景。背景差分在进行目标检测中使用较多。有基于单高斯模型,双高斯模型的背景差分,核密度估计法等。景差分能很好的提取完整的目标,但是受环境变化的影响比较大,因此需要建立稳定可靠的背景模型和有效的背景更新方法。

    1, 读取摄像头
    2, 背景减除
    fgbg1 = cv.createBackgroundSubtractorMOG2(detectShadows=True)
    fgbg2 = cv.createBackgroundSubtractorKNN(detectShadows=True)
    # fgmask = fgbg1.apply(frame)
    fgmask = fgbg2.apply(frame) # 两种方法
    3, 将没帧图像转化为灰度图像 在高斯去噪 最后图像二值化
    gray = cv.cvtColor(res, cv.COLOR_BGR2GRAY)
    blur = cv.GaussianBlur(gray, (11, 11), 0)
    ret, binary = cv.threshold(blur, 0, 255, cv.THRESH_BINARY | cv.THRESH_OTSU)
    4, 选取手部的 ROI 区域 绘制轮廓
    gesture = dst[50:600, 400:700]
    contours, heriachy = cv.findContours(gesture, cv.RETR_EXTERNAL, cv.CHAIN_APPROX_SIMPLE) # 获取轮廓本身
    for i, contour in enumerate(contours): # 获取轮廓
    cv.drawContours(frame, contours, i, (0, 0, 255), -1) # 绘制轮廓
    print(i)
    

    在这里插入图片描述

    2.1.3 基于边缘的手势检测方法

    基于边缘的手势分割方法利用边缘检测算子在图像中计算出图像的轮廓,常用来进行边缘检测的一阶算子有(Roberts算子,Prewitt算子,Sobel算子,Canny算子等),二阶算子则有(Marr-Hildreth算子,Laplacian算子等),这些算子在图像中找到手的边缘。但是边缘检测对噪声比较敏感,因此精确度往往不高。

    边缘检测代码示例:

    import numpy as np
    from PIL import Image
    import matplotlib.pyplot as plt
    import matplotlib.cm as cm
    import scipy.signal as signal     # 导入sicpy的signal模块
    
    # Laplace算子
    suanzi1 = np.array([[0, 1, 0],  
                        [1,-4, 1],
                        [0, 1, 0]])
    
    # Laplace扩展算子
    suanzi2 = np.array([[1, 1, 1],
                        [1,-8, 1],
                        [1, 1, 1]])
    
    # 打开图像并转化成灰度图像
    image = Image.open("pika.jpg").convert("L")
    image_array = np.array(image)
    
    # 利用signal的convolve计算卷积
    image_suanzi1 = signal.convolve2d(image_array,suanzi1,mode="same")
    image_suanzi2 = signal.convolve2d(image_array,suanzi2,mode="same")
    
    # 将卷积结果转化成0~255
    image_suanzi1 = (image_suanzi1/float(image_suanzi1.max()))*255
    image_suanzi2 = (image_suanzi2/float(image_suanzi2.max()))*255
    
    # 为了使看清边缘检测结果,将大于灰度平均值的灰度变成255(白色)
    image_suanzi1[image_suanzi1>image_suanzi1.mean()] = 255
    image_suanzi2[image_suanzi2>image_suanzi2.mean()] = 255
    
    # 显示图像
    plt.subplot(2,1,1)
    plt.imshow(image_array,cmap=cm.gray)
    plt.axis("off")
    plt.subplot(2,2,3)
    plt.imshow(image_suanzi1,cmap=cm.gray)
    plt.axis("off")
    plt.subplot(2,2,4)
    plt.imshow(image_suanzi2,cmap=cm.gray)
    plt.axis("off")
    plt.show()
    

    2.1.4 基于模板的手势检测方法

    基于模版的手势分割方法需要建立手势模版数据库,数据库记录了不同手势不同场景下的手势模版。计算某个图像块和数据库中各个手势的距离,然后使用滑动窗遍历整幅图像进行相同的计算,从而在图像正确的位置找到数据库中的最佳匹配。模版匹配对环境和噪声鲁棒,但是数据库需要涵盖各种手型、大小、位置、角度的手势,并且因为需要遍历整个图像进行相同的计算,实时性较差。

    2.1.5 基于机器学习的手势检测方法

    贝叶斯网络,聚类分析,高斯分类器等等也被用来做基于肤色的分割。随机森林是一种集成的分类器,易于训练并且准确率较高,被用在分割和手势识别上。建立肤色分类的模型,并且使用随机森林对像素进行分类,发现随机森林得到的分割结果比上述的方法都要准确.

    3 手部识别

    毫无疑问,深度学习做图像识别在准确度上拥有天然的优势,对手势的识别使用深度学习卷积网络算法效果是非常优秀的。

    3.1 SSD网络

    SSD网络是2016年提出的卷积神经网络,其在物体检测上取得了很好的效果。SSD网络和FCN网络一样,最终的预测结果利用了不同尺度的特征图信息,在不同尺度的特征图上进行检测,大的特征图可以检测小物体,小特征图检测大物体,使用金字塔结构的特征图,从而实现多尺度的检测。网络会对每个检测到物体的检测框进行打分,得到框中物体所属的类别,并且调整边框的比例和位置以适应对象的形状。

    在这里插入图片描述

    3.2 数据集

    我们实验室自己采集的数据集:

    数据集包含了48个手势视频,这些视频是由谷歌眼镜拍摄的,视频中以第一人称视角拍摄了室内室外的多人互动。数据集中包含4个类别的手势:自己的左右手,其他人的左右手。数据集中包含了高质量、像素级别标注的分割数据集和检测框标注数据集,视频中手不受到任何约束,包括了搭积木,下棋,猜谜等活动。

    在这里插入图片描述

    需要数据集的同学可以联系学长获取

    3.3 最终改进的网络结构

    在这里插入图片描述
    在这里插入图片描述

    最后整体实现效果还是不错的:
    在这里插入图片描述

    4 最后

    说明:需要完整的代码和分析报告的同学联系学长获取。
    学长亲自接毕业设计,有需要的同同学:
    (q扣)
    746876041
    在这里插入图片描述

    展开全文
  • 十二星女面对婚外情会说不吗? 新浪首页登录注册 ...苍茫大地博客 ...首页博文目录图片关于我 个人资料 苍茫大地 微博 加好友发纸条 写留言加


    //d5.sina.com.cn/pfpghc2/201705/09/48ef23a57b6b40a08e9d7c8b0ef34c89.jpg
    个人资料
    苍茫大地
    苍茫大地
    博客十周年地图
    • 博客等级:
    • 博客积分:666积分
    • 博客访问:109,528
    • 关注人气:40
    • 获赠金笔:8
    • 赠出金笔:0
    • 荣誉徽章:点亮荣誉勋章兑换图片博主服务兑换私密博文兑换金笔
    正文字体大小:  

    [转载]计算机视觉、机器学习相关领域论文和源代码

     (2013-04-18 22:45:40)
    标签: 

    转载

     

    1.http://www.cvchina.info/2011/09/05/uiuc-cod/

    2.http://blog.csdn.net/zouxy09/article/details/8550952

     

    一、特征提取Feature Extraction:

    ·         SIFT [1] [Demo program][SIFT Library] [VLFeat]

    ·         PCA-SIFT [2] [Project]

    ·         Affine-SIFT [3] [Project]

    ·         SURF [4] [OpenSURF] [Matlab Wrapper]

    ·         Affine Covariant Features [5] [Oxford project]

    ·         MSER [6] [Oxford project] [VLFeat]

    ·         Geometric Blur [7] [Code]

    ·         Local Self-Similarity Descriptor [8] [Oxford implementation]

    ·         Global and Efficient Self-Similarity [9] [Code]

    ·         Histogram of Oriented Graidents [10] [INRIA Object Localization Toolkit] [OLT toolkit for Windows]

    ·         GIST [11] [Project]

    ·         Shape Context [12] [Project]

    ·         Color Descriptor [13] [Project]

    ·         Pyramids of Histograms of Oriented Gradients [Code]

    ·         Space-Time Interest Points (STIP) [14][Project] [Code]

    ·         Boundary Preserving Dense Local Regions [15][Project]

    ·         Weighted Histogram[Code]

    ·         Histogram-based Interest Points Detectors[Paper][Code]

    ·         An OpenCV - C++ implementation of Local Self Similarity Descriptors [Project]

    ·         Fast Sparse Representation with Prototypes[Project]

    ·         Corner Detection [Project]

    ·         AGAST Corner Detector: faster than FAST and even FAST-ER[Project]

    ·         Real-time Facial Feature Detection using Conditional Regression Forests[Project]

    ·         Global and Efficient Self-Similarity for Object Classification and Detection[code]

    ·         WαSH: Weighted α-Shapes for Local Feature Detection[Project]

    ·         HOG[Project]

    ·         Online Selection of Discriminative Tracking Features[Project]

                            

    二、图像分割Image Segmentation:

    ·           Normalized Cut [1] [Matlab code]

    ·           Gerg Mori’ Superpixel code [2] [Matlab code]

    ·           Efficient Graph-based Image Segmentation [3] [C++ code] [Matlab wrapper]

    ·           Mean-Shift Image Segmentation [4] [EDISON C++ code] [Matlab wrapper]

    ·           OWT-UCM Hierarchical Segmentation [5] [Resources]

    ·           Turbepixels [6] [Matlab code 32bit] [Matlab code 64bit] [Updated code]

    ·           Quick-Shift [7] [VLFeat]

    ·           SLIC Superpixels [8] [Project]

    ·           Segmentation by Minimum Code Length [9] [Project]

    ·           Biased Normalized Cut [10] [Project]

    ·           Segmentation Tree [11-12] [Project]

    ·           Entropy Rate Superpixel Segmentation [13] [Code]

    ·           Fast Approximate Energy Minimization via Graph Cuts[Paper][Code]

    ·           Efficient Planar Graph Cuts with Applications in Computer Vision[Paper][Code]

    ·           Isoperimetric Graph Partitioning for Image Segmentation[Paper][Code]

    ·           Random Walks for Image Segmentation[Paper][Code]

    ·           Blossom V: A new implementation of a minimum cost perfect matching algorithm[Code]

    ·           An Experimental Comparison of Min-Cut/Max-Flow Algorithms for Energy Minimization in Computer Vision[Paper][Code]

    ·           Geodesic Star Convexity for Interactive Image Segmentation[Project]

    ·           Contour Detection and Image Segmentation Resources[Project][Code]

    ·           Biased Normalized Cuts[Project]

    ·           Max-flow/min-cut[Project]

    ·           Chan-Vese Segmentation using Level Set[Project]

    ·           A Toolbox of Level Set Methods[Project]

    ·           Re-initialization Free Level Set Evolution via Reaction Diffusion[Project]

    ·           Improved C-V active contour model[Paper][Code]

    ·           A Variational Multiphase Level Set Approach to Simultaneous Segmentation and Bias Correction[Paper][Code]

    ·          Level Set Method Research by Chunming Li[Project]

    ·          ClassCut for Unsupervised Class Segmentation[code]

    ·         SEEDS: Superpixels Extracted via Energy-Driven Sampling [Project][other]

     

    三、目标检测Object Detection:

    ·           A simple object detector with boosting [Project]

    ·           INRIA Object Detection and Localization Toolkit [1] [Project]

    ·           Discriminatively Trained Deformable Part Models [2] [Project]

    ·           Cascade Object Detection with Deformable Part Models [3] [Project]

    ·           Poselet [4] [Project]

    ·           Implicit Shape Model [5] [Project]

    ·           Viola and Jones’s Face Detection [6] [Project]

    ·           Bayesian Modelling of Dyanmic Scenes for Object Detection[Paper][Code]

    ·           Hand detection using multiple proposals[Project]

    ·           Color Constancy, Intrinsic Images, and Shape Estimation[Paper][Code]

    ·           Discriminatively trained deformable part models[Project]

    ·           Gradient Response Maps for Real-Time Detection of Texture-Less Objects: LineMOD [Project]

    ·           Image Processing On Line[Project]

    ·           Robust Optical Flow Estimation[Project]

    ·           Where's Waldo: Matching People in Images of Crowds[Project]

    ·           Scalable Multi-class Object Detection[Project]

    ·           Class-Specific Hough Forests for Object Detection[Project]

    ·         Deformed Lattice Detection In Real-World Images[Project]

    ·         Discriminatively trained deformable part models[Project]

     

    四、显著性检测Saliency Detection:

    ·           Itti, Koch, and Niebur’ saliency detection [1] [Matlab code]

    ·           Frequency-tuned salient region detection [2] [Project]

    ·           Saliency detection using maximum symmetric surround [3] [Project]

    ·           Attention via Information Maximization [4] [Matlab code]

    ·           Context-aware saliency detection [5] [Matlab code]

    ·           Graph-based visual saliency [6] [Matlab code]

    ·           Saliency detection: A spectral residual approach. [7] [Matlab code]

    ·           Segmenting salient objects from images and videos. [8] [Matlab code]

    ·           Saliency Using Natural statistics. [9] [Matlab code]

    ·           Discriminant Saliency for Visual Recognition from Cluttered Scenes. [10] [Code]

    ·           Learning to Predict Where Humans Look [11] [Project]

    ·           Global Contrast based Salient Region Detection [12] [Project]

    ·           Bayesian Saliency via Low and Mid Level Cues[Project]

    ·           Top-Down Visual Saliency via Joint CRF and Dictionary Learning[Paper][Code]

    ·         Saliency Detection: A Spectral Residual Approach[Code]

     

    五、图像分类、聚类Image Classification, Clustering

    ·           Pyramid Match [1] [Project]

    ·           Spatial Pyramid Matching [2] [Code]

    ·           Locality-constrained Linear Coding [3] [Project] [Matlab code]

    ·           Sparse Coding [4] [Project] [Matlab code]

    ·           Texture Classification [5] [Project]

    ·           Multiple Kernels for Image Classification [6] [Project]

    ·           Feature Combination [7] [Project]

    ·           SuperParsing [Code]

    ·           Large Scale Correlation Clustering Optimization[Matlab code]

    ·           Detecting and Sketching the Common[Project]

    ·           Self-Tuning Spectral Clustering[Project][Code]

    ·           User Assisted Separation of Reflections from a Single Image Using a Sparsity Prior[Paper][Code]

    ·           Filters for Texture Classification[Project]

    ·           Multiple Kernel Learning for Image Classification[Project]

    ·          SLIC Superpixels[Project]

     

    六、抠图Image Matting

    ·           A Closed Form Solution to Natural Image Matting [Code]

    ·           Spectral Matting [Project]

    ·           Learning-based Matting [Code]

     

    七、目标跟踪Object Tracking:

    ·           A Forest of Sensors - Tracking Adaptive Background Mixture Models [Project]

    ·           Object Tracking via Partial Least Squares Analysis[Paper][Code]

    ·           Robust Object Tracking with Online Multiple Instance Learning[Paper][Code]

    ·           Online Visual Tracking with Histograms and Articulating Blocks[Project]

    ·           Incremental Learning for Robust Visual Tracking[Project]

    ·           Real-time Compressive Tracking[Project]

    ·           Robust Object Tracking via Sparsity-based Collaborative Model[Project]

    ·           Visual Tracking via Adaptive Structural Local Sparse Appearance Model[Project]

    ·           Online Discriminative Object Tracking with Local Sparse Representation[Paper][Code]

    ·           Superpixel Tracking[Project]

    ·           Learning Hierarchical Image Representation with Sparsity, Saliency and Locality[Paper][Code]

    ·           Online Multiple Support Instance Tracking [Paper][Code]

    ·           Visual Tracking with Online Multiple Instance Learning[Project]

    ·           Object detection and recognition[Project]

    ·           Compressive Sensing Resources[Project]

    ·           Robust Real-Time Visual Tracking using Pixel-Wise Posteriors[Project]

    ·           Tracking-Learning-Detection[Project][OpenTLD/C++ Code]

    ·           the HandVu:vision-based hand gesture interface[Project]

    ·           Learning Probabilistic Non-Linear Latent Variable Models for Tracking Complex Activities[Project]

     

    八、Kinect:

    ·           Kinect toolbox[Project]

    ·           OpenNI[Project]

    ·           zouxy09 CSDN Blog[Resource]

    ·           FingerTracker 手指跟踪[code]

     

    九、3D相关:

    ·           3D Reconstruction of a Moving Object[Paper] [Code]

    ·           Shape From Shading Using Linear Approximation[Code]

    ·           Combining Shape from Shading and Stereo Depth Maps[Project][Code]

    ·           Shape from Shading: A Survey[Paper][Code]

    ·           A Spatio-Temporal Descriptor based on 3D Gradients (HOG3D)[Project][Code]

    ·           Multi-camera Scene Reconstruction via Graph Cuts[Paper][Code]

    ·           A Fast Marching Formulation of Perspective Shape from Shading under Frontal Illumination[Paper][Code]

    ·           Reconstruction:3D Shape, Illumination, Shading, Reflectance, Texture[Project]

    ·           Monocular Tracking of 3D Human Motion with a Coordinated Mixture of Factor Analyzers[Code]

    ·           Learning 3-D Scene Structure from a Single Still Image[Project]

     

    十、机器学习算法:

    ·           Matlab class for computing Approximate Nearest Nieghbor (ANN) [Matlab class providing interface toANN library]

    ·           Random Sampling[code]

    ·           Probabilistic Latent Semantic Analysis (pLSA)[Code]

    ·           FASTANN and FASTCLUSTER for approximate k-means (AKM)[Project]

    ·           Fast Intersection / Additive Kernel SVMs[Project]

    ·           SVM[Code]

    ·           Ensemble learning[Project]

    ·           Deep Learning[Net]

    ·           Deep Learning Methods for Vision[Project]

    ·           Neural Network for Recognition of Handwritten Digits[Project]

    ·           Training a deep autoencoder or a classifier on MNIST digits[Project]

    ·          THE MNIST DATABASE of handwritten digits[Project]

    ·          Ersatz:deep neural networks in the cloud[Project]

    ·          Deep Learning [Project]

    ·          sparseLM : Sparse Levenberg-Marquardt nonlinear least squares in C/C++[Project]

    ·          Weka 3: Data Mining Software in Java[Project]

    ·          Invited talk "A Tutorial on Deep Learning" by Dr. Kai Yu (余凯)[Video]

    ·          CNN - Convolutional neural network class[Matlab Tool]

    ·          Yann LeCun's Publications[Wedsite]

    ·          LeNet-5, convolutional neural networks[Project]

    ·          Training a deep autoencoder or a classifier on MNIST digits[Project]

    ·          Deep Learning 大牛Geoffrey E. Hinton's HomePage[Website]

    ·         Multiple Instance Logistic Discriminant-based Metric Learning (MildML) and Logistic Discriminant-based Metric Learning (LDML)[Code]

    ·         Sparse coding simulation software[Project]

    ·         Visual Recognition and Machine Learning Summer School[Software]

     

    十一、目标、行为识别Object, Action Recognition:

    ·           Action Recognition by Dense Trajectories[Project][Code]

    ·           Action Recognition Using a Distributed Representation of Pose and Appearance[Project]

    ·           Recognition Using Regions[Paper][Code]

    ·           2D Articulated Human Pose Estimation[Project]

    ·           Fast Human Pose Estimation Using Appearance and Motion via Multi-Dimensional Boosting Regression[Paper][Code]

    ·           Estimating Human Pose from Occluded Images[Paper][Code]

    ·           Quasi-dense wide baseline matching[Project]

    ·           ChaLearn Gesture Challenge: Principal motion: PCA-based reconstruction of motion histograms[Project]

    ·           Real Time Head Pose Estimation with Random Regression Forests[Project]

    ·           2D Action Recognition Serves 3D Human Pose Estimation[Project]

    ·           A Hough Transform-Based Voting Framework for Action Recognition[Project]

    ·           Motion Interchange Patterns for Action Recognition in Unconstrained Videos[Project]

    ·         2D articulated human pose estimation software[Project]

    ·         Learning and detecting shape models [code]

    ·         Progressive Search Space Reduction for Human Pose Estimation[Project]

    ·         Learning Non-Rigid 3D Shape from 2D Motion[Project]

     

    十二、图像处理:

    ·         Distance Transforms of Sampled Functions[Project]

    ·         The Computer Vision Homepage[Project]

    ·         Efficient appearance distances between windows[code]

    ·         Image Exploration algorithm[code]

    ·         Motion Magnification 运动放大 [Project]

    ·         Bilateral Filtering for Gray and Color Images 双边滤波器 [Project]

    ·         A Fast Approximation of the Bilateral Filter using a Signal Processing Approach [Project]

                      

    十三、一些实用工具:

    ·           EGT: a Toolbox for Multiple View Geometry and Visual Servoing[Project] [Code]

    ·           a development kit of matlab mex functions for OpenCV library[Project]

    ·           Fast Artificial Neural Network Library[Project]

     

     

    十四、人手及指尖检测与识别:

    ·           finger-detection-and-gesture-recognition [Code]

    ·           Hand and Finger Detection using JavaCV[Project]

    ·           Hand and fingers detection[Code]


     

    十五、场景解释:

    ·           Nonparametric Scene Parsing via Label Transfer [Project]


     

    十六、光流Optical flow:

    ·         High accuracy optical flow using a theory for warping [Project]

    ·         Dense Trajectories Video Description [Project]

    ·         SIFT Flow: Dense Correspondence across Scenes and its Applications[Project]

    ·         KLT: An Implementation of the Kanade-Lucas-Tomasi Feature Tracker [Project]

    ·         Tracking Cars Using Optical Flow[Project]

    ·         Secrets of optical flow estimation and their principles[Project]

    ·         implmentation of the Black and Anandan dense optical flow method[Project]

    ·         Optical Flow Computation[Project]

    ·         Beyond Pixels: Exploring New Representations and Applications for Motion Analysis[Project]

    ·         A Database and Evaluation Methodology for Optical Flow[Project]

    ·         optical flow relative[Project]

    ·         Robust Optical Flow Estimation [Project]

    ·         optical flow[Project]


     

    十七、图像检索Image Retrieval

    ·           Semi-Supervised Distance Metric Learning for Collaborative Image Retrieval [Paper][code]


     

    十八、马尔科夫随机场Markov Random Fields:

    ·         Markov Random Fields for Super-Resolution [Project]

    ·         A Comparative Study of Energy Minimization Methods for Markov Random Fields with Smoothness-Based Priors [Project]


     

    十九、运动检测Motion detection:

    ·         Moving Object Extraction, Using Models or Analysis of Regions [Project]

    ·         Background Subtraction: Experiments and Improvements for ViBe [Project]

    ·         A Self-Organizing Approach to Background Subtraction for Visual Surveillance Applications [Project]

    ·         changedetection.net: A new change detection benchmark dataset[Project]

    ·         ViBe - a powerful technique for background detection and subtraction in video sequences[Project]

    ·         Background Subtraction Program[Project]

    ·         Motion Detection Algorithms[Project]

    ·         Stuttgart Artificial Background Subtraction Dataset[Project]

    ·         Object Detection, Motion Estimation, and Tracking[Project]


     

    0

    0

    阅读(289) 评论 (0) 收藏(1) 转载原文  喜欢 打印举报
    发评论

    登录名: 密码: 找回密码 注册

        

    按住左边滑块,拖动完成上方拼图

    发评论

    以上网友发言只代表其个人观点,不代表新浪网的观点或立场。

    新浪BLOG意见反馈留言板 不良信息反馈 电话:4006900000 提示音后按1键(按当地市话标准计费) 欢迎批评指正

    新浪简介 | About Sina | 广告服务 | 联系我们 | 招聘信息 | 网站律师 | SINA English | 会员注册 | 产品答疑

    新浪公司 版权所有

    //d5.sina.com.cn/pfpghc2/201705/09/48ef23a57b6b40a08e9d7c8b0ef34c89.jpg
    个人资料
    苍茫大地
    苍茫大地
    博客十周年地图
    • 博客等级:
    • 博客积分:666积分
    • 博客访问:109,528
    • 关注人气:40
    • 获赠金笔:8
    • 赠出金笔:0
    • 荣誉徽章:点亮荣誉勋章兑换图片博主服务兑换私密博文兑换金笔
    正文字体大小:  

    [转载]计算机视觉、机器学习相关领域论文和源代码

     (2013-04-18 22:45:40)
    标签: 

    转载

     

    1.http://www.cvchina.info/2011/09/05/uiuc-cod/

    2.http://blog.csdn.net/zouxy09/article/details/8550952

     

    一、特征提取Feature Extraction:

    ·         SIFT [1] [Demo program][SIFT Library] [VLFeat]

    ·         PCA-SIFT [2] [Project]

    ·         Affine-SIFT [3] [Project]

    ·         SURF [4] [OpenSURF] [Matlab Wrapper]

    ·         Affine Covariant Features [5] [Oxford project]

    ·         MSER [6] [Oxford project] [VLFeat]

    ·         Geometric Blur [7] [Code]

    ·         Local Self-Similarity Descriptor [8] [Oxford implementation]

    ·         Global and Efficient Self-Similarity [9] [Code]

    ·         Histogram of Oriented Graidents [10] [INRIA Object Localization Toolkit] [OLT toolkit for Windows]

    ·         GIST [11] [Project]

    ·         Shape Context [12] [Project]

    ·         Color Descriptor [13] [Project]

    ·         Pyramids of Histograms of Oriented Gradients [Code]

    ·         Space-Time Interest Points (STIP) [14][Project] [Code]

    ·         Boundary Preserving Dense Local Regions [15][Project]

    ·         Weighted Histogram[Code]

    ·         Histogram-based Interest Points Detectors[Paper][Code]

    ·         An OpenCV - C++ implementation of Local Self Similarity Descriptors [Project]

    ·         Fast Sparse Representation with Prototypes[Project]

    ·         Corner Detection [Project]

    ·         AGAST Corner Detector: faster than FAST and even FAST-ER[Project]

    ·         Real-time Facial Feature Detection using Conditional Regression Forests[Project]

    ·         Global and Efficient Self-Similarity for Object Classification and Detection[code]

    ·         WαSH: Weighted α-Shapes for Local Feature Detection[Project]

    ·         HOG[Project]

    ·         Online Selection of Discriminative Tracking Features[Project]

                            

    二、图像分割Image Segmentation:

    ·           Normalized Cut [1] [Matlab code]

    ·           Gerg Mori’ Superpixel code [2] [Matlab code]

    ·           Efficient Graph-based Image Segmentation [3] [C++ code] [Matlab wrapper]

    ·           Mean-Shift Image Segmentation [4] [EDISON C++ code] [Matlab wrapper]

    ·           OWT-UCM Hierarchical Segmentation [5] [Resources]

    ·           Turbepixels [6] [Matlab code 32bit] [Matlab code 64bit] [Updated code]

    ·           Quick-Shift [7] [VLFeat]

    ·           SLIC Superpixels [8] [Project]

    ·           Segmentation by Minimum Code Length [9] [Project]

    ·           Biased Normalized Cut [10] [Project]

    ·           Segmentation Tree [11-12] [Project]

    ·           Entropy Rate Superpixel Segmentation [13] [Code]

    ·           Fast Approximate Energy Minimization via Graph Cuts[Paper][Code]

    ·           Efficient Planar Graph Cuts with Applications in Computer Vision[Paper][Code]

    ·           Isoperimetric Graph Partitioning for Image Segmentation[Paper][Code]

    ·           Random Walks for Image Segmentation[Paper][Code]

    ·           Blossom V: A new implementation of a minimum cost perfect matching algorithm[Code]

    ·           An Experimental Comparison of Min-Cut/Max-Flow Algorithms for Energy Minimization in Computer Vision[Paper][Code]

    ·           Geodesic Star Convexity for Interactive Image Segmentation[Project]

    ·           Contour Detection and Image Segmentation Resources[Project][Code]

    ·           Biased Normalized Cuts[Project]

    ·           Max-flow/min-cut[Project]

    ·           Chan-Vese Segmentation using Level Set[Project]

    ·           A Toolbox of Level Set Methods[Project]

    ·           Re-initialization Free Level Set Evolution via Reaction Diffusion[Project]

    ·           Improved C-V active contour model[Paper][Code]

    ·           A Variational Multiphase Level Set Approach to Simultaneous Segmentation and Bias Correction[Paper][Code]

    ·          Level Set Method Research by Chunming Li[Project]

    ·          ClassCut for Unsupervised Class Segmentation[code]

    ·         SEEDS: Superpixels Extracted via Energy-Driven Sampling [Project][other]

     

    三、目标检测Object Detection:

    ·           A simple object detector with boosting [Project]

    ·           INRIA Object Detection and Localization Toolkit [1] [Project]

    ·           Discriminatively Trained Deformable Part Models [2] [Project]

    ·           Cascade Object Detection with Deformable Part Models [3] [Project]

    ·           Poselet [4] [Project]

    ·           Implicit Shape Model [5] [Project]

    ·           Viola and Jones’s Face Detection [6] [Project]

    ·           Bayesian Modelling of Dyanmic Scenes for Object Detection[Paper][Code]

    ·           Hand detection using multiple proposals[Project]

    ·           Color Constancy, Intrinsic Images, and Shape Estimation[Paper][Code]

    ·           Discriminatively trained deformable part models[Project]

    ·           Gradient Response Maps for Real-Time Detection of Texture-Less Objects: LineMOD [Project]

    ·           Image Processing On Line[Project]

    ·           Robust Optical Flow Estimation[Project]

    ·           Where's Waldo: Matching People in Images of Crowds[Project]

    ·           Scalable Multi-class Object Detection[Project]

    ·           Class-Specific Hough Forests for Object Detection[Project]

    ·         Deformed Lattice Detection In Real-World Images[Project]

    ·         Discriminatively trained deformable part models[Project]

     

    四、显著性检测Saliency Detection:

    ·           Itti, Koch, and Niebur’ saliency detection [1] [Matlab code]

    ·           Frequency-tuned salient region detection [2] [Project]

    ·           Saliency detection using maximum symmetric surround [3] [Project]

    ·           Attention via Information Maximization [4] [Matlab code]

    ·           Context-aware saliency detection [5] [Matlab code]

    ·           Graph-based visual saliency [6] [Matlab code]

    ·           Saliency detection: A spectral residual approach. [7] [Matlab code]

    ·           Segmenting salient objects from images and videos. [8] [Matlab code]

    ·           Saliency Using Natural statistics. [9] [Matlab code]

    ·           Discriminant Saliency for Visual Recognition from Cluttered Scenes. [10] [Code]

    ·           Learning to Predict Where Humans Look [11] [Project]

    ·           Global Contrast based Salient Region Detection [12] [Project]

    ·           Bayesian Saliency via Low and Mid Level Cues[Project]

    ·           Top-Down Visual Saliency via Joint CRF and Dictionary Learning[Paper][Code]

    ·         Saliency Detection: A Spectral Residual Approach[Code]

     

    五、图像分类、聚类Image Classification, Clustering

    ·           Pyramid Match [1] [Project]

    ·           Spatial Pyramid Matching [2] [Code]

    ·           Locality-constrained Linear Coding [3] [Project] [Matlab code]

    ·           Sparse Coding [4] [Project] [Matlab code]

    ·           Texture Classification [5] [Project]

    ·           Multiple Kernels for Image Classification [6] [Project]

    ·           Feature Combination [7] [Project]

    ·           SuperParsing [Code]

    ·           Large Scale Correlation Clustering Optimization[Matlab code]

    ·           Detecting and Sketching the Common[Project]

    ·           Self-Tuning Spectral Clustering[Project][Code]

    ·           User Assisted Separation of Reflections from a Single Image Using a Sparsity Prior[Paper][Code]

    ·           Filters for Texture Classification[Project]

    ·           Multiple Kernel Learning for Image Classification[Project]

    ·          SLIC Superpixels[Project]

     

    六、抠图Image Matting

    ·           A Closed Form Solution to Natural Image Matting [Code]

    ·           Spectral Matting [Project]

    ·           Learning-based Matting [Code]

     

    七、目标跟踪Object Tracking:

    ·           A Forest of Sensors - Tracking Adaptive Background Mixture Models [Project]

    ·           Object Tracking via Partial Least Squares Analysis[Paper][Code]

    ·           Robust Object Tracking with Online Multiple Instance Learning[Paper][Code]

    ·           Online Visual Tracking with Histograms and Articulating Blocks[Project]

    ·           Incremental Learning for Robust Visual Tracking[Project]

    ·           Real-time Compressive Tracking[Project]

    ·           Robust Object Tracking via Sparsity-based Collaborative Model[Project]

    ·           Visual Tracking via Adaptive Structural Local Sparse Appearance Model[Project]

    ·           Online Discriminative Object Tracking with Local Sparse Representation[Paper][Code]

    ·           Superpixel Tracking[Project]

    ·           Learning Hierarchical Image Representation with Sparsity, Saliency and Locality[Paper][Code]

    ·           Online Multiple Support Instance Tracking [Paper][Code]

    ·           Visual Tracking with Online Multiple Instance Learning[Project]

    ·           Object detection and recognition[Project]

    ·           Compressive Sensing Resources[Project]

    ·           Robust Real-Time Visual Tracking using Pixel-Wise Posteriors[Project]

    ·           Tracking-Learning-Detection[Project][OpenTLD/C++ Code]

    ·           the HandVu:vision-based hand gesture interface[Project]

    ·           Learning Probabilistic Non-Linear Latent Variable Models for Tracking Complex Activities[Project]

     

    八、Kinect:

    ·           Kinect toolbox[Project]

    ·           OpenNI[Project]

    ·           zouxy09 CSDN Blog[Resource]

    ·           FingerTracker 手指跟踪[code]

     

    九、3D相关:

    ·           3D Reconstruction of a Moving Object[Paper] [Code]

    ·           Shape From Shading Using Linear Approximation[Code]

    ·           Combining Shape from Shading and Stereo Depth Maps[Project][Code]

    ·           Shape from Shading: A Survey[Paper][Code]

    ·           A Spatio-Temporal Descriptor based on 3D Gradients (HOG3D)[Project][Code]

    ·           Multi-camera Scene Reconstruction via Graph Cuts[Paper][Code]

    ·           A Fast Marching Formulation of Perspective Shape from Shading under Frontal Illumination[Paper][Code]

    ·           Reconstruction:3D Shape, Illumination, Shading, Reflectance, Texture[Project]

    ·           Monocular Tracking of 3D Human Motion with a Coordinated Mixture of Factor Analyzers[Code]

    ·           Learning 3-D Scene Structure from a Single Still Image[Project]

     

    十、机器学习算法:

    ·           Matlab class for computing Approximate Nearest Nieghbor (ANN) [Matlab class providing interface toANN library]

    ·           Random Sampling[code]

    ·           Probabilistic Latent Semantic Analysis (pLSA)[Code]

    ·           FASTANN and FASTCLUSTER for approximate k-means (AKM)[Project]

    ·           Fast Intersection / Additive Kernel SVMs[Project]

    ·           SVM[Code]

    ·           Ensemble learning[Project]

    ·           Deep Learning[Net]

    ·           Deep Learning Methods for Vision[Project]

    ·           Neural Network for Recognition of Handwritten Digits[Project]

    ·           Training a deep autoencoder or a classifier on MNIST digits[Project]

    ·          THE MNIST DATABASE of handwritten digits[Project]

    ·          Ersatz:deep neural networks in the cloud[Project]

    ·          Deep Learning [Project]

    ·          sparseLM : Sparse Levenberg-Marquardt nonlinear least squares in C/C++[Project]

    ·          Weka 3: Data Mining Software in Java[Project]

    ·          Invited talk "A Tutorial on Deep Learning" by Dr. Kai Yu (余凯)[Video]

    ·          CNN - Convolutional neural network class[Matlab Tool]

    ·          Yann LeCun's Publications[Wedsite]

    ·          LeNet-5, convolutional neural networks[Project]

    ·          Training a deep autoencoder or a classifier on MNIST digits[Project]

    ·          Deep Learning 大牛Geoffrey E. Hinton's HomePage[Website]

    ·         Multiple Instance Logistic Discriminant-based Metric Learning (MildML) and Logistic Discriminant-based Metric Learning (LDML)[Code]

    ·         Sparse coding simulation software[Project]

    ·         Visual Recognition and Machine Learning Summer School[Software]

     

    十一、目标、行为识别Object, Action Recognition:

    ·           Action Recognition by Dense Trajectories[Project][Code]

    ·           Action Recognition Using a Distributed Representation of Pose and Appearance[Project]

    ·           Recognition Using Regions[Paper][Code]

    ·           2D Articulated Human Pose Estimation[Project]

    ·           Fast Human Pose Estimation Using Appearance and Motion via Multi-Dimensional Boosting Regression[Paper][Code]

    ·           Estimating Human Pose from Occluded Images[Paper][Code]

    ·           Quasi-dense wide baseline matching[Project]

    ·           ChaLearn Gesture Challenge: Principal motion: PCA-based reconstruction of motion histograms[Project]

    ·           Real Time Head Pose Estimation with Random Regression Forests[Project]

    ·           2D Action Recognition Serves 3D Human Pose Estimation[Project]

    ·           A Hough Transform-Based Voting Framework for Action Recognition[Project]

    ·           Motion Interchange Patterns for Action Recognition in Unconstrained Videos[Project]

    ·         2D articulated human pose estimation software[Project]

    ·         Learning and detecting shape models [code]

    ·         Progressive Search Space Reduction for Human Pose Estimation[Project]

    ·         Learning Non-Rigid 3D Shape from 2D Motion[Project]

     

    十二、图像处理:

    ·         Distance Transforms of Sampled Functions[Project]

    ·         The Computer Vision Homepage[Project]

    ·         Efficient appearance distances between windows[code]

    ·         Image Exploration algorithm[code]

    ·         Motion Magnification 运动放大 [Project]

    ·         Bilateral Filtering for Gray and Color Images 双边滤波器 [Project]

    ·         A Fast Approximation of the Bilateral Filter using a Signal Processing Approach [Project]

                      

    十三、一些实用工具:

    ·           EGT: a Toolbox for Multiple View Geometry and Visual Servoing[Project] [Code]

    ·           a development kit of matlab mex functions for OpenCV library[Project]

    ·           Fast Artificial Neural Network Library[Project]

     

     

    十四、人手及指尖检测与识别:

    ·           finger-detection-and-gesture-recognition [Code]

    ·           Hand and Finger Detection using JavaCV[Project]

    ·           Hand and fingers detection[Code]


     

    十五、场景解释:

    ·           Nonparametric Scene Parsing via Label Transfer [Project]


     

    十六、光流Optical flow:

    ·         High accuracy optical flow using a theory for warping [Project]

    ·         Dense Trajectories Video Description [Project]

    ·         SIFT Flow: Dense Correspondence across Scenes and its Applications[Project]

    ·         KLT: An Implementation of the Kanade-Lucas-Tomasi Feature Tracker [Project]

    ·         Tracking Cars Using Optical Flow[Project]

    ·         Secrets of optical flow estimation and their principles[Project]

    ·         implmentation of the Black and Anandan dense optical flow method[Project]

    ·         Optical Flow Computation[Project]

    ·         Beyond Pixels: Exploring New Representations and Applications for Motion Analysis[Project]

    ·         A Database and Evaluation Methodology for Optical Flow[Project]

    ·         optical flow relative[Project]

    ·         Robust Optical Flow Estimation [Project]

    ·         optical flow[Project]


     

    十七、图像检索Image Retrieval

    ·           Semi-Supervised Distance Metric Learning for Collaborative Image Retrieval [Paper][code]


     

    十八、马尔科夫随机场Markov Random Fields:

    ·         Markov Random Fields for Super-Resolution [Project]

    ·         A Comparative Study of Energy Minimization Methods for Markov Random Fields with Smoothness-Based Priors [Project]


     

    十九、运动检测Motion detection:

    ·         Moving Object Extraction, Using Models or Analysis of Regions [Project]

    ·         Background Subtraction: Experiments and Improvements for ViBe [Project]

    ·         A Self-Organizing Approach to Background Subtraction for Visual Surveillance Applications [Project]

    ·         changedetection.net: A new change detection benchmark dataset[Project]

    ·         ViBe - a powerful technique for background detection and subtraction in video sequences[Project]

    ·         Background Subtraction Program[Project]

    ·         Motion Detection Algorithms[Project]

    ·         Stuttgart Artificial Background Subtraction Dataset[Project]

    ·         Object Detection, Motion Estimation, and Tracking[Project]


     

    0

    0

    阅读(289) 评论 (0) 收藏(1) 转载原文  喜欢 打印举报
    发评论

    登录名: 密码: 找回密码 注册

        

    按住左边滑块,拖动完成上方拼图

    发评论

    以上网友发言只代表其个人观点,不代表新浪网的观点或立场。

    新浪BLOG意见反馈留言板 不良信息反馈 电话:4006900000 提示音后按1键(按当地市话标准计费) 欢迎批评指正

    新浪简介 | About Sina | 广告服务 | 联系我们 | 招聘信息 | 网站律师 | SINA English | 会员注册 | 产品答疑

    新浪公司 版权所有

    展开全文
  • 机器视觉与脑神经科学

    千次阅读 2012-08-28 12:22:18
    现在交叉学科发展让机器视觉不止满足于算法提升发明,很多人试图从生物、神经等学科解释或提出CV里模型。Itti大牛Saliency模型就是基于神经科学提出(附其论文网址...
  • 如果你有什么问题,希望跟我能够一起交流,除了通过博客交流外,欢迎你加入我QQ群,一起交流有关于机器学习、深度学习、计算机视觉有关内容。目前我处于广泛涉猎阶段,希望我们能够一起沟通。下图是我群二维码:...
  • 关于机器学习、深度学习及计算机视觉入门论文和书籍阅读笔记。机器学习 3 监督学习 3 回归 3 分类 4 无监督学习 4 聚类 4 深度学习 4 计算机视觉 14 入门基础与图像相关 14 图像预处理 16 坐标变换 16 灰度映射 16 ...
  • 机械手姿态识别的立体视觉匹配,关于机器视觉的毕业论文,关于机器人的设计
  • 重要的关于机器人视觉的核心论文,包含机器视觉的重要算法,经典之作。
  • 一篇关于机器视觉和目标检测的论文。 在做目标识别的时候有帮助。
  • ** 基于图像的视觉伺服与基于位置的视觉伺服 ** 首先说,基于图像的视觉伺服与基于位置的视觉伺服主要表现形式在于图像雅可比矩阵的构建机器表现形式。 其实,关于视觉伺服的一些知识,还是有...------基于视觉的伺服
  • 关于,,,和论文的类似集合以及实现。 2020年 知识密集型梯度提升统一框架:利用人类专家开发嘈杂稀疏域(AAAI 2020) Harsha Kokel,Phillip Odom,Shuo Yang,Sraraam Natarajan 实用联合梯度提升决策树...
  • 作者具有在生产计算机视觉系统上工作和参与竞争性机器学习经验。 许多核心团队成员是Kaggle大师和大师。 该库工业,深度学习研究,机器学习竞赛和开源项目。 目录 s | | | | | 安装 相册化需要Python ...
  • 我们的论文机器学习云API是否正确使用? (#421)”既包括关于ML-API滥用的有组织的数据库,也包括我们开发的工具/检查程序。 我们选择要求“可重用”和“可用”徽章,我们希望该工件可以激励并帮助将来的研究...
  • 关于,,,和论文的类似集合以及实现。 2020年 DTCA:可解释索赔验证基于决策树共同注意网络(ACL 2020) 吴连伟,袁Yuan,赵永强,梁浩,安布琳·纳齐尔 隐私保护梯度提升决策树(AAAI 2020) 李勤彬,吴...
  • 轮毂识别论文.zip

    2020-03-05 15:20:00
    东北大学赵玉良老师关于轮毂识别的一些研究论文。 1、面向柔性自动化生产线的汽车轮毂识别系统 2、汽车轮毂在线识别系统的研究 3、基于机器视觉的汽车轮毂识别系统
  • 图像分析与机器视觉课程作业,是一篇关于行人重识别的论文《Joint Discriminative and Generative Learning for Person Re-identification》的解读报告。
  • 关于顶级会议,这里有一份参考: ...我比较关注是ICCV, CVPR, NIPS, ICML,在B站上关注“极市平台”,在...专栏文章,可以找到“计算机视觉顶会文章解读汇总(CVPR/ECCV/ICCV/NIPS)”,查看近四年相关论文。 ...
  • 突出 ,而衰减不需要特征 ,它目的主要是提高图像的视觉质量或凸现某些特征信息 ,使得处理后 图像对某些特定应用比原来图像更加有效[ 2 ] .因此此类图像处理技术在医学、 遥感、 微生物、 刑侦以及 军事等...
  • 公众号:【深度学习技术前沿】,致力于目标检测、图像分类、点云与语义分割、人脸识别、目标跟踪、机器视觉、模型剪枝与压缩、神经网络架构搜索、文本分类、情感分析、知识图谱、强化学习、NAS、GAN等领域的论文研究...

空空如也

空空如也

1 2 3 4 5 6
收藏数 105
精华内容 42
关键字:

关于机器视觉的论文