精华内容
下载资源
问答
  • 主要讲述人体行为识别的基础流程,归纳了人体行为识别常用的数据集,总结了时域分割的发展现状和常用的方法,讲解了人体行为识别比较经典的方法,并归纳了人体行为识别最新、最热的深度学习方法。引入了动作分割,再...
  • 运动人体检测和行为识别涉及广泛,包括人工智能、计算机视觉、模式识别等,人体行为识别在医疗、商业、军事中具有重要的应用价值,为探究良好的人体行为识别方法,本文引入傅里叶-隐马尔可夫模型进行相关分析,在...
  • 系统利用优化算法对数据实现最优估计,并依据传感器信噪比对优化数据进一步修正,之后在系统设定传感器信任级别和融合权重基础上完成人体行为识别。实验结果表明,本文算法可以提高数据空间精度和平滑度,可对...
  • 主要讲述人体行为识别的基础流程,归纳了人体行为识别常用的数据集,总结了时域分割的发展现状和常用的方法,讲解了人体行为识别比较经典的方法,并归纳了人体行为识别最新、最热的深度学习方法。引入了动作分割,再...
  • 人体行为识别与理解

    2016-04-27 11:03:54
    人体行为识别与理解逐渐成为如图像分析、人机交互、视频检索以及智能监控等领域的基础保障,其广泛的应用前景以及潜在的社会、经济价值,已使其成为计算机视觉分析领域中备受关注的前沿方向。在各种人体行为识别方法...
  • 基于CNN与VLAD的人体行为识别研究,王冬雪,张磊,人体行为识别是很多实际应用关键技术,例如视频监控、人机交互、虚拟现实和视频检索等,所以智能的人体行为识别技术有着很高
  • 基于概率融合的人体行为识别方法,李阳,,基于无线传感器网络的人体行为识别,特别是穿戴式行为识别,在环境智能、健康监护等众多领域应用非常广泛,受到了研究人员越来越
  • 提出了一种基于特征级融合运动人体行为识别方法。应用背景差分法和阴影消除技术获得运动人体区域和人体轮廓; 采用R变换提取人体区域特征, 采用小波描述子提取人体轮廓特征; 然后将这两种具有一定互补性特征采用K...
  • 基于CNN和VLAD的人体行为识别研究

    千次阅读 2018-03-10 10:53:18
    人体行为识别在科技、生活中有着广泛的应用,如视频监控、人机交互、虚拟现实和视频检索等,因此智能的人体识别技术具有很高的研究价值和应用前景,特别是现今视频数据呈指数增长。相对于传统的人工特征方法,CNN...

          人体行为识别在科技、生活中有着广泛的应用,如视频监控、人机交互、虚拟现实和视频检索等,因此智能的人体识别技术具有很高的研究价值和应用前景,特别是现今视频数据呈指数增长。相对于传统的人工特征方法,CNN特征在对原始数据的特征表达方面有着绝对的优势,已经逐渐取代了以HOG和SIFT等人工特征成为主流的特征提取方法。VLAD(Vector of Aggragate Locally Descriptor)是一种能将尺寸不同的视频特征数据表示成尺寸相同的特征向量,通过VLAD特征表示可以使视频特征数据满足一般分类器的输入要求并得到分类结果。

         下面介绍几个常用的数据集:

    1.1 KTH

    介绍:视频数据集包括六种动作(走、慢跑、快跑、拳击、挥手和鼓掌),所有动作由25个人分别演示,并且融合了四种场景进行演示,一共有25 \times 6 \times 4 = 600个AVI视频文件。

    1.2 Weizmaan

    介绍:一共有90个视频文件,由9个人展示,每个人展示十种动作。

    1.3 HOHA

    介绍:从电影中采集的真实的人类活动。

    1.4 Keck Gesture

    介绍:包含14中不同手势(军用信号),使用彩色相机拍摄,分辨率为 640 \times 480,每个手势都有三个人演示,每个视频序列中,一个人重复演示三次同样的手势,训练的一共有3 \times 3 \times 14 = 126个视频序列。并且拍摄角度固定背景也固定。测试的一共4 \times 3 \times 14 = 168个视频序列,并且使用运动相机拍摄并且处于杂乱且有移动物体的背景中。视频格式为AVI。

    1.5 MSR action

     数据集包含16个视频序列,并且一共有63个动作,每一个视频序列包含复合动作,一些序列不同人的不同动作,同时有室内和室外场景,所有的视频都是在杂乱并且移动的背景中。视频分辨率为320 \times 240,帧率为15fps,视频序列的长度在32~76秒之间

    1.6 YouTube Action    

    介绍:包含11种动作类,对于每一类动作,视频分为25组, 每一组有4个动作(分在同一组的视频有着一些共同的特征)

    1.7 UT-Interaction

    介绍:提供了一个人-人交互的数据集。包括6类动作,一共有20个视频序列(时长约1分钟),分辨率为720 \times 480,帧率30fps。

    1.8 UCF50

    介绍:YouTube Action的拓展。

    1.9 UCF101

    介绍:UCF50的拓展。

         王冬雪提出了一种CNN特征提取结合VLAD特征表示的人体行为识别方法,并在Youtobe数据库上进行验证,并取得了较高的识别准确率,证明了CNN结合VLAD是一个十分有效的人体行为识别方法。详见:

    中国科技论文在线
    http://www.paper.edu.cn/releasepaper/content/201803-35

    展开全文
  • 基于CNN特征与HMM时序建模的人体行为识别研究,王冬雪,张磊,随着视频总量和类别数量迅速增长,智能化视频分析方法已经成为许多实际应用核心技术,例如异常监控、医疗诊断和视频检索
  • 导言:由上一篇博客方法实现人体行为识别,准确率高,但缺陷在于速度慢,最大原因在于经典two-stream的人体行为识别均使用光流图作为temporal net输入。光流法速度慢,在应用中无法实时。这篇博客引用论文 ...

    导言:由上一篇博客的方法实现人体行为识别,准确率高,但缺陷在于速度慢,最大的原因在于经典的two-stream的人体行为识别均使用光流图作为temporal net的输入。光流法速度慢,在应用中无法实时。

    这篇博客引用论文

    Real-time Action Recognition with Enhanced Motion Vector CNNs——–Bowen Zhang, Limin Wang, Zhe Wang, Yu Qiao, Hanli Wang

    MotionVector来替代optical flow可以极大的提升速度。MotionVector原本用于视频压缩,以便视频传输到指定端后解压。论文中使用MotionVector作为运动特征来使用。但是速度快带来的缺陷是图片精度低,与光流图的点状形式存在不同,运动向量图以块状存在,因此图片不清楚,噪声多,势必带来识别准确率的下降。

    该网络的核心思想是通过使用optical flow训练好的OF-CNN指导MV-CNN的训练。该transfer knowledge思想来自于Hinton大神的一篇论文:

    Distilling the knowledge in neural network

    论文中使用了两种方法来防止精度过度下降。

    1.使用Teacher Initialization进行初始化。即使用opticalflow的model进行初始化,再用motion vector进行fine-tune.

    2.使用监督性transfer。即定义一种新的loss。该loss称之为Teacher superivision loss(TSL)。使用softmax loss 和TSL共同监督网络。knowledge transfer

    TSL公式如下这里写图片描述

    PT(i)代表optical flow在fc layer的值除以Temp,并经过softmax的输出。Ps(i)是MV-CNN的softmax输出(不用除以TEMP)。TEMP是来自于Hinton的论文,称之为temperature (to soften the next-to-last layer output)。

    MV-CNN网络本身的LOSS,即普通的softmax:

    这里写图片描述

    最终的LOSS为

    这里写图片描述
    其中w是权重,一般设置为4,Temp一般为w的一半,即2。

    论文重点就这两个,其最终的结果是略次于two-stream的方法,比C3D强。

    我的实验:

    由于前两天刚完成VGG的two-stream Action recognition,因此直接使用VGG完成这篇论文的部分实验。仅仅做了如下改变

    1. 将optical flow换成motion vector。其中出了一个bug: motion vector有的视频的图片数量小于光流法,原因在于不是每一帧都包含motion vector,有的帧提取不出运动向量,即I-frame,因此可能出现丢帧的情况。在本例中,我发现有的视频最后一帧和最后一帧无法提取出运动向量。因此少这两帧。如果是中间帧缺失,程序会讲上一帧的图像复制到当前帧。因此:将训练文件中的图片个数进行修改,修改到与Motion vector一致。
    2. 换pretrain model,换成optical-CNN训练完成的model。
    3. 换学习率,增大学习率,与论文中一致,不过发现迭代次数不需要太多,stepvalue大概一万就可以,下降三次即可收敛完毕。
      补充:我的测试是在python下进行的,因此速度测试存在一个问题,这个问题是矩阵赋值的速度极大的影响了整个网络的运行速度。比如图片的crop一定会用矩阵赋值,经过测试,crop图片中心进行测试,caffe模型的运行时间是0.1s,而crop赋值达到0.06s。而作者是matlab,因此矩阵赋值的速度远远大于没有用mkl优化的numpy赋值。速度测试一直耽搁着,等解决了会再更新。

    实验结果:temporal的Training Acc:64.6%,测试Acc:79.78%。加入spatial net(与上一篇博客的model一样)后的ACC:84.985%。

    反思:最终的结果不能令人满意,我的temporal Accuracy超过论文中的79.3%,而最终的combination Acc:86.6%。超过我大概有1.6%。我的网络比他深,始终想不出有什么原因会导致结合准确率低于他。等以后有思路了,一定会更新。

    展开全文
  • 基于可穿戴传感器的人体行为活动的数据采集与识别,谭海清,张雷,人体行为识别技术旨在感知行为数据来识别行为类别,拥有广阔的应用前景并受到了广泛的学术关注,被用于移动健康看护、随身运动监
  • 针对随机森林算法静态性、容易陷入局部最优等问题,提出了一种蜜蜂交配优化...实验结果表明:该算法能有效地识别六种行为,具有较高分类预测准确率和行为识别率,且具有较强稳定性、鲁棒性、全局寻优和抗噪声能力。
  • 传统人体动作识别分类器对异常值比较敏感,容易受固有噪声影响,这会导致严重类失衡问题,所以相似的人体行为可能存在很大类内差异。提出一种基于能量最小二乘双分界面支持向量机(ELS-TSVM)人体动作识别算法...
  • 一个卷积map某一位置值是通过卷积上一层三个连续同一个位置局部感受野得到。 3D CNN架构包含一个硬连线hardwired层、3个卷积层、2个下采样层和一个全连接层。每个3D卷积核卷积立方体是连续7帧...

    PS:应该是最早在行为识别中使用3D卷积。

    3D Convolutional Neural Networks for Human Action Recognition

    一个卷积map的某一位置的值是通过卷积上一层的三个连续的帧的同一个位置的局部感受野得到的。

    3D CNN架构包含一个硬连线hardwired层、3个卷积层、2个下采样层和一个全连接层。每个3D卷积核卷积的立方体是连续7帧,每帧patch大小是60x40;

    1)应用了一个固定的hardwired的核去对原始的帧进行处理,产生多个通道的信息,然后对多个通道分别处理。最后再将所有通道的信息组合起来得到最终的特征描述。这个实线层实际上是编码了我们对特征的先验知识,这比随机初始化性能要好。

    2)每帧提取五个通道的信息,分别是:灰度、xy方向的梯度,xy方向的光流。其中,前面三个都可以每帧都计算。然后水平和垂直方向的光流场需要两个连续帧才确定。所以是7x3 + (7-1)x2=33个特征maps。

     

    3) 然后用一个7x7x3的3D卷积核(7x7在空间,3是时间维)在五个通道的每一个通道分别进行卷积(这里是每个通道单独处理,处理完再叠在一起)。为了增加特征map的个数(实际上就是提取不同的特征),我们在每一个位置都采用两个不同的卷积核,这样在C2层的两个特征maps组中,每组都包含23个特征maps。23是(7-3+1)x3+(6-3+1)x2前面那个是:七个连续帧,其灰度、x和y方向的梯度这三个通道都分别有7帧,然后水平和垂直方向的光流场都只有6帧。54x34是(60-7+1)x(40-7+1)。

    4)maxpooling:这里跟2D的CNN一样,只改变map空间尺寸,通道信息不会改变。

    5)C6层:C6层包含有128个特征map,每个特征图由S5层中所有78(13x6)个特征图全连接计算得到,每个特征map尺寸为1x1,也就是一个值了,而这个就是最终的特征向量了,共128维,维度数等于需要分类的类别数量。

     

     

    展开全文
  • 人体识别是计算机视觉领域的一大类热点问题,其研究内容涵盖了人体的监测与跟踪、手势识别、动作识别、人脸识别、性别识别行为与事件识别等,有着非常广泛的应用价值。随机森林以它自身固有的特点和优良的分类效果...

    人体识别

    摘 要

    人体识别是计算机视觉领域的一大类热点问题,其研究内容涵盖了人体的监测与跟踪、手势识别、动作识别、人脸识别、性别识别和行为与事件识别等,有着非常广泛的应用价值。随机森林以它自身固有的特点和优良的分类效果在众多的机器学习算法中脱颖而出。随机森林算法的实质是一种树预测器的组合,其中每一棵树都依赖于一个随机向量,森林中的所有的向量都是独立同分布的。本文简单介绍了随机森林的原理,并对近几年来随机森林在姿势识别和人脸识别中的应用进行讨论。

    1.人体识别概述

    人体识别是计算机视觉领域的一大类热点问题,其研究内容涵盖了人体的监测与跟踪、手势识别、动作识别、人脸识别、性别识别和行为与事件识别等。其研究方法几乎囊括了所有的模式识别问题的理论与技术,例如统计理论,变换理论,上下文相关性,分类与聚类,机器学习,模板匹配,滤波等。人体识别有着非常广泛的应用价值。

    绝大多数人脸识别算法和人脸表情分析算法在提取人脸特征之前,需要根据人脸关键点的位置(如眼角,嘴角)进行人脸的几何归一化处理。即使在已知人脸粗略位置的情况下,人脸关键点精确定位仍然是一个很困难的问题,这主要由外界干扰和人脸本身的形变造成。

    当前比较流行的算法有:基于启发式规则的方法、主成分分析(PCA)、独立元分析(ICA)、基于K-L 变换、弹性图匹配等。

    2.随机森林综述

    随机森林顾名思义,使用随机的方式建立一个森林,森林里面有很多的决策树组成,随机森林的每一棵决策树之间是没有关联的。在得到森林之后,当有一个新的输入样本进入的死后,就让森林的每一棵决策树分别进行一下判断,看看这个样本应该属于哪一类(对于分类算法),然后看看哪一类能被选择最多,就预测这个样本为那一类。

    随机森林是一种统计学习理论,其随机有两个方面:首先是在训练的每一轮中,都是对原始样本集有放回的抽取固定数目的样本点,形成k个互不相同的样本集。第二点是:对于每一个决策树的建立是从总的属性中随机抽取一定量的属性作分裂属性集,这样对于k个树分类器均是不相同的。由随机生成的k个决策树组成了随机森林。

    对于每一个决策树来讲,其分裂属性是不断的选取具有最大信息增益的属性进行排列。整个随机森林建立后,最终的分类标准采用投票机制得到可能性最高的结果。

    下图是随机森林构建的过程:

    大数据图1 随机森林构建过程

    3.随机森林在人体识别中的应用

    3.1 随机森林应用于姿势识别

    以[1]一文来讨论,论文中所涉及到的人体识别过程主要分为两步,首先是,身体部位标记:对于从单张景深图像中对人体进行分段,并标记出关键节点。之后进行身体关节定位,将标记的各个人体部分重新映射到三维空间中,对关键节点形成高可靠的空间定位。

    大数据
    图2 深度图像-身体部位标记-关节投影

    文的最主要贡献在于将姿势识别的问题转化成了物体识别的问题,通过对身体不同部位的空间位置的确定来实现,做到了低计算消耗和高精确度。在身体部位标记的过程中,将问题转化成了对每个像素的分类问题,对于每个像素点,从景深的角度来确定该点的局域梯度特征。该特征是点特征与梯度特征的良好结合。
    举个例子,对于不同点的相同属性值的判别,如下图,图a中的两个测量点的像素偏移间均具有较大的景深差,而图b中的景深差则明显很小。由此看出,不同位置像素点的特征值是有明显差别的,这就是分类的基础。

    大数据图3 景深图像特质示例

    大数据

    文中对于决策树的分裂属性的选择来说。由于某两个像素点、某些图像特征选取的随意性,将形成大量的备选划分形式,选择对于所有抽样像素对于不同的分裂属性划分前后的信息熵增益进行比较,选取最大的一组ψ=(θ, τ)作为当前分裂节点。(信息增益与该图像块最终是否正确地分类相关,即图像块归属于正确的关键特征点区域的概率。)

    大数据图4 决策时分类说明

    大数据决策树的建立后,某个叶子节点归属于特定关键特征点区域的概率可以根据训练图像最终分类的情况统计得到,这就是随机森林在实际检测特征点时的最重要依据。

    在人体关节分类中,我们由形成的决策森林,来对每一个像素点的具体关节属性进行判断,并进行颜色分类。随机森林这种基于大量样本统计的方法能够对由于光照、变性等造成的影响,实时地解决关键特征点定位的问题。

    如图所示,是对于景深图像处理后的结果展示。

    大数据
    图5 姿势识别处理结果

    应该这样说,这篇文章在算法的层面对随机森林没有太大的贡献。在划分函数的形式上很简单。这个团队值得称道的地方是通过计算机图形学造出了大量的不同体型不同姿势的各种人体图像,用作训练数据,这也是成为2011年CVPR Best Paper的重要原因。正是因为论文的成果运用于Kinect,在工业界有着巨大的作用,落实到了商用的硬件平台上,推动了随机森林在计算机视觉、多媒体处理上的热潮。

    3.2 随机森林应用于人脸识别

    基于回归森林的脸部特征检测通过分析脸部图像块来定位人脸的关键特征点,在此基础上条件回归森林方法考虑了全局的脸部性质。对于[2]进行分析,这篇论文是2012年CVPR上的论文,本文考虑的是脸部朝向作为全局性质。其主要描述的问题是如何利用条件随机森林,来确定面部10个关键特征点的位置。与之前不同的是,在随机森林的基础上,加入了面部朝向的条件约束。

    大数据

    图6 脸部10个特征点

    对于面部特征标记的问题转化成了对大量图像块的分类问题。类似于人体识别中的局域梯度特征识别。本文中,对于每一个图像块来说,从灰度值、光照补偿、相位变换等图像特征,以及该图像块中心与各个特征点的距离来判断图像块的位置特征。在决策树的分裂属性确定过程,依然使用“最大信息熵增益”原则。

    大数据
    图7 条件随机森林算法说明

    文中提出了更进一步基于条件随机森林的分类方法,即通过设定脸部朝向的约束对决策树分类,在特征检测阶段能够根据脸部朝向选择与之相关的决策树进行回归,提高准确率和降低消耗。此论文还对条件随机森林,即如何通过脸部朝向对决策进行分类进行了说明,但这与随机森林算法没有太大关系,这里就不再继续讨论了。随机森林这种基于大量样本统计的方法能够对由于光照、变性等造成的影响,实时地解决关键特征点定位的问题。

    另一篇文章[3]对于脸部特征标记,提出了精确度更高、成本更低的方法。即,基于结构化输出的随机森林的特征标记方式。文中将面部划分为20个特征点,对于各个特征点来说,不仅有独立的图像块分类标记,还加入了例如,点4,对于其他嘴唇特征点3,18,19的依赖关系的判断。这样的方法使特征点标记准确率大大增加。

    该方法依然是使用随机森林的方法,有所不同的是引入了如式中所示的与依赖节点之间的关系。对于决策树的建立依然是依赖信息熵增益原则来决定,叶子节点不仅能得到特征的独立划分还会得到该特征对依赖特征的贡献,最终特征节点的判断会综合原始投票及空间约束。

    大数据
    图8 脸部特征标记大数据大数据

    图9 决策树依赖关系

    例如当对下图中人脸特征点进行分类时,使用简单的随机森林方法,经过判断会将各个点进行标注,可以看到 红色的点,标注出的鼻子特征。如果利用依赖节点进行判断,鼻子的点会被局限在其他鼻子特征点的周围,进行叠加后,得到了这个结果。显然,对于此节点的判断,利用结构输出的方式,准确度更高了。

    大数据图10 结构化输出结果

    4.随机森林总结

    大量的理论和实证研究都证明了RF具有很高的预测准确率,对异常值和噪声具有很好的容忍度,且不容易出现过拟合。可以说,RF是一种自然的非线性建模工具,是目前数据挖掘算法最热门的前沿研究领域之一。具体来说,它有以下优点:

    1.通过对许多分类器进行组合,它可以产生高准确度的分类器;

    2.它可以处理大量的输入变量;

    3.它可以在决定类别时,评估变量的重要性;

    4.在建造森林时,它可以在内部对于一般化后的误差产生不偏差的估计;

    5.它包含一个好方法可以估计遗失的资料,并且,如果有很大一部分的资料遗失,仍可以维持准确度。

    6.它提供一个实验方法,可以去侦测变量之间的相互作用;

    7.学习过程是很快速的;

    8.对异常值和噪声具有很好的容忍度,且不容易出现过拟合;

    随机森林的缺点:

    1.对于有不同级别的属性的数据,级别划分较多的属性会对随机森林产生更大的影响,所以随机森林在这种数据上产出的属性权值是不可信的;
    2.单棵决策树的预测效果很差:由于随机选择属性,使得单棵决策树的预测效果很差。

    参考文献:
    [1] Shotton, J.; Fitzgibbon, A.; Cook, M.; Sharp, T.; Finocchio, M.; Moore, R.; Kipman, A.; Blake, A., “Real-time human pose recognition in parts from single depth images,”Computer Vision and Pattern Recognition (CVPR), 2011 IEEE Conference on , vol., no., pp.1297,1304, 20-25 June 2011
    [2] Dantone M, Gall J, Fanelli G, et al. Real-time facial feature detection using conditional regression forests[C]//Computer Vision and Pattern Recognition (CVPR), 2012 IEEE Conference on. IEEE, 2012: 2578-2585.
    [3] Heng Yang, Ioannis Patras, “Face Parts Localization Using Structured-output Regression Forests”, ACCV2012, Dajeon, Korea.

    作者:陈楠End.
    展开全文
  • 导言:经典two-stream的人体行为识别均使用光流图作为temporal net输入。光流计算量过大导致光流法速度慢,在应用中无法满足实时性。 这篇博客引用论文 Real-time Action Recognition with Enhanced Motion ...
  • 针对大数据的人体行为识别时实时性差和识别率低问题,提出了优化投影对线性近似稀疏表示分类(OP-LASRC)监督降维算法,与线性近似稀疏表示(LASRC)快速分类算法结合用于大数据行为识别。利用LASRC残差计算...
  • 行为识别 人体骨架检测+LSTM

    万次阅读 多人点赞 2017-03-29 13:16:31
    在人工智能研究领域,这一技能叫人体行为识别,是智能监控、人机交互、机器人等诸多应用的一项基础技术。以电影提到老人智能看护场景为例,智能系统通过实时检测和分析老人行动,判断老人是否正常吃饭、服药、...
  • 咚”和“微信晒步数”等多款备受用户热爱的应用软件,从而也证明了对行为识别系统的研 究具有重要的应用价值。对行为识别系统的研究起源于使用摄像头进行采集图像信息并基于 计算机视觉技术进行行为识别,到如今...
  • 咚”和“微信晒步数”等多款备受用户热爱的应用软件,从而也证明了对行为识别系统的研 究具有重要的应用价值。对行为识别系统的研究起源于使用摄像头进行采集图像信息并基于 计算机视觉技术进行行为识别,到如今...
  • 人体运动行为特征识别在医疗健康、人机接口、体育竞技等诸多领域都有广泛应用。介绍了常见用于运动数据采集传感器和相应方法,简述了运动数据预处理一般手段;介绍了运动数据特征提取过程,重点描述了常见...
  • 基于视频流的运动人体行为识别是一项既具有挑战性同时又非常具有广阔应用前景的研究课题.行为识别是基于人体目标识别和人体跟踪更高级的计算机视觉部分,研究出一种健壮的行为识别算法具有重要的理论意义和广泛...
  • 行为动作识别

    万次阅读 多人点赞 2019-05-23 15:48:56
    因此,如何提高视频中人体行为识别的准确性和快速性,已成为视频分析系统研究中的重点问题。 目前,典型的视频人体行为识别方法主要有:时空兴趣点、密集轨迹等。其中: 时空兴趣点,是通过检测视频中的角点、提取...
  • 老人等特殊人群智能护理是人体行为识别研究新方向。现有行为识别方法在学习样本时需要人工标记样本数量多,在面向特殊人群行为识别应用时存在工作量大、识别率低问题。为此,提出一种主动学习与预测方法,...
  • 针对人体行为最重要motion特征,提出了基于时间上下文二级递推异常行为识别方法.不同于传统深度学习训练方法,本文方法不是直接从图像数据中学习特征,而是把提取形状信息HOG特征作为训练输入.首先提取基于...
  • 摘要:以人类行为识别为基础的环境辅助生活(AAL)系统...本文介绍了红外摄像机在AAL领域的应用,并讨论了红外摄像机在人体动作识别(HAR)中的性能。特别关注的是其中一个最关键的行动-下降。在这篇参考文献中,我们生...
  • 针对人体运动方向的随机特性,研究场景中有多台摄像机时视角无关的行为识别方法。...建立室内多视角行为视频样本库,实验结果表明,利用该方法识别室内运动行为,能够达到视角无关行为识别的目的。
  • 应用计算机视觉相关技术来进行异常行为识别是目前非常热门研究方向,研究过程包括了图像处理、视频分析、机器学习等领域相关技术。对运动目标跟踪、建模以及根据其所处环境对行为进行判断和分类,以及让计算机...

空空如也

空空如也

1 2 3 4 5 6
收藏数 112
精华内容 44
关键字:

人体行为识别的应用