精华内容
下载资源
问答
  • 对近年来人脸识别技术进行了广泛的调研
  • 人脸识别是目前计算机技术研究的热门领域,广泛应用于人们的日常生活,如门禁系统、摄像监视系统、相机 以及智能手机等。传统的人脸识别技术需要经过人工特征提取、特征选择以及分类器选择等一系列复杂步骤,然 而 ...
  • 行业发展情况,适合做PPT参考
  • Loss研究现状 模型名称 Important Insight 笔记 资料 2021年 MegFace 投稿:CVPR2021. 动机 1. 目前的normalization-based方法都倾向于通过对特征向量进行归一化来抑制损失幅度的影响。 2. 而图像的...

    Loss研究现状

    模型名称Important Insight笔记资料
    2021年
    MegFace投稿:CVPR2021.
    动机
    1. 直觉上,在同一类样本中,质量差的样本 理应比 质量好的样本 到类别中心的距离稍远。因为质量好的样本(比如没有任何遮挡的清晰正脸),特征更确定,所以用来表示该类别的特征更加准确。反之,质量差的样本(比如有遮挡的模糊侧脸)不确定性大,用来表示该类别的特征就有很大的不确定性。
    2. 目前,confidence-aware的方法虽然考虑了样本不确定性,然而需要额外的参数量。
    3. 基于angular-based方法虽然计算高效,但是它们没有对样本的质量作出区分。这样一来,类别中心很容易学习到 质量差的样本中 的一些 Instance-Specific 信息,从而使得模型的泛化能力弱,进而难以泛化到 open-world 场景中。
    4. 对不同质量的样本进行区分,并且让同一类别中质量好的样本靠近类别中心而质量差的样本到类别中心距离稍远能够进一步提升模型的泛化能力。这是因为,越靠近类别中心,越能够代表该类的特征。让质量差的样本稍微远离类别中心是让其在代表该类上的话语权尽可能地低,这样可以减小 质量差样本中的噪声 影响,从而提升模型的泛化能力。
    5. 为了实现上述目标,作者提出MegFace。它不仅扩大类间距离,同时让类内样本与类中心呈现一个锥形结构,质量差的样本离中心远,质量好的样本离中心近。同时MegFace不会给模型带来额外的计算量。
    方法
    1. 图2(a)是ArcFace的决策边界情况图,它用来代表目前angular-based的方法。这类方法不会对样本质量做区分,因此各种质量的样本在空间上的排布完全是随机的。而margin是固定的,它只要求所有样本都在决策边界之内就行了。
    2. 这就很容易出现图2(a)这种样本排布情况,而在这种情况下,[小圈(质量好的样本)] 只要进入到决策边界内就不容易再向类中心靠拢了(因为已经完成目标了);而[大圈(质量差的样本)] 因为样本可能出现的范围大,为了保证所有可能出现的位置都进入 决策边界内,[大圈]的中心 就比 [小圈] 的中心 在角度空间上 更容易靠近 类中心向量 W W W。而这是不合理的。
    3. 实际上,为了实现 动机中 说到的目标,我们更希望样本是图2(d)中的这种排列。即,质量越好的样本离类别中心向量 W W W 的角度越近。为了实现这种排列,作者通过 特征向量的幅度 a i a_{i} ai 建立了 [样本质量] 与 [到类别中心的角度距离] 之间的联系,进而让质量好的样本靠近类别中心,质量差的样本到类别中心角度稍远。
    4. 实际上,通过观察图2(d)的排列可以发现一定的规律。
       质量越差的样本(圈越大,因为样本质量越差,不确定性越强,其可能出现在特征空间的区域就越大)
       (1) 到原点的距离越近,离原点的距离就是特征向量的幅值 a_{i}。
       (2) margin越小,也就是决策边界到类别中心向量 W W W 的角度越大。(图2(b)中,圈3的决策边界明显比圈1到类别中心向量的角度大)。
       这样,我们就可以通过 建立 [幅值a_{i}] 、[margin] 以及 [到类别中心的角度] 之间的关系,来约束不同质量的样本呈现图2(d)中的排列方式。    那么,如何建立三者的关系呢?
    5. 作者在ArcFace Loss的基础上,进行了很巧妙地改进设计,就实现了上面的排布。这个公式长这样:
    L i = − log ⁡ e s cos ⁡ ( θ y i + m ( a i ) ) e s cos ⁡ ( θ y i + m ( a i ) ) + ∑ j ≠ y i e s cos ⁡ θ j + λ g g ( a i ) L_{i}=-\log \frac{e^{s \cos \left(\theta_{y_{i}}+m\left(a_{i}\right)\right)}}{e^{s \cos \left(\theta_{y_{i}}+m\left(a_{i}\right)\right)}+\sum_{j \neq y_{i}} e^{s \cos \theta_{j}}}+\lambda_{g} g\left(a_{i}\right) Li=logescos(θyi+m(ai))+j=yiescosθjescos(θyi+m(ai))+λgg(ai)
    其中, a i a_{i} ai 是第 i i i个特征向量的 2-范数(即 幅度)。 m ( a i ) m(a_{i}) m(ai) 是动态的角度margin,它是 m ( a i ) m(a_{i}) m(ai)的单调递增函数。它的作用是将不同质量的样本无限挤压到类中心,同时倒逼质量好的样本幅值增大,质量差的样本幅值减小 g ( a i ) g(a_{i}) g(ai) 是正则化项,它是单调递减函数。它的作用是不让幅值过大过小。 具体来说
    6. 对于质量差的样本,它的不确定性大,所以体现在图2中的圈大。圈[大] --> 决策边界可优化到的极限margin就[小] --> 而margin m ( ⋅ ) m(\cdot) m()是单调递增的函数,这就倒逼 幅值 a i a_{i} ai 变[小]; 当然, a i a_{i} ai 也不能无限小,所以用一个单调递减的正则化项 g ( a i ) g(a_{i}) g(ai) 来约束它。
    7. 对于质量好的样本,它的不确定性大,所以体现在图2中的圈小。 圈[小] --> 决策边界可优化到的极限margin[大] --> 而margin m ( ⋅ ) m(\cdot) m()是单调递增的函数,这就倒逼 幅值 a i a_{i} ai 变[大]。当然, a i a_{i} ai 也不能无限大,所以用一个单调递减的正则化项 g ( a i ) g(a_{i}) g(ai)来约束它。
    8. 这样一来,通过上述的优化方式,质量好的样本 margin 大且幅值大(到原点远),质量差的样本margin小且幅值小(到原点近)。这样就形成了图2(d)的排列方式。
    1. 论文地址
    投稿:.
    动机
    1.
    2.

    1.1.
    2.
    2020年
    Circle Loss投稿:CVPR2020.
    动机
    1. 作者发现一种统一看待分类和对比学习的视角。

    1.1. 【极市】张宇涵-CVPR2020 Oral|Circle Loss,从统一视角提升深度特征学习能力.
    投稿:.
    动机
    1.
    2.

    1.1.
    2.
    2019年
    ArcFace投稿:CVPR2019.
    动机
    1.

    方法
    1. ArcFace就是把 margin m m m 从 CosFace 的
    c o s ( θ 1 ) − m > c o s ( θ 2 ) cos (\theta_{1})-m>cos (\theta_{2}) cos(θ1)m>cos(θ2)
    修改成了
    c o s ( θ 1 + m ) > c o s ( θ 2 ) cos (\theta_{1}+m)>cos (\theta_{2}) cos(θ1+m)>cos(θ2)

    2. 相比CosFace,ArcFace相当于直接对角度加 margin。而CosFace是对 C o s Cos Cos 空间加margin,是间接地对角度加margin。
    3. ArcFace的公式:
    1. 【极市】邓健康-CVPR2019 ArcFace构建高效人脸识别系统
    2018年
    CosFace投稿:CVPR2018.
    动机
    1. (A/L)-Softmax 的决策边界 c o s ( m θ 1 ) = c o s ( θ 2 ) cos(m \theta_{1})=cos(\theta_{2}) cos(mθ1)=cos(θ2) 在训练中比较难优化。
    2. CosFace将决策边界改成 c o s ( θ 1 ) − m = c o s ( θ 2 ) cos( \theta_{1}) -m=cos(\theta_{2}) cos(θ1)m=cos(θ2),保证增大类间角度差异的同时,让模型更容易优化。

    方法
    1. 我们从softmax loss开始。
    L s = 1 N ∑ i = 1 N − log ⁡ e f y i ∑ j = 1 C e f j L_{s}=\frac{1}{N} \sum_{i=1}^{N}-\log \frac{e^{f_{y_{i}}}}{\sum_{j=1}^{C} e^{f_{j}}} Ls=N1i=1Nlogj=1Cefjefyi
    其中,
       f j = W j T x = ∥ W j ∥ ∥ x ∥ cos ⁡ θ j f_{j}=W_{j}^{T} x=\left\|W_{j}\right\|\|x\| \cos \theta_{j} fj=WjTx=Wjxcosθj 可以看成是 样本 x x x类别 j j j 的中心向量 W j W_{j} Wj 之间的余弦距离。
       f y i f_{y_{i}} fyi 就表示样本 x x x 与其对应的类别 y i y_{i} yi 的中心向量的距离。
    2. 要实现正确地分类,就是要让 样本的 [属于其类别的 e f y i e^{f_{y_{i}}} efyi] 尽可能地大于 [不属于其类别的 e f j e^{f_{j}} efj]。
    3. 我们将问题简化成二分类问题。假设 我们有一个样本 x x x 属于类别 j = 1 j=1 j=1 ,根据前面的定义, f j f_{j} fj 表示该样本与 类别中心 j j j的中心向量之间的余弦距离,这样优化的目标就变成让 f 1 f_{1} f1尽可能地大于 f 2 f_{2} f2 (余弦距离,距离越大越相似)
    4. 由于 f j f_{j} fj 同时受到 ∥ W j ∥ \left\|W_{j}\right\| Wj ∥ x ∥ \|x\| x 以及 c o s θ j cos \theta_{j} cosθj 的影响,这样不太好优化。
    5. 为此,作者令 ∥ W j ∥ = 1 \left\|W_{j}\right\|=1 Wj=1, ∥ x ∥ = s \|x\|=s x=s s s s是个定值)。
    6. 这样,样本 x x x 与类别中心 j j j 的距离 f j f_{j} fj 就仅仅由 它们之间的角度 c o s θ j cos \theta_{j} cosθj 决定。
    7. 这样一来, f 1 > f 2 f_{1}>f_{2} f1>f2 就等价于 c o s θ 1 > c o s θ 2 cos \theta_{1}>cos \theta_{2} cosθ1>cosθ2
    8. 原本,softmax 的优化目标是让 f 1 > f 2 f_{1}>f_{2} f1>f2。CosFace将上述目标改进成 f 1 − m > f 2 f_{1}-m>f_{2} f1m>f2;( m m m>0) 。
    9. 这么做就让类内距离更加聚拢。具体来说,原本只要让 [样本与其类别中心的余弦距离 f 1 f_{1} f1] 大于 [样本与其它类别中心的余弦距离 f 2 f_{2} f2] 即可,这比较好实现,因为类内余弦距离本来就容易比类间距离大。    现在要求 f 1 f_{1} f1 不仅要大于 f 2 f_{2} f2还 要大 m m m,小于 m m m都不行,这样就使得优化的条件变得更加苛刻
    10. 这样的好处就是,类间的距离可以充分增大。

    11. CosFace 的 Loss 如下。


    1.
    2.
    2017年
    L-Softmax投稿:CVPR2017.
    动机
    1. Softmax loss无法确保类内的紧凑和类间的疏离。
    2. Large Margin Softmax Loss(简称L-Softmax loss),其主要思想是在标准的Softmax loss中加入了一个角度约束,确保不同类别的样本分界更明显。

    1. 知乎-L-Softmax loss和A-Softmax loss。这篇博文对决策边界讲的很好。1.
    2.
    展开全文
  • 人脸识别国内外现状及发展

    千次阅读 2019-11-05 09:23:02
    分几个方面分别的论述一下人脸识别的技术和产业发展的相关状况。 第一,人脸识别技术的价值在哪里。我们把人脸作为一个生物学特征,作为一个商业化运用,只是备选的一个方案之一。生物学当中,唯一的判断的标准,...

    分几个方面分别的论述一下人脸识别的技术和产业发展的相关状况。 

    第一,人脸识别技术的价值在哪里。我们把人脸作为一个生物学特征,作为一个商业化运用,只是备选的一个方案之一。生物学当中,唯一的判断的标准,其实识别从精准度的角度和不可替代的角度来讲,最精准的是虹膜,但是虹膜的识别采集成本非常高,识别的效率相对不是很高,需要等待的时间。所以这两个条件约束了整个的产业化运用只能局限在相对小众的,对识别要求极高的军工、国防等安全性非常高的远的投入,不适合大范围的推广。 

    第二,指纹。我们知道指纹的唯一性比较强,指纹同时采集成本是比较低的,比对成本也不高。但是为什么指纹没有成为一个特别大的可供支付、刷脸可替代的方案呢?实际上主要的原因是因为指纹的可复制性,是一个静态图像之间的比对,现在我们可以看到淘宝也好,各种各样的大量的指纹贴,指纹膜,可复制的特征,不适合支付。所以指纹现在也大致上被pass了。 

    第 三和第四分别是人脸识别和声音识别技术。这两个在现在横向来相比,采集成本和比对的效率,以及生命特征的唯一性来讲,性价比比较高。所以现阶段来看,人脸识别浮出水面,是有它的道理的,这是它的价值。商业特征的应用场景到底在哪里。 

    人脸识别的应用场景是非常宽泛的,现在主要两块, 一个是金融行业,一个是安保行业 。金融行业,已经从马云的蚂蚁金服演示中看到了场景,通过 刷脸进行支付 ,显然刷脸可以付钱了,为什么不可以签收快递呢,下一步淘宝应该会把淘宝签收快递的功能打通。我相信有一天,我们会收到无人机送来的快递,无人机在你的面前拍一张照片,进行对比,就知道这个用户就是需要的用户,完成整个的支付过程。实际上这种场景,是经过多方面的讨论和认证的。基于这样的场景,是跟第三方的支付认证相关的,包括我们看到的腾讯的银行,第一张远程开卡,就是通过人脸识别的技术,把人证合一进行认证,这样远程开户,远程开卡的功能,在我们的券商,在我们的网络银行上面,应该有广泛的应用。 

    对于安保行业来说,刷脸开门,现阶段,人脸识别的应用应该说达到了一个可具备商业化的水平,我们举个例子,在去年的时候,香港有一个导演叫许鞍华,他在南京地铁中丢了一个他的皮包,这个案件的破获,只花了5个小时。视频监控里面获取了一张照片截图,截到了嫌疑人的照片,是极其模糊的,侧脸的照片,如果肉眼比对,发现不了什么。但是有一家非上市公司,在这里不能提供他的公司名称,他们通过一个图像还原技术,把那个照片还原出可能嫌疑人的样子,清晰照,用这个照片到图库当中比对,锁定嫌疑人的身份,把嫌疑人抓获,只需要了5个小时的时间。现在安防领域的监控,我们可以看到各个省市以及地级市,都在上大量的视频监控,人脸识别的大平台。在整个安防的投入当中,上一代的安防只是静态的记录下来数据,但是下一代的安防,是对实时数据的采集、辨认,就是一个核心的技术,这个技术,人脸识别在其中发挥的作用是很大的。 

    我 们再拓展一下,未来的商业用途,到底有没有第二代人脸识别技术的潜在的应用的场景呢。我们说在未来,应该说原来整个确定身份的身份证,但是证和人的比对需要人工来完成。如果我们直接界定,达到了这样的一个标准,实际上每个人所对应的唯一的ID就是脸部的生物特征。这个识别了以后,所有的地方都可以用刷脸的方式,所有的地方都可以用刷脸去开门,用刷脸去做各种各样的事情。你刷脸的数据,包括你去坐火车、坐飞机、去哪儿吃饭、购物、收快递等等,这些数据都会掌握到人脸识别中,刷脸的数据将取代现在线上的点击量. 

    现在信用卡、银行卡消费的数据,其实有助于知道用户消费习惯和消费数据,做大数据的营销和征信,但是刷脸时代来临之后,这个的价值更大了。有很多张卡,但是只有一张脸,这是唯一的。刷脸数据是2.0时代当中,我们重点看到的。 

    为什么在这个时间段,人脸识别的技术会大范围的爆发出来,大范围的应用起来,成熟度到底怎么样呢?我们首先要界定一下人脸识别技术要达到产品化的应用,是两阶段的过程。 第一阶段,需要获取大量的样本数据,这些数据是用于训练的,训练的是学习算法,这个是深度学习算法,把这些数据和相互人之间的关系提取出来,进行一个特别的比对。耦合度高,超过一定的水平之后,我们会认定这两个人是一个人,但是这个模型是需要投入大量的成本,这个成本包括优化的成本,包括数据训练的成本,包括运算的成本 ,我们当时人脸识别的一个业内的公司,这家公司的创始人,曾经说,人脸识别的技术意味着什么呢?太上老君的炼丹炉,有了这个炉之后,大数据是炉子炼的原料,解决计算能力资源的稀缺。因此这些合在一起,形成了现在人脸识别大爆发的时代,就是我们说的技术上的突破。 

    但是在产业上面的应用来看,目前我们可以看到,美国和以色列的人脸识别,特别是动态识别的水平是国际领先的。全网的实时监控当中,FBI在去年推出了他们的下一代的电子识别系统,总的投入是超过10亿美金的。在美国将来无论是在什么地方犯了事,监控锁定犯罪嫌疑人,进行全网追捕。 

    国内是什么水平呢?顶尖的学术水平,就代表着国内产业发展的阶段。目前主要是三种力量,一个是 清华大学的苏光大教授 ,他是中国的人脸识别之父。第二个是 中科院的自动化所的李教授 ,他早年在微软的亚洲研究院当中获得了非常高的成就,后来到了中科院的自动化所,专攻人脸识别。在奥运会当中,以及后来很多的人脸识别的应用当中,提供了比较好的技术。 第三支就是 香港中文大学的汤晓鸥教授 的团队,每年会进行学术界的比赛,他是高记录的保持者。目前的识别率是超过了人类的脸部识别的总体水平,汤教授帮助讯飞在语音识别领域之后,在人脸识别的领域当中,建立了自己的行业地位。所以国内基本上目前是这样的发展阶段,我们去推导下面的阶段,我们怎么去甄别人脸识别的技术,到底哪一家靠谱,哪一家不靠谱,我们可以提出一些关键的甄别的关键点。这些点在哪里呢? 

    第一,我们要区分的,动态和静态配合式的识别还是非配合式的识别。配合式的就是像蚂蚁金服那样的,需要数据的比对方进行配合,可以很好的去采集正脸的二维的数据。另外,就是非配合式的,非配合式的没有办法对排除方的配合,是需要随机采集的图片进行比对,这个识别的效果会差一些,但是识别的时效性会很高。 
     

    这两种模式当中,我们关注三点。

    第一点,你的人脸建模当中到底提取了多少个特征点进行比对,这个跟我们人脸上面的一些特征是关键节点,每个人的差异很大,而你选取的特征点的数据越多,比对的准确率就会越高。我们也采访了一些专家,他们目前能够做到的特征点的比对,应该是在700个点以上。目前大部分做刷脸的门禁这样系统产品的公司,特征点的选取大概是在50个左右。所以我们去做调研和交流,可以问一下整个公司人脸识别建模当中特征点的数量。


    第二点,人脸识别数据库的数据样本和大小,这是一个非常重要的指标。样本及大小,是我们可供的数据集,这些必须要对人脸,比如说一个人有500张照片,拍的都是他的脸,不同的角度和位置、光线,把这些数据进行合理的清洗,供机器去训练包括比对和识别之后,可以告诉你是识别对了还是识别错了,这样的样本数非常重要,有助于训练,提高模型的准确率。因此可标签的数据样本集的大小,这个大小目前至少是百万以上的级别,才会使得现在识别率能够提升到世界领先的水平,这个也是可以甄别的关键点之一。 

    第三点,是不是你的商业模式能够对你的整个的数据的获取,我们说人脸数据的比对,形成一个 正循环的模式。实际上数据来源,人脸的样本来源,是来源于两个非常重要的渠道,美图秀秀和美颜照相机,这是一个商业的互换,这个数据,因为考虑到做一个脱敏的处理,剩下的只有几百个关键的特征点的数据,其他的都被略去,用脱敏的技术之后,形成了从获取数据到训练模型,再到优化模型,持续的反馈结果,获取新的数据,这样的一个正循环的过程。有了这个以后,你的模型的数据就会获取的很好了,这是商业模式上非常重要的一个指标。 

    如果有了这三个指标之后,应当说同时具备了这三个,可能是在人脸识别领域当中有非常大的领先优势,或者是未来发展潜力的东西。同时我们在直观的性能方面去分析,直观的到底识别的表现上有两个非常重要的指标,一个是识别的准确率,我们界定了刚才说的学术界当中,每年一比的人脸识别大赛,现在基本上测试水平都在95%以上,但是是人和图片之间相互比对,说明是这个人,这算一个,再比对一个,又对了,算第二个。所有的人和照片都是匹配好的,最后正确率在99.2%左右,这是我们说的目前的正常的比对方法。 

    还有一个非常重要的方法,我们看到商业银行和淘宝在内的一些人脸识别的技术,会提出一个 错误率 的问题,这个数据,目前来看可以做到十万分之一的错误率,别人拿着我的身份证去比对,如果机器能够区分出来,是不通过,这是对的。如果机器把我的身份证给别人的时候也通过了,这可能就是一个错误的,错误率要在十万分之一左右才可以,目前能达到这样错误率的公司是屈指可数的,这是一个识别准确率的问题. 

    另外还是在多大样本中可以实现这样的准确率,这个是至关重要的。一个公司里面也就是两三百个人,在这些人当中,挑选出来通过,没有什么难度。但是在公安部的大平台当中,省级的平台当中,都是上亿人的身份证照片中,要准确的挑出来十个或者是一百个候选人,这个范围缩小到这个概率当中,你的准确率能有多大,这是一个很重要的指标。 

    第二点, 识别的速度问题 。同样还是刚才我们说到的样本集的大小决定了识别的速度。本身你在可供比对的样本中,没有很大的数据,比如说是成千上万的,识别的数大家都是差不多,都是在1秒之内作出反映,但是如果在一个上亿的大的样本当中,去把照片准确的识别出来,这样对时间的要求,对效率反映的要求就提高了。所以识别速度是一个很重要的指标。 

    以上我们说了五个指标,我们说这个确实是可以对公司的具体能力和技术进行综合判断的。 

    基于以上我们说的这些,关注的公司是有识别技术的公司,这个识别技术是人脸识别的技术。我们前面讲了,本身国内发言的几支学术界的力量大家非常清楚,来源于哪一支,背靠着哪一支强大的学术团队,研究团队的力量,使得这家公司是一个很好的位置。比如说我们前面讲到的科大讯飞,在汤晓鸥教授的支持下,他们的团队是学术界第一的力量在支持他们,这是一个资源性的优势。比如说川大智胜,这个和李教授他们有密切的合作,同时他们自己在图象识别领域当中,也有自己独特的技术,承担着国家大量的科研基金的项目,同时我们也特别强调一个就是川大智胜的人脸识别技术,是目前我们看到的 人机交互 ,因为这个和二维的平面识别有很大的区别,优势非常明显,因为采集到了五官之间立体曲面之间的结合,所以采集到的数据量更丰富。可供比对的特征也是更多的,我们之前在视频当中找到拍到的侧脸,不清晰的照片,很难去识别出来犯罪嫌疑人到底是谁,是因为我们二代身份证库当中,本身就是只有正脸的可供比对的数据。三代或者是四代身份证采集数据的过程当中生物特征肯定要被提取出来,首先是指纹,三维的人脸识别会更快,三代四代可能就会被提取。 

    一旦需要被提取到三维的人脸的数据,那么这个时候川大智胜作为国内目前唯一一家有产品和技术的公司,面临的是广阔的市场。但是我们同时也要看到,三维人脸识别虽然有非常惊人的优势,同时劣势也是非常明显的,特征点的选取,包括侧脸的选取,是有难度的。同时表情的因素,其实对于数据处理的影响,没有在立体表情的因素那么好,提取的时候效率是偏低的,消耗的数据也非常大。所以现在来看,我们能够看到的应用场景目前还是小范围的,包括像美国对犯罪的有案底的犯人,我们国内目前在监狱当中也逐步的推广,将来全民都要采集,这肯定是一个非常巨大的市场。 同时这家公司在人脸识别公司当中,技术特点和现在持续的对三维人脸识别加码,有一个项目是1.8个亿,要投入到研发当中,国家自然科学基金也已经持续的支持他们三维人脸识别的学术研究的项目,已经支持了很多年。所以在这个领域,应该是到了开花结果的地步。所以这一点,我们特别提示大家要关注这个公司,在技术上确实是有稀缺性的。 

    科大讯飞,就是典型的我们刚才讲的商业模式,可以实现人脸识别数据正循环的公司,是拥有互联网端的入口的。之前在语音的领域当中,讯飞语音云走的就是这样的模式,我获取的是你语音的数据,用你的数据持续的训练我后台的算法,使得他们提升和保持和其他竞争对手的领先优势。这样的话,数据端的循环,从语音的这个领域当中,复制到图像识别,就是人脸识别当中。大家如果关注讯飞,大家可以看到,在上个星期的时候,推出了双重生物特征的识别的因素,双重是什么呢?两重加密以后,确实就是这个人,把出错的概率降到非常低的水平。同时识别,双重加密之后,这个身份验证的过程可以做到数量级上面的提升。 

    有了这样一种开放云的平台之后,讯飞的数据正规化的过程也在逐步的建立,他下一步会和非常多的第三方的应用方合作,包括可以刷脸开锁的智能硬件方面,包括和电话银行,电话客服,还有邮箱去实现他的数据入口的正循环的过程。我们核心的问题就是以上的这样的一些判断的标准来去甄别的。我认为讯飞实际上是非常有希望的人脸识别的公司。我们在报告当中,也提到了讯飞是一个生态级的公司,不光是在人脸识别的这个领域当中有比较强的资源优势和技术优势,以及商业模式的优势。同时在我们整个的人工智能领域当中,讯飞超脑可以不断的用它孵化,基于学习的模式,从语音迁移到现在的图像,下一步迁移到语义当中,不断的做技术的衍生,这样的生态链一旦形成的话,在人工智能产业的地位是不可动摇的。所以人工智能整个的产业,我们想推的是科大讯飞。 

    人脸识别的领域当中,讯飞的优势也是非常明显的,同时我们也是看好川大智胜拥有的三维人脸识别的技术。其他的品牌公司,我们可以看到欧比特收购的公司,在安防领域的人脸识别当中,在监狱当中是超过50%的,在产品化方面也做的非常好。其他的两家,刚刚推出了自己的识别技术,现在了解的信息当中,还没有办法很好的甄别他们现在是否拥有满足我们以上的五个标准。在以后的调研和跟踪当中,我们会对他们的标准进行梳理和进一步的分解。这是对识别类公司的分析. 

    下一个阶段,我们觉得还有比较好的投资机会,除了第一类识别类的,第二类应该是数据资源类的,数据资源目前来看就是视频资源,有比较好的视频资源的公司,可以通过视频资源进行持续的深度学习的算法和优化,也许他自己没有这个技术和能力,但是可以通过技术合作的方式,找到研发团队或者是公司进行合作,共同开发优势。目前在视频资源当中的这些公司进行梳理的话,我觉得东方网力在这个当中步子迈的最前。目前产品端还是没有关于人脸识别成型的产品推出来,但是他的应用是在于多年的视频数据的积累。这个是和后期有密不可分的关系。先收购了广州的安防领域的视频监控的智能化的公司,这个步子一迈出去,布局的意图非常的明显。摄象头公司会往视频的公司侵占,后面的公司将来可能会往存储的环节去挤压,有可能将来会把分析和存储在一个环节当中就完成了,这个时候面临的压力是比较大的,所以转型的动力也是最迫切的,意愿也是最强烈的。 

    所以总体总结下来,现在人脸识别技术大爆发,并不是偶然的,应该说很好的满足了我们讲的人工智能的三大条件。深度学习的算法,大数据和云计算,这三个条件成熟了以后,在拐点到来的时候,大规模的商业化应用是水到渠成的。下一个阶段,基于计算机视觉的应用,在视频监控领域当中,对人的行为模式的识别、跟踪和分析,这些都会成为一个非常大的市场,成熟度还有待于进一步的检验。但是这个市场我们已经都看得到了,所以现在我跟大家探讨人脸识别的产业的发展机会,我觉得其实大家需要关注的不仅仅在于人脸识别技术本身的发展,也不仅仅在于哪几家上市公司拥有哪几项技术,而是看到背后代表的是整个计算机视觉的兴起。 

    人工智能报告当中也提到过,计算机视觉的1.0版本,是对静态图像的识别,2.0版本,肯定是动态视频内容的理解和学习,包括像谷歌的无人驾驶汽车,包括报告里面提到过的以色列的那个公司,也是纳斯达克上市的,他们用计算机视觉的技术实现了汽车的辅助的无人驾驶。在这个领域当中,实际上计算机视觉可供开发的应用非常丰富的。现在还有一个法律的问题,就是允许不允许无人驾驶的汽车上路,合法不合法的问题,大家不用担心这个问题。因为这个公司IPO的时候,这个公司的CEO说过一句话,他说现在还在担心无人驾驶的汽车上路合法不合法,但是我可以肯定的告诉你,十年以后,人开车上路是不合法的,这肯定是一个大的方向和趋势。这就是我从人工智能的领域延伸出来的,人脸识别只是一个点,更多的还有待于大家去一点一点的发掘。

    展开全文
  • 国内人脸识别研究现状

    千次阅读 2012-05-15 22:27:40
    最近几年,在国内掀起了一股图像处理、分析、识别的热潮,而其中的车牌识别和人脸识别无疑是其中的研究热潮。 本人没有做过车牌识别的项目,不便叙述,不过,倒是可以跟大家聊聊最近几年国内在人脸识别领域的一些...

    最近几年,在国内掀起了一股图像处理、分析、识别的热潮,而其中的车牌识别和人脸识别无疑是其中的研究热潮。

    本人没有做过车牌识别的项目,不便叙述,不过,倒是可以跟大家聊聊最近几年国内在人脸识别领域的一些发展情况。

    广义的人脸识别实际包括构建人脸识别系统的一系列相关技术,包括图像采集,人脸定位,预处理,人脸特征提取,模式分类、判决识别等等。当然,还包括相应的摄像机,摄像头等光学设备,以及PC,DSP,ARM等计算平台。毋庸置疑的是,在这当中,基于图像的智能分析(包括人脸定位,预处理,特征提取,模式分类,判决识别扥)是最重要的一个环节。而这个部分,属于模式识别、人工智能、机器学习相结合的一个产物。但就知识面来说,需要对概率论,数理统计,模式识别,模式分类,图像处理,线性代数,随机过程,高等数学等等这些课程有一定的熟悉程度。当然了,如果,你是在学校里面搞科研,matlab是肯定要熟练才行。如果,你是在公司里面搞图像算法方面,编程(一般采用c++)肯定是少不了的。当然,如果你不是专门搞图像算法这部分的,大概了解了解就可以了,如果仅仅是想利用业余兴趣来学习,个人感觉,会非常困难。 人脸识别,是20世纪80年代提出的,不过,国内真正开始做这部分,是20世纪90年代。个人认为,国内最早研究人脸识别的,当属于中科院计算所跟哈工大的一个联合面像实验室。该实验室的高文教授,陈熙林教授,山世光教授,直到今天,都一直活跃在人脸识别领域,更可贵的是,在IEEE上面发表了很多paper。这一点,很值得国内的同行学习。后来,该实验室,成为上海银晨的研发中心,专门为上海银晨做技术研发和技术支持。其次是中科院生物识别研究所的李子青教授,以及下属的中科奥森公司。李子青教授,当年在微软亚洲研究院的时候,就从事人脸识别方面的研究工作。后来,在中科院组建了专门的人脸识别研究团队(当然是他跟他带领的一群博士硕士)。该研究团队,首先提出了基于近红外的人脸识别技术,并将该项人脸识别技术用于08年北京奥运会。同时,基于近红外的人脸识别技术,得到了国际上同行业专家的认同和一致肯定。顺便提一下,李子青教授编辑了一本名为《Handbook of face recognition》的书籍,可以说是目前人脸识别领域,最为全面的一本参考书。接着,是清华大学的丁晓青教授。丁晓青教授在OCR(字符识别)领域,可谓国内第一人。不过,最近几年转行做人脸识别,也是非常有成就的。不说别的,就只从FRVT2006(美国国家标准研究所2006年全球人脸识别供应商系统性能测试)的测试结果来看,丁晓青教授的研究团队(自然也是丁教授跟她的博士、硕士)是唯一一个完成大规模3D人脸识别性能测试的参赛团队。由此可见,在国内人脸识别领域来说,她们的算法,在3D领域,绝对排名第一。不过,国内人脸识别产品市场占有率最高的,是汉王科技的门禁和考勤系统。汉王科技也是中科院下属的一个公司,其人脸识别技术,是采用双摄像头,分别捕获到人脸的信息,从而合成3D人脸图片,然后进行特征提取和相应的识别工作。最后一个,就是深圳的飞瑞斯,该公司最近也在推广其自主开发的人脸识别系统。于前几位不同的是,它们采用了多光源进行补光的策略,从而有效解决了人脸识别中环境干扰的问题。当然,除此之外,也有一些小公司或者单位,也在从事人脸识别方面的研究工作。不过,都没有自主的技术或者产品推出。在这里,就不介绍了。 注意:以上均为本人观点,仅供参考。

    分类: CV相关
    展开全文
  • 总结了该技术在国内外的研究现状及其应用,如基于卷积神经网络(CNN)的人脸识别方法、深度非 线性人脸形状提取方法、基于深度学习的人脸姿态鲁棒性建模、有约束环境中的全自动人脸识别、基于深度学习的视 频监控下的...
  • 人脸识别技术发展现状及未来趋势

    万次阅读 多人点赞 2019-02-20 10:05:40
    人脸识别技术商业化应用领域不断扩张的趋势下,"刷脸"办事正愈发常见。  人脸识别,是基于人的脸部特征信息进行身份识别的一种生物识别技术。用摄像机或摄像头采集含有人脸的图像或视频流,并自动在...

      当前,随着人工智能、物联网等前沿技术的迅速发展,智能时代已悄然到来,"刷脸"逐渐成为了新的风潮。在人脸识别技术商业化应用领域不断扩张的趋势下,"刷脸"办事正愈发常见。

      人脸识别,是基于人的脸部特征信息进行身份识别的一种生物识别技术。用摄像机或摄像头采集含有人脸的图像或视频流,并自动在图像中检测和跟踪人脸,进而对检测到的人脸进行脸部识别的一系列相关技术,通常也叫做人像识别、面部识别。

      刚刚过去的2018年,是我国人脸识别技术全面应用的重要节点,标志着"刷脸"时代的正式到来。

      一、人脸识别技术发展背景

      人脸识别,是基于人的脸部特征信息进行身份识别的一种生物识别技术。除了安防、金融这两大领域外,人脸识别还在交通、教育、医疗、警务、电子商务等诸多场景实现了广泛应用,且呈现出显著应用价值。为了进一步把握人脸识别技术所带来的重大机遇,我国出台了一系列政策予以支撑。

      2015年以来,我国相继出台了《关于银行业金融机构远程开立人民币账户的指导意见(征求意见稿)》、《安全防范视频监控人脸识别系统技术要求》、《信息安全技术网络人脸识别认证系统安全技术要求》等法律法规,为人脸识别技术的应用以及在金融、安防、医疗等领域的普及奠定了重要基础。

      2017年,人工智能首次被写入全国政府报告;同年7月,国务院发布了《新一代人工智能发展规划》;12月,工信部出台了《促进新一代人工智能产业发展三年行动计划(2018-2020年)》,其中对人脸识别有效检出率、正确识别率的提升做出了明确要求。作为人工智能主要细分领域,人脸识别获得的国家政策支持显而易见。

      二、人脸识别技术发展历程

      

      人脸识别最初在20世纪60年代已经有研究人员开始研究,真正进入初级的应用阶段是在90年代后期,发展至今其技术成熟度已经达到较高的程度。整个发展过程可以分为机械识别、半自动化识别、非接触式识别及互联网应用阶段。

      与其他生物识别方式相比,人脸识别优势在于自然性、不被察觉性等特点。自然性即该识别方式同人类进行个体识别时所利用的生物特征相同。指纹识别、虹膜识别等均不具有自然性。不被察觉的特点使该识别方法不易使人抵触,而指纹识别或虹膜识别需利用电子压力传感器或红外线采集指纹、虹膜图像,在采集过程中体验感不佳。目前人脸识别需要解决的难题是在不同场景、脸部遮挡等应用时如何保证识别率。此外,隐私性和安全性也是值得考虑的问题。人脸识别优势明显,未来将成为识别主导技术。具体来说,相比指纹识别、虹膜识别等传统的生物识别方式,优点主要还集中在四点:非接触性、非侵扰性、硬件基础完善和采集快捷便利,可拓展性好。在复杂环境下,人脸识别精度问题得到解决后,预计人脸识别有望快速替代指纹识别成为市场大规模应用的主流识别技术。

      

      三、人脸识别技术研发现状

      截至2018年7月2日,我国人脸识别技术专利申请总量达到10404项。其中,发明专利数最多,达到6589项,占比为63.33%;实用新型专利数其次,为2591项,占比为24.90%;外观、发明授权专利数占比分别为3.54%、8.23%。

      

      从申请专利数量来看,2007-2017年,我国人脸识别专利申请数量总体上呈上升的趋势。尤其是2014年后,人脸识别专利申请数量大幅增多;到2017年,人脸识别专利申请数量达到2847项。

      从公开专利数量来看,2007-2017年,我国人脸识别专利公开数量总体上呈趋势。2017年,我国人脸识别专利公开数量为2698项,达到近年来最大值;截至2018年7月,专利公开数量为2163项。

      四、人脸识别技术应用概况

      2014年是我国人脸识别技术的转折点,使人脸识别技术从理论走向了应用,2018年则是人脸识别技术全面应用的重要节点,"刷脸"时代正式到来。

      目前,从我国人脸识别技术应用来看,主要集中在三大领域:考勤门禁、安防以及金融。

      

      从具体应用来看,主要包含了公共安全领域的刑侦追逃、罪犯识别以及边防安全等;信息安全领域的政府职能领域的电子政务、户籍管理、社会福利和保险;商业企业领域的电子商务、电子货币和支付、考勤、市场营销;场所进出领域的军事机要部门、金融机构的门禁控制和进出管理等。

      

      2018年,人脸识别技术在更多的领域解锁了更多应用,广东省、江苏省、浙江省、河北省、青岛市等地在2018年的高考期间均启用了人脸识别系统;北京大学将人脸识别技术应用到了校园入园人员身份验证领域;北京市人社局也计划在市级公租房将全部安装人脸识别系统,以预防公租房违规转租;滴滴在6月正式上线人脸识别系统……

      从目前我国在人脸识别技术领域领先企业的应用布局来看,安防和金融是相对布局较多的领域,在物流、零售、智能手机、汽车、教育、地产、文娱广告等领域也均开始涉足。

      五、人脸识别未来发展趋势

      首先,人脸识别应用的最广泛领域便是安防行业,不仅给整个安防行业注入了新的生命活力,也进一步开拓了新的发展市场。作为安防市场未来的发展方向的智能视频分析,其中最重要的技术就是人脸识别。

      其二,我国的三维测量技术近年来发展形势较好,而现今3D人脸识别算法正对2D投影的缺陷做了补充,此外对于其中的传统难点,包括人脸旋转、遮挡、相似度等在内的都有了很好的应对,这也成为了人脸识别技术的另一个最为重要的发展路线之一。

      其三,大数据深度学习进一步提升了人脸识别的精确度,这也为2D人脸识别的应用作了一定的突破,将其应用于互联网金融行业当中,能够快速普及金融级应用。

      其四,人脸识别技术由于其便利性、安全性,可在智能家居中用作门禁系统以及鉴权系统,因此智能家居与人脸识别技术的融合是未来发展的重点方向。智能家居中的人脸识别系统是结合嵌入式操作系统和嵌入式硬件平台建立的,加强了人脸识别技术与智能家居应用的结合度,具有概念新、实用性强等特点。

      其五,人脸识别技术是未来基于大数据领域的重要发展方向。现如今公安部门都引入了大数据,这也弥补了传统技术的难点,通过人脸识别技术使得这些照片数据再度存储利用,能够大大提升公安信息化的管理和统筹,这将成为未来人脸识别的主要发展趋势。

    大连市妇科医院 http://yiyuan.120ask.com/dlfk/news/
    展开全文
  • 针对语音驱动人脸动画的关键问题:音视频映射,综述了逐帧分析、多帧分析和逐音素分析的映射方法,同时也梳理了多种脸部模型的思想,动画合成、情感融合、人脸动画评价的方法,及可能的研究发展方向。
  • 近年来,三维人脸识别研究取得了较大进展。相比二维人脸识别,三维人脸识别更具有优势,主要特点是在识别中利用了三维形状数据。该文首先根据三维形状数据的来源,将三维人脸识别分为基于彩色图像的三...
  • 最近几年,在国内掀起了一股图像处理、分析、识别的热潮,而其中的车牌识别和人脸识别无疑是其中的研究热潮。 本人没有做过车牌识别的项目,不便叙述,不过,倒是可以跟大家聊聊最近几年国内在人脸识别领域的一些...
  • 人脸识别技术研究现状综述.pdf
  • 近年来,三维人脸识别研究取得了较大进展.相比 二维人脸识别,三维人脸识别更具有优势,主要特点是在识 别中利用了三维形状数据.
  • 人脸识别研究的背景意义现状及特征提取 方法研究 1 研究背景与意义 . 1 2 国内外研究现状 . 2 人脸识别的研究现状 . 2 人脸识别中稀疏编码的研究现状 . 3 3 人脸的特征提取方法概述 . 5 基于局部特征的方法 . 5 基于...
  • 人脸识别研究的背景意义现状及特征提取 方法研究 1 研究背景与意义 1 2 国内外研究现状 2 2.1 人脸识别的研究现状 2 2.2 人脸识别中稀疏编码的研究现状 3 3 人脸的特征提取方法概述 5 3.1 基于局部特征的方法 5 3.2 ...
  • 本文首先介绍了人脸识别技术的研究背景、国内外研究现状和应用场景;研究了Viola&Jones人脸检测算法的基本原理,并对其中涉及的Haar-like特征、积分图方法、AdaBoost分类器和级联的思想进行了阐述;研究了基于PCA...
  • 人脸识别研究历史分为人脸面部特征人工识别、人脸人机交互识别、人脸机器自动识别3 个阶 段。人脸识别系统包括人脸特征检测与分割、人脸特征规范化、人脸表征和人脸识别4 部分。根据表征方式 的不同, 人脸识别...
  • matlab人脸识别论文

    万次阅读 多人点赞 2019-10-11 17:41:51
    本文设计了一种基于BP神经网络的人脸识别系统,并对其进行了性能分析。该系统首先利用离散小波变换获取包含人脸图像大部分原始信息的低频分量,对图像数据进行降维;再由PCA算法对人脸图像进行主成分特征提取,进--步...
  • 国内人脸识别研究现状 及 进展

    千次阅读 2011-05-04 00:19:00
    人脸识别技术研究与应用的最新进展 经典值得一看 http://wenku.baidu.com/view/4b647c0002020740be1e9b42.html
  • 人脸识别技术的研究现状与展望.pdf
  • 这里有个关于国内#人脸识别#研究现状的博文(http://blog.csdn.net/carson2005/article/details/5829442),大家可以参考一下。 有几处比较不确切的地方,比如: 1,人脸识别提出是在1964年,而不是80年代; ...
  • 人脸识别技术的现状和发展趋势
  • 人脸识别研究

    千次阅读 2019-01-14 13:41:54
    一、发展史1、人脸识别的理解: 人脸识别(Face Recognition)是一种依据人的面部特征(如统计或几何特征等),自动进行身份识别的一种生物识别技术,又称为面像识别、人像识别、相貌识别、面孔识别、面部识别等。...

空空如也

空空如也

1 2 3 4 5 ... 20
收藏数 3,807
精华内容 1,522
关键字:

人脸识别研究现状