• 刚过去的2017年,刷屏科技圈的无疑还是深度学习技术 谷歌翻译全面升级成基于RNN的网络架构 对抗神经网络GAN强化学习的兴起 DeepMind与暴雪达成合作,将AI用来打星际争霸 AlphaGo Zero AlphaZero...

    刚过去的2017年,刷屏科技圈的无疑还是深度学习技术


    谷歌翻译全面升级成基于RNN的网络架构
    对抗神经网络GAN和强化学习的兴起
    DeepMind与暴雪达成合作,将AI用来打星际争霸
    AlphaGo Zero 和AlphaZero的相继问世
    ···


    基于深度学习的各种应用越来越多,Nvidia的GPU越来越值钱,AI创业公司如雨后春笋,谷歌、Facebook、Amazon、BAT等各大公司在AI市场争雄逐利……总之,AI形势似乎一片大好,就连我妈都在畅想着马上能有个AI帮她做饭洗衣服打扫卫生……


    但是,当一项技术被普及到连大部分外行人都能说出几个专有名词的时候,我们就得冷静下来考虑它的泡沫了——千禧年的互联网是这样,16年的VR也是这样——只不过,互联网挺了过来成为了真正的革命性技术,而VR则从泡沫成了泡影。


    如今的深度学习又何尝不是呢?


    出来个Alphago媒体就开始集体高潮,什么“AI会不会取代人类?毁灭世界?”都出来了;人脸识别是普及了但似乎也没什么大的卵用,我们学校宿舍的人脸识别门禁还不是想进就进;AI培训机构满天飞,宛如割韭菜一样收割着市场;而一个自称是搞AI的高大上程序员很可能就是个调参侠;还有宣称“all in AI”的百度李总以身犯险体验无人驾驶,结果被交管局盯上了——无人驾驶面临的最大障碍也许并不在技术上,而是立法和道德上的困难,真是讽刺啊······


    好吧,说了这么多其实并不是在否定深度学习,它取得的成就是有目共睹的,在视觉、推荐、医疗等领域也确实做到了变现。这里要说明的是,这轮依靠大数据和GPU的深度学习技术也许已经走到了尽头。庆幸的是,至少学术界没有盲目乐观:去年年末,这场技术大潮的缔造者Hinton宣布放弃反向传播算法,另起炉灶投入胶囊理论的研究。深度学习所能做到的其实从一开始就决定了,神经网络是一种仿人脑的结构,而反向传播算法却在生物学上很难令人信服,同时黑箱式的调参操作也让深度网络的可解释性大打折扣。


    年初的采访中,李开复说了今年将有大量的AI泡沫破掉。该死的死,该进的进,这轮泡沫的破裂仍会给工业界留下许多东西——强大算力的GPU,大幅提升的图像、语音、推荐系统,逐步培养起来的用户习惯,以及具备工程和学术能力的人才等等,但留下来的这些究竟会给社会带来多大的影响,我们拭目以待吧。


    不同于去年,今年年初引起关注的是另外一样东西——比特币。从去年12月份的历史最高价19800美元/个,到一月份狂跌至8600美元/个,对于经历过数次垂直下跌的比特币而言,这似乎也只是小打小闹。


    比特币实际上是一个构建在P2P网络上的去中心化的加密电子货币系统,这东西摆明了是跟天朝对着干的:一是因为去中心化这个概念对银行、政府这些权力中心地带不是很友好;另一方面比特币的去中心化以及极强的匿名安全性,对贩毒洗钱等犯罪人员是很一颗赛艇的。


    作为一个无辜小市民,虽然感觉错过了比特币就错过了一个亿,但还是不要跟国家对着干的好。而作为一个伪技术宅,我更在意的是比特币背后的底层技术——区块链,这几天学习了一下区块链技术,越发觉得这东西不可思议!可能是比深度学习更具颠覆性的技术!


    2008年11月1日,一个自称中本聪的神秘人在一个隐秘的密码邮件组上发表了一篇论文《Bitcoin: A Peer-to-Peer Electronic Cash System》——比特币就此问世!2009年,中本聪创建了区块链上的第一个区块——创世区块,并在其上挖出了世界上第一枚比特币,一个价值数千亿美元的比特币市场就此拉开帷幕!更具hack色彩的是,这位中本聪至今未曾抛头露面,就连FBI和CIA都拿他没办法,而且他手上持有的独自挖出的150万枚比特币也分文未动!


    越是深入了解区块链,越会发现设计它的精妙之处。实际上,比特币只不过是用来生产区块链的“手段”,而不是“目的”——每挖出一个区块,就给挖出区块的人一定数量的比特币奖励。所以说,区块链的价值远在比特币之上。区块链是一个公共的不可修改的“电子账簿”,网络上的每一比交易都记录在上,这样无需第三方提供的信任服务,网络上的每个人都能在保证安全的基础上实现点对点的交易。区块链的唯一性(即整个网络共同维护同一个电子账簿)是基于一种工作量证明原理,算力高的矿工能产生区块的概率更高,理论上每个人都能充当矿工,而如果有人想要攻击区块链(如伪造一条区块链),就必须拥有比整个网络中大多数节点算力之和还大的算力才能实现攻击(现今超级计算机都不一定有如此计算力),并且持续攻击的难度是随着时间呈指数级增长的。


    不仅是可以用来构建电子货币系统,我们可以想象区块链在许多方面的应用前景:不需要支付宝或微信这样的第三方也能实现安全支付;创建安全匿名的通讯工具;甚至比银行卡更安全的存取钱方式;区块链作为物联网的底层通信基础简直在合适不过了;数字资产、数字票据等在金融领域的应用;有可能颠覆法律行业的智能合约技术·······


    区块链技术代表了现代密码学和互联网结合所能达到的最高成就,它提供了在不可信的不稳定的网络中达成共识的一种方式,远不止是一个公开的可信赖的电子账簿这么简单。它透露的一个深刻思想在于:分布式的群体模式可能远比中央控制要强大。这对于公司、企业、银行甚至是国家的存在方式都是一种挑战。这项技术所能带来的社会变革可能是前所未有的,当然这也意味着它将遇到的阻力也是巨大的。


    21世纪,我们始终处于一场信息革命之中。从阿桑奇到斯诺登,再到如今的中本聪,这些数字世界的英雄们以一己之力与权力作斗争,挑战腐朽的旧秩序,即使这场区块链革命没有成功,他们也会前赴后继,这不只是一种叛逆的黑客精神,也是每一个平凡弱小的我们的心愿——尝试建立一个真正自由、真正公平、真正有隐私可言的世界——而这,也正是互联网建立的初衷。就像《攻壳机动队2》里所说的


    The net is vast and infinite!

    网络无限宽广!

    展开全文
  • 基于深度学习的目标检测算法综述分为三部分: 1. Two/One stage算法改进。这部分将主要总结在two/one stage经典网络上改进的系列论文,包括Faster R-CNN、YOLO、SSD等经典论文的升级版本。 2. 解决方案。这部分...

    前言

    基于深度学习的目标检测算法综述分为三部分:

    1. Two/One stage算法改进。这部分将主要总结在two/one stage经典网络上改进的系列论文,包括Faster R-CNN、YOLO、SSD等经典论文的升级版本。

    2. 解决方案。这部分我们归纳总结了目标检测的常见问题和近期论文提出的解决方案。

    3. 扩展应用、综述。这部分我们会介绍检测算法的扩展和其他综述类论文。

     

    在上篇文章 大牛分享 | 基于深度学习的目标检测算法综述(二)我们归纳总结了目标检测的常见问题和近期论文提出的解决方案。本篇文章是基于深度学习的目标检测算法综述的最后部分。在这里,我们会介绍目标检测算法的扩展应用,每个方向给出1篇代表论文,同时,最后给出google发表在CVPR2017上的目标检测算法效果和性能评估论文。

     

    3. 扩展应用、综述

    目标检测在很多计算机视觉领域中已经有了很多成熟的应用,如人脸检测、行人检测、图像检索和视频监控等。而目标检测算法不仅可以应用在普通物体的分类和定位上,在近年也有了很多扩展。我们会在后文中介绍其中三篇论文,如logo检测论文“Scalable Object Detection for Stylized Objects”、通过改进的Top-Down结构提升识别和分割效果的论文“Path Aggregation Network for Instance Segmentation”以及把目标检测思想用于视频分段的“Rethinking the Faster R-CNN Architecture for Temporal Action Localization”。

    论文"Mimicking Very Efficient Network for Object Detection"借鉴知识蒸馏思想,在训练过程中用训练好的大网络作为监督网络指导小网络的参数学习,实现从零开始训练目标检测网络。

    本综述中的最后部分我们还介绍了Google发表于CVPR2017的平衡速度和准确率的论文"Speed/accuracy trade-offs for modern convolutional object detectors",该文用非常大量详实的实验探讨了常用目标检测算法及其各参数设置对于目标检测speed和accuracy的影响,对如何平衡速度和准确率提出了建议

    3.1 logo检测:Scalable Object Detection for Stylized Objects

    论文链接:https://arxiv.org/pdf/1711.09822.pdf

    开源代码:

    录用信息:

    论文目标:

    论文旨在解决对logo的检测问题。作者将e2e的检测模型分为两步,1. 使用Single Shot Multibox Detector(文中使用YOLO v2)检测可能的logo位置。2. 使用Triplet Loss训练的deep image-similarity network模型对logo进行检索。

    核心思想:

    Logo检测和普通目标检测的区别,以及分成两步检测的原因有:1. Logo种类可能很多,如果用Softmax分类几千种物体效果会很差。随着数量增多,识别效果会很快变差,由于每个分类器不仅要识别是哪个物体而且要识别Proposal中是否包含待检测目标。2. Logo更新很快,如果用普通目标检测,添加新数据后需要重新训练。3. Logo在图片中一般都有固定的字体、特性,而且相对普通物体更醒目易于观察。4. Logo相比普通物体和背景的关系不大。作者用人脸检测来做示例,人脸和logo检测类似,都是大量实例检测。每张人脸都是不同的,但是如果用目标检测来区分每个人脸是不现实的。只能先做人脸检测,然后再做人脸检索。

    如上图所示,本文使用的网络为2-layer网络。Layer1是YOLOv2,通过识别Logo来提取框,然后crop+resize为224*224。 作者提出使用Single Shot Multibox Detector而非proposal-based网络的原因为logo检测需要使用物体的全局信息。Layer2是训练检索网络。训练为典型的triplet loss训练过程:使用两组相同logo,一组不同logo,通过缩小类内loss、增大类间loss来促进收敛网络。Layer2网络通过CNN提取特征然后经过L2归一化和FC层,最终提取feature vector。检索数据集的准备过程在训练完成后进行,使用特定logo经过特征提取和仿射变换操作,制作数据集。最终使用feature vector的余弦距离来进行实例检索。

    算法效果:

    由于这篇论文针对的是logo检测的改进,所以测评都是在logo数据集上。Flickrlogos-32为开源的logo数据集,MSR1k和Synth9K为作者自己造的logo数据集。

     

    3.2 实例分割:Path Aggregation Network for Instance Segmentation

    论文链接:https://arxiv.org/abs/1803.01534

    开源代码:

    录用信息:CVPR2018

    论文目标:

    我们在综述的第二部分提到,FPN是目标检测Top-Down结构的一种常见形式。这篇论文通过改进主干网络FPN的结构,缩短了从低层特征到高层特征之间的路径,进一步减少了定位信息流动的难度,从而同时提升了目标检测和实例分割的效果。

    核心思想:

    网络结构如下图。

    图1 PANet的框架

    PANet的框架如图1所示,Bottom-up Path用于增强Low-layer的信息传播。Adaptive
    Feature Pooling允许每个候选区域可以获取所有特征层次的信息,以此用于预测。添加了一个互补分支用于预测mask。

    PANet的创新点可以总结如下:

    a.创建Bottom-up增强路径缩短信息路径,利用Low-level 特征中存储的精确定位信号,提升特征金字塔架构。

    b.创建Adaptive Feature Pooling合并所有特征层次上每个proposal的特征信息,避免任意分配结果。

    c.使用小型Fc层补充mask预测,捕获每个proposal的不同视图,以此与原始的Mask R-CNN互补。通过融合这两个视图,增加信息多样性,能更好的预测mask。

    具体如下:

    1. Bottom-up Path Augmentation

    高层的神经元主要响应整个物体,其他神经元更倾向于响应局部纹理信息。该网络结构通过传播low-level的强响应,增强了整个特征结构的定位能力。因为对边缘和实例部分的强响应对于精确定位实例是强指向标。因此论文使用横向连接将低层和高层的信息连接起来。使用bottom-up path将底层信息传递到决策层只需要不到十层(如图1绿色虚线所示),但是FPN则需要通过backbone,走完整个ResNet基础网络,需要走一百多层。具体的Augmented Bottom-up Structure 如图2所示。

     

    图2 Augmented Bottom-up Structure

    网络结构在FPN{P2,P3,P4,P5}后接{N2,N3,N4,N5}(图1 a,b所示),其中N2就是P2没有经过任何操作。如图2所示,每个模块通过横向连接将较高分辨率的Ni和低分辨率的Pi+1横向连接,产生Ni+1。

    2. Adaptive Feature Pooling

    FPN的proposals根据其大小分配给不同的特征层次。这样尺寸小的proposal被分配给Low-level,而尺寸大的分配给High-level,但这可能会产生非最优结果。例如两个只相差10个像素的proposals会被分给不同的特征层次,但实际上它们很相似。因此,特征的重要性与其所属的特征层次并不是强相关。高层次的特征由更大的感受野产生,获取了更丰富的语义信息。小型proposals获取这些特征可以更好地使用语义信息做预测。另一方面,低层次特征有许多细节和定位信息。基于此,论文提出对每个proposal池化所有层次的特征,然后融合它们做预测。其实现过程如图3所示。

    将每个候选区域映射到不同的特征层次,用RoIAlign池化不同层次的特征网格,进一步融合不同层次的特征网格(逐像素求最大或者求和)。

     

    图3 Adaptive Feature Pooling Structure

    3. Fully-connected Fusion

    Fc与FCN有不同的属性,由于局部感受野和共享参数,FCN有像素级预测,而Fc对不同空间的预测均是通过一组可变参数实现,因此它的位置敏感度较高。另外Fc预测不同空间位置均通过全部proposals的全局信息实现,这对于区分不同实例和识别属于同一对象的分离部分很有效。因此考虑将这两种层的预测结果融合可以达到更好的预测。其实现如图4所示。

    图4 Fully-connected Fusion Structure

    算法效果:

    在实例分割方面,使用相同的初始化模型,PANet比Mask R-CNN好了将近3个点;在目标检测方面,使用renet50当基础网络的PANet比coco2016年的冠军高了0.9%,它的backbone是2×ResNet-101+ 3×Inception-ResNet-v2和推理tricks。

    图5 PANet在COCO上的结果图,其中上侧为分割的结果对比表,下侧检测的结果对比表

    3.3 目标检测用于视频分段:Rethinking the Faster R-CNN Architecture for Temporal Action Localization

    论文链接:https://arxiv.org/abs/1804.07667

    开源代码:

    录用信息:CVPR2018

    论文目标:

    本文借鉴了目标检测经典算法Faster R-CNN的思想,实现了对视频动作的定位与识别。

    1. 通过multi-tower network和 dilated temporal convolutions方法,提高了动作定位精度(Temporal Action Localization)。

    2. 通过扩展候选片段感受野,提高视频中的关键动作的识别效果(Temporal context)。

    核心思想:

    1.借鉴了Faster R-CNN的思想,将目标检测的思想从空间域转化为时间域。采用类似RPN层的结构对视频中动作做初步的定位与识别,然后采用类似RCNN的结构对动作实现精确定位及分类。

    2. 由于视频时长从1s到200s不等,跨度非常大。本文通过multi-tower network和 dilated temporal convolutions解决了视频动作分布时间跨度较大难以定位的问题,同时通过扩展生成候选片段和动作分类的感受野,更有效的利用了视频上下文时序信息提升了动作识别效果。

    算法概述

    1) Temporal Action Localization

    即:给定一段未分割的长视频,算法需要检测视频中的行为开始时间、结束时间及其类别。

    action recognition与temporal action Localization之间的关系同 image classfication与 object detection之间的关系非常像。本文主要为了解决Temporal Action Localization问题,借鉴了Faster R-CNN的结构。

    与目标检测类似,它包含两个阶段:

    1.生成动作候选区域

    给定一组帧序列,通常通过二维或者三维卷积网络提取出一组一维特征图。之后,将该特征图传输给一维网络(类似RPN层,Segment Proposal Network),返回一组候选片段。

    2.对候选区域分类

    接着,对于每个候选片段,本论文计算动作类别的概率,并进一步对片段边界进行回归。在这一步,首先使用一维的SoIPooling(时间维度上做Pooling,类似空间维度的RoIPooling),接着使用 DNN 分类器来实现。

    Segment Proposal Network:

    文中作者采用了multi-tower 架构。每个 anchor 大小都有一个具备对齐后的感受野的相关网络。

     

    可以理解为对于尺度Feature map做相应Pooling或者空洞卷积(dilated temporal convolutions),作者经过实验后认为空洞卷积效果更好,时序定位更加准确。

    2)如何有效利用时序上下文(temporal context)

    作者在生成动作候选区域及动作种类识别时,认为动作前后信息对精确定位和动作分类有很大的意义。故强制将前面一段时间和后面一段时间加入候选区。

    如图:

    虽然候选区是中间的S区域,但是它依然会强制把前s/2和后s/2的区域加入proposal

    文中表示: 推理过程中以0.7为阈值的IoU的proposals做NMS。

    在训练过程中阈值大于0.7选为正样本,小于0.3为负样本。用Adam优化器,学习率0.0001

    算法效果:

    可以看到该方法在提取的片段较少时,有最好的表现。其他方法在提取片段较多时才会有较好表现。

    3.4 从零训练目标检测网络: Mimicking Very Efficient Network for Object Detection

    论文链接:

    http://openaccess.thecvf.com/content_cvpr_2017/papers/Li_Mimicking_Very_Efficient_CVPR_2017_paper.pdf

    开源代码:没找到

    录用信息:CVPR2017

    论文目标:

    这篇论文与本综述(一)中介绍的DSOD的目标一致,都是解决如何有效地“从0开始训练检测网络”的问题。不同的是,DSOD旨在提出一种可以实现从头训练的检测网络结构。而本文借鉴知识蒸馏思想,在训练过程中,用训练好的大网络作为监督网络指导小网络的参数学习,小网络无需用预训练模型初始化。训练得到的小网络模型用于测试。

    核心思想:

    知识蒸馏,用大网络监督小网络的学习,常被用于解决分类任务中的模型压缩和加速问题。mimic论文作者将此思想应用于检测网络的学习任务。

    论文以faster rcnn为例,介绍了论文的网络结构和训练过程。

    上图示意了训练时的网络结构,上半部分是要训练的目标网络,通常是一个精简的小网络,后面加上RPN网络;下半部分是大网络,大网络用已经训练好的大检测网络模型进行参数初始化。论文将训练过程中的监督信息分成两部分:来自大网络的监督信息 mimic supervision 和训练数据的标注信息ground-truth supervision。

    作者认为检测过程分为两个部分feature extractor和feature decoder,feature 对于大网络和小网络分别作为basenet的faster rcnn,二者的区别仅在于feature extractor不同(分别是大网络和小网络),而在提取到特征后的feature decoder是一致的。因此,论文将来自大网络的mimic supervision应用于feature extractor部分,而将ground-truth supervision应用于feature decoder部分。

    论文将训练过程分为两个阶段,下面分别介绍这两个阶段的参数学习方法:

    1)第一个阶段应用mimic supervision学习图中上半部分的目标小网络;小网络随机初始化参数,大网络用已经训练好的大检测网络模型进行参数初始化。训练过程中,固定大网络参数,使用以下loss指导小网络进行参数学习。

    其中,u^i为大网络的RPN输出的第i个候选框的特征,这个特征是从候选框的对用的feature map中直接提取得到的;v^i是小网络的RPN对应的第i个候选框的特征;变换操作r()是用于将v^i变换到与u^i相同的维度;m_i是第i个候选框特征的维度。

    最小化以上loss的过程也就是将大网络的特征提取能力迁移到小网络的过程。

    2)第二个阶段应用ground-truth supervision进行检测网络(detection network)的学习和RPN网络的精修。对于faster rcnn,检测网络跟RPN网络共享部分特征,对共享的特征层,使用第一阶段学到的参数初始化;对检测网络新增加的卷积层,随机初始化参数。

    论文指出,第二阶段如果只用ground-truth supervision精修,会损害第一阶段学到的网络参数。因此,作者提出使用softmax层之前的那层特征(classification logits)进行mimic supervision。即上面公式中的u^i和v^i分别为大小网络的第i个proposal的classfication logits,这个阶段的loss计算包括两部分L_m(W)和L_gt(W),如下所示,其中L_gt(W)代表分类和位置预测误差。

    以上介绍了大网络到小网络的特征提取和检测能力迁移。除此以外,本论文思想还可用于接受大分别率输入图像的网络的检测能力迁移至小分辨率输入图像的网络,提升小分辨率输入图像的检测效果。如下图所示,基本思想即在最后一个feature map输出让RPN网络之前添加一个decovolution层增加feature map的分辨率,训练时使用支持大分辨率输入的网络进行监督。

    算法效果:

    下表中MR_-2为Miss Rate on False Positive Per Image,数值越小代表效果越好。其他细节可参见原论文。

     

    3.5 调研速度和准确率平衡的综述:Speed/accuracy trade-offs for modern convolutional object detectors

    论文链接:https://arxiv.org/abs/1611.10012

    开源代码:

    录用信息:CVPR2017

    论文目标:

    通过大量实验对比三种主流检测算法在各个情况下的表现。

    核心思想:

    在我们日常的视觉任务中往往有一个大家都会有一个经验,就是当提高一个网络的复杂度能得到更好的效果,而去精简一个网络的同时准确度自然会有所损失。更进一步来讲,相比于分类任务,目标检测任务在实际应用的时候更容易受到计算复杂度,内存要求等因素的限制。本文用非常大量详实的实验探讨了最常用的一些目标检测算法以及其中各个参数的设置对于目标检测的speed和accuracy的影响,以及对于如何以较好的性价比平衡速度和准确率给予了自己的结论。

    看这篇论文的作者参与数量就能感觉到做完这些大量的实验,尤其是在像coco这样很大的数据集上,是非常耗时且花费精力的。在这里感谢作者的工作为没有资源和时间去做这些试验的人给出了很好的指导性的建议。我认为这些建议很多时候在实用的角度来讲贡献一点也不亚于提出一个新的方法。

    首先先说一下试验的背景:用不同的深度学习框架,不同的网络初始化方法,不同的数据增强方法等等训练相同的算法,其性能和最终准确率都会有所不同。为了去掉这些因素的影响,作者统一在tensorflow的框架上实现了Faster R-CNN,SSD,RFCN算法,并以此为基础进行试验,保证了试验的公平性,其中有部分的参数初始化方法以及优化方法略有不同,在论文中均作了说明。同时为了保证基础特征的公平性和丰富程度,作者分别在VGG16, ResNet-101, Mobilenet, Inception-V2, Inception-V3, Inception-ResNet上进行试验,使得结果具有更高的普适性,同时也能从基础网络的角度看到了不同网络对于不同算法准确率和速度的影响。作者还对比了不同图像输入尺寸在以上这些网络上的表现。最后作者还对比了各个算法不同的预选框的设置方法,某些网络特定层的特征分辨率的不同等等设置对于网络的影响。可以说作者整个的试验设计非常系统,非常严谨。通过作者的试验结果,可以从各个角度对于当前目标检测的网络选择和参数设置有一个很直观的认识。

    整个论文有非常多的试验结果和结论,如果对于哪方面感兴趣的读者建议还是去仔细查看原论文的相应部分的图表和论述。本文这里就不一一拿出来讨论,只抽出一部分试验结果进行描述。

    首先整体对比一下不同的网络接入三种检测算法后的表现,其中每种网络和算法的组合对又根据不同的图像输入尺寸,stride size画出了多个点。可以看到ResNet101,和Inception-ResNet101(在输入尺寸等比较小的情况下)是性价比比较高的网络,而Inceptionv2-3网络表现平平。也许像Inceptionv3这种网络是对于分类任务高度定制的,多尺寸的卷积和的融合影响了物体的位置信息的表达,不太适合于目标检测任务。

    而检测算法方面,Faster R-CNN系列在mAP上稳稳胜出。但是速度相较于SSD R-FCN来讲也明显慢一些,但是通过一些参数的设置FASTER R-CNN也可以达到很快的速度。

    作者对比了输入不同图像尺寸对网络的影响,可以看到,输入更大的图片确实可以明显的提升mAP但是也降低了网络的速度。作者还统计了不同算法和网络对于不同尺寸的目标预测的表现。结论是SSD对于小物体表现非常差,远低于其他算法。而在大物体上的表现几乎一样,甚至在一些网络上表现更好。所以如果检测任务当中大部分目标均为大物体,SSD绝对是一个非常好的选择,可以达到有快又准的效果。但是如果存在大量的小物体,为了提高召回率还是建议选择两阶段的检测算法比较好。具体试验结果请查看原始论文。

    上图的实验结论非常超出我的认知,图中对比了不同网络在不同算法上的表现。可以看到SSD算法对于基础网络的特征非常不敏感,从结构、计算复杂度、深度差别很大的网络接入SSD后mAP的变化非常不明显。而两阶段的检测器,对于不同的网络mAP变化非常大。当基础网络复杂度比较低的时候SSD算法的性价比要更高一些。而另一方面增大SSD基础网络的复杂度,收益也相当有限,无法达到二阶段算法的准确率。可能SSD算法的主要瓶颈在于算法结构上,所以提高送入feature的质量并没有特别改善SSD的表现。

    还有一个很有指导意义的结论是当要优化算法的速度的时候,减少proposal 的数量是一个很好的选择。可以很大程度的加快网络的速度同时精度受到的影响比较小。一个例子是当Faster R-CNN+Inception-ResNet组合时,只用50个proposals 与用300个proposals相比,mAP相差无几,但是速度提升了三倍之多,这里原文中有更详细的讨论。

    结论:

    本文通过大量实验对比了影响目标检测算法速度和准确性各项因素的作用,可以帮助从业者在实际应用中选择更合适的目标检测算法。

    展开全文
  • 本文我们主要从以下四个方面来分析对比联邦学习和区块链 现状及造成这种现状的原因 对比:相同点不同点 应用 互补:强强联合

    前言

    本文我们主要从以下四个方面来分析对比联邦学习和区块链

    1. 现状及造成这种现状的原因
    2. 对比:相同点和不同点
    3. 应用
    4. 互补:强强联合

    现状及造成这种现状的原因

    在互联网新浪潮中,最受关注的两项热门技术,一个是联邦学习,一个是区块链。联邦学习是一种在大数据服务中保护隐私的分布式机器学习技术,区块链是一种在去中心化网络中实现价值转移的分布式账本技术。

    联邦学习诞生于2016年的谷歌输入法优化项目,在互联网产业中存在三种服务形态:横向联邦学习、纵向联邦学习和联邦迁移学习。2020年4月,为应对国际形势严峻挑战,中央出台关于完善要素市场化的重要文件,数据作为新型生产要素写入文件中,与土地、劳动力、资本、技术并列为五个生产要素。一方面,数据区别于传统生产要素的最大特征是严格要求保护个人数据隐私,是个人权利不可侵犯的体现,受到法规严格保护。另一方面,数据的开放共享又是人工智能为用户提供便捷服务的基础,是数字经济发展的命脉之所在,也是中国在下一轮国家间新技术竞争中取胜的关键。因此,数据成为生产要素的难点在于实现隐私保护和数据开放共享之间的平衡,产业界一般采用联邦学习技术解决该问题。

    区块链诞生于2009年的比特币项目,根据账本来源分为三种服务形态:数字货币、智能合约、应用平台。2019年10月,中共中央政治局就区块链技术进行集体学习,习总书记强调,区块链技术的集成应用在新的技术革新和产业变革中起着重要作用,通过推动区块链和实体经济深度融合,有望解决中小企业贷款融资难、银行风控难、部门监管难等问题;利用区块链技术探索数字经济模式创新,有望为打造便捷高效、公平竞争、稳定透明的营商环境提供动力。目前,全球主要国家都在加快布局区块链技术发展,我国在区块链领域拥有良好基础,要加快推动区块链技术和产业创新发展,积极推进区块链和经济社会融合发展。

    能够获得如此热度和重要性,联邦学习和区块链有个重要的共同特征:可信。俗话说“人心隔肚皮”,陌生人之间一般难以建立信任,这是因为在资源有限的社会竞争中,获得更多利益是人的本性,人们担心被欺诈而损失利益。然而,信任在市场经济中具有至关重要的作用,能够简化交易流程、提高交易成功率,进而实现大规模交易活动,推动市场经济健康良好运行。

    在传统市场中,交易由权威机构监督执行。例如,政府制定《消费者权益保护法》及《产品质量法》,并对违法行为进行惩罚。也就是说,权威机构提供“可信媒介”作用,为市场交易保驾护航,尤其是对于常见商品,质量、价格等细节均有十分详尽、标准化的管理方案。

    在新兴的互联网市场中,智能终端设备依据摩尔定律飞速发展、光纤网络和5G无线网络逐步普及,产品创新层出不穷。相比之下,权威机构需要经过较长时间调查和研究方能制定相应法规,这使得很多互联网产品短时间内得不到权威机构的“可信媒介”作用,进而使得用户不敢放心大胆的使用新产品。例如,在互联网电子支付出现7年之后,权威机构才为部分互联网企业发放支付牌照,这才有了后来无处不在、十分便捷的手机支付形式。现如今,点对点转账(提高跨境交易的便捷性)、互联网大数据合作(提高用户服务水平)等新产品,尚缺乏成熟的法律法规来进行必要的管理与规范,亟需可用的“可信媒介”。

    联邦学习和区块链正是在这样的背景下诞生的技术派“可信媒介”。联邦学习的可信在于,在数据合作过程中使用的是不可逆的变换数据,即使没有权威机构监督,隐私数据也不会泄露。区块链的可信在于,在记账过程中使用了群体共识和数字签名技术,即使没有权威机构监督,所记录的交易也是不可篡改且不可抵赖的。因此,这样的技术“可信媒介”将为国民经济持续健康发展提供新的生产力。

    对比

    深入分析,我们发现联邦学习和区块链有很多相似之处,表格1详细对比了两项技术的共同点和差异。

    图:联邦学习与区块链的异同


    应用

    应用场景

    两项技术均用于互联网场景。不同之处在于,联邦学习用于个性化的用户服务,例如在电商APP给女朋友挑选礼物,这是令很多男生发愁的一件事情,联邦学习可以综合购物历史、性格爱好、商品推荐等大数据信息,帮助用户选出既时髦又有个性的礼物。又例如,金融的核心是风控,传统业务模式中,找出潜在的多头和欺诈风险用户是比较困难的,联邦学习可以从消费习惯、社交关系、职业等维度实现风险定价,为优质用户提供更低利息贷款。

    区块链用于点对点的交易记账和合约,例如在国际贸易中,跨境支付需要经过汇出银行、中央银行、代理和收款银行等多家金融机构的处理和清算,导致了手续费率高、到账时间长等问题。区块链可提供去中心化的点对点电子现金系统,支付过程无需传统的中心化金融机构,可极大的降低手续费率并缩短到账时间。又如传统的开发票、报销和抵税流程十分繁杂,需要会计人员多重审核,区块链可用于实现自动开票、报销和抵税,从而减少繁杂的人力投入。

    应用基础

    两项技术均需要有协作意愿和共识的计算节点。不同之处在于,联邦学习要求节点之间的数据具有互补性,例如其中一个节点存储消费习惯特征,另一个节点存储性格、爱好等特征。各节点之间的共识为联邦算法,通过约定在联邦之间的信息交互协议,实现模型训练及推理。

    区块链需要各节点同步记录所有交易信息,例如账户A给账户B支付1个代币,A的支付信息及签名将发送给网络上的所有节点,各节点产生一致的记录。区块链网络里能够达成一致,最关键的技术是共识算法。共识算法是解决一致性问题的关键,在分布式、去中心化的区块链网络中协助节点保持数据一致。常用的共识算法如工作量证明(POW)、拜占庭容错(BFT)、股份授权证明(DPoS)等。

    应用目标

    两项技术的目标都是在去中心化网络中增强节点之间的互信。不同之处在于,联邦学习旨在实现“数据可用不可见”的隐私保护技术,并通过融合使用各方数据提升用户服务的质量,进而创造出新的价值。例如同态加密就是一种隐私保护技术,所产生的密文与明文完全不一样,分布性质和排序性质都发生了巨大变化,这使得原始数据是“不可见”的,密文可按指定规则进行运算,进而实现梯度下降算法和模型优化,实现了“可用”。

    区块链旨在确保交易记录不可篡改,利用共识算法、分布式技术解决在去中心化网络中的双重支付问题,最终实现数字世界的价值表示和价值转移。例如在比特币系统中,账户A给账户B支付1个比特币,并将该信息广播给所有“矿工”节点,“矿工”为了获得系统奖励,都努力将该信息打包到新区块,并为了获得更多奖励争当历史区块的见证者,这便使得该信息在区块链中不可篡改。

    强强联合

    联邦学习和区块链有共同的应用基础,通过技术上的共识实现多方合作的可信网络,具有较好的互补性。从应用目标来看,联邦学习旨在创造价值,而区块链旨在表示和转移价值,因此有以下两种基本结合形式。

    图:联邦学习与区块链的异同


    第一种结合是利用区块链的记录不可篡改特性,对联邦学习合作方可能面临的恶意攻击进行追溯和惩罚。例如,在多个参与方进行联邦学习的同时,部署区块链用于记录联邦学习的数据指纹(包括建模样本、推理样本、交互信息),而对应的原始数据存储于参与方本地。当发现有样本遭受恶意攻击时,由各参与方或者第三方组成调查组,依据区块链记录的指纹对原始数据进行核验,便可以找出具体是哪一方遭受了攻击,进而采取相应的措施。

    第二种结合是利用区块链的价值表示和转移功能,对联邦学习服务所创造的价值进行记账和利益分配。例如,在多个参与方进行联邦推理的同时,部署区块链用于记录用户服务的接口调用日志指纹、各参与方的贡献、该服务所产生的收益,并通过智能合约自动将收益分配给各参与方。这种方式与现有的按条计费不同,可以更精准地评估每次调用的质量,从而激励参与方确保调用的准确性,并积极优化效果。

    该文章首发于公众号 JDD风控算法,想获取更多资讯请扫码关注或阅读原文

    展开全文
  • 从The DAO到BEC,SocialChain,Hexagon,再到近期大量 EOS 竞猜类游戏漏洞,“智能合约”已经成为区块链安全的重灾区。据成都链安区块链安全态势感...
        

    640?wx_fmt=jpeg


    从The DAO到BEC,SocialChain,Hexagon,再到近期大量 EOS 竞猜类游戏漏洞,“智能合约”已经成为区块链安全的重灾区。据成都链安区块链安全态势感知系统Beosin-Eagle Eye检测发现,区块链行业的重大安全事故数量在2018年-2019年爆发式增长,因智能合约漏洞而引发的经济损失,也赶超交易平台事故成为了第一名。


    智能合约安全漏洞频现并非偶然,当前数字货币市场鱼龙混杂,智能合约缺乏有效的监管,缺少第三方专业审计团队安全审计流程,其代码安全性与逻辑漏洞仅靠开发人员人工审核,难免存在隐患和漏洞。


    对于项目方来说,由于智能合约不可修改的特性,要对上线后发现的漏洞进行有效修复,只能选择重新部署新的合约,这将付出巨大的代价,因此有的项目方可能会选择不响应,不处理。


    但如果项目方迟迟不修补漏洞,公众对于漏洞的存在不知情,风险会随着时间的增长迅速膨胀,漏洞一旦爆发可能会造成更大的危害,波及更大的人群,可能会造成很多人的投资瞬间化为乌有,造成不可逆的资产损失。


    针对在智能合约领域广大开发者容易忽略的隐患和漏洞,Beosin成都链安推出了安全教学视频——深度讲解:区块链智能合约搭建、漏洞及防范措施


    640?wx_fmt=png


    课程将从以下几个方面全方位讲解:



    1.智能合约是什么?关键特点是什么?


    2.智能合约如何搭建及注意事项


    3.分析黑客如何攻击区块链平台智能合约


    4.近期EOS竞猜游戏合约回顾及分析


    5.如何避免智能合约安全漏洞及方法


    6.免费VaaS平台自动检测合约安全漏洞


    7.免费EOS-IDE平台在线编辑、编译、运行调试、部署智能合约


    8.总结


    欢迎大家观看教学视频正式版:


    ▲双击观看视频


    要应对区块链智能合约的安全漏洞问题,我们建议广大项目方应做出几乎唯一可行的、切实有效的努力——在智能合约上线之前,对其进行全面深入的代码安全审计,尽可能的消除漏洞,降低安全风险。


    上线后,一定要注意应急响应,比如监控智能合约有没有异常交易情况。同时,开发项目方要有应急响应团队。


    为护航区块链安全生态,Beosin(成都链安)推出了全线安全产品,包括为所有区块链从业者提供方便而免费的智能合约安全审计服务VaaS平台,对智能合约安全漏洞进行形式化验证,从容应对常规合约安全问题;EOS智能合约集成开发环境“Beosin EOS-IDE”,同时支持EOS智能合约在线编辑、编译、一键部署和调试等多种功能,供所有开发者免费使用等,后期我们还将继续开发出一系列的智能合约验证工具集,提前辅助合约开发者发现问题,提⾼形式化验证的⾃动化⽔平。


    目前区块链领域中应用的智能合约越来越受到公众的关注,黑客的攻击事件也日渐频繁,而智能合约的安全与否直接影响项目安全。未来在智能合约得到真正有效且安全监管前,我们应该对区块链安全漏洞事件保持敬畏,做好完善的风险防范,必要时可借助第三方专业审计团队的力量防患于未然。


    小彩蛋:


    Beosin成都链安安全教学视频已经上线看雪论坛“推荐课程”,大家也可以从这里观看哟~后期我们还将在更多的技术论坛、技术社区,推出更丰富的安全教学视频,敬请期待!


    看雪网址:

    https://www.kanxue.com/course.htm


    640?wx_fmt=png

    ▲看雪论坛“推荐课程”



    欢迎大家体验:


    一、智能合约自动形式化验证平台VaaS精简版,准确率达到95%以上


    Beosin(成都链安科技)已向全球发布VaaS平台,全球首个同时支持ETH、EOS、Fabric、TRON等多个区块链平台的智能合约形式化验证平台,准确率达到95%以上。


    VaaS(精简版)系统为所有区块链从业者提供方便而免费的智能合约安全审计服务,对智能合约安全漏洞进行形式化验证,从容应对常规合约安全问题。欢迎大家登陆官方网址体验:


    官方网址:http://www.lianantech.com


    640?wx_fmt=png

    ▲VaaS 精简版平台


    二、在线Beosin EOS-IDE免费版本,EOS智能合约在线编辑、编译、调试、部署一步到位


    EOS智能合约集成开发环境“Beosin EOS-IDE”同时支持EOS智能合约在线编辑、编译、一键部署和调试功能,极大提升了用户体验,使EOS应用开发更简单、更方便。为推动EOS全生态发展,Beosin EOS-IDE已首发EOSPark。


    欢迎大家免费体验:通过浏览器访问https://beosin.com/EOS-IDE/index.html#/(如下图,推荐Chrome浏览器)。


    640?wx_fmt=png

    ▲Beosin EOS-IDE



    Beosin官方发表正式声明:


    为了全球化市场战略需要,公司发布全新英文品牌 “Beosin”。作为深耕区块链安全领域的公司,“Beosin”力求为行业保驾护航,以打造区块链全生态安全为宗旨,竭诚为客户提供包括智能合约安全审计、智能合约开发审计一条龙、钱包安全加固与审计、DApp安全加固与审计、区块链平台安全检测、交易所安全检测、企业级安全服务等。但公司英文名称更名并不涉及业务架构或公司所有权变化。新品牌的Logo如下图:


    640?wx_fmt=jpeg


    近期,有XX链安科技与成都链安科技重名,且Logo及宣传语相似。成都链安科技是一家由分布式资本、界石资本、盘古创富投资的专门从事区块链安全的公司,与其他XX链安科技无任何关联。请大家认准成都链安科技唯一指定商标品牌,谨防上当受骗,一切消息以官网及官方公众号为准。


    成都链安科技官方公众号名称:Beosin成都链安

    成都链安科技官方网址:

    www.lianantech.com

    ——Beosin


    640?


    关于Beosin:


    Beosin(成都链安)成立于2018年,公司位于四川省成都市,专注于区块链生态安全。公司由杨霞和郭文生两位教授共同创建,团队核心成员由来自海内外知名高校和实验室留学经历的教授、博士后、博士及阿里、华为等知名企业精英组成。已获得分布式资本、界石资本、盘古创富等著名投资机构的两轮股权投资。其核心技术为形式化验证,是全球最早一批将此技术应用到区块链安全领域的公司。


    公司首批入选Etherscan智能合约审计推荐名单及普华永道创新加速器,荣获全国首届中小微企业SaaS应用创新创业大赛冠军,获得OKEx最佳安全审计合作伙伴奖等荣誉,参加工信部多项区块链安全标准的撰写,入选工信部“2018区块链白皮书”,作为唯一安全公司入选“2018中国区块链企业百强榜”,荣膺金色财经“2018年度最专业安全服务机构”。已与Huobi、OKEx、KuCoin、LBank、CoinBene、CoinMex、CoinTiger、Becent、ONT、Qtum、比原链、Wanchain、Scry、布比区块链、云象区块链、QuarkChain、IoTeX、麦子钱包、EOSPark等共计超过40家区块链公司建立战略合作关系,审计报告被国内外各大知名交易所认可。审计智能合约超500份,独立发现区块链安全漏洞10余个,获得行业及客户的一致好评和认可。让区块链全生态更安全,是我们的美好愿景!


    640?wx_fmt=jpeg

    640?wx_fmt=jpeg

    640?wx_fmt=jpeg




    Beosin

    作为Huobi、OKEx、KuCoin、LBank等

    著名交易所指定的合约审计公司。 

    入选Etherscan智能合约安全审计名单。


    欢迎联系Beosin,了解智能合约安全审计

    智能合约开发审计一条龙

    钱包安全加固与审计

    DApp安全加固与审计

    区块链平台安全检测

    交易所安全检测

    企业级安全服务

     ·

    电话:028-83262585

    网站:www.lianantech.com

    邮箱:vaas@lianantech.com

    地址成都市世纪城南路599号

    天府软件园D7座504室


    官网:

    https://www.lianantech.com


    GitHub网址:

    https://github.com/Lianantech/VCA


    Facebook网址

    https://www.facebook.com/BeosinChengdu/


    twitter网址:

    https://twitter.com/Beosin_com


    Telegram中文群:

    https://t.me/LiananTech_cn


    Telegram英文群:

    https://t.me/LiananTech_en


    微博:

    https://weibo.com/u/6566884467


    CSDN博客:

    https://blog.csdn.net/CDLianan


    知乎专栏:

    640?wx_fmt=jpeg



      点击了解更多


    640?wx_fmt=jpeg

    展开全文
  • 什么?!!!区块链和ML要结合生娃?!!!

    注重版权,若要转载烦请附上作者和链接

    作者:Joshua_yi

    链接:https://blog.csdn.net/weixin_44984664/article/details/106205139

    区块链和机器学习可以说是当下最火的几个词了

    这两尊大佛怎么放在一块儿呢?
    在这里插入图片描述
    以下仅为菜鸡小编的一次区块链作业

    简单谈了一下区块链和机器学习融合的应用

    若有不正确之处,还请大神们指正🙏🙏🙏


    摘要

    自区块链诞生以来受到越来越多的人的关注。随着时间的推移区块链中的相关技术也愈加完善,同时区块链中所存储的数据也与日俱增,这表示其中蕴含的信息量也越来越多。要想将这些信息加以利用,一个突破口就是和机器学习和深度学习相结合。本论文就着重于将ML和区块链技术相融合,利用其对区块链中的数据进行分析和应用。

    关键字: 区块链、比特币、 机器学习

    abstract

    Since the birth of the blockchain, a large number of people pay attention to it. With the passage of time, the related technologies in the blockchain is becoming perfect. At the same time, the data stored in the blockchain has also been increasing over time. To use these information, a breakthrough is to combine with machine learning and deep learning. This paper focuses on the integration of ML and blockchain technology, and uses it to analyse the data in the blockchain to produce some practical utility.

    Keywords: blockchain,Bitcoin , machine learning

    一、引言

    1、选题背景

    本学期学习了区块链技术与应用一课程,对区块链的相关技术以及相应的应用有了一定的了解。结合自己所学的知识,发现区块链在未来的一个发展方向是和人工智能领域相结。通过对区块链种海量的信息进行分析,可以帮助我们进行决策等操作。前人已经在区块链和人工智能结合的领域做出了一定的成果,下面是对他们的综述以及自己的一些理解。

    2、回顾区块链

    要说起区块链,对"区块链"一词的解释是必要的。在此之前需要对其起源------比特币进行说明,在早期的密码学圈子里,人们对于比特币的底层技术的称呼就是"比特币",用英文则是用"Bitcoin"指比特币的网络系统或者网络协议。

    在之后的发展中人们将所有的底层技术比如,时间戳,工作量证明机制等合并起来,为了跟比特币区分,重新取了个名字叫Blockchain,翻译过来就成了"区块链",这就是"区块链"一词的来源。在这里需要进行说明强调的是区块链并不是一个单一的技术,而是一系列技术的集合。

    我们从该词的命名方式上就大概可以知道,区块链是怎么工作的。通过一串的数字块, 每个块包含一定量的数据,通过"链"将这些数据块连接起来,形成一个分布式数据库。实际上这条"链"并不存在,而是由一个个哈希值链接成的。 一个新创建的块包含着从节点收集的很多信息,广播到网络上的每个节点,此时具有相同共识协议的节点就可以接受这个含有信息数据的块并将其添加到区块链中。每个添加的块均包含链中先前块的信息。也就说明,如果更改了某一个块,则该块之后的所有块也将无效。同时加上区块链总是承认最长的一条链,这一规则使区块链具有了不可篡改的特性。当然在不同类型的区块链中,达成新区的共识协议的策略可能有所不同。

    当比特币用户向收款人发起转账过程时,简单来说会经历两个过程。第一个过程,在付款人生成交易信息之后,他需要使用通过椭圆曲线签名算法求得的私钥,对该场交易进行签名。有付款人进行签名的作用是确认交易信息来源的是否是交易发起方并且确定交易数据是否完整,防止该场交易的信息被其他别有用心的人伪造。需要注意的是当交易信息发生修改之后,原先的数字签名就会随之失效,需要重新生成新的数字签名。第二个过程,将该场交易的信息和生成的数字签名一起发送到整个比特币网络当中。此时,在此网络中并接收到信息的矿工就可以通过公钥解密该数字签名,来对该场交易进行验证。如果成功,可以证明这笔交易确实由付款人发起且交易信息未在某个过程种被其他人修改;否则该场交易无效,交易回滚到之前的状态。通过验证的有效交易将由该名矿工打包,上传至区块链。

    二、机器学习和和区块链

    本节总结了区块链和机器学习结合在比特币价格预测和交易实体分类两个方向上的应用的实验。

    1、比特币价格预测

    我们可以通过UTXO记录交易中的比特币数量来预测比特币价格。 Jourdan等人在2018年通过创建概率图形模型来预测UTXO的价格。 其中一个模型是块交易地址模型(BT-A),它是具有条件依赖结构的比特币块的固定图形模型。 块事务实体地址模型(BT-EA)作为BT-A的扩展,向每个地址添加了分类实体。 从图1中的仿真结果可以看出,就MSE,RMSE,MAE,RMAE四个指标而言,在除Exchange之外的所有类别中BT-EA模型表现均明显优于BT-A模型。

    xxxx

    预测比特币价格的另一方法是使用贝叶斯回归作为"Latent source model" ,这是Shah等人在2014年首先所做的。“Latent source model” 旨在对价格变化的基本模式进行建模。 比特币价格yy是根据特征xx进行预测的,“Latent source model” 参考了下面所列的公式 P(yx)=k=1TPk(y)exp(12xsk22)μkP ( y | x ) = \sum _ { k = 1 } ^ { T } P _ { k } ( y ) \exp ( - \frac { 1 } { 2 } \| x - s _ { k } \| _ { 2 } ^ { 2 } ) \mu _ { k } 需要对其中的参数进行说明的是,其中s1,sks_1 ,……,s_k是K个与不清楚的未估计的未知潜在源。PkP_k 是与概率μk\mu_k相关的潜在分布,可以表示为Pk(T=K)=μkP_k(T=K)=\mu_kP(yx)P ( y | x )的期望值可以根据如下公式进行估算 E[yx]=i=1nyiexp(14xxi22)i=1nexp(14xxi22)E [ y | x ] = \frac { \sum _ { i = 1 } ^ { n } y _ { i } \exp ( - \frac { 1 } { 4 } \| x - x _ { i } \| _ { 2 } ^ { 2 } ) } { \sum _ { i = 1 } ^ { n } \exp ( - \frac { 1 } { 4 } \| x - x _ { i } \| _ { 2 } ^ { 2 } ) } 未来平均价格变化取决于以下三个时期的历史数据的价格变化:前30分钟,60分钟和120分钟,记为 Δpj,j=1,2,3\Delta p ^ { j } , j = 1,2,3。 每个Δpj\Delta p^j由以下公式计算 Δp=w0+j=13wjΔpj+w4r\Delta p = w _ { 0 } + \sum _ { j = 1 } ^ { 3 } w _ { j } \Delta p ^ { j } + w _ { 4 } r

    • w0,w1,w2,w3,w4w _ { 0 } , w _ { 1 } , w _ { 2 } , w _ { 3 } , w _ { 4 }是要估算的权重

    • r=(vbva)/(vb+va)vb,var = ( v _ { b } - v _ { a } ) / ( v _ { b } + v _ { a } )其中v _ { b } , v _ { a }是全球前60位的订单买卖总量

    为了更好地刻画输入和输出的特征,Akcora等人在2019引入了图形链的概念,该概念描述了比特币区块链的局部拓扑特征,以探索比特币区块链结构对比特币价格形成和动态的影响。 比特币区块链的交易地址图形表示如图2所示。圆圈顶点表示输入和输出地址。 正方形顶点表示交易,边缘代表UTXO(比特币的转移)。 链模型表示涉及交易的x个输入UTXO和y个输出UTXO,表示为 CxyC _ { x \rightarrow y }。 格兰杰因果关系检验评估了按各种标准聚类的所有链状链和链状链簇。 实验结果表明,分裂链小链簇定义为, y<x<20y < x < 20,个体链(例如 C17,C61,C33C _ { 1 \rightarrow 7 } , C _ { 6 \rightarrow 1 } , C _ { 3 \rightarrow 3 }),极端链(例如C202.3.12.17C _ { 20 \rightarrow 2.3.12.17 }) ,根据余弦相似度(例如) C911,C317,C814,C11C _ { 9 \rightarrow 11 } , C _ { 3 \rightarrow 17 } , C _ { 8 \rightarrow 14 } , C _ { 1 \rightarrow 1 }的聚类对于比特币价格动态至关重要。 使用重要的小链可以进一步开发价格预测模型。

    在这里插入图片描述

    2019年Abay等人将Chainlet模型扩展到新的图形模型" Chain-Net",该模型进一步评估了所有或多个事务的拓扑特征,并考虑了已转让比特币的数量。 根据仿真结果来看,ChainNet采用Betti模型特征和FL特征进行短期和长期预测获得了更好的性能。

    2、交易实体分类

    由于比特币的一些特性使得其成为了许多不法分子收取勒索金额的一种常见方式。也有许多人对此类问题进行了研究。2019年时Akcora等人在使用拓扑数据分析(TDA)方法来生成比特币地址图,去检测与勒索付款有关的地址取得了一定的成果。

    他们使用方法是先将相似的地址分组到节点中,然后将两个节点之间的公共地址放入边集合中。在TDA中首先通过基于不同的过滤标准将数据划分为子样本,然后将每个子样本中的相似点聚类来表示图中的数据集。 比特币交易图模型是有向图,可以表示为 G=(V,E,B)G = ( V , E , B )其中V是一组顶点,E是一组边,而 B = Address, Transaction 是一种节点类型。 通过使用为每个地址提取的六个图形特征,将TDA映射器方法应用于创建六个过滤的簇树图形。 在计算每个群集中的勒索地址数量(表示为V)后,将可疑分数分配给新地址。 群集中地址的可疑分数最初设置为0。 如果满足以下条件,则将增加一:(1)包含阈值,表示为1,乘以标记的勒索软件地址的总数小于V; (2)大小阈值(表示为2)乘以群集中标记的勒索地址的数量大于群集中所有地址的数量。 之后当可疑地址的可疑分数高于分位数阈值时将被过滤。 结果表明,最佳的TDA模型参数为 ϵ1=0.05,ϵ2=0.35,q=0.7\epsilon _ { 1 } = 0.05 , \epsilon _ { 2 } = 0.35 , q = 0.7此时性能优于Random Forests和XGBoost方法。

    2018年时Jourdan等将交易实体分为四个最常见的类别:交易所,服务,赌博,矿池。分类的目的是帮助选择根据交易类别构建的适当预测模型。 他们所应用的分类方法是梯度增强决策树算法以及高斯过程以确定最佳超参数。 可以由图3得出结论,交易所,赌博和服务类别的准确性很高。 但是,"矿池"类别的准确性很差。 这表明采矿活动可能不适合作为独立标签。

    在这里插入图片描述

    三、结论及展望

    从客观上来看,当前的将机器学习和区块链相结合的研究仍处于非常初步的阶段。但是,相信随着算力,算法等的不断提升,该方向上的具体应用将会越来越多。我们可以从以下几个方面去努力。

    • 设计具有学习能力的模型和应用,以规范和发现区块链中的异常行为。
    • 随着区块链的发展,隐私问题将会越来越受到用户的关注。 结合数据融合,可以设计多层次的区块链结构对用户进行数据身份验证,以保护用户的隐私。
    • 基于机器学习和深度学习的模型经过改进可以为区块链提供及时的预测模型。

    参考文献

    [1] Chen, Fang and Wan, Hong and Cai, Hua and Cheng, Guang, Machine Learning in/for Blockchain: Future and Challenges,2020

    [2] Marc Jourdan et al Probabilistic Model of the Bitcoin Blockchain , In: CoRR abs/1812.05451 (2018)

    [3] Kushal Singla and Joy Bose and Sharvil Katariya Machine Learning for Secure Device Personalization Using Blockchain,2018

    四、总结

    当然区块链可以除了和机器学习相结合,而且还可以同深度学习,强化学习等领域相结合,有兴趣的小伙伴阔以去阅读相关的论文鸭~~

    不要忘记给小编点个小心心哦~~
    在这里插入图片描述

    展开全文
  • “人工智能与区块链技术研讨会西安站”9 日在西安电子科技大学举行。这是继北京站顺利举办之后,人工智能与区块链技术研讨会全球巡回的第二站。包括西安电子科技大学通院电子实验室主任刘乃东、清华大学软件学院邓仰...
  • 还在为搞不定生涩的区块链概念,不知道以太坊实际应用的场景,开发中遇到BUG不知道如何解决而苦恼吗,转发此条微博,加入QQ群,在群里私聊管理员(QQ330474772)即刻立即获得几十本学习书籍PDF资料,并有热心技术...
  • 区块链学习-一、区块链的发展过程1. 区块链发展1.1 起源-比特币1.2 区块链1.3 区块链演进趋势 参考书籍:《深度探索区块链:Hyperledger技术与应用》 @著 张增骏 董宁 朱轩彤 陈剑雄 1. 区块链发展 概述 区块链发展...
  • 参考资料: ...东南大学D&amp;amp;Intel Lab相关ppt ...有了数据库是干什么,大概实现的逻辑,特点,才能引申出对当今这些新技术的对比、适应发展。 目的:研究数据表示、存取 数据模型:表示数据的模...
  • 引言给迷失在如何学习区块链技术的同学一个指引,区块链技术是随比特币诞生,但区块链技术支撑着比特币的运行,因此要搞明白区块链技术,应该先了解下比特币。比特币如果你是还不知比特币是什么,那就看看比特币是...
  • “如果你正在寻找一本在技术层面解释比特币是如何运作的,并且你有一定计算机科学编程的基本知识,这本书应该很适合你。”&#13; 2、区块链:从数字货币到信用社会&#13; &#13; 作者: 长...
  • 区块链学习路线

    2018-06-08 20:02:52
    这里把自己学习区块链过程中的一些资料进行索引,可以循序渐进的了解区块链技术及其应用,比特币知识重点推荐中本聪白皮书《精通比特币》,区块链技术及工程应用,重点推荐IBM的Hyperledger系列课程。 一、目标...
  • 区块链技术被认为是继蒸汽机、电力、互联网之后,下一代颠覆性的核心技术。 一句话解释区块链 有一天,你答应你的女朋友要给她买个迪奥的包包,她立刻记下这句话,还发了朋友圈、微信群,并告诉了你们的所有朋友...
  • 纵观区块链快速的发展趋势,如狂风暴雨般... 就目前来说,区块链的发展前景是十分被看好的,就从学术科研的角度来说,这种超前的规则思想也是我们应该学习借鉴的,我个人认为区块链不仅可以像深度学习一样创...
  • 原文链接:深度解析区块链金融应用前景如何?说起区块链定义,很多人都知道这是一种分布式记账方式,主要是解决人与人之间的信任问题。 而在区块链大潮涌入的这个时间节点,金融领域首当其冲将会迎来很多冲击,那么...
  • 我的区块链著作《区块链的数学原理》,今天...在机器学习和深度学习等人工智能技术取得突破的时代背后,一场更大的技术革命正在酝酿迅速发展,那就是区块链革命。如果说机器学习和深度学习增强的是个体的生产力,...
  • 问题导读1.你对区块链了解多少?2.区块链与大数据、云计算是什么关系?3.区块链原理是什么?4.区块链该如何学习?5.区块链有哪些应用?6.区块链与我们普通开发有什么区别...
  • / 深度探讨 今天,互联网已经深刻地改变了我们的生活。但你想象过吗:假如穿越回90 年代,给一位从来没有用过互联网的人解释我们今天的生活,会是什么样子? 人们很有可能会说:“百度谷歌不就是...
  • SLAM算法与ConvNets和深度学习是互补的。SLAM关注几何问题,而深度学习主要关注识别问题。如果你想让机器人走到冰箱面前而不撞到墙,就用SLAM。如果你想让机器人识别冰箱里的物品,就用ConvNets。http://openmvg...
  • 2017年真的是概念频发的一年,上半年人工智能刚刚站稳脚跟,阿尔法狗击败各路围棋高手更是将人工智能送上了天,导致一直平静的算法界也出现了深度学习,但还不过几个月,比特币以一路飙升至2w美元将区块链带向了人们...
1 2 3 4 5 ... 20
收藏数 10,839
精华内容 4,335