精华内容
下载资源
问答
  • 注意:ip地址可以来确定流量类型,例如可以将使用Google的ip地址归类为google的应用程序。但是,由于CDN的广泛使用以及IP地址的动态分配,应该谨慎使用IP地址作为分类依据。 3.负载数据 即使对于加密流量,也可以...

    Deep Learning for Encrypted Traffic Classification:An Overview

    常用流量解析方法主要有四种:
    1.端口号解析
    2.DPI技术
    3.统计特征/时序特征 + 机器学习
    4.时空特征 + 深度学习
    5.其他特征 +深度学习(待拓展)

    第一种端口号解析的方法,是最早应用于流量解析的方法,但由于部分应用会使用不常见的端口号以及端口伪装等问题,准确率不高。
    第二种DPI的方法,是目前最常见的应用于流量分类的方法,即通过分析载荷的相关字段,解析流量类别。但缺点是不能应用于加密流量。
    第三种统计特征/时序特征+机器学习的方法。统计了大量的数据流和数据包特征作为特征集,其中许多特征并不能影响分类效果,但是如果特征集太小,又不能应用于机器学习的方法中。分类效果有局限性。
    第四种时空特征+深度学习,将时空特征映射到图片形式,作为深度学习模型的输入。

    在处理流量分类问题时,首先第一点是应该明白需要分类的目标(Problem Formulation),即我们要干什么?
    1.进行协议分类,分析是HTTPS,还是SSH
    2.进行应用分类,分析该应用是Skype还是Wechat产生的
    3.进行形态分类,分析是上传还是下载
    4.进行行为分类,分析是发送文字还是发送语音
    5.分析哪个门户网站,或者分析哪个浏览器,或者分析哪个操作系统下产生的

    第二步需要收集数据,来训练深度学习模型。
    目前应用于流量分类的基准数据集还很少,原因主要是因为潜在的流量类别太大,很难找到能够满足所有分类需求的数据集。另外没有常用的可以被广泛接受的流量收集方法以及标签方法。流量收集的方法也存在差异,在客户端和服务端不同位置收集的流量都会显著影响流量特征。
    data collection主要有以下几个问题:
    1.可靠的标签,期待值y(标签)的重要性不言而喻。对于非加密类型的流量,可以通过开源的DPI工具,如nDPI来为流量进行标签。对于加密流量而言,在可控情形下,排除干扰流量的影响,从客户端是可以对流量进行标签的。
    2.可靠的特征,客户端距离服务端的位置会影响时延,隧道流量会影响包长度特征。不同抓包点得到的数据训练得到的模型对于另一抓包点得到的数据分类效果不一定准确。
    3.如何构建具有代表性的数据集,对于每一个类别的样本,数量要多而且需要具备多样性,来防止产生过拟合。 另外检测模型有效性的关键在于能否在其他测试集上达到好的分类效果。

    preprocess
    在得到数据之后,要对数据进行清洗和预处理。例如数据包重传,重复ACK以及乱序的数据包。针对不同的数据集以及分类目的,删除这些数据包的影响是不同的。如果是使用整条流的统计特征而言,删除无关的数据包可能影响不大。但是如果是通过前几个数据包进行分类,会产生更大的影响。除此之外预处理部分还应该包括常用的数据归一化。

    特征角度(Feature Selection):在分类任务中通常对使用以下一种或多种特征结合的方法。
    1.时序特征
    时序特征通常包括包长,包间时延,上下行方向。对于加密流量而言,通常前20个数据包的特征足够达到比较好的准确率。并且有研究表明,一组采样数据包也能达到比较好的准确率。
    2.头部特征
    网络层和运输层中包含许多用户相关的信息,并且是未加密的。在深度学习方法之前,通常使用端口号,运输层协议,包长等特征来作为代表性特征。在最近,特别是基于深度学习方法而言,习惯使用整个数据包作为输入。注意:ip地址可以来确定流量类型,例如可以将使用Google的ip地址归类为google的应用程序。但是,由于CDN的广泛使用以及IP地址的动态分配,应该谨慎使用IP地址作为分类依据。
    3.负载数据
    即使对于加密流量,也可以通过运输层以上的信息进行分类。例如有研究通过TLS1.2握手包中的纯文本数据得到了很高的准确率。
    4.统计特征
    统计特征通常通过整条数据流得出,例如平均包长,最大包长,最小包间时延等等。但是得到统计特征需要观测整条数据流或者这条流的绝大部分。因此仅仅适用于离线分类。对于应用分类,统计特征通常还会受到用户行为,操作模式以及网络条件的影响。所以,对于数据集收集的要求比较高。

    模型选择角度(Model Selection):
    1.MLP(多层感知机)很少使用在流量分类领域
    2.CNN(卷积神经网络)
    3.RNN(循环神经网络)
    4.AE(自动编码器)
    5.GAN(对抗生成网络)
    什么会影响模型选择问题呢?1.输入特征种类以及维度会影响模型选择。2.数据集大小也会产生影响,如果数据集较小,则不能使用深度学习的方法来分类。
    如果在数据集比较大的情况下,会有以下几种特征来对应模型类别:
    1.时序特征以及包头特征:
    如果使用这些特征作为输入,通过前10-30个数据包或者从整条流中采样数据包都足以达到很好的分类效果。当输入维度比较低时,机器学习方法和MLP都能实现很好的分类效果,当输入维度较大时,CNN和LSTM更为准确。
    2.载荷和头部特征:
    在目前加密流量中,数据流前几个包含握手信息的数据包通常是未加密的,可以用来进行分类。由于输入维度比较高,应该使用CNN和LSTM。也可以将时序特征与这部分特征相结合,会稍微增加准确率。
    3.统计特征:
    对于统计特征而言,由于是统计整条流的各种特征,其维度是有限的,通常使用机器学习的方法来进行分类。实验表明,当统计前10-180个数据包的特征,足够实现分类效果。但是这种方法不能用于实时分类。

    以上各种特征,各种模型结合的方法,均不能保证在某一数据集都能实现很好的分类效果。

    目前未加密流量已经被研究的很透彻了,例如很多开源的DPDK,DPI等技术。但对于加密流量,仍然是一项无比艰巨的任务,因为缺少代表性的特征。
    接下来面临的问题在于:
    1.更强的加密协议,TLS1.3
    2.同时属于多个类别的流量分类
    3.通过流中间位置的数据包进行分类
    4.分类未知的类别
    5.迁移学习
    6.多任务学习

    展开全文
  • 毕竟计算机系统在图像识别等任务上的准确率已经超过人类水平,每年一次突破性进展的时代也已经过去。 近日,FAIR(Facebook AI Research) 的 Ross Girshick 、何恺明等大神联手,在 ImageNet-1k 图像分类数据集上...
        

    640?wx_fmt=png&wxfrom=5&wx_lazy=1


    翻译 | Serene

    编辑 | 阿司匹林

    出品 | 人工智能头条(公众号ID:AI_Thinker)


    2017 年 7 月,最后一届 ImageNet 挑战赛落幕。


    为何对计算机视觉领域有着重要贡献的 ImageNet 挑战赛,会在 8 年后宣告终结?


    毕竟计算机系统在图像识别等任务上的准确率已经超过人类水平,每年一次突破性进展的时代也已经过去。


    近日,FAIR(Facebook AI Research) 的 Ross Girshick 、何恺明等大神联手,在 ImageNet-1k 图像分类数据集上取得了 85.4% 的准确率,超越了目前的最好成绩,而且没有使用专门为训练深度学习标记的图像作为训练数据。

    640?wx_fmt=png

    论文地址:

    https://research.fb.com/publications/exploring-the-limits-of-weakly-supervised-pretraining/


    然而,这不能怪大家不努力,只怪 Facebook 实在太土豪。10 亿张带有 hashtag(类似于微博里面的话题标签)的图片,以及 336 块 GPU,敢问谁能有这种壕气?


    Facebook 表示,实验的成功证明了弱监督学习也能有良好表现,当然,只要数据足够多。


    话不多说,我们一起来看看 Facebook 是怎样用数据和金钱砸出这个成果的。


    以下内容来自 Facebook 官方博客,人工智能头条 编译:


    图像识别是人工智能研究的重要领域之一,同时也是 Facebook 的一大重点关注领域。我们的研究人员和工程师希望尽最大的努力打破计算机视觉系统的边界,然后将我们的研究成功应用到现实世界的问题中。为了改进计算机视觉系统的性能,使其能够高效地识别和分类各种物体,我们需要拥有至少数十亿张图像的数据集来作为基础,而不仅仅是百万量级。


    目前比较主流的模型通常是利用人工注释的单独标记的数据进行训练,然而在这种情况下,增强系统的识别能力并不是往里面“扔”更多的图片那样简单。监督学习是劳动密集型的,但是它通常能够达到最佳的效果,然而手动标记数据集的大小已经接近极限。尽管 Facebook 正在利用 5000 万幅图像对一些模型进行训练,然而在数据全部需要人工标记的前提下,将训练集扩大到数十亿张是不可能实现。


    我们的研究人员和工程师想出了一个解决办法:利用大量带有“hashtag”的公共图像集来训练图像识别网络,其中最大的数据集包括 35 亿张图像以及 17000 种 hashtag。这种方法的关键是使用现有的、公开的、用户提供的 hashtag 作为标签,而不是手动对每张图片进行分类。


    这种方法在我们的测试中运行十分良好。我们利用具有数十亿张图像的数据集来训练我们的计算机视觉系统,然后在 ImageNet 上获得了创纪录的高分(准确率达到了 85.4%)。除了在图像识别性能方面实现突破之外,本研究还为如何从监督学习转向弱监督学习转变提供了深刻的洞见:通过使用现有标签——在本文这种情况下指的是 hashtag——而不是专门的标签来训练 AI 模型。我们计划在不久的将来会进行开源,让整个 AI 社区受益。


    大规模使用 hashtag


    由于人们经常用 hashtag 来对照片进行标注,因此我们认为这些图片是模型训练数据的理想来源。人们在使用 hashtag 的主要目的是让其他人发现相关内容,让自己的图片更容易被找到,这种意图正好可以为我们所用。


    但是 hashtag 经常涉及非可视化的概念,例如 “#tbt” 代表“throwback Thursday”;有些时候,它们的语义也含糊不清,比如 “#party”,它既可以描述一个活动,也可以描述一个背景,或者两者皆可。为了更好地识别图像,这些标签可以作为弱监督数据,而模糊的或者不相关的 hashtag 则是不相干的标签噪声,可能会混淆深度学习模型。


    由于这些充满噪声的标签对我们的大规模训练工作至关重要,我们开发了新的方法:把 hashtag 当作标签来进行图像识别实验,其中包括处理每张图像的多个标签(因为用户往往不会只添加一个 hashtag),对 hashtag 同义词进行排序,以及平衡常见的 hashtag 和少见的 hashtag 的影响。


    为了使标签对图像识别训练更加有用,我们团队训练了一个大型的 hashtag 预测模型。这种方法显示了出色的迁移学习结果,这意味着该模型在图像分类上的表现可以广泛适用于其他人工智能系统。


    在规模和性能上实现突破


    如果只是用一台机器的话,将需要一年多的时间才能完成模型训练,因此我们设计了一种可以将该任务分配给 336 个 GPU 的方法,从而将总训练时间缩短至数周。随着模型规模越来越大——这项研究中最大的是 ResNeXt 101-32x48d,其参数超过了 8.61 亿个——这种分布式训练变得越来越重要。此外,我们还设计了一种删除重复值(副本)的方法,以确保训练集和测试集之间没有重叠。


    尽管我们希望看到图像识别的性能得到一定提升,但试验结果远超我们的预期。在 ImageNet 图像识别基准测试中(该领域最常见的基准测试),我们的最佳模型通过 10 亿张图像的训练之后(其中包含 1,500 个 hashtag)达到了 85.4% 的准确率,这是迄今为止 ImageNet 基准测试中的最好成绩,比之前最先进的模型的准确度高了 2%。再考虑到卷积网络架构的影响后,我们所观察到的性能提升效果更为显著:在深度学习粒使用数十亿张带有 hashtag 的图像之后,其准确度相对提高了 22.5%。


    在 COCO 目标检测挑战中,我们发现使用 hashtag 预训练可以将模型的平均精度(average precision)提高 2% 以上。

    640?wx_fmt=png


    这些图像识别和物体检测领域的基础改进,代表了计算机视觉又向前迈出了一步。但是除此之外,该实验也揭示了与大规模训练和噪声标签相关的挑战和机遇。


    例如,尽管增加训练数据集规模的大小是值得的,但选择与特定识别任务相匹配的一组 hashtag 也同样重要。我们选择了 10 亿张图像以及 1,500 个与 ImageNet 数据集中的类相匹配的 hashtag,相比同样的图像加上 17,000 个 hashtag,前者训练出来的模型取得了更好的成绩。另一方面,对于图像类别更多更广泛的任务,使用 17,000 个主 hashtag 训练出来模型性能改进的更加明显,这表明我们应该在未来的训练中增加 hashtag 的数量。


    增加训练数据量通常对图像分类模型的表现是有益,但它同样也有可能会引发新的问题,如在图像内定位物体的能力明显下降。除此之外我们还观察到,实验中最大的模型仍然没有能够充分利用 35 亿张巨大图像集的优势,这表明我们应该构建更大的模型。


    未来的图像识别:更大规模、自我标注


    本次研究的一个重要结果,甚至比在图像识别方面的广泛收益还要重要,是确认了基于 hashtag 来训练计算机视觉模型是完全可行的。虽然我们使用了一些类似融合相似的 hashtag,降低其他 hashtag 权重的基本技术,但并不需要复杂的“清洗”程序来消除标签噪声。相反,我们能够使用 hashtag 来训练我们的模型,而且只需要对训练过程进行微小的调整。当训练集的规模达到十亿级时,我们的模型对标签噪音表现出了显著的抗干扰能力,因此数据集的规模在这里显然是一个优势。


    在不久的将来,我们还会设想使用 hashtag 作为计算机视觉标签的其他方法。这些方法可能包括使用人工智能来更好地理解视频片段或更改图片在 Facebook 信息流中的排名方式。hashtag 还可以帮助系统更具体地识别图像是不是属于更细致的子类别,而不仅仅是宽泛的分类。一般情况下,图片的音频字幕都是仅宽泛地注释出物种名称,如“图片中有一些鸟类栖息”,但如果我们能够让注释更加精确(例如“一只红雀栖息在糖枫树上”),就可以为视障用户提供更加准确的描述。


    640?wx_fmt=png640?wx_fmt=png


    此外,这项研究还可以改进新产品以及现有产品中的图像识别功能带来。例如,更准确的模型可能会促进我们改进在 Facebook 上呈现 Memories(与QQ的“日迹”相似)的方式。随着训练数据集越来越大,我们需要应用弱监督学习——而且从长远来看,无监督学习会变得越来越重要。


    这项研究在论文“Exploring the Limits of Weakly Supervised Pretraining”中有更详细的描述。


    原文地址:

    https://code.facebook.com/posts/1700437286678763/?__tn__=%2AsH-R&from=groupmessage&isappinstalled=0



    扫描二维码,关注「人工智能头条」

    回复“技术路线图”获取 AI 技术人才成长路线图

    640?wx_fmt=jpeg

    点击 | 阅读原文 | 查看更多干货内容

    展开全文
  • (1)小程序版本管理 ①小程序开发版(开发优化阶段) ②小程序体验版(管理员和开发人员体验和测试阶段) ③线上版(开发微信用户体验) 注:不要随意将功能不完整的小程序demo提交审核发布,如果发现随意发布,后台审核...

    (1)小程序版本管理
    ①小程序开发版(开发优化阶段)
    ②小程序体验版(管理员和开发人员体验和测试阶段)
    ③线上版(开发微信用户体验)
    :不要随意将功能不完整的小程序demo提交审核发布,如果发现随意发布,后台审核人员会进行封号处理。

    (2)小程序成员管理
    点击管理-成员管理会发现,成员分为管理员、项目成员、体验人员等不同角色。
    一:人员组织结构和权限分配:多数情况下,一个团队多人同时参与同一个小程序项目。
    1)人员组织结构:
    在这里插入图片描述
    2)权限分配:
    ①项目管理成员负责统筹整个项目的进展和风险、把控小程序对外发布的节奏
    ②产品组提出需求
    ③设计组与产品讨论并对需求进行抽象,设计出可视化流程与图形,输出设计方案。
    ④开发组依据设计方案,进行程序代码的编写
    ⑤代码编写完成后,产品组与设计组体验小程序的整体流程
    ⑥测试组编写测试用例并对小程序进行各种边界测试

    3)工作流程图
    在这里插入图片描述
    4)平台权限
    在这里插入图片描述
    5)成员权限
    在这里插入图片描述

    (3)小程序版本
    小程序版本概念图:
    在这里插入图片描述
    小程序版本-体验版:一般会将客户拉入体验人员名单(开发人员名单也可),之后客户便可以通过扫描二维码使用体验版小程序。
    小程序版本-开发版:开发过程中,开发组人员一般都是项目组负责开发的程序猿。

    (4)微信4大价值观
    1)一切以用户价值为依归
    2) 让创造发挥价值
    3)好的产品应该是用完即走的
    4)让商业化存在于无形之中

    (5)编写及设计理念
    **注:**产品和运营思路-----坚持“一切以用户价值为依归” 这一产品价值观,开发者需要保持一定的克制心态。

    设计理念:① 导航清晰②流程明确③重点突出④符合预期⑤等待与反馈⑥异常处理⑦内容和文案准确友好⑧和谐统一⑨平台适配

    等待与反馈-在设计加载等待状态时,应注意以下事项:
    ①若载入等待时间较长,应提供取消操作,并使用进度条显示载入的进度;
    ②载入过程中,应保持动画效果;无动画效果的加载很容易让人产生该界面已经卡死的错觉;
    ③不要在同一个页面同时使用超过1个加载动画。

    (6)用户体验测试和完善体验
    ①用户体验测试,可以在设计、开发、测试等全部阶段使用。是一种低成本检测设计质量的方法。
    ②尽早进行用户体验测试。
    ③用户测试之前需要确定好需要被检验的流程和任务,需要为用户构建明确的目标,并提示用户以完成任务的方式完成目标。
    ④最好选择产品真实,作为被测试的用户。
    ⑤设计开放性的问题让用户回答。不用带有主观性的询问语言,引导用户回答。
    ⑥在用户测试过程中,需要全程做好记录。

    展开全文
  • 转载地址:https://blog.csdn.net/rolan1993/article/details/79085530最近正在做微信小程序,需要实现一个流程进度的图样式如下面需求:没完成的灰色小圆点表示完成的使用蓝色小圆点设置当前状态使用有外圈的小圆点...
    展开全文
  • 在今天举行的2017微信公开课PRO版上,腾讯微信负责人张小龙表示,微信小程序特性是:无须安装、触手可及、用完即走、无须卸载。 张小龙解答了关于小程序的疑问,并透露小程序计划于2017年1月9日正式上线。 ...
  • 2019/03/23Python PySide2小程序和打包

    千次阅读 2019-03-23 17:08:23
    Python PySide2小程序和打包 工作环境:Python3.6 PySide2 PyInstaller 工作时间:2019/03/18-2019/03/23 之前已经做了几个小插件,可以实现一些图像处理的功能。但是我认为这样是不完整的。从我大三学C++的时候开始...
  • 2017年AI技术盘点:关键进展与趋势

    千次阅读 2018-02-04 18:01:15
    而之所以能够通过自我对弈产生大量训练数据,是因为下棋是个规则定义很清晰的任务,到了一定状态就能够赢或者输,无非这种最终的赢或者输来得晚一些,不是每一步落子就能看到的,现实生活中的任务是很难达到这一点的...
  • 知识图谱研究进展

    万次阅读 2020-01-12 17:43:38
    在原文《知识图谱研究进展》基础上上做了相应的调整和补充 本文首先简要回顾知识图谱的历史,探讨知识图谱研究的意义。其次,介绍知识图谱构建的关键技术,包括实体关系识别技术、知识融合技术、实体链接技术和知识...
  • 本文主要是对论文:王坤峰, 苟超, 段艳杰, 林懿伦, 郑心湖, 王飞跃. 生成式对抗网络GAN的研究进展与展望. 自动化学报, 2017, 43(3): 321-332.进行总结。相...
  • 最近20年天文学有什么重大的进展

    千次阅读 2018-04-12 10:43:58
    而得益于优良的算法和强大的计算机,地面人员可以使用程序从海量的数据中匹配符合条件的恒星。开普勒发射一年内就找到了上百个有行星系统的恒星,这比它发射之前找到的所有还要多。而且这一发现说明了恒星带有行星...
  • 区块链关键技术研究进展

    千次阅读 2019-11-28 09:58:28
    本文介绍近年来区块链关键技术的发展现状和研究进展。首先从共识机制、互操作性、安全性、隐私保护和可监管性等方面介绍了区块链技术的现状和面临的挑战。然后重点从跨链通信技术、区块链智能合约、区块链安全性、...
  • 知识表示学习研究进展

    万次阅读 2017-01-23 00:46:46
    Paper: 刘知远 2016 知识表示学习研究进展 计算机研究与发展 1. 表示学习旨在将研究对象的语义信息表示为稠密低维表示向量;而知识表示学习则面向知识库中的实体和关系进行表示学习;该技术可以在低维空间中高效...
  • 全面解读文本情感分析任务

    千次阅读 2019-11-19 16:24:19
    【摘要】 文本情感分析在社交媒体、舆情监测等领域有着广泛的应用,如商品评价正负面...用户可以直接在EI体验空间小程序体验这些功能。 1基本概念 为什么:随着移动互联网的普及,网民已经习惯于在网络上表达意见...
  • 大数据可视化的方法、挑战及进展

    万次阅读 2016-06-24 09:06:24
    大数据可视化的方法、挑战及进展 摘要:在简化数据量和降低大数据应用的复杂性中,大数据分析发挥着关键的作用。可视化是其中一个重要的途径,它能够帮助大数据获得完整的数据视图并挖掘数据的价值。大数据分析和...
  • Paper之NIPS/NeurIPS:2009年~2019年NIPS/NeurIPS(神经信息处理系统进展大会)历年最佳论文简介及其解读 导读:十年磨一剑,霜刃未曾试。今日把示君,谁有不平事? 整整一个十年过去了,带大家解读《神经信息处理...
  • 接下来的一个星期都在“找代码——抄代码——运行失败”,再“找代码——抄代码——运行失败”的恶性循环中度过,除了第一天搭好了对话框和按钮的框架以外,每天就只有小小的一点进展: 第一天查找各种加载图片的...
  • 大数据处理及其研究进展

    千次阅读 2014-06-10 14:22:52
    大数据处理及其研究进展,内容比较通俗易懂,结构比较清晰
  • 从2012年底开始,深度学习从图象识别出发,很快席卷了所有图像里大部分的任务,包括后来的目标检测、图像分割,以及各种图像的应用,以及最近图像超分辨率和跟踪,都被深度学习所颠覆。神经网络系统自由度和它的灵活...
  • 解读GAN及其 2016 年度进展

    万次阅读 2017-02-08 09:46:33
    作者:程程 ...来源:知乎 著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。...其次对其在2016年度的主要进展进行梳理和概括,主要包括从模型理论框架到实际应用问题中的相关扩展与改进及其
  • GPU在视频转码中的应用研究进展

    千次阅读 2011-08-08 14:24:45
    GPU在视频转码中的应用研究进展 已有的视频转码软件 目前,市场上已经出现了几款优秀的利用GPU进行辅助视频转码的软件,典型的代表包括nVidia的Badaboom,AMD的ATIAvivo,Cyberlink的MediaShow和免费软件Media...
  • 深度卷积神经网络最新进展综述

    千次阅读 2019-11-07 09:49:23
    深度卷积神经网络最新进展综述摘要1、引言合理的创建标题,有助于目录的生成如何改变文本的样式插入链接与图片如何插入一段漂亮的代码片生成一个适合你的列表创建一个表格设定内容居中、居左、居右SmartyPants创建一...
  • NLP:《NLP_2019_Highlights》2019年自然语言处理领域重要进展及其解读 NLP_2019_Highlights 2019 was an impressive year for the field of natural language processing (NLP). In this report, I want to ...
  • 人脸检测研究最新进展

    千次阅读 2016-08-28 23:05:15
    这篇文章讨论现有的评价基准存在的问题,并提出了一种改进的程序,取得了相当好的结果。 (4)A Method for Object Detection Based on Pixel IntensityComparisons Organized in Decision Trees. CoRR 2014. N. ...
  • 无人机任务决策

    千次阅读 2018-05-14 16:52:18
    无人机任务决策综述0 前言无人机在民用领域和军事战略中起着越来越重要的作用,能够完成包括火灾监测、搜索救援、侦查追踪和执行歼灭等多种任务。存在不确定性的自主决策是一个深入研究的问题空间,特别是在陆、空、...
  • 面向边缘计算的资源优化技术研究进展屈志昊, 叶保留, 陈贵海, 唐斌, 郭成昊河海大学计算机与信息学院,江苏 南京 211100南京大学计算机科学与技术系,江苏 南京 2...
  • 图计算系统进展和展望

    千次阅读 2016-11-16 14:44:06
    以上过程的顶点程序的计算是严格按照顶点ID由到大来执行的,因为首先整个顶点区间按照顶点ID升序枚举。而在一个顶点区间内,虽然不同子图的计算任务并发到多个线程中处理,但GraphChi会提前检查是否存在这样的顶点...
  • 大数据机器学习系统研究进展

    千次阅读 2015-10-06 14:35:45
    因此,大数据机器学习系统要解决的一个重要问题是,让不易使用的大数据处理技术和平台变得易于使用,要填平普通程序员和常规程序设计方法与现有的大数据处理技术之间的鸿沟,尽可能让普通程序员用常规程序设计方法便...

空空如也

空空如也

1 2 3 4 5 ... 20
收藏数 33,899
精华内容 13,559
关键字:

任务进展小程序