精华内容
下载资源
问答
  • 审稿要求论文作者引用审稿自己文章的这种行为可耻吗?
    千次阅读
    2019-07-24 13:15:35

    这种行为都快成了行业内不成名的潜规则

    审核后的文章说实在话,审稿人只具有审核与意见阐述的权利,要求加上自己的名字是对原著作者的不尊重

    你都没写,凭什么要加你的名字

    但是现在好多审核的你不加我名字,我就找各种理由不让你通过,最后你被逼无奈就得同意

    更有卑鄙的是,还得加在第一作者的位置上面,哪些只加在第二作者位置上的都算是比较仁义了

    国内学者发论文多少都会遇见这种问题

    尤其是北大南大核心,科技核心跟中文核心还好一点……

    当然你不是不可以拒绝,但是前提你遇见这种情况的前提下,你的文章质量非常过硬,我不发这个还可以发别的,但是很多人又做不

    到这么硬气,长久就是恶性循环

    审稿人知道你的文章问题多,以此为要挟,你不得不为了毕业,为了评职称而这么做

    所以这种不是可耻不可耻的问题,国人对待这种问题只有两种方法

    要不我写的非常好,我不怕你不要

    要不我不发你的,我多花钱发别的

    这就跟大晚上你出门穿着不要太暴露,暴露就会有坏人盯着你

    人盯着都是你的问题,实际没人管,这是一个体制的问题。

    作者:论文辅导员
    链接:http://www.lwfdy.com/archives/9.html
    来源:https://www.lwfdy.com/

    更多相关内容
  • 引用文献时如何写作者的名字

    千次阅读 2021-01-31 20:37:15
    撰写科技论文时,总免不了要引用前人的发现,尤其是在前言和讨论部分。那么在文中提到他人的研究时,如何写出作者的名字呢?其实规则很简单,通常只需要写出第一作者的姓(last name)就可以了。比如下面的例句: ...

    撰写科技论文时,总免不了要引用前人的发现,尤其是在前言和讨论部分。那么在文中提到他人的研究时,如何写出作者的名字呢?其实规则很简单,通常只需要写出第一作者的姓(last name)就可以了。比如下面的例句:

    Hiemer et al. (2015) observed that the transcriptional regulator YAP abnormally accumulated in the nucleus in pre-malignant oral tissues 1.

    大多数文章都有多名作者,所以要在第一作者的姓之后加et al., 表示其他作者的名字没有列上。这里“et al.”可以写成斜体,也可以不加标点,所以就有四种写法: “et al.” “et al” “et al.” “et al”。选哪种写法首先要看你准备投稿的目标期刊在这方面有没有规定。如果有,就按照期刊的要求来写;如果没有,你可以任选一种,要注意的是一篇文章前后要保持一致,通篇只能用一种写法,不要中间换来换去的。另外要注意不要用etc来代替et al. etc一般用来罗列事物,et al用来代表作者。

    当然如果只有一个作者,就不需要et al了。如果你引用的文献有两个作者,普遍接受的写法是两个作者的姓都要写上:Smith and Zhang (2008) reported… 三个或更多作者的时候,除非期刊关于列出几个作者有特别规定,只需要写出第一作者 + et al.

    从上面的例句还可以看出,如果你引用文献时提到了作者的名字,也要加上发表的年份,不论文献的格式如何。

    中国作者在这方面容易出现的一个错误是用全名,尤其是在提到中国作者的名字时。用中文写论文时可能这种写法是普遍接受的,但是要记住用英文写的时候只要姓就可以了。

    另一个常见错误是姓和名混淆,这可能是因为英文里名在前,姓在后,和中文习惯相反造成的。比如John Smith,John是名,Smith是姓。但是也有时会写成”Smith, John”,中间有个逗号,那就是前面是姓,后面是名了。查阅文献的时候,如果你看到的是文献的全文,作者名字都是完全显示出来的,那么一般就是名在前姓在后了;如果你在数据库,比如Pubmed里检索到摘要,那通常是姓是全拼出来的,而名字只剩缩写了(Smith J)。

    其实,引用文献不一定要提到作者的名字。如果每句话都加上作者的名字,会影响文章阅读起来的流畅性。尽量少用或不用,既节省了字数,又不用担心写错作者的名字,是更值得推荐的做法。只要你正确引用了文献,作者的名字不一定非要出现在论文中。




    来源:
    LetPub中文官网

    展开全文
  • 而在本文中,我们为大家搜集了大数据领域中被引用次数最多的论文及其摘要,帮助大家理解论文主旨。 感兴趣的小伙伴,可以自行搜索进行研究。 大数据随机森林 大数据是统计学面临的主要挑战之一,从算法和理论的观点...

    来源 | elsevier

    译者 | 火火酱

    责编 |  邓晓娟

    出品 | CSDN云计算(ID:CSDNcloud) 

    在学习云计算的过程中,不可避免的就是研究各种文献。而在本文中,我们为大家搜集了大数据领域中被引用次数最多的论文及其摘要,帮助大家理解论文主旨。感兴趣的小伙伴,可以自行搜索进行研究。

    大数据随机森林

    大数据是统计学面临的主要挑战之一,从算法和理论的观点来看,大数据会带来无数后果。

    论文摘要:

    大数据包含大量的数据,同时也包含在线数据和数据异构性。近年来,人们通过例如线性回归模型、聚类方法和自举算法等统计学方法来处理大数据。随机森林(random forests)是由Breiman在2001年提出的一种基于决策树、集合和自举思想的方法。通过这种强大的非参数统计方法,可以在单一和通用的框架中考虑回归问题以及两类和多类分类问题。

    针对分类问题,本文对现有的将随机森林应用于大数据的提议有选择地进行了回顾。这些提议是基于并行环境以及随机森林的线上应用之上的。本文还将解释在这些方法中如何处理袋外错误(out-of-bag error)。

    接下来,本文在大数据背景下对随机森林进行了各类解释。最后,在两个庞大的数据集(1500万和1.2亿的观测数据)、一个模拟数据集以及真实世界数据上实验了5个变量。结果显示,其中一个变量需二次采样。另外三个变量则与随机森林的并行化实现相关,或涉及自举法在大数据中的各种应用,或涉及“分而治之(divide-and-conquer)”算法。第五个变量与随机森林的在线学习有关。这些数值试验突出了不同变量的相对性能,也揭示了一些局限性。

    系统化文献综述之云环境中数据复制技术

    论文摘要:

    云计算面临着许多挑战,其中之一就是使用复制数据。数据复制是分布式海量数据管理的一项重要技术。其主要目的是将数据放置在不同的位置,从而在不同位置有同一特定文件的多个副本。

    复制是分布式环境中广泛研究的对象之一,在分布式环境中,一些数据的多个副本会被储存在不同地方,在其中解决创建、维护和更新副本的成本是非常重要且具挑战性的问题。在过去的十年里,分布式计算的应用和架构发生了巨大变化,同时,复制协议也发生了巨大变化。

    然而,尽管这个问题十分重要,但到目前为止,还没有在分布式云环境中系统地研究过该问题。云环境中的数据复制分为静态方法和动态方法。在静态算法中,创建的副本数从一开始就是常量,是由用户从开始就决定的,或者是由云环境决定的。而在动态算法中,考虑到其所属的环境,副本数是由用户的访问算法来决定的。本文旨在系统地回顾这两类算法的数据复制技术,并分别讨论两者的特点。

    大数据之项目集挖掘:比较分析

    论文摘要:

    众所周知,项目集挖掘是一项探索性数据挖掘技术,用于发现隐藏在数据集合中所有有趣的关联。由于它支持不同的目标分析,因此它在从网络流量数据到医疗记录的各种不同领域中都是十分有益的。

    随着数据量的增加,人们利用Apache Hadoop和Spark等分布式计算框架的优势开发出了不同的可扩展性数据挖掘算法。本文通过理论和实验的对比分析,回顾了处理大数据领域频繁项目集挖掘问题的基于Hadoop和Spark的可扩展性算法。由于项目集挖掘目标计算量很大,因此其分布和并行化策略会严重影响内存的使用、负载平衡和通信成本。

    本文详细讨论了频繁项目集挖掘分布式方法的算法选择方法,然后通过实验分析比较了最先进的分布式算法在合成数据集和实际数据集上的性能。在数据集特征(例如数据分布、平均事物长度、记录数)和特定参数设置方面详细讨论了算法的优缺点。最后,在理论分析和实验分析的基础上,提出了项目集挖掘问题并行化的开放研究方向。

    为智慧城市提供关联数据:以卡塔尼亚为例

    论文摘要:

    语义网技术,特别是关联开放数据,提供了一种将城市作为物质、社会和技术系统共享知识的方法,从而支持智慧城市应用程序的开发。

    本文通过介绍一个基于卡塔尼亚安利的原型,旨在分享经验教训,可为其他有类似需求的案例提供实践参考。

    本文讨论了实现句法和语义互操作性的重要性(作为将异构数据源转换为关联数据的结果):语义互操作性在数据级得到解决,以便顶层的进一步开发。我们提出了一个智能城市综合数据模型,该模型集成了多个数据源,包括地理参考数据、公共交通、城市故障报告、道路维护和城市垃圾收集。针对公共交通、城市故障报告和道路养护等领域,提出了一些新的本体设计模型。邀请领域从业者和普通公众使用原型并填写问卷,提供问题和反馈。

    同时,还进行了一个计算实验,以评估该数据模型在实际可扩展性方面(而不是增加数据和在复杂情况下的效率方面)的性能。研究所产生的所有数据、模型、原型和调查问卷结果都可从网上公开获取。

     

    一种使用灰狼优化算法和MapReduce的新聚类方法

    论文摘要:

    随着技术的进步,数据量正迅速增长。需要更加高效地分析方法来支持有关数据的智能决策。数据聚类是一种重要的数据挖掘分析方法,广泛应用于数据分析领域。面对日益增长的海量数据集的分析需求,当今迫切需要改进传统的数据分析方法。

    本文针对大规模数据集基于提出了一种有效的聚类方法——基于MapReduce的灰狼优化算法(MR-EGWO)。该方法引入了一种新型的灰狼优化算法——增强型灰狼优化算法(EGWO),将灰狼的搜索策略与二项式交叉混合,并引入了莱维飞行(lévy flight)步骤,从而增强搜索能力。

    此外,该算法还可被用于优化聚类过程。实验在七个UCI基准数据集上测试了EGWO的聚类效率,并将其与五种现有的聚类技术(即K-均值、粒子群优化(PSO)、引力搜索算法(GSA)、蝙蝠算法(BA)以及灰狼优化算法(GWO))进行了比较。通过收敛图和箱线图验证了EGWO的收敛性和一致性。此外,将提出的EGWO在Hadoop框架中的MapReduce模型上并行化,并命名为MR-EGWO来处理大规模数据集。

    另外,本文还从F-measure的角度验证了MR-EGWO的聚类质量,并将其与基于MapReduce的四种最优聚类进行了比较:并行K均值、并行 K-PSO、基于MapReduce的人工峰群优化(MR-ABC)、基于动态频率的并行k-bat算法(DFBPKBA)。实验结果表明,本研究提出的技术为大规模数据聚类提供了前景广阔且强大的替代方案。

     

    快速深度卷积人脸检测在困难样本挖掘中的应用

    论文摘要:

    人脸检测是机器学习中一项重要的视觉信息分析技术。大数据的兴起导致了海量可视化数据的积累,从而更加需要正确快速的分析方法。深度学习方法为此问题提出了一个解决方案。

    研究表明,大量高可变性数据训练可以显著提高其有效性,但这通常会导致昂贵的计算成本并且使模型高度复杂化。若以分析海量数据集中的大量可视化内容为目标,模型的复杂程度对模型是否能够取得成功来说至关重要。本文介绍了一种针对人脸检测的轻量级深度卷积神经网络(CNN),该网络设计的目的是减少训练和测试时间,并使其有效性优于之前发表的深度卷积神经网络论文。

    为了在不影响效率的前提下训练这种轻量级深度神经网络,本文提出了一种渐进式正例及困难负例挖掘的新训练方法,并证明了该方法能够显著提高训练速度和精度。此外,本研究还训练了一个能够检测个体面目特征的独立深层网络,建立并评估了能够将两个网络输出相结合的模型。两种方法都能够检测被严重遮挡和各类姿势变化下的人脸,解决了真实情况下进行实时人脸检测的难题,本文提出的方法在无人飞行器(UAVs)等移动环境中也适用。

    列车延误预测系统:大数据分析视角

    论文摘要:

    目前使用的列车延误预测系统并没有利用最先进的工具和技术:从铁路信息系统收集大量列车历史运行数据,处理和提取有用且可操作的信息。相反,现在的预测系统依赖于铁路基础设施专家基于经典单变量统计建立的静态规则。

    本文旨在利用最新的大数据技术、学习算法和统计方法,构建一个面向大规模铁路网的数据驱动的列车延误预测系统(TDPS)。特别是,本文提出了一种针对浅层和深度极限学习机的快速学习算法,该算法充分利用了最新的内存大规模数据处理技术来预测列车延误,并与目前最先进的TDPSs算法进行了比较。来自意大利铁路网的真实数据表明,该方案能够改进目前最先进的TDPSs算法。

    上下文感知计算中的大数据应用——前景与挑战

    论文摘要:

    大数据时代已经到来了,无数的应用程序和系统生成的数据量、种类和速度都是传统计算系统和数据库无法管理的。传感器已经存在与各种设备中,传感器收集的数据已经成为大数据的主要来源之一。

    本文主要关注从数据派生上下文并据此行动的上下文感知计算系统是如何处理大量数据的。大型行业参与者,即谷歌、雅虎和亚马逊已经借助来自于电子邮件、聊天信息、浏览和购物历史的用户数据开发了上下文感知应用程序。例如,Gmail通过了解航班预订信息来提醒用户注意航班时间表。同样,亚马逊会了解用户的喜好并推荐相关商品等。在本文中,我们从大数据角度研究了上下文感知计算系统。首先,本文在传感平台基础上提出现有工作的分类法,然后讨论了大数据上下文感知系统领域的最新发展,重点讨论了大数据上下文感知系统如何应对各种大数据挑战。最后,本文对涉及设计和开发上下文感知的大数据生成系统的开放性研究问题进行了深入分析。

    基于4V大数据流的高效资源管理系统

    论文摘要:

    成千上万的数据源正以前所未有的速度不断生成大数据流。对此类数据流的分析需要云资源,随着云上大数据的发展,合理分配云资源成为一个重要的研究课题。当前使用的方法是根据数据特征分配云资源。但是由于数据生成的随机性,大数据流中的数据特征是未知的,这给选择和分配合适的资源到大数据流带来了困难。

    针对这一问题,本文提出了一种高效的资源管理系统。该系统初步估计了大数据流在容量、速度、多样性和可变性方面的数据特征。估计值以名为数据特征(CoD)的向量表示。另一方面,借助自组织映射(SOM),可动态创建云资源集群。SOM使用CoD来创建集群并将其分配到大数据流。

    此外,由SOM形成的集群的拓扑顺序可减少等待时间。文中提出的系统已经过实验测试。实验结果表明,该系统不仅可以有效地预测数据特征,而且可以有效地提高云资源的性能。

    用于深度学习大数据分析的GPGPU神经网络原型

    论文摘要:

    大数据涉及大量复杂的、持续增长的数据。考虑到数据存储和网络的快速发展,各组织都在收集包含有用信息的持续增长的大型数据集。为了在有效期内从这些数据集中提取信息,使用分布式和并行算法是十分重要的。机器学习是大数据分析常用的方法,其中收集的数据被用于预测未来的行为。

    利用人工神经网络进行深度学习是从复杂数据集中提取信息的常用方法之一。与传统的概率机器学习技术相比,深度学习能够创建更为复杂的模型,这为我们提供了有关如何原型化的在GPU和CPU集群上执行深度学习应用程序的分步指南。Python和Redis是本指南的核心支持工具。

    本教程将能帮助读者在几个小时内了解构建分布式高性能GPU应用程序的基础知识。由于我们不依赖任何深度学习应用程度或框架,因此可以针对读者的想法在大数据上进行原型设计的任何并行算法来调整本教程。最后,本文将讨论如何从原型过渡到完全成熟的生产应用程序。

     

    大数据系统应对机器学习挑战:大数据科学即服务

    论文摘要:

    近年来,人们见证了两大方面的进步,一是日常生活中产生和收集的数据规模的巨大进步,二是人们利用现代技术来处理、分析和理解这些数据的能力的进步。这两大趋势的交点就是今天所说的大数据科学。大数据科学需要可扩展的体系结构来存储和处理数据。

    云计算是支持大数据存储、处理和复杂分析应用程序的实用且经济的解决方案。本文将详细分析用于支持大数据科学作为数据科学家们的商品服务的软件堆栈的构建模块。此外,研究还根据支持的服务模型对大数据分析框架的最新技术进行了分析和分类,目前这些框架大多在云上可用。与此同时,本文还提供了有关该领域的最新发展和挑战。

     

    Marcher:支持能源意识高效能计算和大数据分析的异构系统

    论文摘要:

    过多的能源消耗是设计和部署下一代超级计算机的主要制约因素。要将高性能计算和大数据应用程序的能耗降至最低,就要从架构、系统支持和应用程序的多个层次上使用新的节能技术(硬件和软件)。

    在过去的十年中,我们见证了在开发更加节能的硬件和基础设施方面的重大进展。然而,软件的能效并没有得到很大的提高。阻碍绿色软件技术探索的障碍之一就是缺少能够为技术评估和验证提供精确的、实时功率和能量测量的工具和系统。

    Marcher是一个异构高性能计算基础结构,旨在通过为能源敏感型高性能计算和大数据分析研究提供支持来填补这一空白。Marcher系统配备了Intel Xeon CPUs, Intel Many Integrated Cores (Xeon Phi), Nvidia GPUs, 可识别能耗的存储系统以及硬盘驱动器 (HDDs) 和固态磁盘 (SSDs)的混合存储。

    为研究人员获取这些主要计算组件分解后的细粒度能耗数据提供了易于使用的工具和界面。本文介绍了Marcher系统的设计,并演示了Marcher功率测量工具在不同研究项目中用于获取详细能耗数据的用法。

    BLADYG:用于大型动态图的图形处理框架

    论文摘要:

    近年来,大型动态图的分布式处理变得越来越流行,特别是在某些领域,例如:社会网络分析、Web图分析和空间网络分析。在这种情况下,人们提出了许多分布式/并行图形处理系统,例如:Pregel, PowerGraph, GraphLab, 和Trinity。

    然而,这些系统智能处理静态图,而没有考虑演化图和动态图的问题。在本文中,我们考虑了图形处理系统中的规模和动态性问题。本文介绍了BLADYG,一种能够解决大规模图形中的动态性问题的图形处理框架。

    文中介绍了在AKKA框架基础上实现BLADYG。我们通过将其应用于大型动态图的分布式k-core分解和划分等问题,对其性能进行了试验评估。实验结果表明,BLADYG的性能和可扩展性在大规模动态图中的表现令人满意。

     

    用于识别癌症驱动因素的大型DNA甲基化数据集的分类

    论文摘要:

    DNA甲基化是一种经过了充分研究的基因修饰,对调节基因组的功能至关重要。其改变在肿瘤发生和肿瘤抑制中起重要作用。因此,研究DNA甲基化数据有助于发现癌症中的生物标志物。

    由于关于DNA甲基化的公共数据越来越丰富——并且考虑到基因组中存在大量的甲基化点位(特征)——因此,有一个有效处理如此大数据集的方法是十分重要的。基于大数据技术,我们提出了BIGBIOCL算法,该算法可以将监督分类方法应用于具有数十万特征的数据集。它旨在通过迭代删除选定的特征来提取可选的和等价的分类模型。

    通过对从癌症基因组图谱中提取的DNA甲基化数据集进行实验,重点研究三种类型的肿瘤:乳腺癌、肾癌和甲状腺癌。通过分类,准确地(准确率>97%)提取几个甲基化位点及其相关基因。结果表明,BIGBIOCL可以在几个小时内对数十万个特征执行数百次分类迭代。

    此外,我们还将本方法与其他最新的分类器和基于网络分析的DNA甲基化分析方法的性能进行了比较。最后,实验还有效地计算了多个替代分类模型,并从DNA甲基化大数据集中提取一组候选基因,进一步研究其在癌症中的积极作用。BIGBIOCL、实验结果、以及进行新实验的指南可以在GitHub上面免费获取:

    https://github.com/fcproj/BIGBIOCL

     

    Spark参数调整方法

    论文摘要:

    因为Spark成功地向开发人员隐藏了与并行性、容错能力和集群设置相关的大部分复杂性,对大数据流分析来说,它已经成为极具吸引力的平台。

    然而,这是以超过150个可配置参数为代价的,因为这些参数的组合数量呈指数增长,因此无法对其影响进行全面分析。默认值使开发人员可以快速部署他们的应用程序,但是有关是否可以提高性能的问题仍然悬而未决。

    在本文中,我们通过使用巴塞罗那超级计算中心对Spark的Marenostrum III (MN3)进行了大量实验,研究了最重要的可调Spark参数在改组、压缩和序列化方面对应用程度性能的影响。总体目标是指导开发人员更改默认值。我们以之前的工作为基础,在此研究中,将过去的经验映射到反复试验的迭代改进方法中,以基于少量实验运行的证据来调整任意应用程序中的参数。

    该研究的主要贡献在于提出了一种用于参数调整的系统的替代方法,该方法可以轻松地被应用于任何计算基础架构,并且在应用于MH3时,其结果与最初的结果不相上下。在验证的测试案例研究中,观察到加速从20%开始。此外,新方法可以依靠使用样本来运行,而不是在完整的数据集上运行,这使其更加实用。

     

    有效支持高维数据项目集挖掘的并行MapReduce算法

    论文摘要:

    在当今世界,许多科学应用(例如生物信息学或网络)正在不断生成大量数据。由于每个事件通常都具有各种各样的特征,因此不断生成高维数据集。为了从这些复杂的数据集中提取有价值的信息,可以使用不同的探索性数据挖掘算法来发现数据之间隐藏的、特殊的相关性。

    频繁项目集挖掘是一种有效但计算量大的技术,通常用于支持数据探索。由于分布式和并行框架的普及,能够处理大数据的可扩展方法的开发已经扩展到频繁的项目集挖掘。不幸的是,当前大多数算法都是为处理低维数据集而设计的,在那些以高维数据为特征的用例中表现不佳。

    本文介绍了一种基于MapReduce、用于高维数据集的频繁项目集挖掘算法——PaMPa-HD。提出了一种有效的解决方案来并行化并加速处理过程。此外,本文还提出了轻松配置算法参数的不同策略。在真实高维用例上进行的实验结果表明,该方法在执行时间、负载平衡和内存问题的坚固性方面是有效的。

     

    在R中使用大数据编程:

    将分析范围从一个节点扩展到数千个节点

    论文摘要:

    本文通过利用几个扩展软件包(包括来自pbdR项目的扩展)介绍了如何通过R语言实现可扩展性的教程概述。用到的软件包包括MPI、PBLAS、ScaLAPACK、I/O库、配置库等。

    虽然这些库在大型分布式平台上的表现最为出色,但他们在小型集群上也能很好的运行,而且令人惊讶的是,即使在只有两个内核的笔记本电脑上也能流畅地工作。

    本教程首先介绍了图在考虑并行实现之前提高R代码的性能。因为R是一种高级语言,所以一个函数可以有很深的操作层次。对于大数据来说,这很容易导致效率低下。概要分析是了解R代码性能的重要工具,可用于串行和并行改进。pbdR软件包为开发新型分布式数据分析算法提供了高度可扩展功能。这种级别的可扩展性是其他分析软件所无法比拟的。

    对于100GB及以上的数据,复杂的分析算法可实现交互式速度(秒)。这件事得以实现是因为接口对可扩展库只增加了很少的成本。此外,这通常是在串行R代码很少或没有更改的情况下实现的。本概述包括各种复杂程度不同的代码,阐明了并行读取数据、将串行代码转换为分布式并行代码的过程以及如何在R中进行分布式矩阵计算的过程。

     

    聚类算法BIRCH的变体

    论文摘要:

    近年来,随着大型数据集的可用性和并行计算体系结构的兴起,聚类算法又重新引起了人们的关注。然而,大多数聚类算法都有两个缺点:它们无法随数据集大小的增加而很好地扩展,并且常常需要适当的参数化(这并不容易)。本文介绍了A-BIRCH——BIRCH聚类算法的自动阈值估算方法。

    该方法从数据中计算BIRCH的最优阈值参数,使BIRCH即使在没有全局聚类阶段(通常是BIRCH的最后一步)的情况下依然能进行聚类。如果数据满足某些约束条件,则可能实现,如果不满足这些约束条件,A-BIRCH将会在显示结果之前发出相关警告。

    这种方法使BIRCH最终的全局聚类步骤在很多情况下都不是必需的,这带来了两个好处。首先,我们不需要事先知道集群的数量。其次,如果没有计算量巨大的最终全局聚类,快速BIRCH算法将会变得更快。

    对于非常大的数据集,我们引入了BIRCH的另一种变体形式——MBD-BRICH,它与A-BIRCH结合后具有特殊优势,但其整体而言是独立的,并且也具有一般性的优势。

     

    Smart4Job:利用时间序列预测和语义分类进行智能工作岗位分享的大数据框架

    论文摘要:

    最近几年,随着互联网的发展,出现了专用于自动化招聘的门户网站和社交网络,从而导致了优化算法的广泛使用。为此,人们创建了许多求职网站,以便更好地发布和分享工作机会。

    对于招聘人员来说,要选择相关的招聘网站来发布招聘信息有时会很困难,因为他们总是希望能在短时间内吸引到最好的求职者。此外,某些招聘网站还会有各种不同的业务类别,这也让选择变得非常困难。

    针对这些问题,本文建立了一种新的招聘公告推荐系统——Smart4Job,该系统能够为新的招聘信息推荐合适和招聘网站。该系统基于多个整合为一体的大数据平台,包含领域知识分析和时间预测模型。招聘公告的语义分类需要使用受控词汇表进行文本分析。

    借助浏览历史,时间序列分析模型可以为给定岗位推荐最佳招聘网站。最终的决策过程将这些模块的答案组合在一起。该系统已经在真实数据的基础上进行了评估,初步结果表明,该系统具有良好的应用前景。

     

    应用并行计算技术分析Terabyte TB级大气边界层层模型输出

    论文摘要:

    在大气科学中,随着人们越来越容易获得能够处理具有精细时空分辨率的计算资源,模拟输出的大小也持续增长。随着输出大小的增加,串行数据分析方法会变得不堪重负,从而导致处理过程长时间延迟,或者由于内存限制而导致完全失败。并行数据分析方法可以缓解这些问题,然而大气科学家们往往并不了解如何实现这一目标。

    因此,需要通过实例方法来指导如何在大气模拟大数据分析中使用并行处理方法。本文提出了一些十分实用的方法,通过这些方法,可以使用消息传递接口(MPI)和Python并行执行分析。这些方法首先考虑了特定数据分析过程的固有空间依赖性。通过识别这些依赖性,可以在最小化进程间通信的基础上实现数据集的水平或垂直分布。

    此外,分析方法分为数据传输受限或计算受限两种。在数据传输受限问题中,数据传输时间大于处理时间。

    在计算受限问题中,处理时间大于数据传输时间。结果表明,随着处理器数量的增加,计算受限问题的执行时间得到了改善增加节点数也可以最大程度上改善数据传输受限的问题。为了进一步提高计算受限问题的性能,实验使用了图形处理单元(GPU)和统一计算架构(CUDA)框架。实验结果表明,该GPU实验比MPI版本的测试分析方法有了进一步的改善。

     

    无线多媒体传感器网络中用于监控的图形数据库的大数据模型仿真

    论文摘要:

    传感器以各种各样的形式存在于世界各地,如手机、监控摄像头、智能电视、智能冰箱以及血压监测仪。通常来讲,大多数传感器都是某些其他系统中的一部分,与系统中的其他传感器共同组成网络。其中有一个网络是由数百万个连接到互联网的传感器组成的,这就是物联网(IoT)。

    随着无线通信技术的发展,多媒体传感器及其网络有望成为物联网的重要组成部分。在火灾探测、城市监控、预警系统等多个领域已经有了很多关于无线多媒体传感器网络的研究。所有这些应用程序都是通过实时数据流定位传感器节点并长时间采集数据,这些数据可以成称为大数据。大数据可以是结构化的也可能是非结构化的,需要存储以进行进一步的处理和分析。

    分析多媒体大数据是一项艰巨的任务,需要进行高层次建模才能有效地从数据中提取有价值的信息知识。在本研究中,我们提出了一个基于图数据库模型的大型数据库模型,用来处理无线多媒体传感器网络生成的数据。我们引入了一个模拟器来生成综合数据并使用图形模型作为大数据库来存储和查询大数据。

    为此,我们评估了著名的基于图的NoSQL数据库、Neo4j和OrientDB,以及关系数据库MySQL。我们在模拟器上进行了大量的查询实验,证明了在无线多媒体传感器网络中,某些数据库系统是有效且可扩展的。

     

    可视化和可扩展计算的闭环大数据分析方法

    论文摘要:

    许多科学调查都需要进行数据密集型研究,其中需要收集和分析大量的数据。为了从大数据中了解更多信息,我们首先需要从数据中提出最初的假设,然后测试并验证这些关于数据的假设。

    可视化通常被认为是一种从给定的数据集中提出假设的好方法。计算算法与可扩展计算相结合可以对大数据执行假设检验。此外,交互式的可视化界面能够让该领域的专家们直接与数据进行交互,参与到循环中,以完善其研究问题并重新定向其研究方向。

    在本文中,我们讨论了一个集成了信息可视化、可扩展计算和用户界面的框架,以探索大规模的多模态数据流。从数据中发现新知识需要对这种规模的数据集进行探索性的分析,使我们能够正确的看待数据,需要结合自下而上的模式发现和自上而下的人类知识来利用人类感知系统的力量进行发现。

    我们从一种新颖的交互式时间数据挖掘方法开始,该方法帮助我们发现可靠的顺序模式和精确的多元时间序列的时序信息。然后我们进行并行化的解决方案,该方案可以完成使用迭代MapReduce任务从大规模时间序列中提取可靠模式的任务。本研究利用视觉信息技术帮助科学家交互式地探索、可视化和理解其数据。例如,用户可以通过异步web服务访问在HPC上运行的并行挖掘算法。

    通过这种方式,科学家们可以通过比较中间数据来提出新一轮的分析,以获得更具科学意义和统计上更为可靠的模式,因此统计计算和可视化可以相互促进。此外,框架中的可视化接口使科学家可以直接参与循环,并可以重定向分析方向。以上研究结合起来,构成了一种可以通过可视化和可扩展性计算来执行闭环大数据分析的高效方法。

    Hadoop MapReduce在SSDs上分析社交网络的性能

    论文摘要:

    固态硬盘(SSDs)的出现激发了大量调查和开发新驱动器潜力的研究。本研究的重点是了解SSDs与硬盘驱动器(HDDs)在Hadoop MapReduce基础存储时的相对性能和优势。特别是,本次研究将从所有早期的相关工作中分离出来,不使用之前的工作负载,而是检查适合对呈现不同执行模式的复杂网络进行分析的MapReduce任务和数据。

    尽管会涉及大量用于复杂网络分析的算法和实现,我们还是选择了“标杆分析法(benchmarking methods)”,其中包含在复杂网络中执行本地和网络范围内的操作的多种方法。同时,因为其可以用作更复杂的网络处理应用程序原型,所以也足够通用。我们在真实的社交网络数据上执行这些算法(并排除了可能严重影响实验结果的网络宽带的影响),评估了SSDs和HDDs的性能。

    结果表明SSDs对Hadoop是有益的,这一结果也得到了部分早期研究的证实。然而,我们也提供了有力的证据,证明运行中的应用程序的处理模式也具有重要作用,因此在未来的研究中,不能盲目地将SSDs添加到Hadoop中,而应建立组件来评估应用程序的处理模式,然后直接将数据放到适当的储存介质中。

    适用于创新临床模型的大数据合规性

    论文摘要:

    在医疗健康领域,信息十分重要,人体是数据的主要来源。因此,世界卫生保健面临的新挑战就是如何利用这些庞大的数据去对其进行解构。

    为了从这一优势中获益,科学技术为人们提供了一种名为“大数据分析”的解决方案,该方案能够管理海量数据,这些数据的性质可以不同,也可以是来自不同的计算机化医疗保健来源,因为在所有主要健康领域中数字技术的输入都能带来巨大变化。

    临床情报包括通过使用计算机工具实现的分析方法、提取原始临床数据并将其转换为重要见解的过程、能够提供更好临床疗效的新的目的和知识。因此可以说,通过患者数据分析,临床智能将成为解决所有护理方面问题的标准操作程序。

    本文的目的是通过数据挖掘和过程挖掘技术来实现临床情报方法,展示这两种应用于“实际过程”数据析取的方法间的差异,以便通过“符合性检查”与公司合规性模版(所谓的“Model 231”)中的程序进行比较。

    通过使用城市大数据进行颗粒物预测来实现可持续的智慧城市,抛弃昂贵的空气污染基础设施

    论文摘要:

    在数据时代和城市数字化时代中产生了大量与城市环境相关的数据集和数据流。从智慧城市的各种资源中获取和分析数据至关重要。例如,实时的空气污染数据对于控制空气污染、实现城市的可持续发展、保护人类免受空气污染的危害来说是非常重要的。然而,在现实生活中,空气污染占平均建设投资和维护成本过高。

    本文旨在研究如何在不使用昂贵的污染传感器和设备的情况下,以经济有效的方法测量空气污染。为实现这一目标,我们建立了颗粒物预测模型。该模型由多个组件构成,以神经网络和回归为核心,集成异构的多个城市数据源,从迁移学习视角对颗粒物进行预测。

    颗粒物预测实验结果表明,这些数据源能够较好地预测颗粒物,与仅仅以空气污染传感器特征为基础的模型相比,其预测结果更为理想。本次研究中,我们用来自丹麦奥尔胡斯市的城市数据对模型进行了测试评估,并将模型性能与各种指定基线进行比较。该模型相对于基线的优越性表明了其实用性。

    原文链接:

    https://www.journals.elsevier.com/big-data-research/most-cited-articles

    推荐阅读

    
    真香,朕在看了!
    
    展开全文
  • 点击上方“3D视觉工坊”,选择“星标”干货第一时间送达导读:近日,又现多起研究生论文涉嫌抄袭事件。相关高校也都对此迅速做出了回应,这也是继八月份教育部发布文件要求各高校要立即采取行动,全...

    点击上方“3D视觉工坊”,选择“星标”

    干货第一时间送达

    导读:

    近日,又现多起研究生论文涉嫌抄袭事件。相关高校也都对此迅速做出了回应,这也是继八月份教育部发布文件要求各高校要立即采取行动,全面复核、排查近5年(2015年8月1日—2020年7月31日)授予博士、硕士学位的论文后被媒体曝出的研究生论文抄袭事件,值得注意的是,这两所完全不同高校研究生的两篇雷同论文,都于同一年完成.....

    西安建科大、吉大两硕士学位论文高度雷同 

    两高校回应

    据澎湃新闻报道,在中国知网检索发现,西安建筑科技大学工程硕士杜刚的硕士学位论文《榆树壹号院小区工程项目成本管理研究》与吉林大学工程硕士孙福安的硕士学位论文《壹号院工程项目成本管理研究》均在2018年完成。西安建筑科技大学杜刚的论文首页显示,该论文提交日期为2018年5月25日,答辩日期为6月6日。吉林大学孙福安的论文首页载明日期为2018年6月。

    西安建筑科技大学杜刚的论文(左)和吉林大学孙福安的论文(右)存在雷同。

    澎湃新闻对比发现,前述两篇论文页数同为54页,均分为六章,关键词同为“榆树壹号院小区;建筑工程项目;成本管理”。两篇论文第二章、第三章、第六章的结构、文段内容几乎一模一样。

    西安建筑科技大学杜刚的论文(左)和吉林大学孙福安的论文(右)在摘要、关键词部分高度雷同。

    以前述两篇论文第六章“结论与展望”部分内容为例,西安建筑科技大学杜刚在论文中写道,“总而言之,榆树壹号院小区项目在成本管理中,需要在科学成本管理理念的指导下,重视成本管理工作中存在的问题,确保项目质量、进度、成本多方面高水平运作,在榆树市房地产市场环境中具有较大竞争力。”

    西安建筑科技大学杜刚的论文(左)和吉林大学孙福安的论文(右)结论章节部分内容相似。

    而吉林大学孙福安的论文中也出现几乎一模一样的内容。孙福安的论文写道,“总而言之,榆树壹号院项目在成本管理中,需要在科学成本管理理念的指导下,重视成本管理工作中存在的问题,确保项目质量、进度、成本多方面高水平运作,在榆树市房地产市场环境中具有较大竞争力。”

    澎湃新闻进一步对比发现,前述两篇论文在部分章节、“参考文献”“后记与致谢”部分略有不同。相比孙福安的论文,西安建筑科技大学杜刚的论文在“第一章 绪论”章节多了“1.5 技术路线图”的内容。在该论文第四章,亦多了“4.4 成本管理效果对比分析”的内容,这部分内容与孙福安的论文“5.3 成本管理效果分析”雷同。

    西安建筑科技大学杜刚的论文(左)和吉林大学孙福安的论文(右)目录部分高度雷同。

    在“参考文献”部分,两篇论文的参考文献共有12处重合。其中,西安建筑科技大学杜刚论文“参考文献”处多了8篇英文文献。

    在“后记和致谢”部分,吉林大学孙福安的论文提到,“感谢榆树市壹号院项目建设部的工作人员,为我的调研工作提到了较大的支持,为我提供了许多的宝贵数据,让我的论文研究更有说服性,也更为真实”。

    对此,10月9日,西安建筑科技大学研究生院学位办公室一名工作人员告诉记者,获悉情况后,他们已第一时间收集资料,启动调查程序。

    同日,吉林大学研究生院学位办公室一名工作人员告诉记者,他们将让涉事学院组成调查组,尽快展开调查。

    截至小募发稿,上述两校暂未有调查结果公示。

    不同高校同年研究生毕业论文高度雷同

    并不是首例

    值得注意的是,不同于以往涉嫌论文抄袭事件会有一个时间差,这种不同高校同年研究生毕业论文高度雷同事件也并不是首次发生。

    6月份,就有媒体报道电子科技大学2007届毕业生贾桂林11月提交的硕士学位论文《基于CAN总线的汽车组合仪表研究》和武汉理工大学2007届毕业生付胜波2007年4月提交的硕士学位论文《基于CAN总线的汽车组合仪表研究》,两篇论文高度雷同。

    付某论文(左)和贾某论文(右)封面比对

    经比对发现,上述两篇论文从标题、摘要到目录都几乎完全一致。正文经比对,也出现大面积雷同。不过,武汉理工大学付胜波的硕士学位论文比成都电子科技大学贾桂林的硕士学位论文要早提交7个月。

    后贾桂林表示,读在职研究生要求不是很高,硕士学位论文确实参考了别人的资料。具体提供的哪一部分,时间太长已记不清了。贾桂林表示,这其中没有涉及到钱的问题。付胜波则称,硕士学位论文是本人原创。

    后成都电子科技大学研究生院启动对贾桂林学位论文是否抄袭的调查,不过并没有公开告示调查结果。

    7月份,天津大学厦门大学出现了同年毕业的两名硕士,其毕业论文的标题、摘要、关键词、正文的结构及内容雷同或高度相似,多个段落一字不差。

    天津大学软件学院软件工程专业2018届硕士毕业生刘宇宸,与同年毕业的厦门大学信息学院软件工程专业学生林鲤。论文的标题是:《基于J2EE的环保管理系统的设计与实现》。

    对此,厦门大学表示:“这位同学已被授予硕士学位。如果他真的存在学术不端的行为,我们会提交校学位评定委员会研究是否撤销(他的)硕士学位。”天津大学也表态绝不包庇学术不端行为。

    另外,除了同年毕业研究生论文陷入抄袭争议,毕业时间相近的研究生论文近日也频繁被曝出抄袭事件。

    9月份,有网友反映北京交通大学土木建筑工程学院桥梁与隧道工程专业的硕士研究生刘光耀2008年7月提交的硕士学位论文,涉嫌大面积抄袭重庆大学土木工程学院桥梁与隧道工程专业的硕士研究生颜勤2007年5月提交的硕士学位论文。

    据悉,北京交通大学硕士研究生刘光耀2008年7月提交的硕士学位论文《地下互通立交隧道上下层主隧道施工方案优化研究》,导师为刘保国。重庆大学硕士研究生颜勤2007年5月提交的硕士学位论文《互通式地下立交隧道施工力学研究及方案优化》,导师为靳晓光。颜勤硕士学位论文提交时间比刘光耀硕士学位论文早一年。

    刘光耀硕士学位论文(左)涉嫌抄袭颜勤论文(右)部分。

    文中有出现大段文字或配图相似的情况。从论文开篇引言部分就可以看到,从参考文献的标注到具体阐述的内容,几乎一模一样;第4章节“正交隧道施工力学研究及方案优化”中也可以发现,两篇文章上述段落完全一致。

    5月份,有网友反映称,发现两篇标题一模一样的硕士学位论文。陕西师范大学硕士研究生田晓飞2017年5月完成的硕士学位论文《我国高校专业结构优化研究——基于生态学的视角》,涉嫌大面积抄袭武汉理工大学硕士研究生谭鹏2016年5月完成的硕士学位论文《高校专业结构优化研究——基于生态学的视角》,两篇文章通篇比对显示,两人硕士学位论文正文高度雷同。

    田晓飞硕士学位论文(左)中,涉嫌抄袭谭鹏硕士学位论文的部分。

    除了不同高校的两名研究生涉嫌论文抄袭,同一所高校两篇学位论文现雷同的事件也有发生。

    10月初,有网友爆料,中南林业科技大学林学院农业推广类硕士研究生王某2016年5月提交的硕士专业学位论文《耒阳市油茶产业的发展研究》,与中南林业科技大学商学院农村与区域发展类硕士研究生龙某2015年11月提交的硕士学位论文《永顺县油茶产业的发展研究》大面积雷同。

    王某 2016年5月提交的论文《耒阳市油茶产业的发展研究》导师为李志辉、陈永忠,龙某2015年11月提交的硕士学位论文《永顺县油茶产业的发展研究》导师为方威,两篇论文高度雷同。龙某的论文提交比王文绪早约5个月。  

     ▲两篇论文目录仅地名耒阳市、永顺县不同,其余完全一致。左为王某论文目录,右为龙某论文目录。

    两篇论文出现大面积雷同的内容。

     ▲王某论文(左)和龙某论文(右),完全一致部分。

      ▲王文绪论文(左)和龙莉论文(右),完全一致部分。


    后中南林业科技大学党委宣传部一位工作人员发来该校研究生院对此事的回复。回复称,学校对此高度重视,已依法依规启动相应程序,会同当事学院、学科专业对这两篇论文进行全面调查,调查结果将及时公布。学校坚持对学术不端行为零容忍,发现一起,查处一起,绝不姑息。

    同一年的硕士论文完全相同

    查重怎么过的?

    令很多人疑惑的是,为何几乎是同一篇论文会让同一年毕业,不同学校的两名硕士生同时毕业?这查重是怎么通过的?

    对此,有网友提到,同一年的论文是不在查重范围之内的,论文要隔一年才能上传至知网。而这或许就是没有查重出来的原因。

    还有一些网友给出大胆猜测,认为也有可能是找了同样的枪手代写,或者是其中一人在网上查重时,论文被店家卖给了另外一个人。

    图源:微博评论截图

    论文泄露渠道多

    你的论文,可能也遭受过泄密的风险

    高校毕业论文在未上传数据库前,其实都属于非常私密未公开的资产,但两篇论文却出现了高度雷同的情况,除了两名研究生找了同样的枪手写文章这样的可能性外,还有一个极大的可能性是你的毕业论文,在你不知情的情况下,被泄露出去了。

    就拿武汉理工大学这件事举例,当时,其中一名同学回忆到,自己的毕业论文曾发给同学和导师看过,但是最终版本只有导师看过,自己论文被泄露,最大的嫌疑是打印店

    每年毕业季各高校的打印店都是爆满,因为最终都要上交纸质版的论文,学生们必须要去打印店调整格式并打印出来,有时还要打印店老板帮忙调整,这就给了打印店暗中操作的便利机会。打印的多了,就让一些黑心的打印店老板钻了空子,暗中操作买卖学生的论文。

    我们上网搜寻关键词“高校打印店买卖论文”,发现众多相关报道。不少高校打印店低价出售其他同学打印过的论文,还偷偷建一个论文出售微信群,暗中买卖论文。

    更有甚者,50块钱就卖出一篇从内容到格式完美无缺的论文,学生们的知识财产就这样被售卖,辛辛苦苦写好的论文不受到保护,反而还成为了买卖的商品。这种违法行为既满足了打印店老板贪图小利和只需暗箱操作就可赚钱的侥幸心理,也让那些好逸恶劳、不尊重学术和他人成果的同学有机可乘。

    除此之外,论文的泄露,也有可能源自你去查重的平台....

    目前较为知名且使用量较大的查重系统主要由中国知网、万方、维普等知识数据库平台提供,但价格比较昂贵,因此,也有很多学生会选择在电商平台上买论文查重服务。

    比如在某电商平台上,小编搜索“查重”等关键词,有大量打着各类查重平台旗号的商家在提供论文查重服务。各个商家所采用的查重数据库五花八门,收费则从数十元到数百元不等。

    不少提供论文查重的淘宝卖家往往要求买家先将论文复制粘贴到卖家提供的第三方网址链接中,买家等待一定时间后方可下载电子版的查重报告。而买家上传的论文数据是否被卖家及时删除或妥善保管却未可知。

    你自己的论文,很有可能直接被淘宝卖家转卖给了别人。

    论文抄袭要付出代价

    我们要提高防泄露意识

    看过这么多的案例,小募提醒大家一定要注意保护自己科研成果的知识产权,及时保存证据,提高保密意识,慎用各种论文查重服务,去打印店打印论文时也留个心眼,警惕老板是否暗中操作偷偷保存你的论文。

    同时,还是建议大家选择正规的渠道进行论文查重,如果发现自己的论文被泄露,必要时,可以拿起法律的武器为自己维权。不然,很有可能被牵扯进学术不端事件里。


    另外,论文抄袭也是要付出代价的!

    首先是民事责任。抄袭他人论文,侵犯他人著作权。为了研究需要,可以引用他人作品,但是必须注明出处,否则就不属于合理使用。著作权人有权要求停止侵害,赔偿损失。当然,民事纠纷不告不理的原则,只要原作者不主张,就难以确认违法了。

    其次是行政责任。中华人民共和国教育部颁布实施的《普通高等学校学生管理规定》中明文规定:

    第三十七条 对以作弊、剽窃、抄袭等学术不端行为或者其他不正当手段获得学历证书、学位证书的,学校应当依法予以撤销。

    第五十二条 学生有下列情形之一,学校可以给予开除学籍处分:(五)学位论文、公开发表的研究成果存在抄袭、篡改、伪造等学术不端行为,情节严重的,或者代写论文、买卖论文的;

    所以,对于学生来说,严重抄袭,特别是作为学位论文或者公开发表的,是违反行政规章的行为。已经获得的学位,可能会被依法撤销,在读学生会被开除学籍。

    所以说,严谨学术态度很有必要。即便毕业了也可能随时复查论文的原创性,不可抱有一丝侥幸心理!

    本文募格学术整理自澎湃新闻、各高校官网、教育部、募格课堂、募格学术此前报道。

    本文仅做学术分享,如有侵权,请联系删文。

    下载1

    在「3D视觉工坊」公众号后台回复:3D视觉即可下载 3D视觉相关资料干货,涉及相机标定、三维重建、立体视觉、SLAM、深度学习、点云后处理、多视图几何等方向。

    下载2

    在「3D视觉工坊」公众号后台回复:3D视觉github资源汇总即可下载包括结构光、标定源码、缺陷检测源码、深度估计与深度补全源码、点云处理相关源码、立体匹配源码、单目、双目3D检测、基于点云的3D检测、6D姿态估计源码汇总等。

    下载3

    在「3D视觉工坊」公众号后台回复:相机标定即可下载独家相机标定学习课件与视频网址;后台回复:立体匹配即可下载独家立体匹配学习课件与视频网址。

    重磅!3DCVer-学术论文写作投稿 交流群已成立

    扫码添加小助手微信,可申请加入3D视觉工坊-学术论文写作与投稿 微信交流群,旨在交流顶会、顶刊、SCI、EI等写作与投稿事宜。

    同时也可申请加入我们的细分方向交流群,目前主要有3D视觉CV&深度学习SLAM三维重建点云后处理自动驾驶、CV入门、三维测量、VR/AR、3D人脸识别、医疗影像、缺陷检测、行人重识别、目标跟踪、视觉产品落地、视觉竞赛、车牌识别、硬件选型、学术交流、求职交流等微信群。

    一定要备注:研究方向+学校/公司+昵称,例如:”3D视觉 + 上海交大 + 静静“。请按照格式备注,可快速被通过且邀请进群。原创投稿也请联系。

    ▲长按加微信群或投稿

    ▲长按关注公众号

    3D视觉从入门到精通知识星球:针对3D视觉领域的知识点汇总、入门进阶学习路线、最新paper分享、疑问解答四个方面进行深耕,更有各类大厂的算法工程人员进行技术指导。与此同时,星球将联合知名企业发布3D视觉相关算法开发岗位以及项目对接信息,打造成集技术与就业为一体的铁杆粉丝聚集区,近2000星球成员为创造更好的AI世界共同进步,知识星球入口:

    学习3D视觉核心技术,扫描查看介绍,3天内无条件退款

     圈里有高质量教程资料、可答疑解惑、助你高效解决问题

    觉得有用,麻烦给个赞和在看~  

    展开全文
  • 然而很多第一次接触的却对参考文献充满迷惑,下面介绍怎样选取参考文献,并在论文引用。 参考文献可以为专利、专著、期刊、论文等等(百度百科或者百度文库这类的貌似老师不让用,也不算),且参考文献都是...
  • 之前写论文(英文)时,最后列举...例如,何凯明的论文《Deep Residual Learning for Image Recognition》,通过百度学术给出的引用格式为下: 国标,GB/T 7714:He K, Zhang X, Ren S, et al. Deep Residual Lea...
  •   本文介绍如何利用EndNote,对论文参考文献中英文文献的汉语拼音姓名(即作者包含中国的英文文章)的名的第二个字的首写字母加以补充显示。例如,假如如下一篇文章:   可知其第一作者的姓为Kong,名为...
  • 各出版社参考文献的引用格式不尽相同,本文将对“参考文献显示的样式”详细描述。 二.技术实现 1.插入库,代码如下: \usepackage[options]{natbib} 其中,option可选择为: round: (default) for round ...
  • 对别人已经研究过下过结论的内容,我们不需要再做研究,只需要通过参考文献的引用,就可以简要的表明我想要表达的内容,如果读者对这个说法疑问,可以去查找该篇参考文献详细了解。 二、 引用参考文献的原则: ...
  • 学术不端又来,一篇 AAAI 2021 论文涉嫌抄袭 ACL 2020 论文有人还贴了查重结果。几个月以来,学术圈不端行为屡被爆出,先是港科大硕士 ICCV 论文涉嫌抄袭,后北理工硕士生「一字不差」抄袭顶会投稿;就在不久...
  • 《娜璋带你读论文》系列主要是督促自己阅读优秀论文及听取学术讲座,并分享给大家,希望您喜欢。前一篇从个人角度介绍英文论文引言如何撰写。这篇文章将从个人角度介绍英文论文模型设计(Model Design)如何撰写,并...
  • 机器学习,尤其是其子领域深度学习,在近些年来...重要的研究论文可能带来使全球数十亿受益的技术突破。这一领域的研究目前发展非常快,为了帮助你了解进展状况,我们列出了自 2014 年以来最重要的 20 篇科学论文
  • 目录0. 前言1.YOLO V1 大体思路2. YOLO V1的训练过程2.1 YOLO V1网络结构2.2 具体训练过程2.2.1 把主干结构在ImageNet上进行预训练2.2.2 真正开始训练...最近一段时间在读YOLO系列的论文,目前跟着同济子豪兄读完了YOLO
  • 最近在完成论文的写作,无论是硕博士的大论文还是日常发布的小论文,精美的排版都会让评阅心情舒畅,一个良好的word模板也会让论文写作变得简单容易。正所谓工欲善其事必先利其器,拿出半天的时间去为自己 ...
  • 《娜璋带你读论文》系列主要是督促自己阅读优秀论文及听取学术讲座,并分享给大家,希望您喜欢。前一篇从个人角度介绍英文论文模型设计(Model Design)如何撰写。这篇文章将从个人角度介绍英文论文实验评估...
  • 链接:https://www.zhihu.com/question/422615858编辑:深度学习与计算机视觉声明:仅做学术分享,侵删作者:匿名用户https://www.zhihu....
  • 以色列 Technion 电子工程系教授 Yoav Sechhner 认为,“论文作者使用了一种非常先进的方法来学习先验知识( priors ),从本质上说,先验知识约束着所探寻的未知世界。因此,利用少量采集的数据可以很好地...
  • 本文是对篇近年来自然语言处理(NLP)领域高引论文的解读。 1. BERT: Pre-training of Deep Bidirectional Transformers for Language Understanding 作者:Jacob Devlin, Ming-Wei Chang, Kenton Lee, ...
  • 年科研生涯的阶段性总结
  • 在电脑写科研论文的字体和字号什么什么具体要求吗?论文格式 1、毕业论文格式的写作顺序是:标题、作者班级、作者姓名、指导教师姓名、中文摘要及关键词、英文摘要及英文关键词、正文、参考文献。2、毕业论文中...
  • 特别注意,Google学术可以跟踪作者论文(如有论文引用或者作者有论文就会提醒)。如果用学校IP登录,大部分文献可以直接下载。 DBLP 对会议检索很快,会将作者的相关工作整理归类。也会将会议的论文整理。 微软...
  • 论文写作】Latex命令学习,以ACL2020论文模板为例

    千次阅读 多人点赞 2020-06-03 17:15:02
    论文写作】Latex命令学习,以ACL2020论文模板为例1、项目准备工作2、项目文件熟悉2.1 .tex文件说明2.2 .bib文件说明2.3 .cls文件说明2.4 .sty文件说明3、常用命令3.1 \documentclass3.2 \usepackage3.3 \title与\...
  • 一个引用是印度某大学的一篇博士论文; (我心里想,印度的大学果然比较水) 另一个引用, 我确认了下, 是刚刚发在IEEE PAMI上的文章 啊啊啊.
  • 论文的可复现性,能否量化分析?

    千次阅读 2020-02-17 15:50:05
    对于每一名研究者来说,复现论文是理解一篇论文的必经之路,然而也是最令头疼的环节。什么样的论文可以被复现?什么样的论文无法被复现?这实际上也是一个科学问题。 在 NeurIPS 2019 上,元科学研究者 Edward ...
  • 论文和平时学习时有用的网站

    万次阅读 多人点赞 2019-06-07 22:07:02
    摘要:这篇博文介绍几个写论文或平时学习中特别有用的网站,的帮助你找论文中的代码或数据,的则是论文写作、科研管理的利器,方便你更快完成高质量的paper。科学研究与艺术创作异曲同工之妙,若是不能...
  • 不论是写毕业论文、职称论文,还是竞赛论文等等,都需要去查询、阅读大量的参考文献、书籍,才能更好的了解自己的研究领域,从而写出一篇不错的具有前瞻性的论文,或者综述性文章。而参考文献的正确书写格式,也是...
  • R-CNN论文详解(论文翻译)

    万次阅读 多人点赞 2018-05-08 20:27:36
    faster-rcnn在深度学习领域算是一篇开创性的论文,对后续产生的而网络很重要的意义,认真读懂这篇论文,相信也算是深度学习入门了 。今天又重新读了读faster-rcnn,整理了一份阅读笔记,整理的过程使自己对整个深度...
  • 之前也用过NoteExpress,这一国产软件对于中文参考文献的支持性很好,但是由于论文较多,个软件换着用也不太方便。因此需要手动对EndNote参考文献的输出格式(“Output Styles”)加以修改。本文则对EndNote软件的...
  • 尽管我国规范GB/T7714-2015制定了标准的文献著录格式,但现有的数据库检索网站所提供的引用格式仍然存在许多谬误,为学术新人造成困扰甚至误导。本文依据国标规范GB/T7714-2015中的相关论述,结合时下流行的各类...
  • 机器学习和深度学习引用量最高的20篇论文(2014-2017) ...机器学习和深度学习的研究进展正深刻变革着人类的技术,本文列出了自 2014 年以来这个领域发表的最重要(被引用次数最多)的 20 篇科学论文,以飨读者。

空空如也

空空如也

1 2 3 4 5 ... 20
收藏数 23,271
精华内容 9,308
关键字:

引用论文作者有两人