精华内容
下载资源
问答
  • 根 据这个定义,项目就具有了目标明确性、活动一次性及资源消耗性等特性。换句话说,具备前面三个主要特性的活动,都可以看作是项目。现实中的项目随处可见, 如设备消缺、会议组织、技术竞赛、结婚典礼以及家居装修...

    项目是为完成某一独特的产品或服务所做的一次性努力。根 据这个定义,项目就具有了目标明确性、活动一次性及资源消耗性等特性。换句话说,具备前面三个主要特性的活动,都可以看作是项目。现实中的项目随处可见, 如设备消缺、会议组织、技术竞赛、结婚典礼以及家居装修等等,都可以看作是项目。在这些项目的实施过程中,都存在项目管理问题,不过,实际生活与工作中, 可能更多关注的事情本身,而对做好事情相关的组织、计划、控制等过程相对缺少关注,或者没有经验与能力加以关注。

      项目管理是在项目活动中运用知识、技能、工具和技术来实现项目要求。项目管理总体有五个过程:启动过程、计划过程、实施过程、执行过程、收尾过程等,包含了九大领域的知识:范围管理、时间管理、成本管理、质量管理、风险管理、人力资源管理、沟通管理、采购管理及系统管理的方法与工具。作为项目经理要全面掌握这些九个核心领域的知识,并重点把握系统管理的观念,避免进入某个细节,注意在五个不同阶段的重点。

     

      一、项目管理的三个约束条件

      任何项目都会在范围、时间及成本三个方面受到约束,这就是项目管理的三约束。项目管理,就是以科学的方法和工具,在范围、时间、成本三者之间寻找到一 个合适的平衡点,以便项目所有干系人都尽可能的满意。项目是一次性的,旨在产生独特的产品或服务,但不能孤立地看待和运行项目。这要求项目经理要用系统的 观念来对待项目,认清项目在更大的环境中所处的位置,这样在考虑项目范围、时间及成本时,就会有更为适当的协调原则。

      1.项目的范围约束

      项目的范围就是规定项目的任务是什么?作为项目经理,首先必须搞清楚项目的商业利润核心,明确把握项目发起人期望通过项目获得什么样的产品或服务。对于项目的范围约束,容易忽视项目的商业目标,而偏向技术目标,导致项目最终结果与项目干系人期望值之间的差异。

      因为项目的范围可能会随着项目的进展而发生变化,从而与时间和成本等约束条件之间产生冲突,因此面对项目的范围约束,主要是根据项目的商业利润核心做 好项目范围的变更管理。既要避免无原则的变更项目的范围,也要根据时间与成本的约束,在取得项目干系人的一致意见的情况下,合理的按程序变更项目的范围。

      2.项目的时间约束

      项目的时间约束就是规定项目需要多长时间完成,项目的进度应该怎样安排,项目的活动在时间上的要求,各活动在时间安排上的先后顺序。当进度与计划之间 发生差异时,如何重新调整项目的活动历时,以保证项目按期完成,或者通过调整项目的总体完成工期,以保证活动的时间与质量。

      在考虑时间约束时,一方面要研究因为项目范围的变化对项目时间的影响,另一方面要研究,因为项目历时的变化,对项目成本产生的影响。并及时跟踪项目的进展情况,通过对实际项目进展情况的分析,提供给项目干系人一个准确的报告。

      3.项目的成本约束

      项目的成本约束就是规定完成项目需要花多少钱。对项目成本的计量,一般用花费多少资金来衡量,但也可以根据项目的特点,采用特定的计量单位来表示。关 键是通过成本核算,能让项目干系人,了解在当前成本约束之下,所能完成的项目范围及时间要求。当项目的范围与时间发生变化时,会产生多大的成本变化,以决 定是否变更项目的范围,改变项目的进度,或者扩大项目的投资。

      在我们实际完成的许多项目中,多数只重视项目的进度,而不重视项目的成本管理。一般只是在项目结束时,才交给财务或计划管理部门的预算人员进行项目结 算。对内部消耗资源性的项目,往往不做项目的成本估算与分析,使得项目干系人根本认识不到项目所造成的资源浪费。因此,对内部开展的一些项目,也要进行成 本管理。

      由于项目是独特的,每个项目都具有很多不确定性的因素,项目资源使用之间存在竞争性,除了极小的项目,项目很难最终完全按照预期的范围、时间和成本三 大约束条件完成。因为项目干系人总是期望用最低的成本、最短的时间,来完成最大的项目范围。这三个期望之间是互相矛盾、互相制约的。项目范围的扩大,会导 致项目工期的延长或需要增加加班资源,会进一步导致项目成本的增加;同样,项目成本的减少,也会导致项目范围的限制。作为项目经理,就是要运用项目管理的 九大领域知识,在项目的五个过程组中,科学合理的分配各种资源,来尽可能的实现项目干系人的期望,使他们获得最大的满意度。

     

      二、项目管理的五个主要过程组

      一个项目的生命周期大概分成概念、开发、实施与收尾过程。在概念阶段主要是对成本进行分析,对项目的可行性进行研究,其结果是要拿出一份报告,并获得 批准与支持。实际工作中,我们只是有了一个新的想法与概念,就立即转入开发过程。在开发阶段,要有项目计划书、预算的成本以及工作分解计划。

      我们做事时,可能只是拿出一个简单的工作分解与大致的项目计划时间表,就结束了。在实施阶段,要有底层的工作包与确定的成本我们做事时,可能只是拿出 一个简单的工作分解与大致的项目计划时间表,就结束了。在实施阶段,要有底层的工作包与确定的成本估计,但我们没有,到了这一步,我们基本上就开始失去了 控制,没有明确的里程碑,我

      我们只是把一个阶段当成了一个项目。在收尾阶段,我们是经常讨论每个项目的教训,但对完成的工作的文档工作基本上没能及时跟上,同样与用户之间的交接也未能做好。

      项目管理的五个过程组:启动、计划、执行、控制与收尾,贯穿于项目的整个生命周期,对于项目的启动过程,特别要注意组织环境及项目干系人的分析;而在 后面的过程中,项目经理要抓好项目的控制,控制的理想结果就是在要求的时间、成本及质量限度内完成双方都满意的项目范围。

      1.项目的启动过程

      项目的启动过程就是一个新的项目识别与开始的过程。一定要认识这样一个概念,即在重要项目上的微小成功,比在不重要的项目上获得巨大成功更具意义与价 值。从这种意义上讲,项目的启动阶段显得尤其重要,这是决定是否投资,以及投资什么项目的关键阶段,此时的决策失误可能造成巨大的损失。重视项目启动过 程,是保证项目成功的首要步骤。

      启动涉及项目范围的知识领域,其输出结果有项目章程、任命项目经理、确定约束条件与假设条件等。启动过程的最主要内容是进行项目的可行性研究与分析, 这项活动要以商业目标为核心,而不是以技术为核心。无论是领导关注,还是项目宗旨,都应围绕明确的商业目标,以实现商业预期利润分析为重点,并要提供科学 合理的评价方法,以便未来能对其进行评估。

      2.项目的计划过程

      项目的计划过程是项目实施过程中非常重要的一个过程。通过对项目的范围、任务分解、资源分析等制定一个科学的计划,能使项目团队的工作有序的开展。也 因为有了计划,我们在实施过程中,才能有一个参照,并通过对计划的不断修订与完善,使后面的计划更符合实际,更能准确的指导项目工作。

      以前有一个错误的概念,认为计划应该准确,所谓准确,就是实际进展必须按计划来进行。实际并不是如此,计划是管理的一种手段,仅是通过这种方式,使项目的资源配置、时间分配更为科学合理而已,而计划在实际执行中是可以不断修改的。

      在项目的不同知识领域有不同的计划,应根据实际项目情况,编制不同的计划,其中项目计划、范围说明书、工作分解结构、活动清单、网络图、进度计划、资源计划、成本估计、质量计划、风险计划、沟通计划、采购计划等等,是项目计划过程常见的输出,应重点把握与运用。

      3.项目的实施过程

      项目的实施,一般指项目的主体内容执行过程,但实施包括项目的前期工作,因此不光要在具体实施过程中注意范围变更、记录项目信息,鼓励项目组成员努力完成项目,还要在开头与收尾过程中,强调实施的重点内容,如正式验收项目范围等。

      在项目实施中,重要的内容就是项目信息的沟通,即及时提交项目进展信息,以项目报告的方式定期通过项目进度,有利开展项目控制,对质量保证提供了手段。

      4.项目的控制过程

      项目管理的过程控制,是保证项目朝目标方向前进的重要过程,就是要及时发现偏差并采取纠正措施,使项目进展朝向目标方向。

      控制可以使实际进展符合计划,也可以修改计划使之更切合目前的现状。修改计划的前提是项目符合期望的目标。控制的重点有这么几个方面:范围变更、质量标准、状态报告及风险应对。基本上处理好以上四个方面的控制,项目的控制任务大体上就能完成了。

      5.项目的收尾过程

      一个项目通过一个正式而有效的收尾过程,不仅是对当前项目产生完整文档,对项目干系人的交待,更是以后项目工作的重要财富。在经历的很多项目中,更多重视项目的开始与过程,忽视了项目收尾工作,所以项目管理水平一直未能得到提高。

      另外要重视那一类未能实施成功的项目收尾工作,不成功项目的收尾工作比成功项目的收尾更难,也来得更重要,因为这样的项目的主要价值就是项目失败的教训,因此要通过收尾将这些教训提炼出来。

      项目收尾包括对最终产品进行验收,形成项目档案,吸取的教训等。另外,对项目干系人要做一个合理的安排,这也是容易忽视的地方,简单的打发回去不是最好的处理办法,更是对项目组成员的不负责任。

      项目收尾的形式,可以根据项目的大小自由决定,可以通过召开发布会、表彰会、公布绩效评估等手段来进行,形式是根据情况采用,但一定要明确,并能达到效果。如果能对项目进行收尾审计,则是再好不过的了,当然也有很多项目是无需审计的。

     

      三、项目管理的九大知识领域

      项目管理的九大知识领域是指作为项目经理必须具备与掌握的九大块重要知识与能力。其中核心的四大知识领域是范围、时间、成本与质量管理。在这些知识领 域中还涉及很多的管理工具和技术,以用来帮助项目经理与项目组成员完成项目的管理。如:网络图示法、关键路径法、头脑风暴法、挣值法等,不同的工具能帮助 我们完成不同的管理工作。另外,还有很多项目管理软件,如:MicrosoftProject、P3等,作为项目管理的工具,也可以很好的帮助我们解决在项目的各个过程中完成计划、跟踪、控制等管理过程。

      1.项目整体管理知识

      项目的整体管理,或者说是综合管理也不为错,它是综合运用其他八个领域的知识,合理集成与平衡各要素之间的关系,确保项目成功完成的关键。

      项目的整体管理包括三个主要过程:

      项目计划制定:即收集各种计划编制的结果,并形成统一协调项目计划文档。

      项目计划执行:通过执行项目计划的活动,来实施计划。

      整体变更控制:控制项目的变更。

      项目经理负责协调完成一个项目所需的人员、计划以及工作,统领全局,带领团队实现项目的目标;当项目目标之间或参与项目的人员之间出现冲突时,负责拍 板定夺;并负责及时向高层管理人员汇报项目进展信息。总而言之,项目经理主要负责项目的整体管理,这也是项目成功的关键。

      回顾以前负责的项目,觉得主要存在以下问题:

      未找到项目发起人,或者项目发起人不明确,常把自己当成项目发起人;

      项目交付成果定义不清,以致最后收尾时无法对照计划进行验收;

      缺少组织结构描述;

      对项目的控制未能规范化,尤其是项目范围的变更控制;

      风险管理未得到重视,只是在项目组内讨论,并停留在项目负责人的头脑中;

      缺乏项目干系人分析;

      没有规范的进度报告,项目进展报告随意性较大。

      要有效的开展项目管理,引用项目管理的知识体系与方法工具,先依样画葫芦,通过实践,进一步领会这些内容是必须的。

      2.项目范围管理知识

      项目范围的不确定,会导致项目范围的不断扩大,作为项目经理,在项目开始时,就要对项目范围拿出项目干系人都认可的、理解无歧意的范围说明文档——项目章程。然后为了保证项目的实施,明确项目组成员的工作责任,还必须分解项目范围,使之成为更小的项目任务包——工作分解结构(WBS)。

      最后还有就是要认识到项目本身不是孤立的,因此有时范围的变更也是必须的,关键是当变更发生时,如何加以控制。

      在以上讨论之前,最重要的是当面临项目时,或不知道具体做什么时,如何进行范围管理。对潜在项目的识别,有四个步骤:

      确定做一个什么样的项目;

      业务分析,找出重要的业务过程,分析其中最能从项目中得到好处的过程;

      形成项目可能的优势,确定范围、好处及约束;

      选择方案,分配资源。

      对于从多个项目中选择项目,或从多个方案中选择方案的情况,常见的四种方法:整体需要、分类、NPV及加权评分模型。

      3.项目的时间管理知识

      项目的时间管理,就是确保项目按期完成的过程。首先要制定项目的进度计划,然后是跟踪检查进度计划与实际完成情况之间的差异,及时调整资源、工作任务 等,以保证项目的进度实现。在跟踪过程中,要及时与项目干系人进行交流,以及时发现范围的偏差,而产生时间与进度上的差异,或项目组成员有意或无意识的虚 报了项目完成情况,导致进度的失控。

      具体包括以下内容:

      活动定义:从WBS分解而来;

      活动排序:明确活动之间的依赖关系;

      活动历时估算:估算每项活动的时间,可以PERT方法进行;

      利用PROJECT等工具软件,协助项目的时间管理;

      利用甘特图帮助跟踪项目进度;

      利用网络图及关键路径分析,协助确定完成日期上的重要性或调整工期对项目工期的影响,以及处理关注的焦点活动。

      需要注意一点,以前学习项目的时间管理工具及方法以后,就以为可以实现对项目的跟踪控制了,其实不然,这些工

      工具都是通过人来发生作用,活动也是由人来完成的,因此项目经理不能把太多心思花在工具上,而是学会利用工具来协调人与资源的矛盾冲突。

      4.项目的成本管理知识

      对于项目经理在成本管理方面,就是要努力减少和控制成本,满足项目干系人的期望。其过程包括:

      资源计划:即制定资源需求清单;

      成本估算:对所需资源进行成本估算;

      成本预算:将整体成本估算配置到各个单项工作,建立成本基准计划;

      成本控制:控制项目预算的变化,修正成本的估算,更新预算,纠正项目组成员的行动,进行完工估算与成本控制的分析。

      在成本管理中涉及很多财务管理的概念、术语、基础理论及方法与工具的使用,作为项目经理,对这些内容要熟悉,特别是挣值分析的相关术语及简称,如:BCWS、BCWP、ACWP、CV、SV、CPI、SPI等等,不光要了解这些术语的涵意,还要掌握他们的计算公式。

      5.项目人力资源管理知识

      项目的人力资源管理就是有效发挥每个参与项目的人员的作用的过程。项目的人力资源管理过程包括:

      组织计划编制:形成项目的组织结构图;

      获取相关人员:其中重点是业务相关人员;

      团队建设:明确每个项目干系人的责任,训练与提高其技能,实现团队的合作与沟通。

      因为与人发生关系,其中首先是要明确各自的责任,这一点计划编制时就要明确,可以通过项目管理软件帮助项目经理提高效率,并能及时发现任务分解的合理性,最后形成合理的任务分解表。

      同时,要通过有效的激励方法来帮助项目成员实施项目计划,提高效率。项目是通过团队共同努力实现的,注意充分发挥团队的作用,使团队成员各尽所能是项目经理的挑战。在处理过程中,争取做到对事不对人,通过有效的会议来帮助项目实现沟通、检查以及目标实现。

      6.项目的质量管理知识

      项目的质量,理解为项目满足客户明确或隐含的要求的一致性程度。注意这里包括明确的要求,也包括隐含的要求。这对IT项目来说,如何满足用户隐含的质量要求,可能是IT项目质量失败的重要原因。可能所开发的系统符合需求说明中的要求,却与用户实际的要求(包含隐含的需求中),相差很大,导致不一致,结果导致IT项目的失败。

      现代质量管理经过了一个发展过程,目前已建立起相对完善的质量体系,国际组织也有相关的质量文件,以评审普通的生产质量,如ISO2000系列质量标准;对软件的生产质量,也有一些评价模型,如SQFD模型、CMM软件成熟度模型等等。其中CMM成熟度模型分成五个层次:自发的、简单的、有组织的、被管理的及适应的,分别标识为不同的级别。

      对于项目管理需要制订质量计划,并应用质量保证的工具确保质量计划的实施。在质量控制的过程中,有许多现成的工具与方法,如帕累托分析、统计抽样和标 准差等。要提高项目的质量,必须在领导中形成质量意识,通过建立一个好的工作环境来提高质量,通过形成质量文化来改进质量,是全面提升项目质量管理的关键 因素之一。

      在以往所经历的项目中,项目的质量管理基本上没有得到重视,公司每年都在开展QC活动,该活动的目的就是改进质量,但活动成了科技创新活动,而更多的项目实施过程中,如何开展质量管理,却未能有所体现,这也是值得探讨的问题。

      7.项目的沟通管理知识

      项目的沟通管理非常重要,对项目经理而言,就如同前线指挥需要情报管理一样,这是使整个项目组掌握项目信息,实施其他管理手段的基础,所有的控制都有基于沟通基础之上的。

      在项目的开始,需要编制沟通计划,包括什么时间、将什么内容、以什么样的格式、通过什么样的方式、向谁传递。在项目的沟通中,可以采用书面报告、口头报告或非正式的交流,各种方式有利也有弊,关键看是否有利于沟通的效果。

      沟通的复杂程度随着对象的增加而快速增加,因此要通过适当的工具和手段,使面对面的沟通控制在一定范围之内,尽量减少因无效沟通而给项目管理带来的负责影响。

      在沟通中,会议是有效形式之一。很多业务员人员喜欢通过会议,以简单的形式化的语言描述项目的进展与项目中碰到的问题,而不喜欢技术化的图表与文档。

      8.项目的风险管理知识

      当因为未能做好风险管理,导致项目的风险发生时,项目干系人将难以一下子接受风险发生的事实以及风险所带来的损失,需要用更多的时间来调整

      整心理状态,才能恢复对项目的实施。

      项目的风险管理不仅是在项目进行过程中,有效避免风险的发生;而且能在风险发生时,帮助我们用正确的心态去面对,而不会手足无措。很多项目的失败,是 因为风险发生时,对项目干系心理上造成的伤害,导致失去主观判断能力,而作出错误的决策。从这种意义上讲,项目的风险计划的制定主要是为提高项目干系人的 风险意识,只要有了足够的风险意识,风险识别全面与否,在有些项目中可能重要性反而不是太明显。

      风险识别可以采用头脑风暴法、经验法则等方法,在识别这些风险因子之后,可以对这些因子加上权重,最后可以计算出项目成功的概率,并能据此决策项目是 否应该开展、继续或停止。识别风险因子之后,紧接着就是制定风险应对措施。根据风险发生的概率,产生的风险成本与收益,决定相应的应对策略,如风险处理、 风险接受、风险改善等等。

      实际工作中,可能识别到存在的风险,但却不能加以正确处理。风险就这样被层层传递。如因用户参与不够,导致需求不正确,进一步产生工期估计的失误,结果是计划的偏差,最后整个项目的结果产生偏差。因此,要注意从风险的源头抓起,防止风险的层层放大。

      9.项目的采购管理知识

      采购就是从外界获得产品或服务。对于IT项目而言,采购变得越来越重要。目前绝大多数的IT项目都离不开采购管理,而且很多项目的主要内容就是设备采购或咨询采购,对于企业而言,能否做好采购管理是保证项目成功的重点内容。

      有效采购管理包括以下过程:

      编制合理有效的采购计划:这是项目管理的一个重要过程,即确定项目的哪些需求可以通过采购得到更好的满足。在采购计划中,首先是决定是否需要采购、如何采购、采购什么、采购多少、何时采购等内容;

      编制询价计划:即编制报价邀请书RFQ或招标书;

      询价:进行实际询价;

      开标:评估并选择供应商;

      管理:对采购合同进行管理;

      收尾:对采购合同进行收尾。

      在整个过程中,容易忽视的两个过程,一是采购计划,二是合同收尾。采购计划的编制,是采购管理整体按需求进行的前提,如果这一步做不好,其他都是白费劲;而在采购的合同收尾过程中,最容易忘记或做不到的就是采购审计。至于供应商的选择等过程,在IT 项目中,往往会过分重视技术,而忽略管理与成本。其实,管理与成本决定合同能否按期保持履行的前提。在我公司的实际情况中,一般项目以设备为主要成本时, 往往就不再考虑其他内容,而仅是作为一般的设备采购,交会器材部门实施。因为不光没能做到项目管理,亦未做到采购管理,所以这类项目虽然也实施完成了,但 项目的实施质量总令人不太满意

    展开全文
  • 我国在人工智能领域的科学技术研究和产业发展起步稍晚,但在最近十余年的时间里抓住了机遇,进入了快速发展阶段。在这个过程中, 技术突破和创造性高端人才对人工智能的发展起着至关重要的作用。 本周,清华大学AI...

    2019-12-08 20:36:36

    当前,人工智能正处在爆发期。我国在人工智能领域的科学技术研究和产业发展起步稍晚,但在最近十余年的时间里抓住了机遇,进入了快速发展阶段。在这个过程中, 技术突破和创造性高端人才对人工智能的发展起着至关重要的作用。 本周,清华大学AI研究机构AMiner发布了《2019中国人工智能发展报告》,报告遴选 13 个人工智能的重点领域进行重点介绍,包括:机器学习、知识工程、计算机视觉、自然语言处理、语音识别、计算机图形学、多媒体技术、人机交互、机器人、数据库技术、可视化、数据挖掘、信息检索与推荐等。

    本期的智能内参,我们推荐清华大学的研究报告《2019中国人工智能发展报告》,对人工智能 13 个领域的人才情况及技术发展等内容进行了挖掘分析。如果想收藏本文的报告(2019中国人工智能发展报告),可以在智东西头条号私信回复关键词“nc419”获取。

    清华2019最新AI发展报告出炉!400页干货,13大领域一文看懂

     

    本期内参来源:清华大学AMiner

    原标题:

    《2019中国人工智能发展报告》

    作者: 李涓子 唐 杰

    一、机器学习

    机器学习已经成为了当今的热门话题,但是从机器学习这个概念诞生到机器学习技术的普遍应用经过了漫长的过程。在机器学习发展的历史长河中,众多优秀的学者为推动机器学习的发展做出了巨大的贡献。

    学者地图用于描述特定领域学者的分布情况, 对于进行学者调查、分析各地区竞争力现况尤为重要,下图为机器学习领域全球学者分布情况:

    清华2019最新AI发展报告出炉!400页干货,13大领域一文看懂

     

    ▲机器学习领域全球学者分布

    地图根据学者当前就职机构地理位置进行绘制,其中颜色越深表示学者越集中。 从该地图可以看出,美国的人才数量遥遥领先且主要分布在其东西海岸;欧洲中西部也有较多的人才分布;亚洲的人才主要分布于我国东部及日韩地区;其他诸如非洲、南美洲等地区的学者非常稀少;机器学习领域的人才分布与各地区的科技、经济实力情况大体一致。 此外, 在性别比例方面,机器学习领域中男性学者占比 89.8%,女性学者占比 10.2%,男性学者占比远高于女性学者。

    我国专家学者在机器学习领域的分布如上图所示。通过下图我们可以发现,京津地区在本领域的人才数量最多,其次是长三角和珠三角地区,相比之下,内陆地区的人才较为匮乏,这种分布与区位因素和经济水平情况不无关系。同时,通过观察中国周边国家的学者数量情况,特别是与日韩、东南亚等亚洲国家相比,中国在机器学习领域学者数量较多。

    清华2019最新AI发展报告出炉!400页干货,13大领域一文看懂

     

    ▲ 机器学习领域中国学者分布

    对本领域的高水平学术会议论文进行挖掘,解读这些会议在近年的部分代表性工作,会议具体包括:

    International Conference on Machine Learning

    Conference and Workshop on Neural Information Processing Systems

    我们对本领域论文的关键词进行分析,统计出词频 Top20 的关键词,生成本领域研究热点的词云图,如上图所示。其中, 出神经网络(neural networks)、深度学习(deep learning)、强化学习(reinforcement learning)是本领域中最热的关键词。 ICML 和 NeurlPS 是机器学习领域非常具有代表性的会议,限于报告篇幅,我们选取 ICML 和 NeurlPS 近十年若干最佳论文进行解读。

    ICML 2019 年最佳论文

    论文题目: Challenging Common Assumptions in the Unsupervised Learning of Disentangled Representations

    中文题目: 挑战无监督分离式表征的常见假设

    论文作者: Francesco Locatello, Stefan Bauer, Mario Lucic, Gunnar Rätsch, Sylvain Gelly, Bernhard Schölkopf, Olivier Bachem

    论文地址: https://aminer.cn/pub/5c04967517c44a2c74709162/challenging-commonassumptions-in-the-unsupervised-learning-of-disentangled-representations

    论文解读: 文章主要从理论和实践两方面对这一领域中的一些基本假设提出了挑战。文章从理论上证明,如果没有对所考虑的学习方法和数据集产生归纳偏置,那么解耦表示的无监督学习基本上是不可能的。文章还采用了完善的无监督解耦学习实验方案,进行了一个超级大规模的实验研究。最后还发布了disentanglement_lib,这是一个用于训练和评估解耦表示的新库。由于复制这个结果需要大量的计算工作论文还发布了超过 10000 个预训练的模型,可以作为未来研究的基线方法。

    论 文 题 目 : Rates of Convergence for Sparse Variational Gaussian Process Regression

    中文题目: 稀疏变分高斯过程回归的收敛速度

    论文作者: David R. Burt, Carl E. Rasmussen, Mark van der Wilk

    论文地址: https://www.aminer.cn/pub/5cede106da562983788e64b9/rates-ofconvergence-for-sparse-variational-gaussian-process-regression

    论文解读:这篇文章来自英国剑桥大学。自从许多研究人提出了对高斯过程后验的变分近似法后,避免了数据集大小为 N 时 O(N3) 的缩放。它们将计算成本降低到 O(NM2),其中 M ≤ N 是诱导变量的数量。虽然 N 的计算成本似乎是线性的,但算法的真正复杂性取决于 M 如何增加以确保一定的近似质量。论文证明了稀疏 GP 回归变分近似到后验变分近似的 KL 散度的界限,该界限仅依赖于先验核的协方差算子的特征值的衰减。这些边界证明了直观的结果,平滑的核、训练数据集中在一个小区域,允许高质量、非常稀疏的近似。这些边界证明了用M≤N 进行真正稀疏的非参数推理仍然可以提供可靠的边际似然估计和点后验估计。对非共轭概率模型的扩展,是未来研究的一个有前景的方向。

    二、计算机视觉

    计算机视觉(computer vision),顾名思义,是分析、研究让计算机智能化的达到类似人类的双眼“看”的一门研究科学。即对于客观存在的三维立体化的世界的理解以及识别依靠智能化的计算机去实现。确切地说,计算机视觉技术就是利用了摄像机以及电脑替代人眼使得计算机拥有人类的双眼所具有的分割、分类、识别、跟踪、判别决策等功能。总之,计算机视觉系统就是创建了能够在2D 的平面图像或者 3D 的三维立体图像的数据中,以获取所需要的“信息”的一个完整的人工智能系统。

    学者地图用于描述特定领域学者的分布情况,对于进行学者调查、分析各地区竞争力现况尤为重要,下图为计算机视觉领域全球学者分布情况:

    地图根据学者当前就职机构地理位置进行绘制,其中颜色越深表示学者越集中。 从该地图可以看出,美国的人才数量优势明显且主要分布在其东西海岸;亚洲也有较多的人才分布,主要集中在我国东部及日韩地区;欧洲的人才主要分布在欧洲中西部;其他诸如非洲、南美洲等地区的学者非常稀少;计算机视觉领域的人才分布与各地区的科技、经济实力情况大体一致。

    清华2019最新AI发展报告出炉!400页干货,13大领域一文看懂

     

    ▲ 计算机视觉领域全球学者分布

    此外,在性别比例方面,计算机视觉中男性学者占比 91.0%,女性学者占比9.0%,男性学者占比远高于女性学者。

    计算机视觉学者的 h-index 分布如下图所示,大部分学者的 h-index 分布在中间区域,其中 h-index 在 20-30 区间的人数最多,有 706 人, 占比 34.7%,小于 20 的区间人数最少, 有 81 人。

    我国专家学者在计算机视觉领域的分布如下图所示。通过下图我们可以发现,京津地区在本领域的人才数量最多,其次是珠三角和长三角地区,相比之下,内陆地区的人才较为匮乏,这种分布与区位因素和经济水平情况不无关系。同时,通过观察中国周边国家的学者数量情况,特别是与日韩、东南亚等亚洲国家相比,中国在计算机视觉领域学者数量相对较多。

    清华2019最新AI发展报告出炉!400页干货,13大领域一文看懂

     

    ▲计算机视觉领域中国学者分布

    对本领域的高水平学术会议论文进行挖掘,解读这些会议在 2018-2019年的部分代表性工作。 会议具体包括:

    IEEE Conference on Computer Vision and Pattern Recognition

    European Conference on Computer Vision

    论文题目: Encoder-Decoder with Atrous Separable Convolution for Semantic Image Segmentation

    中文题目:具有空洞分离卷积的编码–解码器用于语义图像分割

    论文作者: Liang-Chieh Chen, Yukun Zhu, George Papandreou, Florian Schroff,Hartwig Adam

    论文出处: Proceedings of the European conference on computer vision (ECCV). 2018:801-818.

    论文地址: https://link.springer.com/chapter/10.1007%2F978-3-030-01234-2_49

    研究问题:

    语义分割是计算机视觉中一项基本且重要的研究内容, 它是为图像中的每个像素分配语义标签。 在深度学习语义分割任务中经常会使用空间金字塔池化和编码–解码器结构。空间金字塔池化可以通过不同分辨率的池化特征捕捉丰富的上下文信息,但网络中具有步进操作的池化或卷积会导致与对象边界有关的详细信息丢失。这可以通过空洞卷积提取更密集的特征图来缓解, 但大大增加了计算资源的消耗。而编码-解码器结构则可以通过逐渐恢复空间信息来捕获更清晰的对象边界。通过组合两种方法的优点,提出新的模型—DeepLabv3+。

    近年来,巨量数据的不断涌现与计算能力的快速提升,给以非结构化视觉数据为研究对象的计算机视觉带来了巨大的发展机遇与挑战性难题,计算机视觉也因此成为学术界和工业界公认的前瞻性研究领域,部分研究成果已实际应用,催生出人脸识别、智能视频监控等多个极具显示度的商业化应用。

    近两年大多数研究都集中在深度学习、检测和分类以及面部/手势/姿势、 3D传感技术等方面。 随着计算机视觉研究的不断推进,研究人员开始挑战更加困难的计算机视觉问题,例如,图像描述、事件推理、场景理解等。单纯从图像或视频出发很难解决更加复杂的图像理解任务,一个重要的趋势是多学科的融合,例如,融合自然语言处理领域的技术来完成图像描述的任务。

    图像描述是一个融合计算机视觉、自然语言处理和机器学习的综合问题,其目标是翻译一幅图片为一段描述文字。目前主流框架为基于递归神经网络的编码器解码器结构其核心思想类似于自然语言机器翻译。但是,由于递归网络不易提取输入图像和文本的空间以及层次化约束关系,层次化的卷积神经网络以及启发自认知模型的注意力机制受到关注。如何进一步从认知等多学科汲取知识,构建多模态多层次的描述模型是当前图像描述问题研究的重点。

    事件推理目标是识别复杂视频中的事件类别并对其因果关系进行合理的推理和预测。与一般视频分析相比,其难点在于事件视频更加复杂,更加多样化,而最终目标也更具挑战性。不同于大规模图像识别任务,事件推理任务受限于训练数据的规模,还无法构建端到端的事件推理系统。目前主要使用图像深度网络作为视频的特征提取器,利用多模态特征融合模型,并利用记忆网络的推理能力,实现对事件的识别和推理认知。当前研究起源于视频的识别和检测,其方法并未充分考虑事件数据的复杂和多样性。如何利用视频数据丰富的时空关系以及事件之间的语义相关性,应是今后的关注重点。

    场景理解的目的是计算机视觉系统通过分析处理自身所配置的传感器采集的环境感知数据,获得周围场景的几何/拓扑结构、组成要素(人、车及物体等)及其时空变化,并进行语义推理,形成行为决策与运动控制的时间、空间约束。近年来,场景理解已经从一个初期难以实现的目标成为目前几乎所有先进计算机视觉系统正在不断寻求新突破的重要研究方向。 利用社会–长短记忆网络(SocialLSTM)实现多个行人之间的状态联系建模,结合各自运动历史状态,决策出未来时间内的运动走向。此外神经网络压缩方向也是是目前深度学习研究的一个热门的方向,其主要的研究技术有压缩,蒸馏,网络架构搜索,量化等。

    综上所述,视觉的发展需要设计新的模型,它们需要能考虑到空间和时间信息;弱监督训练如果能做出好的结果,下一步就是自监督学习;需要高质量的人类检测和视频对象检测数据集;结合文本和声音的跨模态集成;在与世界的交互中学习。

    三、 知识工程

    1994 年图灵奖获得者、知识工程的建立者费根鲍姆给出知识工程定义—将知识集成到计算机系统从而完成只有特定领域专家才能完成的复杂任务。在大数据时代,知识工程是从大数据中自动或半自动获取知识,建立基于知识的系统,以提供互联网智能知识服务。大数据对智能服务的需求,已经从单纯的搜集获取信息,转变为自动化的知识服务。我们需要利用知识工程为大数据添加语义/知识,使数据产生智慧(Smart Data),完成从数据到信息到知识,最终到智能应用的转变过程,从而实现对大数据的洞察、提供用户关心问题的答案、为决策提供支持、改进用户体验等目标。

    学者地图用于描述特定领域学者的分布情况,对于进行学者调查、分析各地区竞争力现况尤为重要,下图为知识工程领域全球学者分布情况:

    清华2019最新AI发展报告出炉!400页干货,13大领域一文看懂

     

    ▲知识工程领域全球学者分布

    地图根据学者当前就职机构地理位置进行绘制,其中颜色越深表示学者越集中。 从该地图可以看出,美国的人才数量优势明显且主要分布在其东西海岸; 欧洲及亚洲东部也有较多的人才分布;其他诸如非洲、南美洲等地区的学者非常稀少; 知识工程领域的人才分布与各地区的科技、经济实力情况大体一致。

    此外, 在性别比例方面,知识工程领域中男性学者占比 89.7%,女性学者占比 10.6%,男性学者占比远高于女性学者。

    知识工程领域学者的 h-index 分布如下图所示,大部分学者的 h-index 分布在中低区域,其中 h-index 在 20-30 区间的人数最多,有 783 人, 占比 38.9%,小于 20 区间的人数最少, 有 90 人。

    我国专家学者在知识工程领域的分布如下图所示。通过下图我们可以发现,京津地区在本领域的人才数量最多,其次是珠三角和长三角地区,相比之下,内陆地区的人才较为匮乏, 这种分布与区位因素和经济水平情况不无关系。 同时,通过观察中国周边国家的学者数量情况,特别是与日韩、东南亚等亚洲国家相比,中国在知识工程领域学者数量较多。

    清华2019最新AI发展报告出炉!400页干货,13大领域一文看懂

     

    ▲知识工程领域中国学者分布

    对本领域的高水平学术会议及期刊论文进行挖掘,解读这些会议和期刊在 2018-2019 年的部分代表性工作。这些会议和期刊包括:

    IEEE Transactions on Knowledge and Data Engineering

    International Conference on Information and Knowledge Management

    论文题目: Convolutional 2D Knowledge Graph Embeddings

    中文题目:基于二维卷积的知识图谱嵌入表示学习

    论文作者: Tim Dettmers, Pasquale Minervini, Pontus Stenetorp, Sebastian Riedel

    论文出处: The Thirty-Second AAAI Conference on Artificial Intelligence (AAAI2018)

    论文地址:https://www.aaai.org/ocs/index.php/AAAI/AAAI18/paper/download/17366/15884

    研究问题: 知识图谱的链接预测任务是预测节点之间潜在的关系。传统的链接预测方法专注于浅的、快速的模型,因为这样可以扩展到大规模的 KG 中。但是浅层模型学习到的特征比深沉模型少很多,大大限制了模型的性能。解决该问题的方法之一是增加 embedding 的维度,但是会增加模型参数量,不方便扩展到大规模 KG中。此外,部分现有数据集中有测试集泄露问题:训练集中的三元组稍微翻转一下就可以得到测试集三元组,然后使用基于规则的模型就能达到最佳性能。文章通过构造一个简单的翻转来衡量这个问题严重性,并清洗了部分数据来解决该问题。

    近两年知识获取、推理和应用研究取得了显著的进展,主要表现在如下几个方面:

    1、资源匮乏情况下的知识获取 。知识图谱的构建始终是知识图谱领域的核心问题之一, 近年来除了传统的有监督的实体、关系、 事件知识获取的研究外,也涌现了一批在弱资源情况下的知识获取方法。例如:在集合扩展(实体集扩展)研究中, Learning to Bootstrap for Entity Set Expansion 使用蒙特卡洛树搜索策略的 booststrap 方法有效地提升了实体集扩展方法的稳定性,尤其是在与分类体系相关任务的同时优化上。 HiExpan:Task-Guided Taxonomy Construction by Hierarchical Tree Expansion 提出一个知识分类体系的扩展框架,模型利用弱监督关系抽取模型,从一个小型的上下位关系树出发,抽取扩展的节点并扩展成一个更加丰富的上下位体系。 FewRel 2.0:Towards More Challenging Few-Shot Relation Classification 提出了少次学习任务,通过设计少次学习机制,能够利用从过往数据中学到的泛化知识,结合新类型数据的少量训练样本,实现快速迁移学习。 COMET: Commonsense Transformers forAutomatic Knowledge Graph Construction 提出常识 Transformer 架构,将 GPT-2等语言模型与种子知识图谱相结合,学习其结构和关系,根据图表征形成语言模型,从而生成新的知识并将它们添加到种子图中。

    2、 知识图谱的知识补全和可解释推理 。传统的表示学习缺乏可解释性,知识图谱推理越来越受到关注, 其中既有使用强化学习方法寻找路径的方法,也有使用实体邻居和注意力权重做可解释性推理方法。 Multi-Hop Knowledge Graph Reasoning with Reward Shaping 是基于多跳推理的知识库问答方法,基于强化学习扩展在知识图谱的推理路径, 以获得问题的 正 确 答 案 。 Learning Attention-based Embeddings for Relation Prediction in Knowledge Graphs 提出一种基于注意力机制的特征嵌入方法,获取实体邻近范围内的实体和关系特征,引入关系聚类和多跳关系,有效提升了基于多跳推理的知识图谱补全的效果。 Iteratively Learning Embeddings and Rules for Knowledge Graph Reasoning 研究如何迭代地进行知识表示学习和规则学习,提出的 IterE 模型可以利用学习的规则改进稀疏实体的表示学习,进而提升规则学习和链接预测效果。

    3、基于知识图谱的推荐和对话问答 。将知识图谱作为辅助信息引入到推荐系统中可以有效地解决传统推荐系统存在的稀疏性和冷启动问题, 近几年吸引大量研究人员在相关工作。 随着图卷积神经网络, 图注意力机制等技术的逐渐兴起, 基于图表示学习的推荐模型达到了更高的表现效果,并为推荐系统的可解释性提供了帮助。 KGAT: Knowledge Graph Attention Network for Recommendation 利用知识图谱中商品之间的关系,训练了一个端到端的含注意力机制的模型,用于提高推荐系统的能力。 AKUPM: Attention-Enhanced Knowledge-Aware User Preference Model for Recommendation 使用注意力模型,利用知识图谱对用户进行建模,显著提升了推荐系统的效果。Reinforcement Knowledge Graph Reasoning for Explainable Recommendation 结合强化学习的框架和知识图谱推理来提供对推荐结果的解释。 在对话问答方面, 以前对话生成的信息源是文本与对话记录, 但如果遇到词表之外的( Out-ofVocabulary) 的词,模型往往难以生成合适的、有信息量的回复,而会产生一些低质量的、模棱两可的回复。 Commonsense Knowledge Aware Conversation Generation with Graph 提出一种基于常识知识图谱的对话模型 CCM 来理解对话,产生信息丰富且合适的回复。

    四、自然语言处理

    自然语言是指汉语、英语、法语等人们日常使用的语言,是人类社会发展演变而来的语言,而不是人造的语言,它是人类学习生活的重要工具。概括说来,自然语言是指人类社会约定俗成的,区别于如程序设计的语言的人工语言。在整个人类历史上以语言文字形式记载和流传的知识占到知识总量的 80%以上。就计算机应用而言,据统计,用于数学计算的仅占 10%,用于过程控制的不到 5%,其余 85%左右都是用于语言文字的信息处理。

    处理包含理解、转化、生成等过程。自然语言处理,是指用计算机对自然语言的形、音、义等信息进行处理,即对字、词、句、篇章的输入、输出、识别、分析、理解、生成等的操作和加工。实现人机间的信息交流,是人工智能、计算机科学和语言学所共同关注的重要问题。自然语言处理的具体表现形式包括机器翻译、文本摘要、文本分类、文本校对、信息抽取、语音合成、语音识别等。可以说,自然语言处理就是要计算机理解自然语言,自然语言处理机制涉及两个流程,包括自然语言理解和自然语言生成。自然语言理解是指计算机能够理解自然语言文本的意义,自然语言生成则是指能以自然语言文本来表达给定的意图。

    学者地图用于描述特定领域学者的分布情况,对于进行学者调查、分析各地区竞争力现况尤为重要,下图为自然语言处理领域全球学者分布情况:

    清华2019最新AI发展报告出炉!400页干货,13大领域一文看懂

     

    ▲自然语言处理领域学者分布

    地图根据学者当前就职机构地理位置进行绘制,其中颜色越深表示学者越集中。 从该地图可以看出,美国的人才数量优势明显且主要分布在其东西海岸;欧洲也有较多的人才分布,主要集中在欧洲中西部;亚洲的人才主要分布在我国东部及日韩地区;其他诸如非洲、南美洲等地区的学者非常稀少;自然语言处理领域的人才分布与各地区的科技、经济实力情况大体一致。此外, 在性别比例方面,自然语言处理领域中男性学者占比 89.3%,女性学者占比 10.7%,男性学者占比远高于女性学者。

    我国专家学者在自然语言处理领域的分布如下图所示。通过下图我们可以发现,京津地区在本领域的人才数量最多,其次是长三角和珠三角地区,相比之下,内陆地区的人才较为匮乏, 这种分布与区位因素和经济水平情况不无关系。 同时,通过观察中国周边国家的学者数量情况,特别是与日韩、东南亚等亚洲国家相比,中国在自然语言处理领域学者数量较多。

    清华2019最新AI发展报告出炉!400页干货,13大领域一文看懂

     

    ▲自然语言处理领域中国学者分布

    2019自然语言处理代表性文章是:

    论文题目: BERT: Pre-training of Deep Bidirectional Transformers for Language Understanding

    中文题目: BERT: 语言理解的深层双向转换器的预训练

    论文作者: Jacob Devlin Ming-Wei Chang Kenton Lee Kristina Toutanova

    论文出处: In Proceedings of the 2019 Annual Conference of the North American Chapter of the Association for Computational Linguistics.

    论文地址: https://arxiv.org/abs/1810.04805

    文章介绍一种新的语言表示模型 BERT(Bidirectional Encoder Representations from Transformers),通过联合上下文信息从未标记文本中预训练深层双向表示形式,只需一个额外的输出层,就可以对预训练模型进行调整,在不需要对特定任务的体系结构进行大量修改的前提下,在多种语言相关任务上获得。

    近年来,预训练语言模型在自然语言处理领域有了重要进展。 预训练模型指的是首先在大规模无监督的语料上进行长时间的无监督或者是自监督的预先训练(pre-training),获得通用的语言建模和表示能力。之后在应用到实际任务上时对模型不需要做大的改动,只需要在原有语言表示模型上增加针对特定任务获得输出结果的输出层,并使用任务语料对模型进行少许训练即可,这一步骤被称作微调(fine tuning)。

    自 ELMo、 GPT、 BERT 等一系列预训练语言表示模型(Pre-trained Language Representation Model)出现以来,预训练模型在绝大多数自然语言处理任务上都展现出了远远超过传统模型的效果,受到越来越多的关注,是 NLP领域近年来最大的突破之一,是自然语言处理领域的最重要进展。

    BERT(Bidirectional Encoder Representation from Transformer)是 Google AI于 NAACL2019 提出的一个预训练语言模型。 BERT 的创新点是提出了有效的无监督预训练任务,从而使得模型能够从无标注语料中获得通用的语言建模能力。模型的部分细节在前文的论文解读中已经给出,不再赘述。

    BERT 之后涌现了许多对其进行扩展的模型, 包括: 跨语言预训练的 XLM 和 UDify, 跨模态预训练的模型, 融合知识图谱的 ERNIE, 将seq2seq 等语言生成任务整合入 BERT 类模型的 MASS, UniLM 等。其中几个重要的进展包括:

    (1) XLNet 使用 Transformer-XL 替代了 Transformer 作为基础模型,拥有编码超长序列的能力。 XLNet 提出了一个新的预训练语言任务: Permutation LanguageModeling(排列语言模型),模型将句子内的词语打乱顺序,从而使得预测当前词语时可以利用双向信息。 XLNet 相对 BERT 也使用了更多的语料。

    (2) RoBERTa 采用了与 BERT 具有相同的模型结构,同样采用了屏蔽语言模型任务进行预训练,但舍弃了 BERT 中下句预测模型。此外, RoBERTa 采用了更大规模的数据和更鲁棒的优化方法,从而取得了更好的表现。

    (3) ALBERT 模型针对 BERT 参数量过大难以训练的问题做了优化,一是对词向量矩阵做分解,二是在层与层之间共享参数。此外, ALBERT 将下句预测模型替换为句序预测任务,即给定一些句子预测它们的排列顺序。

    五、 语音识别

    语音识别是让机器识别和理解说话人语音信号内容的新兴学科,目的是将语音信号转变为文本字符或者命令的智能技术,利用计算机理解讲话人的语义内容,使其听懂人类的语音,从而判断说话人的意图,是一种非常自然和有效的人机交流方式。它是一门综合学科,与很多学科紧密相连,比如语言学、信号处理、计算机科学、心理和生理学等。

    语音识别首先要对采集的语音信号进行预处理,然后利用相关的语音信号处理方法计算语音的声学参数,提取相应的特征参数,最后根据提取的特征参数进行语音识别。总体上,语音识别包含两个阶段:第一个阶段是学习和训练,即提取语音库中语音样本的特征参数作为训练数据,合理设置模型参数的初始值,对模型各个参数进行重估,使识别系统具有最佳的识别效果;第二个阶段就是识别,将待识别语音信号的特征根据一定的准则与训练好的模板库进行比较,最后通过一定的识别算法得出识别结果。显然识别结果的好坏与模板库是否准确、模型参数的好坏以及特征参数的选择都有直接的关系。

    学者地图用于描述特定领域学者的分布情况,对于进行学者调查、分析各地区竞争力现况尤为重要,下图为语音识别领域全球学者分布情况:

    清华2019最新AI发展报告出炉!400页干货,13大领域一文看懂

     

    ▲语音识别领域全球学者分布

    地图根据学者当前就职机构地理位置进行绘制,其中颜色越深表示学者越集中。 从该地图可以看出,美国的人才数量优势明显且主要分布在其东西海岸;亚洲也有较多的人才分布,主要在我国东部及日韩地区;欧洲的人才主要集中在欧洲中西部;其他诸如非洲、南美洲等地区的学者非常稀少;语音识别领域的人才分布与各地区的科技、经济实力情况大体一致。

    我国专家学者在语音识别领域的分布如下图所示。通过下图我们可以发现,京津地区在本领域的人才数量最多,其次是长三角和珠三角地区,相比之下,内陆地区的人才较为匮乏, 这种分布与区位因素和经济水平情况不无关系。 同时,通过观察中国周边国家的学者数量情况,特别是与日韩、东南亚等亚洲国家相比,中国在语音识别领域学者数量较多且有一定的优势。

    清华2019最新AI发展报告出炉!400页干货,13大领域一文看懂

     

    ▲ 语音识别领域中国学者分布

    2019代表论文:

    论文题目: X-Vectors: Robust DNN Embeddings for Speaker Recognition

    中文题目: X 向量:用于说话人识别的鲁棒 DNN 嵌入

    论文作者: David Snyder, Daniel Garcia-Romero, Gregory Sell, Daniel Povey and Sanjeev Khudanpur. X-Vectors: Robust DNN Embeddings for Speaker Recognition.

    论文出处: 2018 IEEE International Conference on Acoustics, Speech and Signal Processing(ICASSP)

    论文地址: https://ieeexplore.ieee.org/stamp/stamp.jsp?tp=&arnumber=8461375

    研究问题: 捕捉说话者特征是语音识别领域具有重大意义的研究内容。 大多数说话人识别系统都是基于 i-vectors 来实现的。 标准的基于 i-vectors 的方法由通用背景模型(UBM)和大型投影矩阵 T 组成,该模型以无监督方式来学习。在早期的系统中,神经网络经训练后,被用来分离说话者,从网络中提取帧级表示, 并将其用作高斯说话者模型的特征。近年来, 使用深度神经网络(DNN)捕获说话者特征是当前非常活跃的研究领域。 DNN 嵌入性能也随着训练数据量的增加而高度扩展。

    随着人工智能的迅速发展,语音识别的技术越来越成为国内外研究机构的焦点。人们致力于使机器能够听懂人类的话语指令,并希望通过语音实现对机器的控制。作为一项人机交互的关键技术,语音识别在过去的几十年里取得了飞速的发展,在研究和探索过程中针对语音识别的各部流程进行了各种各样的尝试和改造,以期发现更好的方法来完成语音识别流程中的各个步骤,以此来促进在不同环境下语音识别的效率和准确率。研究人员从最简单的非常小词汇量的阅读式的语音识别问题开始,逐渐转向越来越复杂的问题。

    近年来智能语音进入了快速增长期,语音识别作为语音领域的重要分支获得了广泛的关注,如何提高声学建模能力和如何进行端到端的联合优化是语音识别领域中的重要课题。

    随着人工智能的迅速发展,语音识别的技术越来越成为国内外研究机构的焦点。人们致力于使机器能够听懂人类的话语指令,并希望通过语音实现对机器的控制。作为一项人机交互的关键技术,语音识别在过去的几十年里取得了飞速的发展,在研究和探索过程中针对语音识别的各部流程进行了各种各样的尝试和改造,以期发现更好的方法来完成语音识别流程中的各个步骤,以此来促进在不同环境下语音识别的效率和准确率。研究人员从最简单的非常小词汇量的阅读式的语音识别问题开始,逐渐转向越来越复杂的问题。

    近年来智能语音进入了快速增长期,语音识别作为语音领域的重要分支获得了广泛的关注,如何提高声学建模能力和如何进行端到端的联合优化是语音识别领域中的重要课题。

    语音识别经历了从 2012 年最开始的 DNN 的引入时的 Hybrid HMM 结构,再到 2015 年开始吸引大家研究兴趣的 CTC 算法,而后到 2018 年的 Attention 相关结构的研究热点。 Attention 相关算法在语音识别或者说话人识别研究的文章中出现频率极高。从最开始 Attention,到 Listen-Attend-Spell,再到 Self-Attention(或者 Transformer),在不同的文章被作者多次介绍和分析,频繁出现在了相关文章的 Introduction 环节中。在 Attention 结构下,依然还有很多内容需要研究者们进一步地探索:例如在一些情况下 Hybrid 结构依然能够得到 State-of-the-art 的结果,以及语音数据库规模和 Attention 模型性能之间的关系。

    在近两年的研究中, 端到端语音识别仍然是 ASR( Automatic SpeechRecognition)研究的一大热点,正如上文提到的,基于 Attention 机制的识别系统已经成为了语音技术研究主流。同时,随着端到端语音识别框架日益完善,研究者们对端到端模型的训练和设计更加的关注。 远场语音识别(far-field ASR),模型结构(ASR network architecture),模型训练(model training for ASR),跨语种或者多语种语音识别(cross-lingual and multi-lingual ASR)以及一些端到端语音识别(end-to-end ASR)成为研究热点。

    在语音合成方面,高音质语音生成算法及 Voice conversion 是近两年研究者关注的两大热点, Voice Conversion 方向的研究重点主要集中在基于 GAN 的方法上。 在语言模型方面(Language Model)的研究热点主要包括 NLP 模型的迁移,低频单词的表示,以及深层 Transformer 等。

    在说话人识别方面,说话人信息,特别是说话人识别及切分,正被越来越多的研究者所重视。 目前 Attention 在说话人方面更类似一种 Time Pooling,比Average Pooling 及 Stats Pooling 更能捕捉对说话人信息更重要的信息,从而带来性能提升。说话人识别技术经历深度学习带来的性能飞跃后,在模型结构、损失函数等方面的探讨已经较为成熟,以 TDNN、 ResNet 加上 LMCL、 ArcFace 的主流模型开始不断刷新各数据集的性能上限。模型以外的因素逐渐成为制约说话人系统的瓶颈。说话人技术目前也逐渐暴露出与人脸识别同样的易受攻击的问题。因此, ASVspoof 这样的 Challenge 从 2015 年起就开始关注声纹反作弊问题。相信随着此类研究的不断深入,结合声纹系统的性能提升,声纹将有望变成我们的“声音身份证”。

    六、 计算机图形学

    国际标准化组织 ISO 将计算机图形学定义为:计算机图形学是一门研究通过计算机将数据转换成图形,并在专门显示设备上显示的原理方法和技术的学科。它是建立在传统的图形学理论、应用数学及计算机科学基础上的一门边缘学科。这里的图形是指三维图形的处理。简单来讲,它的主要研究内容是研究如何在计算机中表示图形,以及利用计算机进行图形的计算处理和显示的相关原理和算法。

    在计算机图形学的开创之初,他主要解决的问题是在计算机中表示三维结合图形以及如何利用计算机进行图形的生成处理和显示的相关原理和算法,目的是产生令人赏心悦目的真实感图像,这仅仅是狭义的计算机图形学。随着近些年的发展,计算机图形学的内容已经远远不止这些,广义的计算机图形学研究内容非常广泛,包括图形硬件、图形标准、图形交互技术、栅格图形生成算法、曲线曲面造型、实体造型、真实版图形的计算、显示算法、科学计算可视化、计算机动画、虚拟现实、自然景物仿真等等。

    计算机图形学的总体框架可以包括以下几个部分:数学和算法基础、建模、渲染以及人机交互技术。计算机图形学需要一些基本的数学算法,例如向量和几何的变化、几何建模式的三维空间变化、三维到二维的图形变换等等。建模是进行图形描述和计算,由于在多维空间中有各种组合模型,有一些是解析式表达的简单形体,也有一些隐函数表达的复杂曲线,因此需要进行复杂的建模工作。渲染也叫绘制,指的是模型的视觉实现过程,例如对光照纹理等理论和算法进行处理,其中也需要大量的计算。交互技术可以说是图形学交互的重要工具,是计算机图形学的重要应用。

    学者地图用于描述特定领域学者的分布情况,对于进行学者调查、分析各地区竞争力现况尤为重要,下图为计算机图形学全球学者分布情况:

    清华2019最新AI发展报告出炉!400页干货,13大领域一文看懂

     

    ▲计算机图形学领域全球学者分布

    地图根据学者当前就职机构地理位置进行绘制,其中颜色越深表示学者越集中。 从该地图可以看出,美国的人才数量优势明显; 欧洲也有较多的人才分布,主要在欧洲中西部; 亚洲的人才主要集中在我国东部及日韩地区;其他诸如非洲、南美洲等地区的学者非常稀少; 计算机图形学的人才分布与各地区的科技、经济实力情况大体一致。

    我国专家学者在计算机图形领域的分布如上图所示。通过下图我们可以发现,京津地区在本领域的人才数量最多,其次是长三角和珠三角地区,相比之下,内陆地区的人才较为匮乏,这种分布与区位因素和经济水平情况不无关系。同时,通过观察中国周边国家的学者数量情况,特别是与日韩等地相比,中国在计算机图形领域学者数量略多但差距较小。

    清华2019最新AI发展报告出炉!400页干货,13大领域一文看懂

     

    ▲计算机图形学领域中国学者分布

    2019优秀计算机图形学论文:

    论 文 题 目 : A Style-based Generator Architecture for Generative Adversarial Networks

    中文题目:基于样式的生成式对抗网络生成器架构

    论文作者: Tero Karras, Samuli Laine, Timo Aila.

    论文出处: The IEEE Conference on Computer Vision and Pattern Recognition- CVPR 2019

    论文地址:http://openaccess.thecvf.com/content_CVPR_2019/papers/Karras_A_StyleBased_Generator_Architecture_for_Generative_Adversarial_Networks_CVPR_2019_paper.pdf

    研究问题: 本文针对自动的无监督的习得图像的高层属性(譬如人脸对应的身份信息以及拍摄姿态)以及对于生成的每幅图像产生一些特定的随机化的变换(譬如脸部瑕疵以及头发的细节),生成较为直观且可控的合成结果进行了研究。通过借鉴风格迁移的思想,提出了一种新的对抗网络中的生成器架构。该架构不仅在传统的分布距离的度量上优势明显,并且较好地将控制图像变化的隐变量分离出来进行独立建模。

    随着数字化技术和互联网的发展,计算机图形学在许多领域都已经得到了广泛的应用,如遥感图像分析、多媒体通信、医疗诊断、机器人视觉等。当前计算机图形学的研究逐渐向多学科交叉融合方向发展,即有与认知计算、计算器学习、人机交互的融合,也有与大数据分析、可视化的融合;不仅针对三维数字模型, 而且涵盖了图像视频, 与计算机视觉深度交叉。计算机图形学的快速发展,一个潜在的趋势是不再有明确清晰的主题,更多的体现出方法和技术的创新。

    针对近两年计算机图形学重要期刊会议的相关论文,对该领域内容热点研究内容和前沿技术方法进行了综合分析。目前,热点研究内容主要集中在自监督学习(Self-Supervised Learning)、全景分割(Panoptic Segmentation) 、网络结构搜索( Neural Architecture Search) 和生成式对抗网络( Generative AdversarialNetworks) 等方面。

    自监督学习研究早期主要集中在代理任务的设计和选取上,怎样的代理任务才能最好地提取出有益于下游任务的特征以及为何这些代理任务能够有效,这些是理论层面上自监督学习仍需要解决的问题。随着大量围绕着实例判别代理任务的相关工作的提出,有一些工作将其中的核心思想进行展开提出了所谓对比学习的概念。通过将原来两个图片实例特征间的对比延伸到任意两个模态间特征的对比,使得模型学习不同模态间一致的特征表达并用最大化互信息作为新的衡量准则。

    在已有的工作中,比较典型的代理任务有将图片分块然后预测不同分块间的相对位置或者将分块打乱后重排得到原图,以及基于图片的上下文信息进行补全和图片不同颜色通道间的相互预测等。目前在图像与图形学领域,取得性能突破的方法主要仍局限在监督学习的框架之下,随着无标记数据的不断爆增和模型性能进一步提升的需求,无监督学习将会越来越受到学术界和工业界的重视。而作为目前无监督学习中的一支,自监督学习因其良好的特征判别能力和对大规模数据扩展能力,也将受到更广泛的关注。

    全景分割作为一个统一的任务在 2018 年被提出,它的目标是为图像中的所有像素点都分配一个语义类别和一个实例编号,从另一个角度来说,全景分割算法需要预测出图像中每一个像素点的所属类别和所属实例。在全景分割任务的基础上,近期的进展主要体现在三个方面:(1)从图像整体的角度考虑全景分割,共享网络主干(backbone)形成设计整体网络结构;(2)考虑图像中不同元素之间的交互,建模物体与语义概念之间的关系;(3)提出可学习模块,解决预测结果层面的冲突。接下来,我们将分别介绍有代表性的工作。全景分割作为一个最近被提出的视觉任务,受到了很大的关注,目前方法也在探讨的过程中,具有很大的发展潜力。

    目前深度学习的方法在各类图像与图形分析任务中取得了非常大的成功,伴随这一成功而来的是对网络结构设计要求的不断提高。自动化网络设计自然而然地成为了自动化机器学习的下一个目标。早期的相关工作证明了使用强化学习算法可以发现好的网络架构,但是这些方法在计算过程中需要消耗大量计算资源,因此后续的工作都集中在如何减少计算负担上。搜索空间的设计也是一项重要研究热点,同时,研究人员又拓宽了神经结构搜索的视野,将多种优化目标考虑在内,而不仅仅是减少搜索时间和提高网络精度。具有代表性的工作如尝试限制模型参数的数量或类似的方法,以有效地部署在移动设备上。在此基础上,还有一些工作将网络结构搜索技术扩展到搜索深度网络相关组件上。

    在图像合成方面,近期最引人关注的工作就是生成对抗网络,生成对抗网络由一个生成网络 G 和一个判别网络 D 组成。生成网络 G 和判别网络 D 在训练阶段使用对抗的方式进行学习,生成网络 G 的目标是生成尽可能真实的图片使得判别网络认为这是一张真实的图片;而判别网络 D 的任务则是判别合成的图像是真实的还是生成的。在这种两者对抗的学习过程中,生成 G 学会如何生成真实的图片。目前在生成对抗网络研究中,条件生成对抗网络、损失函数的改进、模型结构的改进及训练方法的改进是主要研究方向。

    七、 多媒体技术

    “多媒体”一词译自英文“Multimedia”,而该词又是由 multiple 和 media 复合而成,核心词是媒体。媒体(medium)在计算机领域有两种含义:一是指存储信息的实体,如磁盘、光盘、磁带、半导体存储器等,中文常译为媒质;二是指传递信息的载体,如数字、文字、声音、图形和图像等,中文译作媒介,多媒体技术中的媒体是指后者。其实,“媒体”的概念范围是相当广泛的。“媒体”有下列五大类:(1)感觉媒体(Perception medium)指的是能使人产生直接感觉的媒体。如声音、动画、文本等;(2)表示媒体(Representation medium)指的是为了传送感觉媒体而人为研究出来的媒体。诸如语言编码、电报码、条形码等等;(3)显示媒体(Presentation medium)指的是用于通信中使电信号和感觉媒体之间产生转换用的媒体。如键盘、鼠标器、打印机等;(4)存储媒体(Storage medium)指的是于存放某种媒体的媒体。如纸张、磁带、磁盘、光盘等;(5)传输媒体(Transmission medium)指的是用于传输某些媒体的媒体。常用的有如电话线、电缆、光纤等。

    学者地图用于描述特定领域学者的分布情况,对于进行学者调查、分析各地区竞争力现况尤为重要,下图为多媒体领域全球学者分布情况。

    地图根据学者当前就职机构地理位置进行绘制,其中颜色越深表示学者越集中。从该地图可以看出,美国的人才数量优势明显且主要分布在其东西海岸;亚洲东部也有较多的人才分布;欧洲的人才主要集中在欧洲中西部;其他诸如非洲、南美洲等地区的学者非常稀少;多媒体领域的人才分布与各地区的科技、经济实力情况大体一致。

    清华2019最新AI发展报告出炉!400页干货,13大领域一文看懂

     

    ▲多媒体领域全球学者分布

    我国专家学者在多媒体领域的分布如下图所示。通过下图我们可以发现,京津地区在本领域的人才数量最多,其次是长三角和珠三角地区,相比之下,内陆地区的人才较为匮乏, 这种分布与区位因素和经济水平情况不无关系。 同时,通过观察中国周边国家的学者数量情况, 特别是与日韩、东南亚等亚洲国家相比,中国在多媒体领域学者数量较多且有一定的优势。

    清华2019最新AI发展报告出炉!400页干货,13大领域一文看懂

     

    ▲多媒体领域中国学者分布

    2019优秀论文:

    论文题目: Beyond Narrative Description: Generating Poetry from Images by MultiAdversarial Training

    中文题目:超越叙事描述:通过多重对抗训练,从意象中生成诗歌

    论文作者: Bei Liu, Jianlong Fu, Makoto P. Kato, Masatoshi Yoshikawa

    论文出处: 26th ACM International Conference on Multimedia – ACMMM’18

    论文地址: https://arxiv.org/pdf/1804.08473v4.pdf

    研究问题:本文主要研究了从图像自动生成诗歌的方法。这项任务涉及多个挑战,包括从图像中发现诗意线索(例如,从绿色中获得希望),以及生成满足图像相关性和语言水平的诗意的诗歌。

    近年来,随着数字化技术的发展,多媒体技术突飞猛进,音视频技术是当前最活跃、发展最迅速的高新技术领域之一。多媒体分析以文本、图像、声音、视频等多种不同类型媒体的数据为研究对象,主要的研究目的一方面是使计算机具备人类的多媒体(如视、听)理解能力,另一方面是从多媒体数据中挖掘信息和知识、帮助人类更好地理解世界。

    多媒体技术研究领域包括多媒体信息处理、多媒体数据压缩编码、多媒体内容分析与检索技术、多媒体交互与集成、多媒体通信与网络、多媒体内容安全、多媒体系统与虚拟现实等。在近几年的研究中,多媒体技术呈现出与计算机体系结构、计算机网络、人机交互、信息安全、社会网络等多学科交叉融合的发展趋势。

    近两年多媒体领域研究热点主要集中在大规模图像视频分析、社会媒体研究、多模态人机交互、计算视觉、计算图像、实时视频流化等方面。

    由于多媒体数据往往是多种信息的传递媒介(例如一段视频中往往会同时使得文字信息、视觉信息和听觉信息得到传播),多模态学习已逐渐发展为多媒体内容分析与理解的主要手段。

    在计算图像方面,大规模数据集的构建仍是一个热点研究方向,尤其语义对象的像素级标注需求越来越强烈,能够人机交互标注的过程中不断学习的协同标注方法得到了广泛关注。

    无监督学习是多媒体数据分析的长远目标。目前很多领域拥有大量的数据,但是这些数据都是没有经过标记的。因此除了基本的数据勘探和异常检测场景,这些数据基本无法使用。近期在使用未标记的数据来改进(标记数据)监督学习过程方面已经取得了许多进展。

    此外自动机器学习(AutoML)和元学习(Meta Learning)的最新研究成果及其在多媒体上的应用也逐渐增多。

    在图像压缩处理方面,也有一些研究工作将深度学习用于图像或视频压缩后处理,并得到了一定的效果。然而,现有工作的一个主要问题是用于后处理的深度网络较为复杂,计算速度慢,不满足实际应用的需求。如何在处理效果和处理速度之间取得一个折中,是压缩后处理的一个主要挑战。

    图神经网络(Graph Neural Network, GNN)在多媒体领域的应用是近两年的热点研究方向,应用场景包括:个性化推荐,如基于多模态图卷积网络(MMGCN)的多模态推荐方法;短视频推荐,如使用基于图的顺序网络进行建模;多视频摘要,如采用图卷积网络衡量每个视频的重要性和相关性;基于文本的行人搜索,如使用深度对抗图注意力卷积网络(A-GANet) 利用文本和视觉场景图学习联合特征空间;视频关系监测,如使用转移图神经网络(DoT-GNN) 解决图像外观变化的问题。

    随着 Mask-RCNN 与 RetinaNet 的发展,物体检测研究日趋成熟,但即便如此,就应用而言,当前的技术依然存在诸多缺陷,为此,针对现代目标检测的基本框架(backbone、 head、 scale、 batchsize 与 post-processing),神经网络架构搜索(NAS)以及细粒度图像分析(FGIA)等 3 个方面的潜在难题成为主要研究内容,尤其是后两者,将成为未来视觉物体检测的两个重要研究维度。

    八、 人机交互技术

    人机交互(Human-Computer Interaction, HCI), 是人与计算机之间为完成某项任务所进行的信息交换过程, 是一门研究系统与用户之间的交互关系的学问。系统可以是各种各样的机器,也可以是计算机化的系统和软件。人机交互界面通常是指用户的可见部分,用户通过人机交互界面与系统交流, 并进行操作。人机交互技术是计算机用户界面设计中的重要内容之一, 与认知学、人机工程学、心理学等学科领域有密切的联系。

    学者地图用于描述特定领域学者的分布情况,对于进行学者调查、分析各地区竞争力现况尤为重要,下图为人机交互领域全球学者分布情况:

    清华2019最新AI发展报告出炉!400页干货,13大领域一文看懂

     

    ▲人机交互领域全球学者分布

    地图根据学者当前就职机构地理位置进行绘制,其中颜色越深表示学者越集中。从该地图可以看出,美国的人才数量优势明显且主要分布在其东西海岸; 欧洲也有较多的人才分布; 亚洲的人才主要集中在日韩地区;其他诸如非洲、南美洲等地区的学者非常稀少; 人机交互领域的人才分布与各地区的科技、经济实力情况大体一致。

    我国专家学者在人机交互领域的分布如下图所示。通过下图我们可以发现,京津地区在本领域的人才数量最多,其次是长三角和珠三角地区,相比之下,内陆地区的人才较为匮乏, 这种分布与区位因素和经济水平情况不无关系。 同时,通过观察中国周边国家的学者数量情况,特别是与日韩等地相比,中国在人机交互领域学者数量较少。

    清华2019最新AI发展报告出炉!400页干货,13大领域一文看懂

     

    ▲人机交互领域中国学者分布

    优秀论文:

    论文题目: Guidelines for human-AI interaction

    中文题目: 人工智能交互指南

    论文作者: Saleema Amershi, Dan Weld, Mihaela Vorvoreanu, Adam Fourney, Besmira Nushi, Penny Collisson, Jina Suh, Shamsi Iqbal, Paul N. Bennett, Kori Inkpen, Jaime Teevan, Ruth Kikin-Gil, and Eric Horvitz

    论文出处: ACM CHI Conference on Human Factors in Computing Systems 2019 (CHI 2019)

    论文地址: https://doi.org/10.1145/3290605.3300233

    研究问题: 人工智能(AI)领域的快速发展给用户界面和交互设计带来了新的机遇和挑战。虽然人机交互届对人和 AI 交互的原则原理已经进行了 20 多年的探讨,我们仍需要更多的研究和创新来解决人工智能新技术及其面向人类的应用不断涌现而带来的新科学及社会问题。作者提出了 18 条具有通用性的、可适用于多种应用场景的、针对人和 AI 交互的设计指导,指出现有知识的空缺及未来的探索方向。 这份指南不仅为 AI 设计师提供了具体、可操作的建议,还旨在推动用户体验和工程开发从业者就设计决策的相关问题展开讨论,推动这一领域研究的研究方法:

    文章提出了 18 条人工智能交互设计指导,并进行多轮的实例评估来验证其有效性,包括通过一个用户实验,邀请 48 位设计师以这些设计指导为工具来测试 20 项广泛使用的有 AI 技术支持的用户产品。

    最近的十年,是人机交互向自然交互蓬勃发展的十年。毋庸置疑,计算机是世纪最伟大的发明,其作用从科学计算工具迅速发展为信息处理和信息交互工具,起引领作用的则是人机交互技术的变革,即以鼠标发明为标志的图形用户界面(Graphical User Interface, GUI)的产生,一改规范命令与计算机交互的命令行界面模式(Command LineInterface, CLI),GUI 提供了普通人与计算机便捷交互的工具和方法,让计算机从实验室走进办公室、走入家庭,十多年前,触屏技术成为产品技术, GUI 中的鼠标被人的天然指点(pointing)工具——手指所取代,计算机又变身出手机,成为更多人方便使用的随身掌上工具。

    更少依赖操控工具,发展学习和使用成本更小的自然交互技术,一直是人机交互研究的价值追求,最
    近十年,随着感知和计算技术的进步,自然交互技术创新层出不穷,并能迅速成为新型产品技术, 《麻省理工科技评论》总结和评论人机交互领域的突破技术(breakthroughs),为人机交互技术、未来终端技术的发展建立了一个高端的技术论坛,影响深远。我把这些突破技术分为 3 大类:支持自然动作的感知技术,面向穿戴的新型终端和基于语音识别的对话交互。

    人体动作蕴含丰富的语义,动作交互技术一方面需要感知技术的进步,另一方面需要发现或设计有明确交互语义的动作(gesture,姿态,由于人手的灵巧性,手势成为主要的交互动作,通常叫做手势),如今,二维表面上,多指触摸动作在触屏上已普遍可用,三维空间中,嵌入了深度摄像头的手持和固定设备,能比较准确识别人的姿态和动作,做出响应。不同于人脸识别等目标明确的视觉识别任务,动作交互不仅要求视觉识别的准确度,更需要研究基于交互任务的动作表达的自然性与一致性,难以发现和突破,所以,除了动作语义很直白的动作游戏(body game),三维动作交互尚缺少普遍认知和接受的交互动作语义。而无论二维还是三维,手势的不可见性,是动作交互的主要难题。

    穿戴(wearable)取代手持(handheld)曾是前几年的一个革命口号,目前看,市场上的确出现了一定规模的新产品,但穿戴仍是补充的地位。穿戴设备中,手环设备基本只有健康和活动检测功能,智能手表可以算做创新终端,但作为缩小版的手机,由于交互界面的缩小和操作方式的限制(通常是小界面上双手参与操作),其承载功能也较手机缩减很多。 VR/ AR(虚拟现实/增强现实)的一个理想载体是头戴式设备,最近几年,多款智能眼镜产品面世,较之前笨重的头盔轻便了许多,逼真的虚拟场景和准确的现实对象识别信息都可以清晰呈现在眼前,并在特定领域开拓着增强体验的应用;然而,智能眼镜尚缺少与其三维真实显示匹配的准确的自然输入技术,以及从眼手绑定在手机上转变到眼手分离的眼镜设备上时,尚未建立起相应的交互模式。

    自然语言对话式交互得益于大数据和智能技术的进步,多语言的自然语音识别技术在用户终端上都达到了很高的可用水平,并且,语音识别超越文本输入方式,成为智能软件助理的使能技术,近两年,更是有基于语音接口的家居产品如雨后春笋般出现, VUI (Voice User Interface,语音用户界面)已经成为交互术语。然而, VUI 的局限也是显而易见的,相对并行模式的视觉通道,串行模式的语音通道的带宽显然窄的多,出声的使用方式在很多场合是不合适的,但作为一种可用的自然交互技术,有效提升了用户体验。

    人机交互作为终端产品的引领技术的作用已经是产业界的普遍认识,欣喜看到很多种自然交互技术和新型交互终端面世,但 GUI 仍是交互的主导模式。计算无所不在,交互自然高效是发展趋势,人机交互的研究和开发空间很大,需要综合地探索自然交互技术的科学原理,建立明确的优化目标,结合智能技术,发展高可用的自然交互技术。

    九、 机器人

    机器人广义上包括一切模拟人类行为或思想以及模拟其他生物的机械(如机器狗,机器猫等)。狭义上对机器人的定义还有很多分类法及争议,有些电脑程序甚至也被称为机器人(例如爬虫机器人)。联合国标准化组织采纳了美国机器人协会给机器人下的定义: “一种可编程和多功能的操作机;或是为了执行不同的任务而具有可用电脑改变和可编程动作的专门系统。一般由执行机构、驱动装置、检测装置和控制系统和复杂机械等组成” 。 机器人是综合了机械、电子、计算机、传感器、控制技术、人工智能、仿生学等多种学科的复杂智能机械。

    目前,智能机器人已成为世界各国的研究热点之一,成为衡量一国工业化水平的重要标志。机器人是自动执行工作的机器装置,因此,它既可以接受人类指挥,又可以运行预先编排的程序,也可以根据以人工智能技术制定的原则纲领行动。在当代工业中,机器人指能自动执行任务的人造机器装置,用以取代或协助人类工作,一般会是机电装置,由计算机程序或电子电路控制。机器人的范围很广,可以是自主或是半自主的,从本田技研工业的 ASIMO 或是 TOSY 的 TOPIO等拟人机器人到工业机器人,也包括多台一起动作的群机器人,甚至是纳米机器人。借由模仿逼真的外观及自动化的动作,理想中的高仿真机器人是高级整合控制论、机械电子、计算机与人工智能、材料学和仿生学的产物。机器人可以作一些重复性高或是危险,人类不愿意从事的工作,也可以做一些因为尺寸限制,人类无法作的工作,甚至是像外太空或是深海中,不适人类生存的环境。机器人在越来越多方面可以取代人类,或是在外貌、行为或认知,甚至情感上取代人类。

    机器人技术最早应用于工业领域,但随着机器人技术的发展和各行业需求的提升,在计算机技术、网络技术、 MEMS 技术等新技术发展的推动下,近年来,机器人技术正从传统的工业制造领域向医疗服务、教育娱乐、勘探勘测、生物工程、救灾救援等领域迅速扩展,适应不同领域需求的机器人系统被深入研究和开发。过去几十年,机器人技术的研究与应用,大大推动了人类的工业化和现代化进程,并逐步形成了机器人的产业链,使机器人的应用范围也日趋广泛。

    学者地图用于描述特定领域学者的分布情况,对于进行学者调查、分析各地区竞争力现况尤为重要,下图为机器人领域全球学者分布情况:

    清华2019最新AI发展报告出炉!400页干货,13大领域一文看懂

     

    ▲机器人领域全球学者分布

    我国专家学者在机器人领域的分布如下图所示。通过下图我们可以发现,京津地区在本领域的人才数量最多,其次是珠三角和长三角地区,相比之下,内陆地区的人才较为匮乏, 这种分布与区位因素和经济水平情况不无关系。 同时,通过观察中国周边国家的学者数量情况,特别是与日韩等地相比,中国在机器人领域学者数量较少。

    清华2019最新AI发展报告出炉!400页干货,13大领域一文看懂

     

    ▲机器人领域中国学者分布

    优秀论文:

    论文题目: Robotic Pick-and-Place of Novel Objects in Clutter with Multi-Affordance Grasping and Cross-Domain Image Matching

    中文题目:通过多 affordance 抓取和跨域图像匹配完成杂乱环境下对新物体的捡放操作

    论文作者: Andy Zeng, Shuran Song, Kuan-Ting Yu, Elliott Donlon, Francois R. Hogan, Maria Bauza, Daolin Ma, Orion Taylor, Melody Liu, Eudald Romo, Nima Fazeli, Ferran Alet, Nikhil Chavan Dafle, Rachel Holladay, Isabella Morona, Prem Qu Nair, Druck Green, Ian Taylor, Weber Liu, Thomas Funkhouser, Alberto Rodriguez

    论文出处: IEEE International Conference on Robotics and Automation, 2018

    论文地址: https://ieeexplore.ieee.org/abstract/document/8461044

    研究问题: 人类可以在仅掌握少量先验知识的前提下识别和抓取陌生目标物,这一能力一直是机器人研究的灵感来源,也是很多实际应用的核心。为此,提出一种能在杂乱环境下对新目标物进行识别和捡放操作的机器人系统,整个系统可直接用于新目标物(在测试过程中首次出现),而无需额外的数据收集或重新训练。

    机器人学习 。 在 AI 兴起的时代,机器人拥有了一种新型的学习方式:深度强化学习。这一新方式借助通用化的神经网络表示,处理复杂的传感器输入,来让机器人从自己的经验活动中直接学习行为。相比传统方式,它解放了工程设计人员们的双手,不再需要程序员们手动设计机器人每一个动作的每一项精确参数。但是,现有的强化学习算法都还不能够适用于有复杂系统的机器人,不足以支撑机器人在短时间内就学习到行为,另外在安全性上也难以保障。

    针对这种困境, 2019 年初,谷歌 AI 与 UC 伯克利大学合作研发了一种新的强化学习算法: SAC(Soft ActorCritic)。 SAC 非常适应真实世界中的机器人技能学习,可以在几个小时内学会解决真实世界的机器人问题,而且它的一套超参数能够在多种不同的环境中工作,效率十分之高。 SAC 的开发基于最大熵强化学习这个框架。此框架尝试让预期回报最大化,同时让策略的熵最大化。一般而言,熵更高的策略具有更高的随机性。从直觉上看,这意味着,最大熵强化学习能取得高回报策略中具有最高随机性的那个策略。 SAC 学习一个随机策略,这个策略会把状态映射到动作,也映射到一个能够估计当前策略目标价值的 Q 函数,这个 Q 函数还能通过逼近动态编程来优化它们。 SAC 通过这样的方式,来让经过熵强化的回报最大化。此过程中,目标会被看作一个绝对真的方法,来导出更好的强化学习算法,它们有足够高的样本效率,且表现稳定,完全可以应用到真实世界的机器人学习中去。

    机器人应用 。 2019 年 6 月,亚马逊在 MARS 人工智能大会上最新发布的仓库机器人Pegasus,该机器人已正式加入亚马逊 Kiva 机器人行列。 Pegasus 是一种新型包裹分拣机器人,外观上看, Pegasus 机器人十分类似亚马逊既有的 Kiva 机器人, 外观还是橙色不变, 2 英尺高, 3 英尺宽,约相当于一个手提包的大小。 Pegasus 机器人更像是对原有 Kiva 机器人的改良版,在原有机器人底座上增加了一个载货平台+皮带传送带对各个包裹进行分类和移动,有助于最大限度地减少包裹损坏并缩短交货时间。 Pegasus 机器人可以自主将右侧盒子放在正确的位置。仓库作业人员将包裹扫描完放到 Pegasus 机器人上, Pegasus 机器人载着包裹到指定地点。

    机器人配备的摄像机可以感知任何意外障碍。到了指定地点,机器人载货平台上的传送带将包装从机器人上移开,然后包裹沿着滑槽向下移动,准备送出。机器人在大约 2 分钟内完成整个包裹运送过程。据亚马逊介绍, Pegasus 机器人具有与 Kiva 机器人驱动器相同的容量。 Pegasus 机器人目前已经在在丹佛分拣中心上线的六个多月,行驶约 200 万英里,经测试,它能将当前系统的包裹分拣错误率大幅降低 50%。本次 MARS 人工智能大会上,除了推出 Pegasus 机器人,亚马逊还发布了一种大型模组化运输机器人 Xanthus。依据上方安装的模组,执行多种不同的任务 Xanthus 拥有透过改变上方配备,胜任不同任务的能力。相较过 去使用的系统, Xanthus 不仅用途更为广泛,体积也只有前辈的 1/3,成本甚至直接砍半。

    机器人平台 。 如何将机器人技术落地、实践商业化一直是备受关注的问题。波士顿动力的策略是要希望其成为平台公司,通过授权或开源方式, 使其技术能被广为被使用。2018 年这个传言似乎得到了证实,在《连线》杂志举办的峰会上,波士顿动力创始人暨首席执行官 Marc Raibert 指出,他们的定位是成为平台公司,让生态圈包括第三方伙伴、客户,一起来找到技术真正适合使用的地方。 Marc Raibert 表示波士顿动力在开发机器人时是以“平台”的概念来出发,客户可以增加硬件,例如手臂及其他组件,“当然,我们也可以针对单一领域打造一个有特殊应用的机器人方案,但我们不知道哪一个领域合适,所以我们从平台的角度出发,希望生态圈帮我们一起来找到技术真正可落地之处”、“我们要打造的是‘通用用途的平台’(general purpose platform),让第三方伙伴、客户、波士顿动力自己的应用开发团队,可以一同来设计产品以符合定制化需求。

    十、 数据库技术

    数据库是按一定的结构和规则组织起来的相关数据的集合, 是综合各用户数据形成的数据集合,是存放数据的仓库(我国数据库的发展现状与趋势—陈黎)。随着计算机技术与网络通信技术的快速发展,数据库技术已经成为当今信息社会中对大量数据进行组织与管理的重要技术手段,是网络信息化管理系统的基础。目前,新一代数据库系统不仅保持和继承了传统数据库系统的各项功能,支持知识管理、数据管理和对象管理,而且还对其它应用系统开放,在网络上支持标准网络协议,具有良好的可连接性、可移植性、可互操作性和可扩展性。

    学者地图用于描述特定领域学者的分布情况,对于进行学者调查、分析各地区竞争力现况尤为重要,下图为数据库领域全球学者分布情况:

    清华2019最新AI发展报告出炉!400页干货,13大领域一文看懂

     

    ▲数据库领域全球学者分布

    地图根据学者当前就职机构地理位置进行绘制,其中颜色越深表示学者越集中。从该地图可以看出,美国的人才数量优势明显且主要分布在其东西海岸;欧洲也有较多的人才分布;亚洲的人才主要集中在我国东部;其他诸如非洲、南美洲等地区的学者非常稀少;数据库领域的人才分布与各地区的科技、经济实力情况大体一致。

    我国专家学者在数据库领域的分布如下图所示。通过下图我们可以发现,京津地区在本领域的人才数量最多,其次是珠三角和长三角地区,相比之下,内陆地区的人才较为匮乏, 这种分布与区位因素和经济水平情况不无关系。 同时,通过观察中国周边国家的学者数量情况,特别是与日韩、东南亚等地相比,中国在数据库领域学者数量较多但差距不大。

    清华2019最新AI发展报告出炉!400页干货,13大领域一文看懂

     

    ▲数据库领域中国学者分布

    优秀论文:

    论文题目: Self-Driving Database Management Systems

    中文题目: 自动驾驶的数据库管理系统

    论文作者: Andrew Pavlo, Gustavo Angulo, Joy Arulraj and, Haibin Lin, Jiexi Lin, Lin Ma, et al.

    论文出处: 7th Biennial Conference on Innovative Data Systems Research (CIDR) – CIDR 2017

    论文地址: https://www.pdl.cmu.edu/PDL-FTP/Database/p42-pavlo-cidr17.pdf

    研究问题: 在过去的二十年中,研究人员和数据库系统供应商都尝试开发了各式辅助工具以在数据库系统的调优和物理设计等各个方面协助数据库管理员( Database Administrator, DBA)。但是,大多数的工作还是不足够完善的,因为它们仍然需要 DBA 对数据库的任何更改做出最终决定,并且是在问题发生后解决问题的反应性措施。尤其是随着云数据库的发展,不需要人工干预的 DBMS 就成为了一个迫切的需求,于是能“自动驾驶”的数据库管理系统(Database Management System, DBMS)便成为了必然的选择。真正地能“自动驾驶”的数据库管理系统所需要的是一种为自治操作而设计的新体系结构。与早期的各种 DBMS 不同的是,该类系统的所有方面都由集成的计划组件控制,该组件不仅可以针对当前工作负载(Workload)优化系统,而且还能预测未来的工作负载的变化趋势,以便系统可以相应地进行准备。这样, DBMS 可以支持所有以前的调优技术,而无需人工确定正确的方式和适当的时间来部署它们。

    步入大数据时代,面对 PB 乃至 EB 级海量数据、复杂多变的应用场景、异构的硬件架构和层次不齐的用户使用水平,传统的数据管理技术难以满足新时代的需求。例如,一个云数据库系统通常具有百万级别的数据库实例,每一个数据库实例通常都有各自的应用场景、不同用户的使用水平往往也有着比较大的差别,数据库中传统的启发式算法在这些场景中难以取得较好的效果,而有经验的数据库管理员也难以直接干预和优化数量如此之多的数据库实例。

    近年来,以机器学习为代表的人工智能技术因其强大的学习和适应能力,在多个领域都大放异彩。同样的,在数据管理领域,传统机器学习和深度学习等技术也有着巨大的潜力和广阔的应用前景。例如,数据库系统所积累的海量历史查询记录可以为基于学习的数据库智能优化技术提供数据支撑。一方面,我们可以构建包含查询、视图或数据库状态的有标签数据,比如,在视图选择问题中,这个标签是指每个候选视图是否被选中。

    另一方面,在缺乏标签数据的时候,我们可以利用(深度)强化学习技术探索性地(从选择结果的反馈中学习)选择最优的候选视图。此外,人工智能技术让自治数据库的自动决策管理、自动调优和自动组装等需求成为可能。在以深度学习为代表的人工智能技术的加持下,让数据库朝着更加智能的方向发展,数据管理技术也随之智能化。近些年涌现的自治数据库和人工智能原生数据库(如 SageDB, XuanyuanDB),通过融合人工智能技术到数据库系统的各个模块(优化器、执行器和存储引擎等)和数据管理的生命周期,可以大幅度提升数据库各方面的性能,为下一代数据库和人工智能技术的发展指明了一个方向。

    在另外一方面,数据管理技术也能以基础设施的身份来支持人工智能的发展。目前的人工智能在落地过程中还面临着一些挑战性。例如,人工智能算法训练效率较低,现有人工智能系统缺少执行优化技术(如大规模缓存、数据分块分区、索引等),不仅会导致大量的计算、存储资源浪费,而且会提高程序异常的发生率(如内存溢出、进程阻塞等),严重影响单个任务的执行效率。其次,人工智能技术往往依赖高质量的训练数据,现实中的训练数据往往是包含很多缺失值、异常值和别名等类型的错误,这些错误通常会影响训练效率,对模型的质量造成干扰。面向人工智能的数据管理技术可以为解决上述挑战做出贡献。

    十一、 可视化技术

    可视化技术是把各种不同类型的数据转化为可视的表示形式,并获得对数据更深层次认识的过程。可视化将复杂的信息以图像的形式呈现出来,让这些信息更容易、快速地被人理解,因此,它也是一种放大人类感知的图形化表示方法。

    可视化技术充分利用计算机图形学、图像处理、用户界面、人机交互等技术,以人们惯于接受的表格、图形、图像等形式,并辅以信息处理技术(例如: 数据挖掘、机器学习等)将复杂的客观事物进行图形化展现,使其便于人们的记忆和理解。可视化为人类与计算机这两个信息处理系统之间提供了一个接口,对于信息的处理和表达方式有其独有的优势,其特点可总结为可视性、交互性和多维性。

    目前,数据可视化针对不同的数据类型及研究方向,可以进一步划分为科学数据可视化、信息可视化,以及可视分析学三个子领域。这三个领域既紧密相关又分别专注于不同类型的数据及可视化问题。具体而言,科学可视化是针对科学数据的可视化展现技术。科学数据,例如,医疗过程中由 CT 扫描生成的影像数据、风洞实验而产生的流体数据、以及分子的化学结构等,是对物理世界的客观描述,往往是通过科学仪器而测量得到的数据。

    这类数据的可视化主要关注于如何以清晰直观的方式展现数据所刻画的真实物理状态。因此,科学可视化往往呈现的是三维场景下的时空信息。信息可视化注重于如何以图形的方式直观展现抽象数据,它涉及到了对人类图形认知系统的研究。在这里,抽象数据(例如: 图形数据、多维度数据、文本数据等)往往是对各应用领域所产生数据的高层次概括,记录的是抽象化的信息。针对这样的数据,信息可视化着眼于多维度信息的可视编码技术,即如何以低维度(2D) 的图形符号来直观展现并揭示抽象数据中所隐藏的潜在规律与模式;可视分析学是多领域技术结合的产物,旨在结合并利用信息可视化、人机交互、以及数据挖掘领域的相关技术,将人的判断与反馈作为数据分析中重要的一环,从而达到精准数据分析、推理及判断的目的。

    学者地图用于描述特定领域学者的分布情况,对于进行学者调查、分析各地区竞争力现况尤为重要,下图为可视化领域全球学者分布情况:

    清华2019最新AI发展报告出炉!400页干货,13大领域一文看懂

     

    ▲ 可视化领域全球学者分布

    我国专家学者在可视化领域的分布如下图所示。通过下图我们可以发现,京津地区在本领域的人才数量最多,其次是长三角和珠三角地区,相比之下,内陆地区的人才较为匮乏, 这种分布与区位因素和经济水平情况不无关系。 同时,通过观察中国周边国家的学者数量情况,特别是与日韩等地相比,中国在可视化领域学者数量较多但差距较小 。

    清华2019最新AI发展报告出炉!400页干货,13大领域一文看懂

     

    ▲可视化领域中国学者分布

    优秀论文:

    论文题目: Visual Exploration of Big Spatio-Temporal Urban Data: A Study of NewYork City Taxi Trips

    中文题目:城市大时空数据的可视化研究:纽约市出租车出行研究

    论文作者: Nivan Ferreira, Jorge Poco, Huy T. Vo, Juliana Freire, Cláudio T. Silva

    论文出处: IEEE Transactions on Visualization and Computer Graphics, 2013

    论文地址: https://ieeexplore.ieee.org/stamp/stamp.jsp?tp=&arnumber=6634127&tag=1

    研究问题: 出租车数据是城市中极具价值的信息,收集并利用好出租车的数据可以有效的帮助决策者和社会学家理解城市的状况并做出正确的决策。但高效的探索出租车数据其实是一个充满挑战的事情。出租车数据十分复杂且庞大,包含了时间和空间上的信息,很难快速查询并进行比较。在采访城市规划和交通专家后,该文作者了解到,他们目前没有合适的工具来完成分析。一些简单的工具和语言只能分析一些小规模的数据,能分析的数据比较片面;而复杂一些的工具,虽然可以对大数据进行分析,则需要掌握高级的数据查询语言,对分析人员而言很困难。所以该文提出了一种支持在起点–终点(OD)数据上进行复杂时空可视化查询的模型。

    可视化语法及工具 。 随着大数据时代的到来,可视化已经成为一个必不可少的工具。现有的可视化软件及工具,可用于设计可视化应用程序和构建可视化分析系统,有助于可视化的广泛使用。为了减少制作可视化的技术负担,一些可视化工具提供了声明性语法,其中包括了 Vega-Lite 和 P5。声明性语法可以将可视化设计与执行细节分离,这使分析人员可以专注于特定于应用程序的设计决策。同时 Vega-Lite 和 P5都提供了易于使用的编程接口。

    Vega-Lite 是一套能够快速构建交互式可视化的高阶语法,它是基于 Vega 和 D3 等底层可视化语法的上层封装。相比于其它比较底层可视化语法, Vega-Lite 可以通过几行 JSON 配置代码即可完成一些通用的图表创建,而相反地,想要用 D3 等去构建一个基础的统计图表则可能需要编写多行代码,如果涉及到交互的话代码量更是会大大增加。 P5 是一个基于 Web的可视化工具包,它能集成了 GPU 计算与渐进式处理,并且提供了带有声明性语法的 API,可用于指定渐进式数据转换和可视化操作,从而帮助分析人员构建融合了高性能计算和渐进式分析工作流的可视化系统。

    可视化与故事叙述 。 故事叙述是可视化研究的一个重要且新兴的方向。 与传统的、 强调数据分析的可视化思路不同,故事叙述强调数据的传达与沟通, 强调数据与人(且通常是普通人)的连结。在此思路下, 研究者们致力于探究: 何种数据呈现与讲述技巧,可以使数据具备吸引力、 记忆度;数据故事的创作流程是怎样的,存在哪些需求和痛点;以及如何自动生成数据故事等等。 用讲故事的方式来呈现可视化,本质上是体现了一种人本导向,即以人的需求出发,提取和分析数据,并以对人友好的方式,将数据中的信息传达出去。随着我们的社会越来越依赖数据赋能,更好地构建数据与人的关系,将成为一条必经之路。叙述可视化的应用,不仅在于那些以“叙述”为主业的领域,如新闻媒体、广告宣传,更在于需要用数据来影响人、说服人、打动人的各行各业。对于研究者来说,相关的研究方向则包括可视化设计、人机交互、认知与感知、智能生成与推荐等等。

    可视化的自动生成 。 数据可视化领域中大多数的可视化生成系统往往是基于数据的交互式探索,也包括商业领域的知名的可视化工具 Tableau 和 PowerBI。而近些年来,为了避免繁杂的数据分析步骤并提升用户效率,可视化的自动生成逐渐成为行业领域中的研究热点。一系列基于规则和机器学习的推荐方法层出不穷,在自动生成可视化的最新研究中,研究者希望在保证准确表现数据的同时,也能将视觉设计的因素考虑在内,确保可视化的美观性和数据的表现力。

    例如, DataShot 和 Text-toViz,分别从数据和自然语言两个角度去自动生成富有设计感的数据可视化,前者直接从表格数据生成信息简报,后者根据用户的自然语言输入生成对应的信息图。制作一个有效且美观的数据可视化往往需要跨专业领域的技能,尤其是需要同时具备数据分析能力和平面设计能力,而这对于一个没有专业训练的普通用户来说是比较困难的。 DataShot 和 Text-to-Viz 等前沿的技术研究均通过自动化的方法从数据洞察和设计美学两个方面帮助用户生成可视化,降低用户制作可视化的门槛,并有效提高生产效率。

    可解释性深度学习 。 LSTMVis 是一个递归神经网络的可视化分析工具,它着重于对 RNNs 中的隐藏特征进行可视化分析。 LSTMVis 结合了一个基于时间序列的选择界面和一个交互式的匹配工具来搜索大型数据集中相似的隐藏状态模式。系统的主要功能是理解模型中动态变化的隐藏状态。该系统允许用户选择一个假设的输入范围来关注局部的改变,将这些状态改变与大型数据集中类似的模式进行匹配,并将这些选择出来的模式进行对齐分析。

    RNNs 在序列建模方面有着重要的作用,但是模型中的隐藏层含义很难被解释清楚。对于一个完成训练的 RNN 模型,分析人员并不清楚这个模型是如何理解序列中不同节点之间的关系的。 LSTMVis 能够帮助用户交互式地探索 RNN 模型复杂的网络结构,并将模型中抽象表示的隐藏层信息与人类可理解的原始输入进行关联。

    随着 21 世纪大数据的兴起和发展,大数据可视化广泛应用于各个领域,本节重点介绍其中的社交媒体可视化、医疗信息可视化和体育数据可视化。 社交媒体,比如最近几年非常流行的 Twitter、 Facebook、微博。它们可以作为强大的在线交流平台,允许数百万用户在任何时间、任何地点产生、传播、共享或交换信息。这些信息通常包括多种多媒体内容,如文本、图像和视频。在社交媒体上传播的大量多媒体数据,涵盖了全球范围内大规模和实时发生的社会动态信息, 这种现象为社交媒体可视化提供了很多机会。

    社交媒体技术层面上的可视化,主要包括: 基于关键字方法的可视化, 基于主题方法的可视化和多元方法的可视化。 现有的研究大多集中于集体行为的可视化,这类研究的主题包括: 信息扩散的可视化,社会竞争与合作的可视化,人的流动性的可视化。

    社交媒体数据的可视化分析正在迅速发展,每年都有大量的新方法出现。然而,该领域仍处于起步阶段,面临许多挑战和悬而未决的问题。许多挑战不能仅 结合的多学科研究,将带来处理和理解社交媒体数据会有更强大、更可行的方法和技术。

    十二、 数据挖掘

    数据挖掘(Data Mining),是指从大量的数据中自动搜索隐藏于其中的有着特殊关系性的数据和信息,并将其转化为计算机可处理的结构化表示,是知识发现的一个关键步骤。数据挖掘的广义观点:从数据库中抽取隐含的、以前未知的、具有潜在应用价值的模型或规则等有用知识的复杂过程,是一类深层次的数据分析方法。数据挖掘是一门综合的技术,涉及统计学、数据库技术和人工智能技术的综合,它的最重要的价值在于用数据挖掘技术改善预测模型。

    学者地图用于描述特定领域学者的分布情况,对于进行学者调查、分析各地区竞争力现况尤为重要,下图为数据挖掘领域全球学者分布情况:

    清华2019最新AI发展报告出炉!400页干货,13大领域一文看懂

     

    ▲数据挖掘领域全球人才部分

    地图根据学者当前就职机构地理位置进行绘制,其中颜色越深表示学者越集中。从该地图可以看出,美国的人才数量遥遥领先且主要分布于其东西海岸;欧洲、亚洲也有较多的人才分布;其他诸如非洲、南美洲等地区的学者非常稀少;可视化领域的人才分布与各地区的科技、经济实力情况大体一致。

    我国专家学者在数据挖掘领域的分布如上图所示。通过下图我们可以发现,京津地区在本领域的人才数量最多,其次是珠三角和长三角地区,相比之下,内陆地区的人才较为匮乏,这种分布与区位因素和经济水平情况不无关系。同时,通过观察中国周边国家的学者数量情况,特别是与日本、东南亚等亚洲国家相比,中国在数据挖掘领域学者数量较多且有一定的优势。

    清华2019最新AI发展报告出炉!400页干货,13大领域一文看懂

     

    ▲数据挖掘领域中国学者分布

    优秀论文: 论文题目: Graph Convolutional Neural Networks for Web-Scale Recommender Systems

    中文题目:图卷积神经网络应用于网络规模推荐系统

    论文作者: Rex Ying, Ruining He, Kaifeng Chen, Pong Eksombatchai, William L. Hamilton, and Jure Leskovec.

    论文出处: In Proceedings of the 24th ACM SIGKDD International Conference on Knowledge Discovery & Data Mining (KDD ’18) .

    论文地址: https://dl.acm.org/citation.cfm?doid=3219819.3219890

    研究问题: 图结构数据作为深层神经网络最新研究成果应用于推荐系统基准的最新的指标,传统的深度学习网络主要针对图片,语音等欧氏空间内规则型数据,但是现实中存在很多不是欧氏数据, 它们的结构不规则,难以用卷积神经网络对其进行结构信息的聚合,故将其扩展到有数十亿用户的网络级推荐系统是一个巨大的挑战。

    近几年,我们已经迎来了大数据时代,各大互联网企业每天都在产生数以亿计的数据。各类数据往往都隐含着一些有价值的信息, 如果人们手动地进行数据分析,往往需要耗费大量的时间。同时,大量未经处理的数据可能会被人们所忽视。数据挖掘就是想自动地从大规模的数据中挖掘出有意义的知识或者模式。这里,我们将数据挖掘领域近期的主要发展归为两大类:复杂数据挖掘、分布式数据挖掘。

    复杂数据包括序列数据、图数据等。在序列数据挖掘中,基于注意力(Attention)机制的 Transformer 模型表现出了巨大的潜力,在机器翻译等任务上取得了非常好的效果。随后, BERT 模型使用双向 Transformer 通过预训练方式在各种自然语言处理的任务上都达到了当时最好的结果。在图数据挖掘研究中,网络表示学习仍然是近年来非常热门的话题。从 DeepWalk 算法开始,基于随机游走的算法在无监督的表示学习任务中表现良好。 NetMF 算法将几种基于随机游走的算法统一写成了矩阵分解的形式,给网络表示学习算法提供了理论基础。图卷积神经网络是另一种处理图数据的有效方法,借鉴了图谱论中的图卷积并使用图的拉普拉斯矩阵,在半监督的节点分类任务和图分类任务中都表现出很好的效果。除此之外,异构网络的表示与挖掘也逐渐被大家所关注。

    分布式数据挖掘已成为数据挖掘领域非常有前途的方向。随着数据挖掘计算成本的增加和数据隐私保护的问题,分布式数据挖掘开始备受关注。分布式数据挖掘利用分布式站点的资源来降低计算成本并增强数据保密性。由于分布式数据挖掘采用了不同的计算方式,传统的数据挖掘技术很难直接应用于分布式数据挖掘。目前,数据安全与数据隐私开始被大家所关注。 2018 年 5 月,通用数据保护条例(GDPR)在欧盟正式生效, 这也使得基于隐私保护的分布式数据挖掘方法逐渐被研究者所重视。

    数据挖掘已经被广泛地应用于各类实际问题,包括金融数据分析、推荐系统等。数据挖掘相关研究需要结合实际问题,注重与机器学习、统计学科等的交叉,从大数据中挖掘出有价值的信息。

    十三、 信息检索与推荐

    R.Baeza-Yates 教授在其著作《现代信息检索中 》中指出 ,信息检索(Information Retrieval, IR)是计算机科学的一大领域,主要研究如何为用户访问他们感兴趣的信息提供各种便利的手段,即:信息检索涉及对文档、网页、联机目录、结构化和半结构化记录及多媒体对象等信息的表示、存储、组织和访问,信息的表示和组织必须便于用户访问他们感兴趣的信息。

    在范围上,信息检索的发展已经远超出了其早期目标,即对文档进行索引并从中寻找有用的文档。如今,信息检索的研究包括用户建模、 Web 搜索、 文本分析、 系统构架、 用户界面、 数据可视化、 过滤和语言处理等技术。

    信息检索的主要环节包括信息内容分析与编码、组成有序的信息集合以及用户提问处理和检索输出。其中信息提问与信息集合的匹配、选择是整个环节中的重要部分。当用户向系统输入查询时,信息检索过程开始,接着用户查询与数据库信息进行匹配。返回的结果可能是匹配或不匹配查询,而且结果通常被排名。大多数信息检索系统对数据库中的每个对象与查询匹配的程度计算数值分数,并根据此值进行排名,然后向用户显示排名靠前的对象。

    推荐系统(Recommendation System, RS)是指信息过滤技术,从海量项目(项目是推荐系统所推荐内容的统称,包括商品、新闻、微博、音乐等产品及服务)中找到用户感兴趣的部分并将其推荐给用户,这在用户没有明确需求或者项目数量过于巨大、凌乱时,能很好地为用户服务,解决信息过载问题。

    一般推荐系统模型流程通常由 3 个重要的模块组成:用户特征收集模块,用户行为建模与分析模块,推荐与排序模块。推荐系统通过用户特征收集模块收集用户的历史行为,并使用用户行为建模和分析模块构建合适的数学模型分析用户偏好,计算项目相似度等,最后通过推荐与排序模块计算用户感兴趣的项目,并将项目排序后推荐给用户。

    信息的检索与推荐都是用户获取信息的手段,无论是在互联网上,还是在线下的生活场景里,这两种方式都大量并存,两者之间的关系是互补的:搜索引擎需要用户主动提供准确的关键词来寻找信息,因此不能解决用户的很多其他需求,比如当用户无法找到准确描述自己需求的关键词时,搜索引擎就无能为力了。和搜索引擎一样,推荐系统也是一种帮助用户快速发现有用信息的工具。

    与搜索引擎不同的是,推荐系统不需要用户提供明确的需求,而是通过分析用户的历史行为给用户的兴趣建模,从而主动给用户推荐能够满足他们兴趣和需求的信息。因此,从某种意义上说,推荐系统和搜索引擎对于用户来说是两个互补的工具。搜索引擎满足了用户有明确目的时的主动查找需求,而推荐系统能够在用户没有明确目的的时候帮助他们发现感兴趣的新内容。在实际生活中也有很多运用。

    同时,信息的检索与推荐也有着一定的区别,可以分为以下几个方面: 首先是主动与被动的不同。搜索是一个非常主动的行动,用户的需求也十分明确,在搜索引擎提供的结果里,用户也能通过浏览和点击来明确的判断是否满足了用户需求。然而,推荐系统接受信息是被动的,需求也都是模糊而不明确的。

    学者地图用于描述特定领域学者的分布情况,对于进行学者调查、分析各地区竞争力现况尤为重要,下图为信息检索与推荐领域全球学者分布情况:

    清华2019最新AI发展报告出炉!400页干货,13大领域一文看懂

     

    ▲信息检索与推荐领域全球人才分布

    地图根据学者当前就职机构地理位置进行绘制,其中颜色越深表示学者越集中。从该地图可以看出,美国的人才数量优势明显且主要分布于其东西海岸;欧洲、亚洲也有较多的人才分布;其他诸如非洲、南美洲等地区的学者非常稀少;信息检索与推荐领域的人才分布与各地区的科技、经济实力情况大体一致。 此外,在性别比例方面,信息检索与推荐领域中男性学者占比 90.6%,女性学者占比9.4%,男性学者占比远高于女性学者。

    清华2019最新AI发展报告出炉!400页干货,13大领域一文看懂

     

    ▲信息检索与推荐领域中国学者分布

    我国专家学者在信息检索与推荐领域的分布如上图所示,从中可以发现京津地区在本领域的人才数量最多,其次是长三角和珠三角地区,相比之下,内陆地区的人才较为匮乏,这种分布与区位因素和经济水平情况不无关系。同时,通过观察中国周边国家的学者数量情况,特别是与日韩、东南亚等地相比,中国在信息检索与推荐领域学者数量较多且优势较大。

    优秀论文:

    论文题目: Adversarial Personalized Ranking for Recommendation

    中文题目:对抗式个性化推荐排名

    论文作者: Xiangnan He, Zhankui He, Xiaoyu Du anTat-Seng Chua.

    论 文 出 处 : The 41st International ACM SIGIR Conference on Research & Development in Information Retrieval – SIGIR ’18

    论文地址: https://arxiv.org/pdf/1808.03908.pdf

    研究问题: 贝叶斯个性化排名(Bayesian Personalized Ranking, BPR)是一种成对学习的排序方法,用于优化个性化排序的推荐模型。它以内隐反馈学习为目标,假定观察到的交互比未观察到的交互排在更高的位置。矩阵因子分解( MatrixFactorization, MF)是最基本也是最有效的推荐模型。 MF 将每个用户和项表示为嵌入向量,通过嵌入向量之间的内积来估计用户对某一项的偏好程度。在信息检索领域,贝叶斯个性化排名训练的矩阵分解模型(MF-BPR)学习一个与训练数据相适应的复杂函数,不能很好地泛化,且其鲁棒性较差,易受参数的对抗性扰动。因此本文提出了一种新的个性化排名训练方法-对抗的个性化排名(Adversarial Personalized Ranking, APR)。

    随着互联网中数字信息数量的增长,商品、书籍、新文章、歌、电影、研究文件等日常基础性事物,其数量和种类填满了多个数据仓库和数据库。蕴含着智能推荐系统和强大的搜索引擎的在线商店、在线音乐、在线视频和图片库等已成为人们快速寻找信息的主要方式。此类系统的流行程度和有用性在于它们能够便捷地显示几乎无限的物品信息。比如, Amazon、 Netflix 等推荐系统尝试了解用户兴趣,并向用户推荐他们感兴趣的商品。尽管这些系统由于使用场景而各不相同,但其寻找用户感兴趣商品的核心机制都是用户兴趣与商品匹配的机制。

    为了提高信息检索与推荐系统中算法模型的准确性和可解释性,研究人员近年来主要关注无偏的在线排序学习模型,以及利用知识信息增强推荐系统的表现和可解释性等方面的研究。其中,无偏的在线排序学习模型是指自动利用大规模用户点击数据训练搜索结果的排序模型。用户点击数据是现代搜索引擎的重要数据来源,具有成本低廉,并且对以用户为中心的检索应用程序(如搜索排名) 特别有用等优点。

    为了充分利用用户点击数据开发一个无偏的学习排名系统,研究人员试图消除用户偏见对排名模型训练的影响。近年来,一种基于反事实学习和图形模型的无偏学习排名框架引起了人们的广泛关注。该框架侧重于使用反事实学习直接训练带有偏倚点击数据的排名模型。这个无偏的学习排名框架对待点击偏差作为一个反事实的影响和去偏用户反馈加权每点击与他们的反向倾向加权。它使用倾向性模型来量化点击的偏差,并没有明确地估计查询文档与培训数据的相关性。研究人员从理论上证明,在正确的偏差估计下,在该框架下使用点击数据训练的排序模型将收敛于使用真实相关信号训练的排序模型。

    信息检索与推荐系统可以为用户推荐其感兴趣的内容并给出个性化的建议。而现在的推荐系统大都着眼于被推荐对象的序列建模,而忽略了它们细粒度的特征。为了解决以上问题,研究人员提出了多任务可解释推荐模型( Multi-Task Explainable Recommendation, MTER)和知识增强的序列推荐模型(Knowledgeenhanced Sequential Recommender, KSP)。其中, MTER 模型是一个用于可解释推荐任务的多任务学习方法,通过联合张量分解将用户、产品、特征和观点短语映射到同一向量空间,来从用户评论中提取产品细粒度的个性化特征。 KSR 模型提出了利用结合知识库的记忆网络来增强推荐系统的特征捕获能力与解释性,解决序列化推荐系统不具有解释性,且无法获取用户细粒度特征的不足。 MTER 和KSR 模型通过对推荐结果的解释,分析被推荐对象的特征,可以让用户可以对使用哪些推荐结果做出更明智,更准确的决策,从而提高他们的满意度。

    近年来,信息检索与推荐领域比较流行的开源平台主要包括基于深度学习的检索模型(MatchZoo)、基于 tensorflow 的 learning to rank 模型(TF-Ranking)和 microsoft recommenders。其中, MatchZoo 是由中国科学院计算技术研究所网络数据科学与技术重点实验室近期发布的深度文本匹配开源项目。 MatchZoo 是一个 Python 环境下基于 TensorFlow 开发的开源文本匹配工具,使用了 Keras 中的神经网络层,并有数据预处理,模型构建,训练与评测三大模块组成, 旨在让大家更加直观地了解深度文本匹配模型的设计、更加便利地比较不同模型的性能差异、更加快捷地开发新型的深度匹配模型。

    MatchZoo 提供了基准数据集(TRECMQ 系列数据、 WiKiQA 数据等)进行开发与测试,整合了当前最流行的深度文本匹配的方法(包括 DRMM, MatchPyramid, DUET, MVLSTM, aNMM, ARC-I,ARC-II, DSSM, CDSSM 等算法的统一实现),旨在为信息检索、数据挖掘、自然语言处理、机器学习等领域内的研究与开发人员提供便利, 可以应用到的任务场景包括文本检索,自动问答,复述问题,对话系统等等。

    TF-Ranking 是一个可扩展的基于 tensorflow 的用于排序的库,由 google 于2018 年提出。 TF-Ranking 提供了一个统一的框架,其中包括一套最先进的学习排序算法,并支持成对或列表损失函数、多项评分、排序度量优化和无偏学习排序。 TF-Ranking 速度很快并且易于使用,可以创建高质量的排序模型。 统一的框架使机器学习的研究人员、实践者和爱好者能够在一个库中评估和选择一系列不同的排序模型。

    此外,这个开源库不仅提供了合理的默认模型,还可以让用户能够开发自己的定制模型,且提供了灵活的 API,用户可以在其中定义和插入自己定制的损失函数、评分函数和指标。 Microsoft Recommenders 是微软云计算和人工智能开发团队与微软亚洲研究院团队深度合作,基于多年来各类大型企业级客户的项目经验以及最新学术研究成果,搭建的完整推荐系统的最新实操技巧开源项目。该项目有效解决了定制和搭建企业级推荐系统中的几个难点,包括如何将学术研究成果或开源社区提供的范例适用于企业级应用、如何集成信息检索与推荐领域的学习指导资源俩协助从业人员深入理解并实际搭建完整推荐系统、如何选择最优算法以应对具体应用场景等。

    为了协助信息检索与推荐领域的算法模型的训练和优化,微软公司提供了一个大规模支持机器阅读理解和问答系统等多种领域研究的数据集,简称 MSMACRO。该数据集从必应(bing)的搜索查询记录中取样,每个问题都有人工生成的答案和完全人工重写的答案。此外,数据集包含从通过 bing 检索的 web文档中提取的百万个密码,这些密码提供了管理自然语言答案所需的信息。

    使用这个数据集,本文提出三个不同层次的难度不同的任务: (i) 根据一组上下文段落预测一个问题是否可以回答,然后像人类一样提取和合成答案(ii) 基于根据问题和段落语境信息可以被理解的上下文段落,来生成格式良好的答案(如果可能) , 最后(iii) 根据给定的一个问题,对检索得到的段落进行排序。数据集的大小和问题来自真实用户搜索查询的事实,该数据集的规模和真实世界的性质使它对基准测试机器阅读理解和问答模型具有吸引力。

    智东西认为,从清华大学该报告可以看出,现阶段人工智能人才总的来看美国的人才数量遥遥领先,我国人才数量在大部分领域领跑第二梯队,但与位居首位的美国相比,中国高影响力学者数量明显不足,顶尖学者相对匮乏,中美之间还存在较大的赶超空间。当前,人工智能已经成为引领新一轮科技革命和产业变革的战略性技术,我国在人工智能领域的科学技术研究和产业发展,起步稍晚于以美国为代表的发达国家,但是,在最近十余年的人工智能爆发发展期我国抓住了机遇,进入了快速发展阶段。在这个阶段,能够推动技术突破和创造性应用的高端人才对人工智能的发展起着至关重要的作用。

    展开全文
  • 领域特定语言(Domain-Specific Languages,简称DSL),是一个很有用的术语和概念,但其边界很模糊。一些东西很明显是DSL,但另一些可能会引发争议。本文接下来就走近“领域特定语言”,了解它的概念、为何要采用DSL...

    领域特定语言(Domain-Specific Languages,简称DSL),是一个很有用的术语和概念,但其边界很模糊。一些东西很明显是DSL,但另一些可能会引发争议。本文接下来就走近“领域特定语言”,了解它的概念、为何要采用DSL,以及使用时应该注意的问题。

    1.定义DSL

    • 领域特定语言(名词),针对某一特定领域,具有受限表达性的一种计算机程序设计语言。这一定义包含4个关键元素:
    • 计算机程序设计语言(computerprogramming language):人们用DSL指挥计算机去做一些事。同大多数现代程序设计语言一样,其结构设计成便于人们理解的样子,但它应该还是可以由计算机执行的语言。
    • 语言性(languagenature):DSL是一种程序设计语言,因此它必须具备连贯的表达能力——不管是一个表达式还是多个表达式组合在一起。
    • 受限的表达性(limitedexpressiveness):通用程序设计语言提供广泛的能力:支持各种数据、控制,以及抽象结构。这些能力很有用,但也会让语言难于学习和使用。DSL只支持特定领域所需要特性的最小集。使用DSL,无法构建一个完整的系统,相反,却可以解决系统某一方面的问题。
    • 针对领域(domainfocus):只有在一个明确的小领域下,这种能力有限的语言才会有用。这个领域才使得这种语言值得使用。

    注意,“针对领域”在这个列表中最后出现,它纯粹是受限表达性的结果。很多人按字面意思把DSL理解为一种用于专用领域的语言。但字面意思常常有误:比如,我们不会管硬币叫“光盘”(Compact Disk,紧凑的盘),即便它确实是“盘”,而且相比于可以用这个术语称呼的东西,更为紧凑(compact)。

    DSL主要分为三类:外部DSL、内部DSL,以及语言工作台。

    • 外部DSL是一种“不同于应用系统主要使用语言”的语言。外部DSL通常采用自定义语法,不过选择其他语言的语法也很常见(XML就是一个常见选择)。宿主应用的代码会采用文本解析技术对使用外部DSL编写的脚本进行解析。一些小语言的传统UNIX就符合这种风格。可能经常会遇到的外部DSL的例子包括:正则表达式、SQL、Awk,以及像Struts和Hibernate这样的系统所使用的XML配置文件。
    • 内部DSL是一种通用语言的特定用法。用内部DSL写成的脚本是一段合法的程序,但是它具有特定的风格,而且只用到了语言的一部分特性,用于处理整个系统一个小方面的问题。用这种DSL写出的程序有一种自定义语言的风格,与其所使用的宿主语言有所区别。这方面最经典的例子是Lisp。Lisp程序员写程序就是创建和使用DSL。Ruby社区也形成了显著的DSL文化:许多Ruby库都呈现出DSL的风格。特别是,Ruby最著名的框架Rails,经常被认为是一套DSL。
    • 语言工作台是一个专用的IDE,用于定义和构建DSL。具体来说,语言工作台不仅用来确定DSL的语言结构,而且是人们编写DSL脚本的编辑环境。最终的脚本将编辑环境和语言本身紧密结合在一起。

    多年来,这三种风格分别发展了自己的社区。你会发现,那些非常擅长使用内部DSL的人,完全不了解如何构造外部DSL。我担心这可能会导致人们不能采用最适合的工具来解决问题。我曾与一个团队讨论过,他们采用了非常巧妙的内部DSL处理技巧来支持自定义语法,但我相信,如果他们使用外部DSL的话,问题会变得简单许多。但由于对如何构造外部DSL一无所知,他们别无选择。因此,在本书中,把内部DSL和外部DSL讲清楚对我来说格外重要,这样你就可以了解这些信息,做出适当的选择。(语言工作台稍显粗略,因为它们很新,尚在演化之中。)

    另一种看待DSL的方式是:把它看做一种处理抽象的方式。在软件开发中,我们经常会在不同的层面上建立抽象,并处理它们。建立抽象最常见的方式是实现一个程序库或框架。操纵框架最常见的方式是通过命令/查询式API调用。从这种角度来看,DSL就是这个程序库的前端,它提供了一种不同于命令/查询式API风格的操作方式。在这样的上下文中,程序库成了DSL的“语义模型”(第11章),因此,DSL经常伴随着程序库出现。事实上,我认为,对于构建良好的DSL 而言,语义模型是一个不可或缺的附属物。

    谈及DSL,人们很容易觉得构造DSL很难。实际上,通常是难在构造模型上,DSL只是位于其上的一层而已。虽然让DSL 工作良好需要花费一定的精力,但相对于构建底层模型,这一部分的付出要少多了。

    2.为何需要DSL

    DSL只是一种工具,关注点有限,无法像面向对象编程或敏捷方法论那样,引发软件开发思考方式的深刻变革。相反,它是在特定条件下有专门用途的一种工具。一个普通的项目可能在多个地方采用了多种DSL——事实上很多项目这么做了。

    DSL有其自身的价值。当考虑采用DSL时,要仔细衡量它的哪些价值适合于我们的情况。

    1)提高开发效率

    DSL的核心价值在于,它提供了一种手段,可以更加清晰地就系统某部分的意图进行沟通。拿格兰特小姐控制器的定义来说,相比于采用命令–查询API,DSL形式对我们而言更容易理解。

    这种清晰并非只是审美追求。一段代码越容易看懂,就越容易发现错误,也就越容易对系统进行修改。因此,我们鼓励变量名要有意义,文档要写清楚,代码结构要写清晰。基于同样的理由,我们应该也鼓励采用DSL。

    人们经常低估缺陷对生产率的影响。缺陷不仅损害软件的外部质量,还浪费开发人员的时间去调查以及修复,降低开发效率,并使系统的行为异常,播下混乱的种子。DSL的受限表达性,使其难于犯错,纵然犯错,也易于发现。

    模型本身可以极大地提升生产率。通过把公共代码放在一起,它可以避免重复。首先,它提供了一种“用于思考问题”的抽象,这样,更容易用一种可理解的方式指定系统行为。DSL提供了一种“对阅读和操作抽象”更具表达性的形式,从而增强了这种抽象。DSL还可以帮助人们更好地学习使用API,因为它将人们的关注点转移到怎样将API方法整合在一起。

    我还遇到过一个有趣的例子,使用DSL封装一个棘手的第三方程序库。当命令–查询接口设计得很糟糕时,DSL 惯常的连贯性就得以凸现。此外,DSL只须支持客户真正用到的部分,这大大降低了客户开发人员学习的成本。

    2)与领域专家的沟通

    我相信,软件项目中最困难的部分,也是项目失败最常见的原因,就是开发团队与客户以及软件用户之间的沟通。DSL提供了一种清晰而准确的语言,可以有效地改善这种沟通。

    相比于关于生产率的简单争论,改善沟通所带来的好处显得更加微妙。首先,很多DSL并不适用于沟通领域问题,比如,用于正则表达式或构建依赖关系的DSL,在这些情况下就不合适。只有一部分独立DSL确实应用这种沟通手段。

    当在这样的场景下讨论DSL时,经常会有人说:“好吧,现在我们不需要程序员了,领域专家可以自己指定业务规则。”我把这种论调称为“COBOL谬论”——因为COBOL曾被人寄予这样的厚望。这种争论很常见,不过,我觉得这种争论不值得在此重复。

    虽然存在“COBOL谬论”,我仍然觉得DSL可以改善沟通。不是让领域专家自己去写DSL,但他们可以读懂,从而理解系统做了什么。能够阅读DSL代码,领域专家就可以指出问题所在。他们还可以同编写业务规则的程序员更好地交流,也许,他们还可以编写一些草稿,程序员们可以将其细化成适当的DSL规则。

    但我不是说领域专家永远不能编写DSL。我遇见过很多团队,他们成功地让领域专家用DSL编写了大量系统功能。但我仍然认为,使用DSL的最大价值在于,领域专家能够读懂。所以编写DSL的第一步,应该专注于易读性,这样即便后续的目标达不到,我们也不会失去什么。

    使用DSL是为了让领域专家能够看懂,这就引出了一个值得争议的问题。如果希望领域专家理解一个“语义模型”的内容,可以将模型可视化。这时就要考虑一下,相比于支持一种DSL,是不是只使用可视化会是一种更有效的办法。可视化对于DSL而言,是一种有益的补充。

    让领域专家参与构建DSL,与让他们参与构建模型是同样的道理。我发现,与领域专家一起构建模型能够带来很大的好处,在构建一种Ubiquitous Language [Evans DDD] 的过程中,程序员与领域专家之间可以深入沟通。DSL提供了另一种增进沟通的手段。随着项目的不同,我们可能发现,领域专家可能会参与模型和DSL,也可能只参与 DSL。

    实际上,有些人发现,即便不实现DSL,有一种描述领域知识的DSL,也能带来很大的好处。即使只把它当做沟通平台也可以获益。

    总的来说,让领域专家参与构建DSL比较难,但回报很高。即使最终不能让领域专家参与,但是开发人员在生产率方面的提升,也足以让我们大受裨益,因此,DSL值得投入。

    3)执行环境的改变

    当谈及将状态机表述为XML的理由时,一个重要的原因是,状态机定义可以在运行时解析,而非编译时。在这种情况下,我们希望将代码运行于不同的环境,这类理由也是使用DSL一个常见的驱动力。对于XML配置文件而言,将逻辑从编译时移到运行时就是一个这样的理由。

    还有一些需要迁移执行环境的情况。我曾见过一个项目,它要从数据库里找出所有满足某种条件的合同,给它们打上标签。他们编写了一种DSL,以指定这些条件,并用它以Ruby语言组装“语义模型”。如果用Ruby将所有合同读入内存,再运行查询逻辑,那会非常慢,但是团队可以用语义模型的表示生成SQL,在数据库里做处理。直接用SQL编写规则,对开发人员都很困难,遑论业务人员。然而,业务人员可以读懂(在这种情况下,甚至编写)DSL里有关的表达式。

    这样用DSL常常可以弥补宿主语言的局限性,将事物以适宜的DSL形式表现出来,然后,生成可用于实际执行环境的代码。

    模型的存在有助于这种迁移。一旦有了一个模型,或者直接执行它,或者根据它产生代码都很容易。模型可以由表单风格的界面创建,也可以由DSL创建。DSL相对于表单有一些优势。在表述复杂逻辑方面,DSL比表单做得更好。而且,可以用相同的代码管理工具,比如版本控制系统,管理这些规则。当规则经由表单输入,存入数据库中,版本控制就无能为力了。

    下面会谈及DSL的一个伪优点。我听说,有人宣称DSL的一个好处是,它能够在不同的语言环境下执行相同的行为。一个人编写了业务规则,然后生成C#或Java代码,或者,描述校验逻辑之后,在服务器端以C#形式运行,在客户端则是JavaScript。这是一个伪优势,因为仅仅使用模型就可以做到这一点,根本无需DSL。当然,DSL有助于理解这些规则,但那是另外一个问题。

    4)其他计算模型

    几乎所有主流的编程语言都采用命令式的计算模型。这意味着,我们要告诉计算机做什么事情,按照怎样的顺序来做。通过条件和循环处理控制流,还要使用变量——确实,还有很多我们以为理所当然的东西。命令式计算模型之所以流行,是因为它们相对容易理解,也容易应用到许多问题上。然而,它并不总是最佳选择。

    状态机是这方面的一个良好例子。可以采用命令式代码和条件处理这种行为,也确实可以很好地构建出这种行为。但如果直接把它当做“状态机”来思考,效果会更好。另外一个常见的例子是,定义软件构建方式。我们固然可以用命令式逻辑实现它,但后来,人们发现用“依赖网络”(比如,运行测试必须依赖于最新的编译结果)解决会更容易。结果,人们设计出了专用于描述构建的语言(比如Make和Ant),其中将任务间的依赖关系作为主要的结构化机制。

    你可能经常听到,人们把非命令式方式称为声明式编程。之所以叫做声明式,是因为这种风格让人定义做什么,而不是用一堆命令语句来描述怎么做。

    采用其他计算模型,并不一定非要有DSL。其他编程模型的核心行为也源自“语义模型”,正如前面所讲的状态机。然而,DSL还是能够带来很大的转变,因为操作声明式程序,组装语义模型会容易一些。

    3.DSL的问题

    前面已经讨论了何时该采用DSL,接下来就该谈论什么时候不该采用DSL,或者至少是使用DSL应注意的问题。

    从根本上说,不使用DSL的唯一原因就是,在你的场景下,使用DSL得不到任何好处,或者,至少是DSL的好处不足以抵消构建它的成本。

    虽然DSL在有些场合下适用,但同样会带来一些问题。总的来说,我认为通常是高估了这些问题,一般人们不太熟悉如何构造DSL,以及DSL如何适应更为广阔的软件开发图景。还有,许多常提及的DSL问题混淆了DSL和模型,这也伤及了DSL的优势。

    许多DSL问题只是与某种特定DSL风格相关,要理解这些问题,我们需要深入理解这些DSL是如何实现的。所以,这些问题留待后面讨论,在这里,我们只看宽泛的问题,这同当前讨论的问题是一致的。

    1)语言噪音

    在反对DSL的观点中,我最常听到的是称为语言噪音的问题:担心语言难于学习,因此,使用多种语言会比使用一种语言复杂得多。必须了解多种语言,会让工作更为困难,新人加入的门槛也提升了。

    当人们谈及这种担心时,他们都会有一些共同的误解。首先,他们通常混淆了学习一门DSL的心血与学习一门通用语言的心血。DSL远比一门通用语言容易,因此,学习起来也要容易得多。

    许多批评者知道这一点,但依然反对DSL,即便它们相对容易学习,在一个项目上有多种DSL也增加了理解的难度。这里的误解在于,他们忘了一点,一个项目总有一些复杂的地方,难于学习。即便不用DSL,代码库中仍然有许多需要理解的抽象。通常,这些抽象应该在程序库里,以便于掌握。即使不必学习多种DSL,也不得不学习多个程序库。

    所以,真正的问题在于,相比于学习DSL底层模型而言,学习DSL会难多少。我认为,相对于理解模型而言,学习DSL 所增加的成本相当小。确实,因为DSL的价值就在于,让人们理解和使用模型更容易,所以使用DSL就应该能降低学习成本。

    2)构建成本

    相对于底层的程序库而言,DSL增加的成本并不大,但这始终是成本。代码需要写,尤其是还要维护。所以,同其他代码一样,它也要做好自己的本职工作。并非所有程序库都值得用DSL封装。如果命令–查询API够用,就没有必要在上面提供额外的API。即便DSL有用,就边界效应而言,构建和维护也需要花费太多的工作量。

    DSL的可维护性是一项重要的考量因素。如果团队中的大多数人都觉得难以理解,即使是一种简单的内部DSL,也会带来很大的麻烦。外部DSL更是让许多人望而却步,一个解释器就足以让很多程序员打退堂鼓。

    人们不习惯构建DSL,这也让添加DSL的成本变得更高。人们要学习新技术。虽然不应该忽略这些成本,但我们也应该清楚,这个学习曲线的成本能够分摊到未来使用DSL的过程中。

    还有一点要清楚,DSL的成本大于构建模型的成本。任何复杂的地方都需要某种机制管理其复杂性,如果复杂到要考虑DSL,几乎肯定复杂到可以从模型中获益的程度。DSL有助于思考模型,降低构建成本。

    这会带来一个相关问题,鼓励使用DSL会导致构建出一堆糟糕的DSL。实际上,我盼着构建出一堆糟糕的DSL,就像有很多糟糕的命令–查询API的程序库一样。问题在于,DSL会不会把事情弄得更糟。一个好的DSL可以封装一个糟糕的程序库,把它变得更易用(如果可能的话,我更愿意修正程序库本身)。糟糕的DSL对于构建和维护而言,就是浪费资源,但这种说法对任何代码都适用。

    3)集中营语言

    集中营语言(ghetto language)问题与语言噪音问题正好相反。比如,一家公司用一种内部语言编写公司内的很多系统,这种语言在其他地方根本用不上。这种做法会让他们很难找到新人,跟上技术变化。

    在分析这个问题时,首先要澄清一点,如果整个系统都是用一种语言编写的,那它就不是一种DSL(至少按我的定义),而是一种通用语言。虽然可以用许多DSL技术构建通用语言,但我强烈建议,不要这样做。构建和维护一种通用语言是一个巨大的负担,它会迫使你在这个集中营中做大量工作,甚至挣扎一生。不要这么做。

    我相信,集中营语言问题并非空穴来风,它隐含了一些现实问题。首先是,一种DSL总是存在着无意中演化成一种通用语言的危险。我们有一种DSL,然后,逐步为它添加新功能;今天添加条件表达式,明天又添加循环,最终图灵完备了。

    对此,唯一的抵御就是坚决防范。确保我们对DSL针对问题的受限范围有个清晰的认识。质疑任何不在此范畴内的新特性。如果想做得更多,可以考虑采用多种语言,综合运用,而非强求一种DSL不断膨胀。

    框架也面临着同样的问题。好的程序库都有一个明确的目的。如果产品定价库包含HTTP协议的实现,从本质上说,我们也就要忍受同样错误之苦:未能分离关注点。

    第二个问题是,自行构造本应从外部获得的东西。这个问题同样适用于DSL和程序库。比如,如今,很少有要自己构造对象–关系映射(object–relational mapping)系统。我有一条关于软件的通用规则,不是自己的业务,不要自己写——总要先看看是否从别的地方可以找到。特别是,随着开源工具的崛起,基于既有开源工作量进行扩展,肯定比从头打造更有意义。

    4)“一叶障目”的抽象

    DSL的有用之处在于,它提供了一种抽象,我们可以基于这种抽象来思考领域问题。这种抽象非常有价值,我们更容易表述领域行为,效果远胜于依据底层构造进行思考。

    然而,任何抽象(包括DSL和程序库)总是伴随着风险——它可能让我们“一叶障目,不见泰山”。有了这种“一叶障目”的抽象,我们就会苦苦思索,竭尽全力把外部世界塞入抽象之中,而非另寻它路。我们常常会见到这种情况:遇到一种不符合抽象的事物,殚精竭虑地让其符合,而不是修改抽象,让抽象更容易接纳新的行为。一旦我们满意了这个抽象,觉得尘埃落定,“一叶障目”也就随之而来。到这种时候,对于颠覆性的变化,难免心生忧虑。

    “一叶障目”是任何抽象都会面临的问题,不仅是DSL,但DSL可能让这个问题变得更严重。因为DSL提供了一种更为舒适的方式操作抽象,一旦适应,更不愿意做出改变。如果采用DSL与领域专家交流,问题可能会更严重,通常,他们在习惯之后更不愿意做出改变。

    如同对待任何抽象一样,应该视DSL为一种“不断演化,尚未完结”的事物。

    ------------------------------------------

    《领域特定语言》
    原书名:Domain-Specific Languages
    作者:Martin Fowler
    译者:ThoughtWorks中国
    出版时间:2013年3月21日
    定价:89.00元
    豆瓣收藏:http://book.douban.com/subject/21964984/
    样章下载:http://download.csdn.net/detail/hzbooks/5170676

    内容简介:
    本书由世界级软件开发大师和软件开发“教父”Martin Fowler历时多年写作而成,ThoughtWorks中国翻译。全面详尽地讲解了各种DSL及其构造方式,揭示了与编程语言无关的通用原则和模式,阐释了如何通过DSL有效提高开发人员的生产力以及增进与领域专家的有效沟通,能为开发人员选择和使用DSL提供有效的决策依据和指导方法。
    全书共57章,分为六个部分:第一部分介绍了什么是DSL,DSL的用途,如何实现外部DS和内部DSL,如何生成代码,语言工作台的使用方法;第二部分介绍了各种DSL,分别讲述了语义模型、符号表、语境变量、构造型生成器、宏和通知的工作原理和使用场景;第三部分分别揭示分隔符指导翻译、语法指导翻译、BNF、易于正则表达式表的词法分析器、递归下降法词法分析器、解析器组合子、解析器生成器、树的构建、嵌入式语法翻译、内嵌解释器、外加代码等;第四部分介绍了表达式生成器、函数序列、嵌套函数、方法级联、对象范围、闭包、嵌套闭包、标注、解析数操作、类符号表、文本润色、字面量扩展的工作原理和使用场景;第五部分介绍了适应性模型、决策表、依赖网络、产生式规则系统、状态机等计算模型的工作原理和使用场景;第六部分介绍了基于转换器的代码生成、模板化的生成器、嵌入助手、基于模型的代码生成、无视模型的代码生成和代沟等内容。

    Martin Fowler
    世界级软件开发大师,软件开发“教父”,敏捷开发方法的创始人之一,ThoughtWorks公司首席科学家。他在面向对象分析与设计、UML、模式、极限编程、重构和DSL等领域都有非常深入的研究并为软件开发行业做出了卓越贡献。他乐于分享,撰写了《企业应用架构模式》(荣获第13届Jolt生产力大奖)、《重构:改善既有代码的设计》、《分析模式:可复用的对象模型》、《UML精粹:标准对象建模语言简明指南》等在软件开发领域颇负盛名的著作。

    展开全文
  • 来源:华泰证券稳增长、促转型,把握新基建浪潮中的七大产业机遇七大领域:5G、数据中心、云计算、工业互联网、物联网、人工智能、传 统基础设施数字化改造新基建担负着不一样的历史使命。传统基...

    来源:华泰证券

    稳增长、促转型,把握新基建浪潮中的七大产业机遇

    七大领域:5G、数据中心、云计算、工业互联网、物联网、人工智能、传 统基础设施数字化改造

    新基建担负着不一样的历史使命。传统基建稳需求、注重补短板,新基建关注新兴产业、 谋未来发展。我们认为,以 5G 网络、云计算、工业互联网为代表的数字化网络和智能化 产业应用将是新基建的核心内容。在 2020 年特殊的经济形势下,新基建肩负着稳定经济 增长的作用,但对于新基建的实质,我们建议需要站在一个更高瞻远瞩的视角去看待,新 基建有望承担的是加速社会及经济结构优化和升级的重任,在即将到来的“十四五”时期 及未来,将对中国产生历史性影响。

    传统基建稳需求、注重补短板,新基建关注新兴产业、谋未来发展。根据去年以来中央的 会议精神,本轮扩基建不同于以往靠“铁公机”拉动,传统基建更注重补短板、惠民生,以 及决胜脱贫攻坚战领域。本次疫情事件暴露出了国内医疗卫生领域短板,或成为倾斜领域。主要投向包括公共卫生服务、医疗救助设施、老旧小区改造、城市停车场、城乡冷链物流、 市政管网、自然灾害防治、污水垃圾处理等,以及农村公路、信息、水利、高标准农田、 农业机械化等现代农业基础设施建设。

    “新基建”兼顾短期逆周期调节及中长期高质量发展要求,将成为基建投资领域新的发力点。早在 2018 年年底的中央经济工作会议提出,“加快 5G 商用步伐,加强人工智能、工业互 联网、物联网等新型基础设施建设”,新基建的概念由此产生,并被列入 2019 年政府工作 报告。2019 年两会期间和同年 7 月的政治局会议中再次强调以 5G、人工智能和工业互联 网等为代表的新基建在逆周期调节中将承担更为重要的角色,要进一步加快推进信息网络 等新型基础设施的建设。进入 2020 年,新基建作为对冲疫情影响和推动实现全面建成小 康社会目标的重要抓手,近期在多次会议中被频繁提及。从 1 月 3 日的国常会、到 2 月 14 日的中央全面深化改革委员会会议、2 月 21 日的政治局会议、2 月 23 日的疫情防控和 经济社会发展工作部署会议和 3 月 4 日的政治局常委会议,频率之高可见其重要程度。

    结合国内相关政策、会议对新基建重点领域的展望,综合考虑中国经济实现高质量发展所 必不可少的产业需求,我们认为,新基建投资有望重点涉及七大领域:5G、数据中心、 云计算、工业互联网、物联网、人工智能、传统基础设施数字化改造。从产业链角度,有 望较为受益的具体产业包括:半导体设备、国产芯片、国产基础软件、服务器、存储、IDC、 云计算、工业机器人、工业互联网、V2X 车联网、超高清视频、人工智能的基础层、技术 层及应用层(智能驾驶,AI+安防、金融、医疗、司法、教育等)

    新基建政策不断深化

    18 年中央经济工作会议首次提出“新型基建”概念,重点配套新兴产业发展,具体包括 5G 网络、数据中心、智能制造、工业互联网、物联网、无人配送、在线消费、医疗信息化等 领域。同时会议中还强调要“加大城际交通、物流、市政基础设施等投资力度”,并“补齐农 村基础设施和公共服务设施建设短板,加强自然灾害防治能力建设”。所以,更广义的新型 基础设施建设还可以包括轨道交通、环保建设等补短板领域。新型基建体量尚小但发展前 景大,符合高质量发展要求,将是政策持续支持方向。可以看到,无论是专项投向新基建 的比例,还是 PPP 项目中新基建的占比,都在不断提升。2020 年至今新增专项债投向新 基建的比例达到 24%,明显高于 2019 年全年 3%的占比;2017~2020 年国内 PPP 项目 中新基建占比总体呈提升趋势,2020 年 2 月占比达 13.4%。

    2020 年高层明确定调“新基建”作为逆周期调节的方向。 “新基建”并不是新名词,早在 2018 年底,中央经济工作会议上明确了 5G、人工智能、工业互联网、物联网等“新型基础设施 建设”的定位。随后“加强新一代信息基础设施建设”被列入 2019 年政府工作报告。2020 年 以来,为了对冲新冠疫情对经济造成的冲击,逆周期调节政策发力,并与过去的传统基建 不同,高层定调推进“新基建”。2020 年 3 月 4 日,中共中央政治局会议指出,要加大公共 卫生服务,应急物资保障领域投入,加快 5G 网络、数据中心等新型基础设施建设进度, 要注重调动民间投资积极性。

    新基建推动中国社会向数字化、信息化和智能化转型

    新基建对提升中国存量资产效率、改善中长期产业竞争力都将起到至关重要的促进作用, 尤其是对关系到国计民生及国家主导产业的重点领域。“十三五”期间中国整体基础设施 建设延续高投入状态,相较于交通运输、电力水利等传统基建,新基建存在短期固定资产 投资规模总量相对较小的特征。目前社会各界对新基建能否较大力度促进经济增长仍存在 观点分歧和担忧。我们建议要用有别于“固定资产投资驱动经济增长”的逻辑来看待新基 建的价值,主要转变两个思路:

    1)要用更加“高瞻远瞩”的眼光看待新基建的对中国社会的价值。对于新基建,不能仅 评估其投资规模对短期经济的拉动作用,更应该从中长期战略价值来理解其发展意义。新 基建的实施有望优化中国庞大的存量制造产能效率和社会生活的方方面面,从而推动中国 社会向数字化、信息化和智能化的结构调整和全面转型升级;

    2)要用更加“市场化”的方式为新基建创造投融资环境。传统基建资金来源主要是政府 财政资金、银行间接融资和 PPP 投资模式等,投资的规划和实施以政府部门主导。但是 新基建由于具有技术升级需要持续大规模研发投入、应用场景和商业模式相对不成熟等典 型特征,未来政府部门可能逐步转变为动员发起方和战略投资方。中国新基建相关产业依 靠市场化竞争不断实现技术升级和进步,并依托境内外资本市场实现直接融资、投资收益 变现和持续扩张。

    5G 下游应用:抢占下一轮信息科技革命制高点

    2019 年是 5G 基建元年,带来 5G 上游的电子、通信产业链业绩回暖。2020 年,伴随着 5G 基础设施覆盖率的提升和 5G 终端的普及,5G 下游应用有望成为下一个投资热点。

    工业互联网:制造强国之路

    工业互联网平台面向制造业数字化、网络化、智能化需求,构建基于海量数据采集、汇聚、 分析的服务体系,支撑制造资源泛在连接、弹性供给、高效配置。工业软件用主要涵盖研 发设计、生产执行、经营管理三大类。基于工业互联网平台,工业软件的形态从本地部署 的复杂系统软件向云化轻量级工业 APP 转变。

    全国各类型平台数量总计已有数百家之多,具有一定区域、行业影响力的平台数量也超过 了 50 多家。既有航天云网、海尔、宝信、石化盈科等传统工业技术解决方案企业面向转 型发展需求构建平台;也有树根互联、徐工、TCL、中联重科、富士康等大型制造企业孵 化独立运营公司专注平台运营;还有优也、昆仑数据、黑湖科技等各类创新企业依托自身 特色打造平台。

    相比于传统的工业运营技术和信息化技术,工业互联网平台的复杂程度更高,部署和运营 难度更大,其建设过程中需要持续的技术、资金、人员投入,商业应用和产业推广中也面 临着基础薄弱、场景复杂、成效缓慢等众多挑战,将是一项长期、艰巨、复杂的系统工程, 当前尚处在发展初期。一是在技术领域,平台技术研发投入成本较高,现有技术水平尚不 足以满足全部工业应用需求;二是在商业领域,平台市场还没有出现绝对的领导者,大多 数企业仍然处于寻找市场机会的阶段;三是在产业领域,优势互补、协同合作的平台产业 生态也还需持续构建。

    5G 催化下工业互联网市场有望提速。工业互联网是以机器、原料、控制、信息系统、产 品的网络互联为基础,通过对工业数据的全面深度感知、实时传输交换、快速计算处理、 高级建模分析实现智能控制、运营优化和生产组织方式变革。而 5G 技术有力的提升了数 据传输的效率,提升了工业互联网的能力。随着 2020 年 5G 商用逐步落地,工业互联网 发展有望进一步提速。

    自主的工业互联网应用生态是大势所趋。相较于基础工具型软件,中国工业软件企业在系 统平台和云应用领域与国外厂商起步时间更为接近,技术水平差距较小,因此有望形成中 国自主的工业应用生态。新冠疫情下,研发、管理等环节远程实施成为刚需,工信部推动 工业 APP 普及率提升,培养用户习惯,为未来工业互联网的进一步建设打下基础。

    我们看好工业互联网龙头标的,建议关注用友网络、宝信软件、能科股份。

    工业机器人:工业互联网核心支撑

    工业机器人是工业互联网在硬件环节的核心支撑, “新基建”投资有望进一步激活中国制造 业对机器人及智能制造装备的需求。机器人作为工业互联网体系的重要组成部分,承载着 大量相关系统、工艺参数、软件工具、企业业务需求和制造能力,引导汇聚和链接着大量 工业资源,通过交互协同和迭代优化,为智能的产生提供必要基础,为制造业智能化的发 展创造前提条件。同时,工业机器人能够充分发挥工业互联网平台的重要作用,成为工业 全要素链接的枢纽,向上对接工业应用,向下连接海量设备,持续沉淀和积累海量具备应 用推广价值的工业经验与知识模型,通过更为科学、高效的工业资源配置方式及路径,驱 动制造业体系和生态的智能化升级与运转。

    工业互联网对工业机器人的技术发展起到促进作用,为产业应用提供了更多可能和场景, 充分激活制造业对智能制造转型升级的需求。1)协助机器人实现互联互通与数据共享:通过基于工业互联网的大数据技术实现机器人相关数据分析与共享,减轻劳动强度,改善 作业环境,从整体上提高生产率、降低成本。2)有效降低机器人损耗及维修成本:通过 远程实时数据监控管理和报警,及时同步生产管理状况,使机器人在工作期间有效地降低物耗,有效避免变形、划伤、碰伤,减少维修造成的停产成本。3)支撑机器人开展定制 化生产:通过工作模型的设计与优化,使机器人快速适应多品种、小批量的定制化生产, 产品快速更新换代,适应日益激烈的市场竞争,有效节约投资,形成规模效益。

    中国具备诞生世界领先机器人公司的基础,本土企业成长潜力大。从“机器换人”到“智能制 造”,国内工业机器人需求有望改善。我们认为国内工业机器人需求有望复苏,2020 年或 出现温和增长,长期成长空间广阔,原因是:1)人口结构的变化将长期推动中国制造业 进行智能制造升级;2)伴随技术发展,工业机器人的实际应用效果从“机器换人”升级为“智 能制造”,从仅仅是替代人工变为提升企业制造效率、稳定产品品质及降低库存;3)国家 及地方政策支持力度大,助力智能制造升级,为机器人产业发展提供有利环境;4)贸易 摩擦缓和或将促使制造业恢复投资意愿,2019Q4 工业机器人行业数据已经出现改善迹象 (2019 年 10 月国内产量当月增速同比转正达 1.7%,11、12 月增速分别提升至 4.3%、 15.3%),虽然新冠疫情或对 2020Q1 机器人产业景气度产生一定负面影响(2020 年 1-2 月国内机器人累计产量同比下滑 19.40%),但随着国内疫情基本得到控制和制造业复工复 产有序推进,我们认为机器人温和复苏的趋势不会改变。

    汽车行业目前仍是国内工业机器人最主要的下游应用,随着中国制造业产业升级和转型的 不断深化,工业机器人的应用将有望更深入衍射到 3C、半导体、新能源、物流仓储等领 域,需求更加多元化,增量空间广。汽车制造行业生产程序相对标准化,工业机器人应用 发展较早,技术成熟,自动化程度较高。消费电子行业的自动化模式与汽车行业类似,均 可在产品零部件生产和整装等环节进行自动化生产,但消费电子行业目前除了个别厂商外, 自动化渗透率仍然处于较低水平,自动化升级的空间仍然广阔。对比 2010、2018 年中国 工业机器人市场销售结构可以发现,汽车行业均位居第一应用领域,但占比由 50%下降到 35%,3C 需求由 13%扩张到 23%,除金属加工以外的其他行业占比由 27%提升至 32%, 行业总体容量增长的同时需求分布呈逐渐多元化的趋势。我们认为受益于随着智能制造及 工业物联网的应用领域不断横向延展,2019 年及以后机器人下游需求多元化的趋势有望 延续。

    中国工业机器人密度仍明显低于全球其他制造强国, “新基建”投资或有助于中国智能制造 程度和工业机器人密度的提升自动化生产的单元产品(机器人)是衡量一个国家自动化 水平的重要指标。虽然中国工业自动化行业规模呈现较快增长趋势,但生产制造业中自动 化率仍低于欧美发达国家。lFR 数据显示,中国自 2013 年开始成为全球工业机器人最大 市场,2018 年中国销量达 15.4 万台,占全球比重达 36%。但是,按照机器人使用密度(平 均每万名制造业工人所使用的工业机器人数量)为标准,中国的工业机器人密度为 140 台 /万人,虽然已经超过全球平均水平,但仍然显著低于美国(217 台/万人)、德国(338 台 /万人)、韩国(774 台/万人)、日本(327 台/万人)等制造业强国。我们认为,中国正处 于制造业转型升级的历史机遇期,半导体、面板、消费电子智能终端、新能源等高端制造 业产能稳步扩张,其对自动化、智能化生产所产生的工业机器人多元化需求将提高中国制 造业整体工业机器人密度,中国工业机器人市场有望进一步扩容。

    5G 护航,工业机器人企业有望与工业互联网深度融合,打造全流程闭环数据传输分析系 统,提升自动化和人工智能效率。5G 技术的普及,有望赋予机器人更加完善的交互能力, 更强大的分析和数据处理能力,很大程度上优化机器人的性能。通过 5G 提供的低时延+ 高稳定性的数据流传输,系统可以精确分析到每一台机器人主机。通过监控系统对机器人 各项历史数据的分析及学习,对实时数据的采集和分析,实现局部故障预警,机械寿命分 析等功能,可帮助客户提前排查生产中的各项问题,有效提升生产效率。与此同时,将客 户处的机器人运转数据返回至企业,用于新一代机器人的技术研发与更新,实现数据的全 流程闭环。与工业物联网的融合,有望提升企业在价值链中的增加值,提升企业经营的回 报率和智能制造升级的投资意愿。

    工业机器人与工业互联网的发展相辅相成,2020 年或是中国机器人产业的新起点,未来 有望孕育世界领先企业。结合人口结构、应用场景、产业政策、企业投资信心等多种因素 综合分析,我们判断 2020 年或是中国机器人产业的新起点,未来主要发展趋势包括:1) 市场份额或进一步集中,研发可持续增长;2)5G 商用时代机器人企业有望与工业互联网、 物联网深度融合;3)协作机器人需求有望快速扩张,或是本土企业重点突破的领域之一;4)中国有望在新一轮发展期诞生世界领先机器人企业。目前国内有望受益于“新基建” 投资发力、工业互联网加快推广等积极因素的工业机器人代表企业包括:机器人(新松机 器人)、埃斯顿等。

    V2X 车联网:技术加速落地

    车联网 V2X,利用通信实现数据感知。车联网通信作为移动网络派生发展出来的新的分支, 在通信技术要求和应用场景特点上有其独特性。车联网通信通常统称为 V2X,根据通信对 象的不同可分为 V2V(车-车)、V2I(车-基础设施)、V2P(车-人)、V2R(车-路)等方式。

    车联网是自动驾驶感知层的不可替代环节。当前的自动驾驶大多依靠雷达、摄像头、定位 等手段实现感知层信息的输入,但依靠以上技术远远不够,信息的实时交互能力和广度都 无法突破,在这一背景下车联网成为自动驾驶感知层的不可替代的环节。

    车联网可以通过通信手段,提供更远距离信息交互能力和远程控制功能,且不受环境、气 候、遮挡等外部条件影响保障了信息的可靠性。同时,车联网实现了信息丰富性,信号灯、 路面状况、行人、以及非视距的全方位信息为自动驾驶提供决策判断,并且在群体信息并 发时可提供更高的算力支持和更加优化的解决方案。

    端层两个关键趋势,即车辆联网设备(T-BOX、OBU)和路侧设备(RSU)渗透率提升, 其中 V2X 有望带来新基建需求,即路侧设备,实现车与路的信息交互。另外,目前主要 依托 4G 网络,未来 5G 网络赋能,需要网络切片和边缘计算等技术叠加,涉及运营商、 设备商等。平台层和应用层将随着网络和硬件能力的逐步提升,并行发展。

    芯片:作为产品智能化的大脑,芯片不可或缺,在汽车网联化、智能化的过程中,将带来 大量的芯片需求。

    车规级通信模组:网联化的建立离不开模组,随着万物互联的推进,各种物联网应用的市 场规模扩大,带来对模组的需求。车联网是物联网领域中 ARPU 值最高的应用之一。

    车载终端:车辆联网和数据传输通过终端产品实现。目前,主流的终端产品主要有后装 OBD、前装 T-Box、以及 UBI 终端,并得到了广泛的应用。通过对车辆运行数据、驾驶人 行为习惯、驾驶偏好等数据进行搜集和分析,实现对道路应急救援、车辆远程维修、整车 厂研发新款车型、汽车后市场服务、以及保险定价等的数据支撑。

    传感器:车联网 V2X 的信息交互建立在数据搜集的基础上,这就需要大量的传感器。目 前,全球规模较大的传感器厂商有博世、意法半导体、德州仪器、安华高、惠普、Qorvo、 楼氏电子、应美盛等。

    平台:平台集合了数据和应用的集中和分发,车联网众多应用场景的实现需要平台作为支 撑。目前,以华为为代表的通信设备商,以 BAT 为代表的互联网企业,以一汽等为代表 的整车厂,以及立足于行业应用的模组厂商等,都在建立各自的车联网平台。相关公司包 括高新兴、兴民智通、索菱股份、得润电子、宜通世纪、兴民智通、金龙汽车、广汽集团 等。

    TSP:TSP 服务涵盖 TSP 服务平台、呼叫中心、内容聚合、数据中心与云平台等,向上 连接整车厂和智能终端,向下连接内容服务提供商,是产业链中较为核心的环节。相关公 司包括兴民智通(九五智驾)、启明信息、万安科技(飞驰镁物)等,其他 TSP 厂商还有 博泰、远特科技、钛马等。

    行业应用:行业应用提供商是产业链中最贴近实际应用场景的环节之一,车联网应用场景 的设想将通过它们提供的应用、系统等软件加载到终端设备中才得以实现。车联网的成熟 必将伴随着各式各样行业应用的涌现和发展。相关公司包括高新兴、北斗星通、中海达、 耐威科技、亚太股份、均胜电子、兴民智通、欧菲光等。

    从路侧端来看,形成了数据交互终端、智能交通解决方案等领域。其中,RSU 路侧涉及 公司包括高新兴、千方科技、金溢科技、华为、中兴通讯等;智能交通交接方案厂商包括 高新兴、千方科技、海康威视、大华股份、佳都科技等。

    在车内装备中,2020 年前后装联网设备市场规模有望超过 210 亿。参考阿里云官网售价, 前装设备市场价约为 1000 元(其中 T-BoX 价格为 700-800 元,V2X 功能模块 200-300 元),后装联网设备市场价约为 150 元。根据工信部发布的《车联网产业发展行动计划》 中的目标,到 2020 年,联网车载信息服务终端的新车装配率达到 60%以上,总车联网渗 透率达到 30%。

    1.2019 年我国汽车销量为 2576.9 万辆,根据华泰证券研究所交运设备行业于 2020 年 3 月 2 日发布报告《多数车企 10 日复工,全年销量略受损》中预测,考虑到疫情影响, 预计 2020 年全年汽车销量增速或下滑至-3~0%。我们保守预计 2020 年全年汽车销量 同比下滑 3%,销量约为 2499.6 万辆,则前装联网车辆 1499.8 万辆,由此预测 2020 年前装联网设备市场规模为 149.98 亿元。

    2. 根据公安部交通管理局 2020 年 1 月 8 日公布的数据显示,全国汽车保有量为 2.6 亿 辆,根据中商情报网发布的《2019 年中国车联网行业市场现状分析及发展趋势预测》 显示,2019 年中国车联网市场用户规模将近 3000 万辆,车联网渗透率仅为 11.5%。按照 2020 年总车联网渗透率为 30%,则新增联网车辆约为 5552 万辆,剔除前装联 网车辆 1499.8万辆,则新增后装联网车辆约为 4052万辆,市场规模约为 60.78亿元。

    在智能化道路基础设施规划建设方面,预计投资金额在千亿级别以上。RSU 设备升级将 包括信号灯、标志、摄像头、激光雷达等各种环境感知设备,涉及投资规模可观。根据国 家统计局数据显示,截止 2018 年,中国高速公路里程为 14.26 万公里,城市道路长度为 43.2 万公里。根据第五届智能网联汽车技术年会(CICV2018)会议,公安部交通管理科 学研究所表示,单个红绿灯设施的改造费用是 10 万,依此假设每公里智能化改造费用为 50 万元,则城市道路和高速公路智能化改造则预计需要投资 2873 亿元。

    根据《战略》提出,到 2025 年智能交通系统和智慧城市相关设施建设取得积极进展,车用 无线通信网络(LTE-V2X 等)实现区域覆盖,新一代车用无线通信网络(5G-V2X)在部分 城市、高速公路逐步开展应用。按照国家统计局数据,2018 年我国地级市数量占总城市数 量 43.6%,参照这一比重,假设 2025 年 V2X 道路智能化渗透率约为 50%,即 2020-2025 年城市道路和高速公路智能化改造市场规模超过 1400 亿元,年均建设量为 287 亿。

    超高清视频:5G 催化成熟

    5G 或成超高清行业发展重要催化剂。由于超高清视频具有更大的视频码率和视频容量, 因此对传输、压缩、转码、存储等技术提出了更高的需求。5G 标准定义的重要的应用场 景之一增强移动宽带(eMBB)将为超高清视频提供大流量传输的服务。根据工信部、中 国 5G 推进组的工作部署,我国 5G 将于 2020 年迈入正式商用,2019 年 6 月,工信部向 中国电信、中国移动、中国联通、中国广电四家企业发放了 5G 商用牌照,也标志着我国 5G 商用正稳步推进。2020 年 5G 网络的应用或成为超高清视频产业发展的重要催化剂。

    4k高清内容短板逐步补齐,超高清产业蓄势待发。我国4K产业链中下游包括电信运营商、 系统集成供应商、终端制造商,近年来发展迅速。而上游内容制作厂商仍旧处于探索盈利 模式的过程中。近年来,随着 4K 花园等高清内容厂商不断进行尝试,中央及地方卫视积 极与企业合作推广,4K 内容逐步丰富,我国 4K 内容短板逐步补齐。

    视频转码是高清视频产业发展的重要环节,面临发展机遇。转码是视频产业中的重要环节, 从收录采集、生产到传输、分发及播放均需要转码技术实现视频文件、视频码流之间的转 换,应用领域十分广泛。在高清视频领域,实现高稳定性、高兼容性、高清晰度的视频转 码对转码技术提出了更高的要求,在传输、终端等产业迅速发展的同时,转码技术作为其 中的关键环节同样面临发展机遇。建议关注当虹科技、数码科技。

    大数据与云计算:数据赋能百业

    IDC:超大型 IDC 方兴未艾

    我们观察到数据中心向集约化,超大型演变。全球来看,根据 Gartner 数据,2017 年全 球数据中心数量总计为 44.4 万个。Gartner 预计,2020 年全球数据中心数量有望减少至 42.2 万个。虽然 Garter 预计数据中心总数量是减少的,但如果我们看机架数数量,未来 几年全球数据中心的机架数量有望保持稳健增长。根据 Gartner 数据,2017 年底,全球 数据中心的机架数量达到 493.3 万架,安装的服务器数量超过 5500 万台。Gartner 预计 2020 年,全球机架数量有望超过 498 万架,服务器数量有望超过 6200 万台。

    通过以上数据,我们看到,全球数据中心的数量在减少,但机架数量和服务器数量都在增 加。这其中主要是因为数据中心的结构在发生变化。根据 Gartner 数据,截至 2017 年底, 全球微型数据中心(机架数量小于 25 个)的数量为 42.3 万个,小型数据中心(机架数量 为 25-100 个)数量为 1.4 万个,中型数据中心(机架数量为 100-500 个)数量为 5732 个,大型数据中心(机架数量 500 个以上)数量为 1341 万个。

    超大型数据中心数量不断增加。根据 2015 年 Synergy 做出的预测,超大规模数据中心数 量将从 2015 年的 259 个增长到 2020 年的 485 个,份额将从 2015 年 21%增长到 2020 年 47%,届时 83%的公有云服务器和 86%的公有云负载将承载在超级数据中心,处理能 力占比从 39%提升到 68%,流量占比从 34%提升到 53%。

    而从实际发展情况来看,超大型数据中心的增速更快,全球云计算企业的快速发展,使得 全球范围内大型数据中心数量快速增长。根据 2017 年 Synergy 数据,2017 年全球范围 内的超大规模数据中心已经超过 390 个,同比增加 90 个。其中,谷歌的数据中心增加比 较明显,腾讯和百度在 2017 年也建立了超大规模的数据中心。

    根据中国信通院数据,2017 年底,中国数据中心机架数量达到 166 万架,数据中心数量 为 1844 个;规划在建数据中心规模 107 万架,数据中心数量为 463 个。从中国数据中心 发展特点来看,大型数据中心数量有望成为增长主力。截止 2017 年底,大型数据中心机 架数量超过 82 万个,同比增长 68%。

    云服务收入占比逐步增加根据中国信通院数据,2017 年中国 IDC 全行业总收入达到 650 亿元左右,2012-2017 年复合增长率为 32%,持续保持快速增长。根据其测算,2017 年 中国传统 IDC 业务收入为 513 亿元,占 IDC 全行业总收入的比重为 78.8%。云服务收入 138 亿元,占比 21.2%,比 2016 年提高 2.8%。我们认为,目前云计算正在企业级服务中 加快推广应用,未来 IT 交付的形态或将逐步云化,云服务收入在我国 IDC 业务收入中的 占比有望进一步增加。

    云计算:企业上云加速

    从 IT 发展历史来看,互联网和移动互联网已经将 C 端的大部分的生活方式和内容,从线 下搬迁至线上。但 B 端向线上迁移的过程确实走的比较漫长。这其中有客观技术支持的原 因,也有主观意愿的影响。本次新冠疫情刺激 B 端企业加速从线下向线上迁移的

    我们认为,C 端和 B 端向线上迁移的工具和载体不同。C 端可以依靠移动互联网,将自身 的交互、交易等日常活动移至线上。但对于 B 端企业而言,能够承载企业日常经营活动, 向线上的迁移的工具和载体,就不只是移动互联网技术,更需要是云计算。因此,我们认 为,云才是企业向线上迁移(或者 B 端互联网,或者产业互联网)的核心载体。

    我们已经看到,目前 B 端企业逐步将自身业务从传统的 IT 架构向云端迁移。但在我们研 究企业向云端迁移的过程当中,我们会发现,现有的云技术和云产品完全能够支持企业业 务的云端部署,但由于不同企业对云认知不同,或者对核心业务数据安全的考量,B 端企 业向线上迁移的过程并不是很顺畅。我们认为,这其中很重要的一个因素就是企业上云的 主观意愿。

    我们认为,此次疫情或将加快企业向线上迁移的进程。具体来看,1)强化企业对云产品 的认知。2)强化企业对云产品的使用习惯。3)使用习惯一旦养成,付费意愿也将逐步体 现。这一点类似于移动互联网对 C 端用户付费意识的培养。

    从具体来看,此次疫情对 B 端企业影响,更多体现为对其的工作方式的影响,短期从原有 的线下模式被迫移至线上。而且目前线上开展的业务内容更多的是以交互为主。但我们认 为,毕竟此次疫情是一起突发事件,其对产业趋势的影响,从初期来看,更多是从一个点 切入,逐步带动其他需求点。未来,从产业发展趋势来看,我们认为,此次疫情可能会加 快 B 端企业的云化进程。包括我们上面讨论的企业在线协同办公、视频会议等都是 B 端企 业云化的体现。云服务对企业业务流程的覆盖有望更深、更广。

    云计算标的建议关注:用友网络、广联达、石基信息、金山办公、浪潮信息。

    云计算基础设施

    泛在算力是智能社会的基石。算力在进入网络化阶段后,受到网络技术发展和网络带宽成 本限制,增设边缘侧设备成为必然趋势,未来将形成云端侧负责大体量复杂计算、边缘侧 负责简单计算执行、终端侧负责感知交互的泛在算力部署形式。整体来看,算力从单核到 多核再到网络化,算力最终走向云- 边- 端多层级泛在部署的理想方案。

    云基础设施(服务器+数据中心+IaaS)的直接驱动变量为流量。来来几年,流量趋势性增 加,云上游产业链发展有望加速。从本质来看,云计算基础设施解决的核心问题是:数据 的计算、存储。只要数据(流量)是在不在增加,对底层计算和存储资源的需求也在不断 增加。因为,我们可以将云基础设施看作是,随着流量(数据量)增加,而不断呈现线性 甚至是非线性增长的业务。另外,我们知道计算机架构就是“底层计算+上层应用”。一般 的需求驱动逻辑是,上层应用带动底层计算的增加,底层计算能力的提升驱动上层应用的 丰富。两者互为影响,互为彼此的驱动变量。我们认为,云基础设施的三大核心变量为:1)云计算快速发展。2)5G 和 AI 的驱动,3)B 端企业线上迁移的驱动。

    服务器是云计算的硬件支撑

    服务器是云计算的硬件支撑和虚拟化资源来源。云计算是对基础 IT 资源的虚拟化(包括 计算资源、存储资源、网络资源等),云计算平台的背后需要数量庞大的服务器集群作为 硬件支撑,可以是单台服务器的集群,也可以是机柜形态服务器的集群。如果云计算机是 电厂,那么单台服务器相当于发电机。云计算中非常重要的一项技术是虚拟化技术,虚拟 化技术是将单台服务器设备的资源进行划分,分成几十甚至是几百台虚拟机,从而向更多 的用户提供计算资源。可以说,服务器是云计算虚拟 IT 资源的底层支撑和来源,服务器 也是云计算中最基础的单元。

    云计算发展带动服务器需求增长

    从直观的角度来看,云计算的发展带动了互联网企业对数据中心的大规模建设,而数据中 心正是有大量的服务器实体构建而成。而对于另一个认知:随着企业对云服务采购力度的 加大,企业自建机房的的需求大幅降低,从而减少对服务器的采购力度。当然这个只是表 面现象,其实企业对服务器计算和存储资源的需求没有因为云化而消失,而是发生了转移, 从自建机房的服务器转移动云计算厂商的服务器。而且,在企业云化之后,其产生的数据 量会急剧增加,对云服务的需求会进一步提升。

    如果从 IT 角度来看,首先我们先明白,云服务到底提供的是一种什么服务(主要针对 IaaS)?最基本的就是对大量数据的计算、处理、存储、共享功能。其实云计算之所以产生,也正 是因为传统的 IT 架构比较难处理互联网所产生的大量数据的计算和处理功能(我们都知 道,从 IT 技术演进来看,云计算是发生在互联网之后,最早由谷歌提出)。

    因此,对云计算需求的核心可以简单理解为,是对数据的计算、处理和存储的需求。而我 们看到,互联网和物联网的崛起,各种智能终端的普及,以及网络的加速,使得数据的产 生在高速提升。因此企业和个人对数据处理的需求是在不断被创造和高速提升的。从这个 角度来看,未来互联网巨头的数据中心也是在不断扩张的,因此服务器的需求仍有较长的 路。核心是:只要对数据的计算和存储有需求,对服务器的需求就不会停止。

    根据 Gartner 数据,全球服务器出货量在 2017Q1 开始加速,其背后的核心驱动因素来自于 全球云计算市场的快速增长。如果具体来看,全球公有云市场的快速发展拉动了对云服务器 的需求。从中国服务器市场发展来看,中国服务器市场发展速度快于全球,从 2017Q1 开启 的这一轮服务求需求上升的周期中国,中国市场服务器出货量增速大概是全球服务器市场增 速的 2-3 倍;出货量占全球比不断上升,由 2013 年的 13%上升至 2019 年 30%左右。

    边缘计算基础设施

    边缘计算是指一种在网络边缘进行计算的新型计算模式。边缘计算机靠近终端或者数据源 头的网络边缘侧,融合网络、计算、存储、应用等,就近提供边缘终端智能服务,满足对 敏捷连接、实施业务、数据优化、应用智能和安全隐私保护等需求。我们可以将边缘计算 简单理解为“终端计算”,区别于云计算时代的“数据中心计算”(云端计算)。

    5G 的发展加速了边缘计算的崛起

    有了 5G 低时延的支撑,边缘端(Edge 端)可以承担原来本机客户端的计算需求。这样 对服务器端和客户端都带来一定好处。对于服务器端而言,边缘端会将访问请教在本地进 行预处理,能够分散大流量的访问和计算压力。对于客户端而言,边缘端的计算环境可控, 算力不依赖于云端服务器。边缘计算作为数据的第一入口,将在智慧园区、云游戏、CDN、 视频监控、工业互联网与 Cloud VR 等场景发挥重要作用。

    边缘计算的业务本质是云计算在数据中心之外汇聚节点的延伸和演进,主要包括云边缘、 边缘云和云化网关三类落地形态。根据 IDC 预测,未来超过 70% 的数据需要在边缘侧分 析、处理和存储。边缘计算领域的多样性计算架构、产品与解决方案越发重要。从边缘计 算对软件和硬件的要求来看,软件平台需要考虑导入云理念、云架构、云技术,提供端到 端实时、协同式智能、可信赖、可动态重置等能力。硬件平台需要考虑异构计算能力,如 鲲鹏、ARM、X86、GPU、NPU、FPGA 等。即边缘计算软件平台采用 Cloud Native 云 原生架构与关键技术,硬件平台支持异构计算能力,以边云协同和边缘智能为关键特征。

    算力基础设施市场规模

    我们从流量增长的角度思考云端协同底层算力的发展对于基础设施的需求。根据思科“视 觉网络指数”(VNI),相比 2017 年,2022 年全球互联网流量将增长 153%,到每月 356 兆亿字节,其中视频占流量的 82%。到 2022 年,思科预测约三分之二(62%)的连接平 板电视机将支持 4K。到那时,4K UHD 分辨率更密集的数据要求将占全球互联网流量的 2%。自从 Cisco 2005 年首次开始 VNI 预测以来,2005-2018 年,流量增长了 56 倍,累 计有 36%的年复合增速。

    Cisco 对全球流量的预测数据包括:

    1)全球 IP 流量将增加 2-3 倍(相比 2017 年) 。到 2022 年,全球 IP 流量预计将达到每 月 396EB,高于 2017 年每月 122EB。到 2022 年,每年流量为 4.8 ZB。

    2)全球互联网用户将占全球人口的 60%。到 2022 年将有 48 亿互联网用户。这比 2017 年的 34 亿或世界人口的 45%有所增加。

    3)全球网络设备和连接将达到 285 亿。到 2022 年,将有 285 亿固定和移动个人设备和 连接。到 2022 年,超过一半的设备和连接将是机器对机器,高于 2017 年的 34%。

    4)全球宽带,Wi-Fi 和移动速度或将接近翻倍。全球平均固定宽带速度将从 39.0 Mbps 增加到 75.4 Mbps。全球平均 Wi-Fi 连接速度将从 24.4 Mbps 增加到 54.0 Mbps。平均全 球移动连接速度将从 8.7 Mbps 增加到 28.5 Mbps 三倍以上。

    5)视频,游戏和多媒体将占所有流量的 85%以上。

    我们可以看出,未来几年全球网络流量将继续保持快速增长,由此带动的对数据计算和存 储的需求也有望快速增长。另外,我们可以从工信部统计的中国移动互联网用户的流量使 用情况可以看出,2018 年中国移动互联网接入流量达到 711 亿 GB,相比与移动互联网大 规模应用前的 2013 年,增长了 60 倍左右。同样,中国月户均移动网接入流量,2018 年 相比与 2013 年也增长了大概 40 倍左右。我们预计,在 5G 带动的新的应用下,网络流量 的增长的幅度或将至少在一个数量级(10 倍)以上。

    综合以上,我们可以的得出以下判断:

    1、未来云计算的持续发展和边缘计算的崛起有望使得网络流量的增加幅度或将至少在一 个数量级(10 倍)以上。

    2、数据量的增加有望推动对数据处理和存储等计算资源需求的增加,对其需求的增加幅 度或将与数据量增加的幅度保持线性或者非线性增长。

    3、对计算资源需求的背后,是服务器、存储等基础设施的支撑。我们认为,对服务器的 需求或将与数据量的增加,保持线性或者非线性(指数级)增长。

    从服务器市场变化来看,2012 年以来移动互联网和云计算带动了服务器出货量持续增长。特别是 2017 年云计算推动的对服务器基础设施的需求更加具有代表性。全球服务器出货 量不仅出现了走出来长达 4 个季度的负增长;而且,全球服务器市场的竞争格局也发生了 比较明显的变化。满足云计算场景下的服务器厂商的市场份额逐步提升。

    建议关注:浪潮信息、宝信软件、深信服、中科曙光。

    人工智能:产业融合 AI,反哺实体经济

    人工智能的发展驱动着劳动力、工作方式以及工作组织形式等多方面的变革,人工智能应 用的成熟,既催生了新的市场,也为传统产业的发展注入了新的活力。

    人工智能产业链大致可分为基础层、技术层和应用层三个类别。人工智能具有算力、算法、 数据三要素,其中基础层提供算力支持,通用技术平台解决算法问题,场景化应用挖掘数 据价值。

    基础硬件层:国际芯片巨头建立先发优势,中国初创企业寻求突破

    底层硬件包括 GPU/FPGA 等用于性能加速的芯片、传感器与中间件,是人工智能应用的 前提。

    我国AI芯片行业发展尚处于起步阶段。长期以来,中国在CPU、GPU、DSP处理器设计 上一直处于追赶地位,绝大部分芯片设计企业依靠国外的IP核设计芯片,在自主创新上受 到限制。而人工智能为中国在处理器领域实现弯道超车提供了机遇。目前人工智能芯片的 发展尚处于早期,技术路径和生态上尚未形成垄断,为国内AI芯片的发展提供了机遇。目前国内 AI 芯片公司主要有中星微、寒武纪、西井科技、地平线、深鉴科技等创业公司, 比特大陆等矿机厂商也正在向人工智能芯片研发转型。

    技术层:算法和计算力是核心驱动力,开源化和通用性是趋势

    技术层是人工智能发展的核心,对应用层的产品智能化程度起到决定性作用,在这一发展 过程中,算法和计算力是人工智能的核心驱动力。

    人工智能正处于从感知智能向认知智能发展的进阶阶段。技术层主要依托基础层的运算平 台和数据资源进行海量识别训练和机器学习建模,以及开发面向不同领域的应用技术,包 含感知智能和认知智能两个阶段,是人工智能的核心。感知智能阶段通过传感器、搜索引 擎和人机交互等实现人与信息的连接,获得建模所需的数据,如语音识别、图像识别、自 然语音处理和生物识别等。认知智能阶段对获取的数据进行建模运算,利用深度学习等类 人脑的思考功能得出结果,如机器学习、预测类 API 和人工智能平台等。通用技术应用 平台提供深度学习、模式识别等技术应用服务,对接应用层。

    目前感知智能已具有大规模应用基础,如计算机视觉技术已大规模应用于安防、金融等领 域,语音识别应用于消费级终端智能音箱、教育等领域。代表企业包括科大讯飞、商汤科 技、旷视科技、云知声等。认知智能仍尚待突破,诸如无人驾驶、全自动智能机器人等仍 处于开发中,与大规模应用仍有一定距离。

    行业应用:AI 技术应用的主战场

    应用层按照对象不同,可分为消费级终端应用以及行业场景应用两部分。消费级终端应用 主要包括智能机器人、智能无人机以及智能硬件三个方向;行业场景应用对接各类外部行 业的 AI 应用场景,如自动驾驶、智慧金融、智慧医疗、智慧教育、智慧零售、智慧安防、 智慧营销、智慧城市等。

    人工智能+产业的融合将是未来行业发展重点,目前医疗、金融、安防、无人驾驶等领域 人工智能技术应用正在加速落地。

    AI+医疗:医疗 AI 在临床使用较多的主要是四类:一是智能影像,二是智能语音,三是医 学机器人,四是临床智能决策。医疗智能影像和语音是基于图像和语音识别技术发展起来 的,由于医学影像资料获取门槛较低且更为标准化,语音数据识别技术成熟,所以智能医 学影像目前发展最为成熟,临床接受程度最高,只是仍然不属于医疗最核心领域。IBM Watson 在临床智能决策上具有领先技术,但由于缺乏足够的训练数据和不同地区本土化 的障碍,实际应用依然非常有限。

    AI+金融:金融领域人工智能主要应用于四大领域:保险科技、智能风控、智能投顾和智 能投研。传统金融机构的资产配置咨询服务普遍只是向高净值用户开放,但如今有了人工 智能与大数据作为依托,部分券商、银行已经可以根据用户的风险测评从海量产品中严选 适合的产品供投资者选择,并能为投资者提供个性化的资产配置建议,帮助投资者减少了 投资的盲目性。

    AI+安防:视频监控是安全防范系统中的重要组成部分,传统的监控系统包括前端摄像机、 传输线缆、视频监控平台。然而查看视频工作量大,人力效率低。运用机器视觉的 AI 分 析平台能够区分人体形态、车辆、或选定的物体与所有其他物体的一般移动和像素变化。它通过识别模式来实现这一点。当捕捉的对象(例如人)违反预设规则时,则发送警报。这使得风险的处置从事后提到事前,且大大节约了人力的消耗。

    AI+智能驾驶:我们认为智能驾驶是人工智能行业应用中最重要也是市场空间最大方向, 无人驾驶需要应用到人工智能的深度学习、视觉感知、大数据等技术和更智能化的硬件设 备,谷歌、高通、英伟达、英特尔、特斯拉、百度等越来越多厂商纷纷投身于此。

    核心技术和装备的国产化是新基建成败的决定因素

    IT 国产化包含了从 IT 底层的基础软硬件到上层的应用软件。以“云”和“端”角度为例, 实现全产业链的安全、可控。

    1)基于国产平台的终端全栈架构:包括国产 CPU、整机设备、固件(BIOS)、操作系统 及驱动层和应用层(办公软件、应用软件)等。终端设备包括单独部署的个人桌面电脑、 笔记本电脑、接入云平台的瘦客户端等。

    2)基于国产平台的云计算全栈架构:随着云计算的发展,政府、金融、电信等各个行业 都在逐步从传统信息系统“烟囱式”的建设方式向私有云、公有云环境进行迁移。云计算 的核心就是利用以虚拟化为代表的技术进行计算、存储、网络等资源的配置管理和弹性扩 展。云计算整体架构包括:基于国产 CPU 的基础设施层,如整机、网络、存储等;IaaS 层--包括操作系统和云管理平台;PaaS 层--主要是通过使用容器环境对应用软件进行微服 务化定制封装,使用 DevOps 理念对云原生应用进行持续部署和集成,使用容器编排工具 对容器进行统一集群管理;SaaS 层包括政府、金融、电信等各行业业务软件。此外,还 包括整个平台的安全管理、运维管理及相应的标准制定遵循。

    另一方面,从装备制造业角度来看,“新基建”具有深远的中长期影响,有望加速中国高 端装备国产化进程。“新基建”的作用不能仅从短期固定资产投资规模来看,其中长期意 义更为重要,有望进一步激活存量制造产能,有效提升制造效率,推动中国制造业向智能 化、高端化转型。“新基建”的破局点之一在于半导体设备及工业机器人等关键装备的技 术持续进步和国产化。本土关键装备制造业的崛起是“新基建”高质量推进的支撑,同时 “新基建”投资也将显著刺激和促进关键装备制造业的市场需求。

    半导体设备和工业机器人或是“新基建”实现突破的关键所在和“新基建”投资下的重点 受益领域。“新基建”的重点领域是 5G、人工智能和工业互联网等,相关关键装备的技术 持续进步是成败关键因素之一。5G 基建及应用将产生较大规模的芯片需求,国产芯片产 能建设高速推进,半导体设备国产化进程有望显著受益。

    国产芯片产业链:支撑“新基建”的产业命脉

    国产 CPU 芯片

    CPU(Central ProcessingUnit)中央处理器,是计算机的运算和控制核心(Control Unit), 它的功能主要是解释计算机指令以及处理计算机软件中的数据。中央处理器内部主要包括 运算器(ALU,Arithmetic Logic Unit)和高速缓冲存储器(Cache)及实现它们之间联系 的数据、控制及状态的总线。

    自主研发CPU需要得到指令集授权。在国产芯片厂商中,华为鲲鹏和飞腾获得了 ARM 公 司 64 位 ARM V8 指令集的架构授权,有权设计、生产、销售 ARMv8 兼容处理器产 品。龙芯、申威分别获得 MIPS 架构和 ALPHA 架构的授权,自主研发处理器内核,并 在此基础上,对相关架构指令集进行了扩展。基于两种指令集授权模式,加上国内一些厂 商自建指令集系统,CPU 国产化的方式主要有三种:

    国产 CPU 主要参与者

    2002 年中科院计算所研制出我国第一款商品化通用高性能 CPU“龙芯”1 号。此后,我 国科研技术人员大力攻关,相继有多款国产处理器芯片陆续面世。目前我国国产处理器芯 片的主要参与者有:龙芯、兆芯、飞腾、海光、申威和华为等。

    国产半导体设备

    5G 基建推进及应用端的发展有望对半导体及设备产业需求产生较大的拉动作用。5G 网络 作为新型基础设施建设的底层技术,有望带来整个信息基础设施的革命性升级。从全球视 角看,5G 是下一轮信息科技革命的制高点,从互联网到移动互联网再到 5G 物联网,将 催生万物互联,带来全新的生产生活方式;从中国的情况看,当前国内的运营商、设备商、 终端商都在蓄力 5G,不断加快 5G 设备研发和产业发展进程。5G 技术的核心在于芯片, 无论是基站还是移动手机,都与之息息相关。直接受益于 5G 大规模商用的芯片包括存储 芯片、计算芯片、控制芯片、智能手机芯片、基带芯片等。此外,未来 5G 的影响将远远 超出技术产业的范围而影响到社会各个层面,催生新的应用场景,推动新的经济活动,进 而对全球范围的各类芯片需求产生更加广泛、普遍的拉动和刺激,进而带动半导体设备需 求进入新的成长期。

    5G 时代,全球存储芯片产能扩张对刻蚀设备、薄膜沉积设备的需求拉动较为突出。5G 产 业发展催生增量需求,叠加下游技术进步对半导体工艺及设备提出更高要求,刻蚀、光刻、 薄膜沉积等关键工艺设备的增量需求空间或将较为广阔。其中存储芯片扩产对设备的拉动 效果显著,例如在 3D NAND 存储芯片领域,随着堆叠层数不断增多,刻蚀、薄膜沉积工 艺难度和次数不断增加,刻蚀设备、薄膜沉积设备需求更为受益,薄膜沉积设备需求增长 幅度可能最大。

    全球范围的新冠疫情为全球半导体及设备需求的复苏带来短期不确定性,但 5G、物联网 (IoT)、人工智能(AI)等新一轮技术变革所驱动的中长期成长趋势不会改变。纵观半导 体及设备产业的历史,每一次市场低迷都随着技术创新的到来而结束并开启新的成长期,虽 然短期来看 2019 年 PC、智能手机等渗透率接近高位在一定程度上影响了半导体及设备行 业的持续快速发展,但 5G、物联网(IoT)为代表的新需求及其带动的云计算、人工智能、 大数据等新应用的兴起,将有望开启半导体及设备行业的增量需求,2019 年下半年全球半 导体及设备产业已初步呈现出复苏趋势。据 SEMI 数据,全球、中国市场单月销售额分别于 2019 年 4 月、2 月跌至近两年最低点,但自 2019 年 9 月以来月度同比下滑幅度均呈逐渐 收窄趋势,其中中国月度同比增速已于 2019 年 12 月由负转正。自 2019 年 4 月以来,北 美半导体设备企业出货金额的同比下滑幅度一直呈现收窄趋势并于 10 月转正,2020 年 1 月同比增速达 23%。但不容忽视的是,2020 年 3 月以来全球疫情加剧,我们认为半导体及 设备需求或将面对短期下行风险,但技术驱动下的长期成长趋势不会发生改变。

    中国大陆正处于晶圆制造产能扩张的历史机遇期,逆周期投资为中国半导体设备需求提供 了较强的成长韧性,同时考虑中国疫情总体得到有效控制,制造业正在有序复工,我们认 为中国半导体设备需求有望实现持续成长。中国大陆市场的全球比重总体呈显著上升趋势, 由 2005 年的 4%提高到 2018 年的 20%,据 SEMI 于 2019 年 12 月的预测,2019、2020、 2021 年中国市场的全球占比有望提升到 22%、25%、25%,其中 2019 年中国大陆市场 回调至 129 亿美元/yoy-2%,下滑幅度小于全球市场,2020、2021 年达 149 亿美元/yoy+16% 和 164 亿美元/yoy+10%,增速均将有望高于全球市场。虽然全球新冠疫情对国内外半导 体设备产业需求成长带来风险,但我们认为中国需求的成长韧性相对更强。

    本土晶圆厂先进制程的产能扩张和技术逐步成熟,为国产设备提供了更好的验证试用平台 和进口替代机会。根据半导体行业内“一代设备,一代工艺,一代产品”的经验,半导体 产品制造要超前电子系统开发新一代工艺,而半导体设备要超前半导体产品制造开发新一 代产品,因此海外半导体设备龙头企业的技术发展历程均离不开全球一流晶圆厂紧密配合, 合作开发、技术协同和产品验证至关重要。

    目前,以中芯国际、长江存储、合肥长鑫为代表的本土半导体制造企业正分别在逻辑电路 芯片、3D NAND 存储芯片、DRAM 存储芯片领域布局先进制程产能,是中国半导体制程 工艺技术走在最前沿的企业。中芯国际 28nm 制程的发展成熟已经为本土企业带来了可观 的验证机会,据中国电子专用设备工业协会数据,2019 上半年国产设备在集成电路生产 线设备市场占比达到 10%左右。我们认为,随着中芯国际、长江存储、合肥长鑫等企业 在工艺技术上的进一步发展将为国产设备带来更前沿的验证机会和更广阔的进口替代市 场,国产设备份额上升潜力较大。

    主流晶圆厂设备国产化持续推进,从长江存储开工至今的设备招标情况来看,中国半导体 设备国产化已取得阶段性突破,本土设备企业已在刻蚀设备、薄膜沉积设备等领域占据一 定份额。长江存储是中国大陆工艺技术走在前沿、现有产能建设规划规模较大的本土晶圆 厂之一,其招标采购的市场份额情况对于评估中国半导体设备的国产化进展具有重要参考 意义。据我们对中国国际招标网的公告梳理,2017~2020 年 2 月长江存储设备采购已中 标本土企业包括:中微公司、北方华创、沈阳拓荆、盛美半导体、华海清科、精测电子、 上海睿励、中科仪等。

    目前中国本土半导体设备产业中已涌现出一批优秀企业,国产半导体设备逐渐呈现谱系化 发展,其中在细分领域走在国内前列的企业包括:北方华创(刻蚀设备、薄膜沉积设备、 清洗设备等)、 中微公司(刻蚀设备)、长川科技(测试设备)、晶盛机电(硅片生长、加 工设备)、上海微电子(光刻设备)、沈阳拓荆(薄膜沉积设备) 、中科仪(真空获得设备、 薄膜沉积设备)、盛美半导体(清洗设备)、华海清科(CMP 设备)、南京晶升能源(硅片 生长设备)等。目前半导体设备国内龙头企业订单较为充足,我们预计或有望从 2020Q2 开始实现较高的收入增长。根据国内主流半导体制造企业的投资规划来看,2020 年或是 本土设备企业成长新起点,本轮设备需求的增长周期有望持续到 2025 年,为本土企业实 现份额上升提供了重要时间窗口,建议关注中微公司、北方华创等本土优势设备企业。

    国产操作系统:信息化强国之基

    操作系统是一个协调、管理和控制计算机硬件资源和软件资源的控制程序,是硬件的第一 层软件扩充,在计算机系统中位于计算机裸机和计算机用户之间:通过系统核心程序对计 算机系统中的几类资源进行管理, 如处理机、存储器、输入 /输出设备、数据与文档资源、 用户作业等, 并向用户提供若干服务, 通过这些服务将所有对硬件的复杂操作隐藏起来, 为用户提供一个透明的操作环境。主要功能包括:处理机管理、存储器管理、设备管理、 文件管理与用户接口。

    操作系统是连接硬件和数据库、中间件、应用软件的纽带,向下适配硬件系统、发挥终端 硬件性能,向上支撑应用软件功能、影响用户的最终体验,起到了承上启下的关键作用, 是构建国产 IT 底层生态环境的重要组成部分。

    谁掌握了操作系统的话语权,谁就掌握了整个 IT 产业的话语权

    PC 时代,Windows 操作系统+Intel CPU 组合而成的 Wintel 联盟居于垄断地位,也成就 了微软在互联网时代的霸主地位。随着移动互联网的兴起,安卓/iOS 操作系统+ARM 快速 崛起,同时谷歌和苹果也随之成为移动互联网时代的霸主。

    全球从 PC 互联网时代发展到移动互联网时代,正在向万物互联时代发展。每一代互联网 相比上一代,从联网设备的数量到市场规模,都会有指数级的增长。每一代互联网都有掌 握产业链的龙头公司,从 PC 时代的英特尔和微软,到今天的 ARM 和 Google,未来谁能 掌握核心芯片和操作系统,就会成为新的万物互联时代的产业链霸主。

    2014 年,微软 WindowsXP 停服;2020 年 1 月 14 日,微软宣布 Win7 停止服务。根据百 度统计流量研究院的数据,截止到 2020 年 2 月,Win7 在我国操作系统领域仍占据 52.4% 的份额。意味着微软停止 Win7 服务,我国将有超过一半的电脑将处于安全无法保障的尴 尬处境。且 Windows 操作系统源代码是封闭的并掌握在微软手中,这极大威胁了我国整 体信息安全保障能力。由此可见,推出我国自己的安全可靠操作系统具有非常重要的战略 意义。

    目前主流操作系统主要有PC端的Windows、 Linux、 OSX等;服务器操作系统Unix/Linux, Windows Server,OS X;嵌入式操作系统μClinux、μC/OS-II、eCos、FreeRTOS 等;PDA 手持终端操作系统 Palm OS、Pocket PC 等。

    目前国产操作系统均是基于 Linux 内核进行的二次开发。Linux 是一款由 C 语言编写的免 费开源系统内核。凭借其免费开源、安全稳定、高模块化程度、广泛的硬件支持、支持多 用户多任务等特点,Linux 获得众多开发者的推崇。

    按照应用领域分类,Linux 操作系统可以分为三类:桌面操作系统、服务器操作系统、嵌 入式操作系统。桌面操作系统是具有图形化界面的操作系统。服务器操作系统是安装在大 型计算机上的操作系统,相对于桌面操作系统,服务器操作系统要承当额外的管理、配置、 稳定、安全保证等功能。嵌入式操作系统是一种用途广泛的系统软件,通常包括与硬件相 关的底层驱动软件、系统内核、设备启动接口、通信协议、图形界面、标准化浏览器等。

    国内操作系统厂商主要有麒麟 OS(中标麒麟、银河麒麟)、深度科技、普华软件、中兴新 支点、凝思、中科方德等公司。各公司简要概况见下表。

    另外,华为也推出了自己的社区版开源操作系统华为欧拉(OpenEuler)。华为欧拉服务器 操作系统软件基于 Linux 稳定系统内核,完美支持鲲鹏处理器和容器虚拟化技术,在系统 的高可靠、高安全以及高保障方面储备了富有竞争力的技术特性。为企业用户提供了稳定 安全的高端计算平台,并充分利用 Linux 的可伸缩、高性能和开放性的优势。

    在国产操作系统领域,我们看好 UOS 和麒麟 OS,对于两者的份额,目前还无法准确判 断,需要持续跟踪双方的发展态势。标的方面,建议关注中国软件(麒麟软件第一大股东)。

    “新基建”十大核心行业龙头企业梳理

    “新基建”推动中国开启新的智能化时代,我们认为,在新的机遇期,新基建相关产业中 具备综合竞争力的一批龙头企业有望脱颖而出、加速发展。从产业链角度,有望较为受益 的具体产业包括:半导体设备、国产芯片、国产基础软件、服务器、存储、IDC、云计算、 工业机器人、工业互联网、V2X 车联网、超高清视频、人工智能的基础层、技术层及应用 层(智能驾驶,AI+安防、金融、医疗、司法、教育等)。上述产业中的主要上市公司如下:

    综合考虑“新基建”驱动下细分领域的行业空间及趋势,以及企业的竞争地位和受益程度, 我们筛选出最有望受益于“新基建”投资的十大核心行业龙头企业,建议关注:

    1)中兴通讯:受益于 5G 基站建设的通信设备龙头;

    2)海康威视:受益于 5G 安防场景应用发展的 AI+安防龙头;

    3)金山办公:受益于云计算行业景气度上行的云化办公软件龙头;

    4)中微公司:受益于中国芯片产能扩张的本土半导体刻蚀设备领军企业;

    5)北方华创:受益于中国芯片产能扩张的半导体设备平台型龙头企业;

    6)浪潮信息:受益于云计算底层计算需求扩张的服务器龙头厂商;

    7)数据港:受益于云计算底层需求扩张的领军 IDC 服务商;

    8)中国软件:受益于国产化浪潮的国产基础软件龙头;

    9)宁德时代:全球领先动力电池系统提供商,车联网及新能源车产业链受益标的;

    10)宝信软件:受益于工业互联网应用落地的钢铁信息化龙头,IDC 业务具有成本优势。

    风险提示

    宏观经济下行压力加大的风险: 全球疫情扩散对国内外需求产生抑制,逆周期政策有望一定程度上对冲宏观经济下行压力, 若政策力度不及预期,或将导致新基建相关产业需求侧弱化。

    宏观经济下行压力加大的风险: 国内新冠疫情虽然得到较为有效的控制,但海外疫情扩散趋势仍未减缓,海外疫情对全球 经济的冲击风险不容忽视。此外,若产生输入性风险,或对国内制造业等产业景气度产生 负面影响。

    宏观经济下行压力加大的风险: 新基建部分相关产业技术壁垒较高,技术突破进度对产业发展至关重要,且中外仍存一定 差距,若贸易摩擦加剧导致海外对华技术封锁或关税政策变化,或对本土相关产业产生不 利影响。

    未来智能实验室的主要工作包括:建立AI智能系统智商评测体系,开展世界人工智能智商评测;开展互联网(城市)云脑研究计划,构建互联网(城市)云脑技术和企业图谱,为提升企业,行业与城市的智能水平服务。

      如果您对实验室的研究感兴趣,欢迎加入未来智能实验室线上平台。扫描以下二维码或点击本文左下角“阅读原文”

    展开全文
  • 项目管理的九知识领域

    千次阅读 2013-11-07 16:17:50
    管理的九知识领域是指作为项目经理必须具备与掌握的九块重要知识与能力。其中核心的四大知识领域是范围、时间、成本与质量管理。在这些知识领域中还涉及很多的管理工具和技术,以用来帮助项目经理与项目组成员...
  • 机器学习:金融领域的岗位需求

    千次阅读 2017-04-17 14:43:12
    转自:机器学习:金融领域的岗位需求 1.蚂蚁金服招聘资深推荐算法工程师 岗位描述: 1、结合业务需要提出合适的算法解决方案,推动方案在业务系统中实现,构建实时化高并发系统,尤其是基于规模用户行为,...
  • 这一年,国务院三次下发文件推进“互联网+政务”和国家信息化建设,数字政府、数字中国目标写入“十三规划”。 2020 年3月4日中共中央政治局常务委员会召开会议,会议指出要加快 5G网络、数据中心等新型基础设施...
  • PMP 项目管理过程组与知识领域梳理

    千次阅读 2019-12-08 10:32:05
    十大知识领域 5个阶段 启动过程组 输入:商业文件、协议; 输出:项目章程、相关方登记册;假设日志; 项目启动会议Initiating Meeting:分发项目章程,宣布立项,项目经理...
  • 技术领域 Linux 内核开发者大会 2012 第七届 Linux 内核开发者大会 2012 第七届 Linux 内核开发者大会PPT 1 Open Source - More than just code Hans Peter Anvin(HPA): Intel Open Source ...
  • 1.领域分析 1.1引言 随着信息时代的来临,基于PDF格式的学术论文与期刊文献的数量猛然增长,给科研人员提供了丰富的参考资料的同时,也迫使科研人员将更多的时间和精力投入到对科技文献的检索与阅读中。如何对...
  • 如果编程语言是一门武功绝学

    万次阅读 多人点赞 2021-05-22 16:30:06
    在编程的学习过程中,我们何尝不是从一招一式的函数、语法、特性等学起,掌握了一门编程语言后,再学习另一门语言就会快很多,如同拥有内功后,习得其他武功也会轻松很多。 如果编程语言是一门武功绝学,各语言分别...
  • 这是作者的系列网络安全自学教程,主要是关于网安工具和实践操作的在线笔记,特分享出来与博友共勉,希望您...这篇文章换个口味,将分享机器学习在安全领域的应用,并复现一个基于机器学习(逻辑回归)的恶意请求识别。
  • 为什么我说Rust是靠谱的编程语言

    万次阅读 多人点赞 2015-05-16 02:59:21
    作者尽量较少的谈及Rust语言本身,反而尝试从Rust语言周边入手,长时间、范围、多角度地考察,研判Rust语言是否靠谱,并给出尽可能客观的理由。为写成本文,作者Liigo不惜“卧底”Rust“老巢”长达一年多,收集...
  • 计算机领域

    千次阅读 2014-08-09 17:46:39
    从人生的职业生涯来看,掌握计算机的自动化办公技能,经理助理、项目文案、分析员、策划经理、策划专员、讲师和销售专员等众多职位对计算机的要求将不会成为求职的门槛。 入门4 计算机娱乐 指南 计算机是一个通用...
  • 你有一个大数据项目,你知道问题领域(problem domain),也知道使用什么基础设施,甚至可能已决定使用哪种框架来处理所有这些数据,但是有一个决定迟迟未能做出:我该选择哪种语言?(或者可能更有针对性的问题是,...
  • Transformer讲解以及在CV领域的应用

    千次阅读 多人点赞 2021-01-10 14:47:24
    Attention2.4 Multi-Headed Attention2.5 Positional Encoding2.6 Layer normalization三、应用任务和结果3.1 NLP领域3.2 CV领域3.2.1 检测DETR3.2.2 分类ViT3.2.3 分割SETR3.2.4 Deformable-DETR四、优点及分析、...
  • 如何成为一门领域的专家

    万次阅读 2018-01-16 12:11:17
    1.怎样成为专家 无数事实证明,一个人只要不是太笨,太不开窍,有这一万个小时的苦练...成长、探索、确立、维持、衰退为中心的个阶段模型 1) 每个阶段都有不同的职业课题需要完成,当前阶段的职业课题没有完成的
  • 【自然语言处理】详说中文自动分词

    千次阅读 多人点赞 2018-11-06 17:05:44
    文章目录中文自动分词前言一、 what is 中文分词二、中文分词的用途三、中文分词的特点和难点四、常见的中文分词方法、中文分词工具1、HanLP 中文分词A、 python调用hanlp进行中文分词2、 BosonNLP3、 语言云:4、...
  • 知识工程学:一个新的重要研究领域 黄荣怀(北京师范大学网络教育实验室 100875)李茂国(教育部高等教育司100816)沙...本文简要介绍了知识工程的概念,分析了知识工程主要研究领域,如软计算、Agent、自然语言理解、逻
  • 你能想明白这些小的skill里面,那些小的skill能帮助你达到你的目标 ,你就可以先学习这些小的skill,如果你能先学会这些最重要的东西,你就能在最短的时间提升自己的表现。 例子来了: 我学习PS的时候,...
  • 作为认知智能的一个重要核心技术,自然语言处理在过去一年中有了进一步的发展,无论从技术和产品都有显著的成果,例如规模预训练语言模型的明显优势和广泛应用,智能对话和服务助理,结合领域需求的 NLP 技术和...
  • 在我刚刚进入大学,从零开始学习 C 语言的时候,我就不断的从学长的口中听到一个又一个语言,比如 C++、Java、Python、JavaScript 这些大众的,也有 Lisp、Perl、Ruby 这些相对小众的。一般来说,当程序员讨论一门...
  • 深度学习领域有哪些瓶颈

    千次阅读 2019-09-18 15:47:04
    来源:知乎问题深度学习是近年来人工智能热潮的原因,它的出现在很多方面都作出了突破,包括在图像、NLP以及语音等领域都有很多问题取得很的突破,但它目前也存在一些问题和瓶颈...
  • 大数据入门的五大核心技术

    千次阅读 2020-08-07 01:14:16
    21世纪,世界已经进入数据爆炸的时代,大数据时代已经来临。从商业公司内部的各种管理和运营数据,到个人移动终端与消费电子产品的社会化数据,再到互联网产生的海量信息数据等,每天世界上产生的信息量正在飞速...
  • 文章发布于公号【数智物语】 (ID:...报告摘要:近年来,知识图谱技术进展迅速,各种领域知识图谱技术在很多领域或行业取得了显著落地效果。在领域知识图谱技术的落地实践过程中涌现出一大批理论与工程问题。...
  • BERT在多模态领域中的应用

    千次阅读 2020-03-03 08:40:52
    ©PaperWeekly 原创 ·作者|李明晓学校|鲁汶大学博士生研究方向|自然语言处理BERT (Bidrectional Encoder Representations from ...
  • 自然语言处理技术

    千次阅读 2020-07-03 19:53:49
    2019 回顾:五大技术进展和四大应用与产品 回望过去,在自然语言处理技术的应用和研究领域发生了许多有意义的标志性事件,我们将从“技术进展”、“应用与产品”两大维度进行回顾。 2019 年,技术进展方面主要体现在...
  • 做产品经理这份工作将涉及大量选择...所以,这份内容是关于一个要进入AI领域的产品经理,所需要积累的“输入”的归纳,以及搭建“内视”框架的过程。(第二份输出也已经完成——《出行服务 + AI —— 一次模拟的创业》)

空空如也

空空如也

1 2 3 4 5 ... 20
收藏数 32,509
精华内容 13,003
关键字:

五大领域语言领域总目标