精华内容
下载资源
问答
  • 培养目标编辑本专业培养具备良好的科学素养,很多人都是读完中职就就业的,建议在确定专业之前对这些专业做一个好好的调查,具有扎实的计算机基础知识、计算机专业知识和较强的计算机办公自动化、数据库等常用软件...

    培养目标编辑本专业培养具备良好的科学素养,很多人都是读完中职就就业的,建议在确定专业之前对这些专业做一个好好的调查,具有扎实的计算机基础知识、计算机专业知识和较强的计算机办公自动化、数据库等常用软件应用能力、计算机网络基本应用能力, 发展趋势编辑市场经济的发展、计算机应用的家庭化、普及化, ,贵州机电技工学校2020年有哪些专业是可以让同学们自己选择的呢,想要报读这些专业的同学。

    一技之长,特别是加入世贸组织以后,将来也能坚持的就可以报读的哦。

    推动了计算机技术人才市场的发展, 我为同学们整理的关于贵州机电技工学校2020年的专业情况,选择专业是很重要的,多种证书,对于刚刚初中毕业的同学们来说,德、智、体、美全面发展的计算机专业高等应用型人才, 贵州机电技工学校2020年有哪些专业 专业 学历 机电设备安装与维修 中专 数控技术应用 中专 汽车运用与维修 中专 机械制造技术 中专 机电制造技术 中专 电器运营与控制 中专 电子技术应用 中专 计算机应用 中专 电子商务 中专 客户信息服务 中专 农业机械使用与维护 中专 贵州机电技工学校计算机应用专业简介 本专业培养适应计算机技术在企事业单位中发展、应用的需要,可是职业学校都是学习特定专业的。

    品学兼优的培养目标,也不知道该选择什么专业 ,实现一张文凭,同学对于专业方面的内容都不清楚, 在中职学校里面。

    成绩一般的同学都选择就读职业学校,系统地掌握计算机科学与技术包括计算机硬件、软件与应用的基本理论、基本知识和基本技能,能在科研院所、企业事业单位、技术和行政管理等部门从事教学、科研、开发、管理等工作的高级专门人才,。

    计算机应用人才更是供不应求,这直接关系到将来的就业,学校目前的专业是很多的哦。

    那么。

    能够在企事业单位相关部门从事计算机办公自动化和计算机软件应用等计算机相关应用工作,一专多能。

    确定了这个专业是自己想要学习的。

    信息产业的规模化。

    展开全文

    展开全文
  • 德智体全面发展、基础扎实知识面宽、能力强、素质高具有创新,系统掌握计算机硬件、软件的基本理论与应用基本技能,具有较强的实践能力,能在企事业单位、机关、行政管理部门从事计算机技术...

    4.了解学科的知识结构、典型技术、核心概念和基本工作流程;

    6.掌握文献检索、资料查询的基本方法、能够获取相关的知识和信息,具有较强的创新意识;

    2.具有较强的思维能力、算法设计与分析能力;

    本专业培养和造就适应现代化建设需要。德智体全面发展、基础扎实、知识面宽、能力强、素质高具有创新,系统掌握计算机硬件、软件的基本理论与应用基本技能,具有较强的实践能力,能在企事业单位、机关、行政管理部门从事计算机技术研究和应用,硬件、软件和网络技术的开发,计算机管理和的应用型专门技术人才。

    1.具备扎实计算机应用技术专业的数据基础理论和基础知识;

    7.熟练掌握一门外语,能够熟读本专业外文书刊。

    获取更多在职研究生相关资讯,可关注人民大学在职研究生微信:ruceduzzy

    准备报在职研究生的考生可能对计算机应用技术专业不是很了解,下面由人民大学在职研究生()招生老师为大家介绍。

    培养目标

    数据仓库与数据挖掘、商务智能、网络与通讯、DBMS原理与设计、软件工程、软件过程、高级操作系统、人工智能、计算理论导论、离散数学、图论与组合优化、自然、IT项目管理等。

    5.有较强的计算机系统的认知、分析、设计、编程和应用能力;

    主要课程

    3.系统掌握计算机科学与技术专业基本理论、基本知识和操作技能;

    毕业生应具备的知识和能力

    展开全文
  • 深入学习关系理论

    2019-10-24 14:01:22
    周末阴雨连绵,在家闲来无事,抽空读了《Database In Depth: Relational Theory for Practitioners》这本评价不错的关系理论书的开篇。作者C.J.Date是关系理论之父Codd的好友,所以对关系理论的理解是足够深入的。...

    周末阴雨连绵,在家闲来无事,抽空读了《Database In Depth: Relational Theory for Practitioners》这本评价不错的关系理论书的开篇。作者C.J.Date是关系理论之父Codd的好友,所以对关系理论的理解是足够深入的。甚至在开篇不久,作者就提到了与Codd理念不合的地方,比如关于NULL的合理性,关于Domain与Type的等价性等。


    1.SQL不等于关系模型!

    在关系理论中,一般常用的术语是关系(Relation)、元组(Tuple)、属性(Attribute)。在SQL中为了方便用户理解,术语常用表(Table)、行(Row)、列(Column)。然而真相却是关系不是表,元组不是行,属性也不是列。如果你真的理解关系理论,这种术语互换可能没什么坏处。可是如果你只是通过SQL学到了关系理论的皮毛,这种类比会让你对真正的关系模型产生误解。

    另一个例子就是关系模型中的关系是基于集合的,可SQL却允许重复的行出现在表中。而且投影(Project)操作也不会产生集合,而是保留重复的值,需要显示声明SELECT DISTINCT ...才能得到真正的集合。此外,属性在关系中也是无序,同样因为关系是基于集合的,然而在SQL中列却是有顺序的。种种细节都能看出,SQL定义的规范确实与正统的关系理论有很大出入。


    2.真正的关系理论

    1968年,Codd这位受过专业训练的数学家发现,数学可以为数据库管理领域注入严谨。他建立的关系理论最初包含三部分:结构(Structure)、完整性(Integrity)和操作(Manipulation)。下面简单快速地介绍一下这三部分的内容:

    1. 结构:定义了关系以及键(Candidate Key),包括主键(Primary Key)和外键(Foreign Key)。
    2. 完整性:主要是实体完整性和引用完整性,即主键不允许为NULL,以及外键不能引用一个不存在的键值。
    3. 操作:包括关系代数(Relational Algebra)和关系赋值。前者关系代数最早由8个运算符组成。

    关于关系的操作最重要的一点就是所有运算都具有闭包属性(Closure Property),即每个操作的返回值都还是一个关系。所以运算符可以简单定义为,入参是1个或以上的关系,返回值则是确定的1个关系。正是基于闭包的性质,我们可以任意嵌套使用关系运算符,组成关系代数的表达式。


    3.模型与实现

    关系理论中重要的一点就是模型(Model)与实现(Implementation)的严格区分。就像软件架构时能在不同的抽象层级上设计一样,如果能在逻辑模型与物理实现之间切换思考,也是一种很强的能力。学习关系理论时需要这种能力,克制自己去思考底层实现。比如表是如何保存在硬盘和内存中的,如何构建索引来高效查询,JOIN如何高效地实现等等。有了模型与实现的分离,关系理论提出了数据独立性(Data Independence),即背后物理、算法等实现上的变化不应该被用户察觉。

    介绍了这种理念后,作者画龙点睛,给出了关系理论中的关系模型的定义:“数据模型是一个抽象的、自包含的、数据结构和操作的逻辑定义,一起构成了一台与用户交互的抽象机器(Abstract Machine)”。从这一层含义上来说,关系模型就是语言,就像软件设计中的API和接口,是提供给用户来操作的语言层。而另一层含义就是,用户通过关系模型(语言)定义好的每个关系模型(实例),就像用编程语言写好的一个个程序一样


    4.关系变量

    如果前面的概念你都了如指掌,那么关系变量(Relation Variable或RelVar)一定会让你耳目一新。其实,当我们执行CREATE TABLE T时,这就像在传统的编程语言中执行了DECLARE T INTEGER,都只是变量的定义。唯一区别就是一个是关系变量,一个是整数变量。

    相信大家对变量和值的概念区分都不陌生,刚开始学编程时最基础的一项应该就是区分变量和值,学会使用变量。从概念上来讲,值是不可改变的常量。值在时间和空间上都是不存在的,它只可以通过某种形式表示来保存在某个位置,比如通过二进制编码保存到内存。而变量是值的表示的容器。

    对于整数变量来说,真正的变量值当然就是整数,而关系变量的值自然就是关系。每当我们改变关系时,其实都是在给关系变量重新赋值。例如,我们执行DELETE FROM T WHERE city = 'Athens',就相当于是在给关系变量T重新赋值T := T WHERE NOT (CITY = 'Athens')。而INSERTUPDATE也是类似的,这也就是为什么前面我们介绍关系的操作时,只要一个赋值运算符就够了。


    5.理论的重要性

    达芬奇:“那些热衷于实践而忽视理论的人,就像是没有方向舵或指南针就出航,永远不确定他将要到哪。实践应该总是基于扎实的理论知识之上”。正所谓“学而不思则罔,思而不学则殆”,本书作者说:如果你对关系理论的了解都来自于SQL,那恐怕你对关系理论的理解还没达到你应该或者以为的水平。所以,理论能学到多好就学到多好,永远别以为自己学透了。学到的知识,它总会在你不经意间派上用场。

    展开全文
  • 知识图谱架构(Knowledge Graph)

    千次阅读 多人点赞 2020-04-07 16:10:57
    本文以通俗易懂的方式来讲解知识图谱相关的知识、尤其对从零开始搭建知识图谱过程当中需要经历的步骤以及每个阶段需要考虑的问题都给予了比较详细的解释。 知识图谱( Knowledge Graph)的概念由谷歌2012年正式...

    1. 前言

    从一开始的Google搜索,到现在的聊天机器人、大数据风控、证券投资、智能医疗、自适应教育、推荐系统,无一不跟知识图谱相关。它在技术领域的热度也在逐年上升。 本文以通俗易懂的方式来讲解知识图谱相关的知识、尤其对从零开始搭建知识图谱过程当中需要经历的步骤以及每个阶段需要考虑的问题都给予了比较详细的解释。

    知识图谱( Knowledge Graph)的概念由谷歌2012年正式提出,旨在实现更智能的搜索引擎,并且于2013年以后开始在学术界和业界普及。目前,随着智能信息服务应用的不断发展,知识图谱已被广泛应用于智能搜索、智能问答、个性化推荐、情报分析、反欺诈等领域。另外,通过知识图谱能够将Web上的信息、数据以及链接关系聚集为知识,使信息资源更易于计算、理解以及评价,并且形成一套Web语义知识库。知识图谱以其强大的语义处理能力与开放互联能力,可为万维网上的知识互联奠定扎实的基础,使Web 3.0提出的“知识之网”愿景成为了可能。

    2 知识图谱定义

    知识图谱:是结构化的语义知识库,用于迅速描述物理世界中的概念及其相互关系。

    知识图谱通过对错综复杂的文档的数据进行有效的加工、处理、整合,转化为简单、清晰的“实体,关系,实体”的三元组,最后聚合大量知识,从而实现知识的快速响应和推理。

    知识图谱有自顶向下自底向上两种构建方式。所谓自顶向下构建是借助百科类网站等结构化数据源,从高质量数据中提取本体和模式信息,加入到知识库中;所谓自底向上构建,则是借助一定的技术手段,从公开采集的数据中提取出资源模式,选择其中置信度较高的新模式,经人工审核之后,加入到知识库中。

    看一张简单的知识图谱:

     

    如图所示,你可以看到,如果两个节点之间存在关系,他们就会被一条无向边连接在一起,那么这个节点,我们就称为实体(Entity),它们之间的这条边,我们就称为关系(Relationship)

    知识图谱的基本单位,便是“实体(Entity)-关系(Relationship)-实体(Entity)”构成的三元组,这也是知识图谱的核心。

    • 实体: 指的是具有可区别性且独立存在的某种事物。实体是知识图谱中的最基本元素,不同的实体间存在不同的关系。如图中的“中国”、“北京”、“16410平方公里”等。

    • 关系: 关系是连接不同的实体,指代实体之间的联系。通过关系节点把知识图谱中的节点连接起来,形成一张大图。如图中的“人口”、“首都”、“面积”等

    3 数据类型和存储方式

    知识图谱的原始数据类型一般来说有三类(也是互联网上的三类原始数据):

    • 结构化数据(Structed Data):如关系数据库
    • 半结构化数据(Semi-Structed Data):如XML、JSON、百科
    • 非结构化数据(UnStructed Data):如图片、音频、视频、文本

    如何存储上面这三类数据类型呢?一般有两种选择,一个是通过RDF(资源描述框架)这样的规范存储格式来进行存储,还有一种方法,就是使用图数据库来进行存储,常用的有Neo4j等。

    RDF结构: 

    Neo4j结构: 

    在知识图谱方面,图数据库比关系数据库灵活的多。 在数据少的时候,关系数据库也没有问题,效率也不低。但是随着知识图谱变的复杂,图数据库的优势会明显增加。当涉及到2,3度的关联查询,基于图数据库的效率会比关系数据库的效率高出几千倍甚至几百万倍。

     

    4 知识图谱的架构

    知识图谱在架构上分,可以分为逻辑架构和技术架构

    4.1 逻辑架构

    知识图谱在逻辑上可分为模式层数据层两个层次。

    • 模式层构建在数据层之上,是知识图谱的核心,通常采用本体库来管理知识图谱的模式层。本体是结构化知识库的概念模板,通过本体库而形成的知识库不仅层次结构较强,并且冗余程度较小。

    模式层:实体-关系-实体,实体-属性-性值

    • 数据层主要是由一系列的事实组成,而知识将以事实为单位进行存储。如果用(实体1,关系,实体2)、(实体、属性,属性值)这样的三元组来表达事实,可选择图数据库作为存储介质,例如开源的Neo4j、Twitter的FlockDB、sones的GraphDB等。

    数据层:比尔盖茨-妻子-梅琳达·盖茨,比尔盖茨-总裁-微软

    4.2 技术架构

    知识图谱的整体架构如下图所示,其中虚线框内的部分为知识图谱的构建过程,同时也是知识图谱更新的过程。

    分析下这张图。

    1. 虚线框的最左边是三种输入数据结构,结构化数据、半结构化数据、非结构化数据。这些数据可以来自任何地方,只要它对要构建的这个知识图谱有帮助。
    2. 虚线框里面的是整个的知识图谱的构建过程。其中主要包含了3个阶段,信息抽取、知识融合、知识加工。
    3. 最右边是生成的知识图谱,而且这个技术架构是循环往复,迭代更新的过程。知识图谱不是一次性生成,是慢慢积累的过程。
    • 信息抽取:从各种类型的数据源中提取出实体、属性以及实体间的相互关系,在此基础上形成本体化的知识表达;
    • 知识融合:在获得新知识之后,需要对其进行整合,以消除矛盾和歧义,比如某些实体可能有多种表达,某个特定称谓也许对应于多个不同的实体等;
    • 知识加工:对于经过融合的新知识,需要经过质量评估之后(部分需要人工参与甄别),才能将合格的部分加入到知识库中,以确保知识库的质量。

     

     

     其实我们的构建知识图谱的过程,就是信息抽取、知识融合、知识加工三个过程,但是这三个过程都有各自的难点,下文通过从这三个模块出发,解析这三个模块说要解决的问题,会遇到的难点。

     

    5. 信息抽取

    信息抽取(infromation extraction)是知识图谱构建的第1步,其中的关键问题是:如何从异构数据源中自动抽取信息得到候选指示单元?

    信息抽取是一种自动化地从半结构化和无结构数据中抽取实体、关系以及实体属性等结构化信息的技术。

    涉及的关键技术包括:实体抽取、关系抽取和属性抽取

    5.1 实体抽取(Entity Extraction)

    实体抽取又称为命名实体识别(named entity recognition,NER),是指从文本数据集中自动识别出命名实体。实体抽取的质量(准确率和召回率)对后续的知识获取效率和质量影响极大,因此是信息抽取中最为基础和关键的部分。

     

    2012年Ling等人归纳出112种实体类别,并基于条件随机场CRF进行实体边界识别,最后采用自适应感知机算法实现了对实体的自动分类,取得了不错的效果。

    但是随着互联网中内容的动态变化,采用人工预定义实体分类体系的方式已经很难适应时代的需求,因此提出了面向开放域的实体识别和分类研究。

    在面向开放域的实体识别和分类研究中,不需要(也不可能)为每个领域或者每个实体类别建立单独的语料库作为训练集。因此,该领域面临的主要挑战是如何从给定的少量实体实例中自动发现具有区分力的模型。

    一种思路是根据已知的实体实例进行特征建模,利用该模型处理海量数据集得到新的命名实体列表,然后针对新实体建模,迭代地生成实体标注语料库。

    另一种思路是利用搜索引擎的服务器日志,事先并不给出实体分类等信息,而是基于实体的语义特征从搜索日志中识别出命名实体,然后采用聚类算法对识别出的实体对象进行聚类。

    5.2 关系抽取(Relation Extraction)

    文本语料经过实体抽取,得到的是一系列离散的命名实体,为了得到语义信息,还需要从相关的语料中提取出实体之间的关联关系,通过关联关系将实体(概念)联系起来,才能够形成网状的知识结构,研究关系抽取技术的目的,就是解决如何从文本语料中抽取实体间的关系这一基本问题。

     

    1. 人工构造语法和语义规则(模式匹配)
    2. 统计机器学习方法
    3. 基于特征向量或核函数的有监督学习方法
    4. 研究重点转向半监督和无监督
    5. 开始研究面向开放域的信息抽取方法
    6. 将面向开放域的信息抽取方法和面向封闭领域的传统方法结合

    5.3 属性抽取(Attribute Extraction)

    属性抽取的目标是从不同信息源中采集特定实体的属性信息。例如针对某个公众人物,可以从网络公开信息中得到其昵称、生日、国籍、教育背景等信息。属性抽取技术能够从多种数据来源中汇集这些信息,实现对实体属性的完整勾画。

    1. 将实体的属性视作实体与属性值之间的一种名词性关系,将属性抽取任务转化为关系抽取任务。
    2. 基于规则和启发式算法,抽取结构化数据
    3. 基于百科类网站的半结构化数据,通过自动抽取生成训练语料,用于训练实体属性标注模型,然后将其应用于对非结构化数据的实体属性抽取。
    4. 采用数据挖掘的方法直接从文本中挖掘实体属性和属性值之间的关系模式,据此实现对属性名和属性值在文本中的定位。

     

    6. 知识融合

     

    通过信息抽取,我们就从原始的非结构化和半结构化数据中获取到了实体、关系以及实体的属性信息。

    如果我们将接下来的过程比喻成拼图的话,那么这些信息就是拼图碎片,散乱无章,甚至还有从其他拼图里跑来的碎片、本身就是用来干扰我们拼图的错误碎片。

    拼图碎片(信息)之间的关系是扁平化的,缺乏层次性和逻辑性; 拼图(知识)中还存在大量冗杂和错误的拼图碎片(信息) 那么如何解决这一问题,就是在知识融合这一步里我们需要做的了。

    知识融合包括2部分内容:实体链接知识合并

    6.1 实体链接

    实体链接(entity linking):是指对于从文本中抽取得到的实体对象,将其链接到知识库中对应的正确实体对象的操作。

    其基本思想是首先根据给定的实体指称项,从知识库中选出一组候选实体对象,然后通过相似度计算将指称项链接到正确的实体对象。

    研究历史:

    1. 仅关注如何将从文本中抽取到的实体链接到知识库中,忽视了位于同一文档的实体间存在的语义联系。
    2. 开始关注利用实体的共现关系,同时将多个实体链接到知识库中。即集成实体链接(collective entity linking)

    实体链接的流程:

    1. 从文本中通过实体抽取得到实体指称项。
    2. 进行实体消歧共指消解,判断知识库中的同名实体与之是否代表不同的含义以及知识库中是否存在其他命名实体与之表示相同的含义。
    3. 在确认知识库中对应的正确实体对象之后,将该实体指称项链接到知识库中对应实体。
    • 实体消歧:专门用于解决同名实体产生歧义问题的技术,通过实体消歧,就可以根据当前的语境,准确建立实体链接,实体消歧主要采用聚类法。其实也可以看做基于上下文的分类问题,类似于词性消歧和词义消歧

    • 共指消解主要用于解决多个指称对应同一实体对象的问题。在一次会话中,多个指称可能指向的是同一实体对象。利用共指消解技术,可以将这些指称项关联(合并)到正确的实体对象,由于该问题在信息检索和自然语言处理等领域具有特殊的重要性,吸引了大量的研究努力。共指消解还有一些其他的名字,比如对象对齐、实体匹配和实体同义。

    6.2 知识合并

    在构建知识图谱时,可以从第三方知识库产品或已有结构化数据获取知识输入。

    常见的知识合并需求有两个,一个是合并外部知识库,另一个是合并关系数据库。

    将外部知识库融合到本地知识库需要处理两个层面的问题:

    数据层的融合,包括实体的指称、属性、关系以及所属类别等,主要的问题是如何避免实例以及关系的冲突问题,造成不必要的冗余 通过模式层的融合,将新得到的本体融入已有的本体库中 然后是合并关系数据库,在知识图谱构建过程中,一个重要的高质量知识来源是企业或者机构自己的关系数据库。为了将这些结构化的历史数据融入到知识图谱中,可以采用资源描述框架(RDF)作为数据模型。业界和学术界将这一数据转换过程形象地称为RDB2RDF,其实质就是将关系数据库的数据换成RDF的三元组数据。

     

    7. 知识加工

    在前面,我们已经通过信息抽取,从原始语料中提取出了实体、关系与属性等知识要素,并且经过知识融合,消除实体指称项与实体对象之间的歧义,得到一系列基本的事实表达。

    然而事实本身并不等于知识。要想最终获得结构化,网络化的知识体系,还需要经历知识加工的过程。

    知识加工主要包括3方面内容:本体构建、知识推理和质量评估

    7.1 本体构建

    本体(ontology)是指工人的概念集合、概念框架,如“人”、“事”、“物”等。

    本体可以采用人工编辑的方式手动构建(借助本体编辑软件),也可以以数据驱动的自动化方式构建本体。因为人工方式工作量巨大,且很难找到符合要求的专家,因此当前主流的全局本体库产品,都是从一些面向特定领域的现有本体库出发,采用自动构建技术逐步扩展得到的。

    自动化本体构建过程包含三个阶段:

    1. 实体并列关系相似度计算
    2. 实体上下位关系抽取
    3. 本体的生成

    比如对下面这个例子,当知识图谱刚得到“阿里巴巴”、“腾讯”、“手机”这三个实体的时候,可能会认为它们三个之间并没有什么差别,但当它去计算三个实体之间的相似度后,就会发现,阿里巴巴和腾讯之间可能更相似,和手机差别更大一些。

    这就是第一步的作用,但这样下来,知识图谱实际上还是没有一个上下层的概念,它还是不知道,阿里巴巴和手机,根本就不隶属于一个类型,无法比较。因此我们在实体上下位关系抽取这一步,就需要去完成这样的工作,从而生成第三步的本体。

    当三步结束后,这个知识图谱可能就会明白,“阿里巴巴和腾讯,其实都是公司这样一个实体下的细分实体。它们和手机并不是一类。”

     

    7.2 知识推理

    在我们完成了本体构建这一步之后,一个知识图谱的雏形便已经搭建好了。但可能在这个时候,知识图谱之间大多数关系都是残缺的,缺失值非常严重,那么这个时候,我们就可以使用知识推理技术,去完成进一步的知识发现。

    我们可以发现:如果A是B的配偶,B是C的主席,C坐落于D,那么我们就可以认为,A生活在D这个城市。

    根据这一条规则,我们可以去挖掘一下在图里,是不是还有其他的path满足这个条件,那么我们就可以将AD两个关联起来。除此之外,我们还可以去思考,串联里有一环是B是C的主席,那么B是C的CEO、B是C的COO,是不是也可以作为这个推理策略的一环呢?

    当然知识推理的对象也并不局限于实体间的关系,也可以是实体的属性值,本体的概念层次关系等。

    推理属性值:已知某实体的生日属性,可以通过推理得到该实体的年龄属性; 推理概念:已知(老虎,科,猫科)和(猫科,目,食肉目)可以推出(老虎,目,食肉目) 这一块的算法主要可以分为3大类,基于逻辑的推理、基于图的推理和基于深度学习的推理

     

    7.3 质量评估

    质量评估也是知识库构建技术的重要组成部分,这一部分存在的意义在于:可以对知识的可信度进行量化,通过舍弃置信度较低的知识来保障知识库的质量。

     

    8. 知识更新

    从逻辑上看,知识库的更新包括概念层的更新和数据层的更新

    概念层的更新是指新增数据后获得了新的概念,需要自动将新的概念添加到知识库的概念层中。 数据层的更新主要是新增或更新实体、关系、属性值,对数据层进行更新需要考虑数据源的可靠性、数据的一致性(是否存在矛盾或冗杂等问题)等可靠数据源,并选择在各数据源中出现频率高的事实和属性加入知识库。 知识图谱的内容更新有两种方式:

    • 全面更新:指以更新后的全部数据为输入,从零开始构建知识图谱。这种方法比较简单,但资源消耗大,而且需要耗费大量人力资源进行系统维护;
    • 增量更新:以当前新增数据为输入,向现有知识图谱中添加新增知识。这种方式资源消耗小,但目前仍需要大量人工干预(定义规则等),因此实施起来十分困难。

     

    9. 总结

    通过知识图谱,不仅可以将互联网的信息表达成更接近人类认知世界的形式,而且提供了一种更好的组织、管理和利用海量信息的方式。目前的知识图谱技术主要用于智能语义搜索、移动个人助理(Siri)以及深度问答系统(Watson),支撑这些应用的核心技术正是知识图谱技术。

    在智能语义搜索中,当用户发起查询时,搜索引擎会借助知识图谱的帮助对用户查询的关键词进行解析和推理,进而将其映射到知识图谱中的一个或一组概念之上,然后根据知识图谱的概念层次结构,向用户返回图形化的知识结构,这就是我们在谷歌和百度的搜索结果中看到的知识卡片。

    在深度问答应用中,系统同样会首先在知识图谱的帮助下对用户使用自然语言提出的问题进行语义分析和语法分析,进而将其转化成结构化形式的查询语句,然后在知识图谱中查询答案。比如,如果用户提问:『如何判断是否感染了埃博拉病毒?』,则该查询有可能被等价变换为『埃博拉病毒的症状有哪些?』,然后再进行推理变换,最终形成等价的三元组查询语句,如(埃博拉,症状,?)和(埃博拉,征兆,?)等。如果由于知识库不完善而无法通过推理解答用户的问题,深度问答系统还可以利用搜索引擎向用户反馈搜索结果,同时根据搜索结果更新知识库,从而为回答后续的提问提前做出准备。

    10. DeepDive使用


    DeepDive (http://deepdive.stanford.edu/) 是斯坦福大学开发的信息抽取系统,能处理文本、表格、图表、图片等多种格式的无结构数据,从中抽取结构化的信息。系统集成了文件分析、信息提取、信息整合、概率预测等功能。Deepdive的主要应用是特定领域的信息抽取,系统构建至今,已在交通、考古、地理、医疗等多个领域的项目实践中取得了良好的效果;在开放领域的应用,如TAC-KBP竞赛、维基百科的infobox信息自动增补等项目中也有不错的表现。

    deepdive是由斯坦福大学InfoLab实验室开发的一个开源知识抽取系统,开源地址:

    https://github.com/HazyResearch/deepdive

    本文用的支持中文的deepdive来自于http://www.openkg.cn/dataset/cn-deepdive,修改了自然语言处理的model包,使它支持中文。

     DeepDive的数据(包括输入,输出,中间media)全都存在关系数据库中,支持数据库类型:postgresql(建议)、mysql、postgresql-xl、greenplum

    DeepDive的系统架构如下图所示,大致分为数据处理、数据标注、学习推理和交互迭代四个流程:

    11. 知识图谱构建流程
    知识图谱的架构,包括知识图谱自身的逻辑结构以及构建知识图谱所采用的技术(体系)结构。

    知识图谱的逻辑结构分为两个层次:数据层和模式层。

    在知识图谱的数据层,知识以事实(fact)为单位存储在图数据库。如果以『实体-关系-实体』或者『实体-属性-值』三元组作为事实的基本表达方式,则存储在图数据库中的所有数据将构成庞大的实体关系网络,形成知识的图谱。

    模式层在数据层之上,是知识图谱的核心,在模式层存储的是经过提炼的知识,通常采用本体库来管理知识图谱的模式层,借助本体库对公理、规则和约束条件的支持能力来规范实体、关系以及实体的类型和属性等对象之间的联系。本体库在知识图谱中的地位相当于知识库的模具,拥有本体库的知识库冗余知识较少

    举例:

    模式层:实体-关系-实体;实体-属性-性值

    数据层:比尔盖茨-配偶-梅琳达;比尔盖茨-总裁-微软

    知识图谱有自顶向下和自底向上2种构建方式。所谓自顶向下构建是借助百科类网站等结构化数据源,从高质量数据中提取本体和模式信息,加入到知识库中;所谓自底向上构建,则是借助一定的技术手段,从公开采集的数据中提取出资源模式,选择其中置信度较高的新模式,经人工审核之后,加入到知识库中。 

    目前知识图谱大多采用自底向上的方式构建,本文也主要介绍自底向上的知识图谱构建技术,按照知识获取的过程分为3个层次:信息抽取、知识融合以及知识加工。

    2.1 知识图谱的构建技术
    采用自底向上的方式构建知识图谱的过程是一个迭代更新的过程,每一轮更新包括3个步骤:

    信息抽取,即从各种类型的数据源中提取出实体(概念)、属性以及实体间的相互关系,在此基础上形成本体化的知识表达
    知识融合,在获得新知识后,需要对其进行整合,以消除矛盾和歧义,比如某些实体可能有多种表达,某个特定称谓也许对应于多个不同的实体等
    知识加工,对于经过融合的新知识,需要经过质量评估之后(部分需要人工参与甄别),才能将合格的部分加入到知识库中,以确保知识库的质量,新增数据之后,可以进行知识推理、拓展现有知识、得到新知识
    2.1.1 信息抽取
    信息抽取是知识图谱构建的第一步,其中的关键问题是如何从异构数据源中自动抽取信息得到候选知识单元。信息抽取是一种自动化地从半结构化和无结构数据中抽取实体、关系以及实体属性等结构化信息的技术。涉及的关键技术包括:命名实体识别、关系抽取和属性抽取。

    1. 命名实体识别(实体抽取)

    命名实体识别(named entity recognition,NER)也称实体抽取,是指从文本数据集中自动识别出命名实体。实体抽取的质量(准确率和召回率)对后续的知识获取效率和质量影响极大,因此是信息抽取中最为基础和关键的部分。

    2012年Ling等人归纳出112种实体类别,并基于条件随机场CRF进行实体边界识别,最后采用自适应感知机算法实现了对实体的自动分类,取得了不错的效果。

    但是随着互联网中内容的动态变化,采用人工预定义实体分类体系的方式已经很难适应时代的需求,因此提出了面向开放域的实体识别和分类研究。

    在面向开放域的实体识别和分类研究中,不需要(也不可能)为每个领域或者每个实体类别建立单独的语料库作为训练集。因此,该领域面临的主要挑战是如何从给定的少量实体实例中自动发现具有区分力的模型。

    一种思路是根据已知的实体实例进行特征建模,利用该模型处理海量数据集得到新的命名实体列表,然后针对新实体建模,迭代地生成实体标注语料库。

    另一种思路是利用搜索引擎的服务器日志,事先并不给出实体分类等信息,而是基于实体的语义特征从搜索日志中识别出命名实体,然后采用聚类算法对识别出的实体对象进行聚类。

    2. 关系抽取

    文本语料经过实体抽取,得到的是一系列离散的命名实体,为了得到语义信息,还需要从相关的语料中提取出实体之间的关联关系,通过关联关系将实体(概念)联系起来,才能够形成网状的知识结构,研究关系抽取技术的目的,就是解决如何从文本语料中抽取实体间的关系这一基本问题。

    早期的关系抽取研究方法主要是通过人工构造语法和语义规则。随后,出现了大量基于特征向量或者核函数的有监督学习方法,关系抽取的准确性也不断提高。但以上研究成果的共同特点是需要预先定义实体关系类型,如雇佣关系、整体部分关系以及位置关系等。

    与之相对的,Banko等人提出了面向开放域的信息抽取方法框架(open information extraction,OIE),并发布了基于自监督(self-supervised)学习方式的开放信息抽取原型系统(TextRunner),该系统采用少量人工标记数据作为训练集,据此得到一个实体关系分类模型,再依据该模型对开放数据进行分类,依据分类结果训练朴素贝叶斯模型来识别『实体-关系-实体』三元组,经过大规模真实数据测试,取得了显著优于同时期其他方法的结果。

    TextRunner系统中错误的部分主要是一些无意义或者不和逻辑的实体关系三元组,据此引入语法限制条件和字典约束,采用先识别关系指示词,然后再对实体进行识别的策略,有效提高了关系识别准确率。

    研究历程简单总结:

    人工构造语法和语义规则--模式匹配
    统计机器学习方法
    基于特征向量或核函数的有监督方法
    研究重点转向半监督和无监督
    开放领域的信息抽取
    将面向开放域的信息抽取方法和面向封闭领域的传统方法结合
    3. 属性抽取

    属性抽取的目标是从不同信息源中采集特定实体的属性信息。例如针对某个公众人物,可以从网络公开信息中得到其昵称、生日、国籍、教育背景等信息。属性抽取技术能够从多种数据来源中汇集这些信息,实现对实体属性的完整勾画。

    由于可以将实体的属性视为实体与属性值之间的一种名词性关系,因此也可以将属性抽取问题视为关系抽取问题。

    百科类网站提供的半结构化数据是当前实体属性抽取研究的主要数据来源。但是还有大量的实体属性数据隐藏在非结构化的公开数据中。

    一种解决方案是基于百科类网站的半结构化数据,通过自动抽取生成训练语料,用于训练实体属性标注模型,然后将其应用于对非结构化数据的实体属性抽取;

    另一种方案是采用数据挖掘的方法直接从文本中挖掘实体属性与属性值之间的关系模式,据此实现对属性名和属性值在文本中的定位。这种方法的基本假设是属性名和属性值之间在位置上有关联关系,事实上在真实语言环境中,许多实体属性值附近都存在一些用于限制和界定该属性值含义的关键词(属性名),在自然语言处理技术中将这类属性称为有名属性,因此可以利用这些关键字来定位有名属性的属性值。

    2.2 知识融合
    通过信息抽取,实现了从非结构化和半结构化数据中获取实体、关系以及实体属性信息的目标,然而,这些结果中可能包含大量的冗余和错误信息,数据之间的关系也是扁平化的,缺乏层次性和逻辑性,因此有必要对其进行清理和整合。知识融合包含2部分内容:实体链接和知识合并。

    2.2.1 实体链接
    实体链接(entity linking)是指对于从文本中抽取得到的实体对象,将其链接到知识库中对应的正确实体对象的操作。

    实体链接的基本思想是首先根据给定的实体指称项,从知识库中选出一组候选实体对象,然后通过相似度计算将指称项链接到正确的实体对象。

    实体链接的一般流程是:

    从文本中通过实体抽取得到实体指称项
    进行实体消歧和共指消解,判断知识库中的同名实体与之是否代表不同的含义,以及知识库中是否存在其他命名实体与之表示相同的含义
    在确认知识库中对应正确实体对象之后,将该实体指称链接到知识库中对应实体
    实体消歧是专门用于解决同名实体产生歧义问题的技术,通过实体消歧,就可以根据当前的语境,准确建立实体链接,实体消歧主要采用聚类法。其实也可以看做基于上下文的分类问题,类似于词性消歧和词义消歧。

    共指消解技术主要用于解决多个指称对应同一实体对象的问题。在一次会话中,多个指称可能指向的是同一实体对象。利用共指消解技术,可以将这些指称项关联(合并)到正确的实体对象,由于该问题在信息检索和自然语言处理等领域具有特殊的重要性,吸引了大量的研究努力。共指消解还有一些其他的名字,比如对象对齐、实体匹配和实体同义。

    共指消解问题的早期研究成果主要来自自然语言处理领域,近年来统计机器学习领域的学者越来越多的参与到这项工作中。

    基于自然语言处理的共指消解是以句法分析为基础的,代表方法是Hobbs算法和向心理论(centering theory)。Hobbs算法是最早的代词消解算法之一,主要思路是基于句法分析树进行搜索,因此适用于实体与代词出现在同一句子中的场景,有一定的局限性。

    向心理论的基本思想是:将表达模式(utterance)视为语篇(discourse)的基本组成单元,通过识别表达式中的实体,可以获得当前和后续语篇中的关注中心(实体),根据语义的局部连贯性和显著性,就可以在语篇中跟踪受关注的实体。

    随着统计机器学习方法被引入该领域,共指消解技术进入了快速发展阶段,McCarthy等人首次将C4.5决策树算法也被应用于解决共指消解问题。

    除了将共指消解问题视为分类问题之外,还可以将其作为聚类问题来求解。聚类法的基本思想是以实体指称项为中心,通过实体聚类实现指称项与实体对象的匹配。其关键问题是如何定义实体间的相似性测度。Turney基于点互信息来求解实体所在文档的相似度,能够有效的实现共指消解。

    基于统计机器学习的共指消解方法通常受限于2个问题:训练数据的(特征)稀疏性和难以在不同的概念上下文中建立实体关联。为解决该问题,Pantel等人基于Harris提出的分布相似性模型,提出了一个新的实体相似性测度模型,称为术语相似度(term similarity),借助该模型可以从全局语料中得到所有术语间的统计意义上的相似性,据此可以完成实体合并,达到共指消解的目的

    2.3 知识合并
    在构建知识图谱时,可以从第三方知识库产品或已有结构化数据获取知识输入。

    常见的知识合并需求有两个,一个是合并外部知识库,另一个是合并关系数据库。

    将外部知识库融合到本地知识库需要处理两个层面的问题:

    数据层的融合,包括实体的指称、属性、关系以及所属类别等,主要的问题是如何避免实例以及关系的冲突问题,造成不必要的冗余
    通过模式层的融合,将新得到的本体融入已有的本体库中
    然后是合并关系数据库,在知识图谱构建过程中,一个重要的高质量知识来源是企业或者机构自己的关系数据库。为了将这些结构化的历史数据融入到知识图谱中,可以采用资源描述框架(RDF)作为数据模型。业界和学术界将这一数据转换过程形象地称为RDB2RDF,其实质就是将关系数据库的数据换成RDF的三元组数据。

    2.4 知识加工
    通过信息抽取,可以从原始语料中提取出实体、关系与属性等知识要素,再经过知识融合,可以消除实体指称项与实体对象之间的歧义,得到一系列基本的事实表达。然而事实本身并不等于知识,要想最终获得结构化,网络化的知识体系,还需要经历知识加工的过程。知识加工主要包括3方面内容:本体构建、知识推理和质量评估。

    2.4.1 本体构建
    本体(ontology)是对概念进行建模的规范,是描述客观世界的抽象模型,以形式化的方式对概念及其之间的联系给出明确定义。本体最大的特点在于它是共享的,本体反映的知识是一种明确定义的共识。如:“人”、“事”、“物”

    本体是同一领域内的不同主体之间进行交流的语义基础。本体是树状结构,相邻层次的节点(概念)之间有严格的『IsA』关系。在知识图谱中,本体位于模式层,用于描述概念层次体系,是知识库中知识的概念模板。

    本体可以采用人工编辑的方式手动构建(借助本体编辑软件),因为人工方式工作量巨大,且很难找到具备专业知识领域的人才,故,也可以以数据驱动的自动化方式构建本体,其包含3个阶段:

    实体并列关系相似度计算,适用于考察任意给定的两个实体在多大程度上属于同一概念分类的指标测度,相似度越高,表明这2个实体越有可能属于同一语义类别。所谓并列关系,是相对于纵向的概念隶属关系而言的;当前主流的实体并列关系相似度计算方法有两种:模式匹配法和分布相似度。其中,模式匹配法采用预先定义实体对模式的方法,通过模式匹配取得给定关键字组合在同一语料单位中共同出现的频率,据此计算实体对之间的相似度。分布相似度方法的前提假设是:在相似的上下文管径中频繁出现的实体之间具有语义上的相似性。
    实体上下位关系抽取,是用于确定概念之间的隶属(IsA)关系,这种关系也称为上下位关系。实体上下位关系抽取是该领域的研究重点,主要的研究方法是基于语法模式(如Hearst模式)抽取IsA实体对。也有方法利用概率模型判定IsA关系和区分上下位词,通常会借助百科类网站提供的概念分类知识来帮助训练模型,以提高算法精度。
    本体的生成,主要任务是对各层次得到的概念进行聚类,并对其进行语义类的标定,为该类的中的实体指定1个或多个公共上位词。
    举例,实体:百度、腾讯、阿里、无人车;当仅仅得到这四个实体时,四者并无任何区别,但进过计算四者之间的形似度后,发现:百度、阿里、腾讯,三者相似度较高,而他们与无人车差别较大;第二步,相似度计算后,发现实体之间的相似度不同,但无上下位差异,所以需要上下位关系抽取后,生成本体,发现:百度、阿里、腾讯对应本体:公司,无人车对应本体:交通工具;他们不属于一类。

    2.4.2 知识推理
    知识图谱之间大多数关系都是残缺的,缺失值非常严重,知识推理是指从知识库中已有的实体关系数据出发,进行计算机推理,建立实体间的新关联,从而拓展和丰富知识网络。知识推理是知识图谱构建的重要手段和关键环节,通过知识推理,能够从现有知识中发现新的知识。假设,A的孩子Z,B有孩子Z,那么A,B的关系很有可能是配偶关系

    知识推理的对象也并不局限于实体间的关系,也可以是实体的属性值,本体的概念层次关系等。

    知识的推理方法可以分为2大类:基于逻辑的推理和基于图的推理。

    基于逻辑的推理主要包括一阶逻辑谓词、描述逻辑以及基于规则的推理。

    一阶谓词逻辑建立在命题的基础上,在一阶谓词逻辑中,命题被分解为个体(individuals)和谓词(predication)2部分。个体是指可独立存在的客体,可以是一个具体的事物,也可以是一个抽象的概念。谓词是用来刻画个体性质及事物关系的词。比如(A,friend,B)就是表达个体A和B关系的谓词。

    对于复杂的实体关系,可以采用描述逻辑进行推理。描述逻辑(description logic)是一种基于对象的知识表示的形式化工具,是一阶谓词逻辑的子集,它是本体语言推理的重要设计基础。

    基于规则的推理可以利用专门的规则语言,如SWRL(semantic Web rule language)。

    基于图的推理方法主要基于神经网络模型或Path Ranking算法。Path Ranking算法的基本思想是将知识图谱视为图(以实体为节点,以关系或属性为边),从源节点开始,在图上执行随机游走,如果能够通过一个路径到达目标节点,则推测源和目的节点可能存在关系。

    2.5 质量评估
    质量评估也是知识库构建技术的重要组成部分。其意义在于:可以对知识的可信度进行量化,通过舍弃置信度较低的知识,可以保障知识库的质量。

    2.6 知识更新
    从逻辑上看,知识库的更新包括概念层的更新、数据层的更新

    概念层的更新是指新增数据后获得了新的概念,需要自动将新的概念添加到知识库的概念层中
    数据层的更新主要是新增或更新实体、关系、属性值,对数据层进行更新需要考虑数据源的可靠性、数据的一致性(是否存在矛盾或冗杂等问题)等可靠数据源,并选择在各数据源中出现频率高的事实和属性加入知识库。
    知识图谱的内容更新有两种方式:

    全面更新:指以更新后的全部数据为输入,从零开始构建知识图谱。这种方法比较简单,但资源消耗大,而且需要耗费大量人力资源进行系统维护;
    增量更新:以当前新增数据为输入,向现有知识图谱中添加新增知识。这种方式资源消耗小,但目前仍需要大量人工干预(定义规则等),因此实施起来十分困难。
     

    参考文献:

    [1] 刘峤, 李杨, 段宏,等. 知识图谱构建技术综述[J]. 计算机研究与发展, 2016, 53(3):582-600.

    https://www.jianshu.com/p/4f09043e22ea

    https://zhuanlan.zhihu.com/p/38593276

    https://www.cnblogs.com/huangyc/p/10043749.html

    展开全文
  • 理论物理

    千次阅读 2008-07-25 18:09:00
    一、学科概况 理论物理是从理论上探索自然界未知的...博士学位应具备坚实的理论物理基础和广博的现代物理知识,了解理论物理学科的现状及发展方向,有扎实的数学基础,熟练掌握现代计算技术,能应用现代理论物理方法处
  • 谈谈系统分析员的知识结构

    千次阅读 2004-07-03 12:31:00
    一、系统分析员应具备的知识结构 系统分析员应该既是信息系统专家,又是企业管理专家,同时还应该是优秀的领导者。 系统分析员应该具有的...其次,应该具有经济管理或企业管理方面较丰富的理论知识和实践经验;同时应该
  • Java面试知识

    千次阅读 2017-02-22 13:50:09
    学习就要一步一个脚印,才会扎实。 1、Java运行机制 Java程序的执行过程,必须经过先编译,后解释两个步骤。Java代码使用javac编译生成.class文件(字节码文件),交给JVM进行解析执行。 2...
  • 表中的每个单元格值都具有时间戳。 总之,在一个 HBase: 表是行的集合、行是列族的集合、列族是列的集合、列是键值对的集合。 关于 Hbase 你需要掌握: Hbase 的架构和原理 Hbase 的读写流程 Hbase 有没有并发问题...
  • 算法不扎实的程序员,每个都很慌

    千次阅读 2019-03-25 16:24:23
    算法能力的考察,向来是顶级科研机构和IT公司面试时最具备区分度的成分,算法功夫扎实,提升面试效率。 算法长期以来被视作是聪明人的专利,好像有些人天生思路就开阔,遇到问题能马上整理出计算模型,然后实施巧思...
  • 基于“把点开活”的面试理论

    千次阅读 2018-10-08 17:30:41
    有关面试理论、方法和技巧的箴言与流言浩如烟海,我大概看了看,发现它们都犯了一个共同的错误——对付面试,最重要的能力,不是表现自我,而是 “把点开活”。 把点开活,原来是相声表演的技巧:以前撂地的相声...
  • 知识图谱技术综述

    千次阅读 2019-09-06 10:04:10
    知识图谱技术综述[J]. 电子科技大学学报自然版, 2016, 45(4): 589-606. XU Zeng-lin, SHENG Yong-pan, HE Li-rong, WANG Ya-fang. Review on Knowledge Graph Techniques[J]. Journal of University of Elec...
  • 关键词:基于行为的学习,基于知识的学习,商业智能,工业4.0,知识图谱,企业图谱, 图数据库, 图计算引擎, 数据可视化应用场景:征信、风控、问答、医疗、能源、舆情、反欺诈、市场营销、社...
  • SLA理论学习讨论

    热门讨论 2018-01-07 20:56:19
    一直以来英语学习虽然知道我们...扎实的地基可以让我们今后的高楼更加的稳固,文档内容已经看过不知几遍了,但是真正理解的内容还好像停留在初次学习的感受中,对于这样学习的好处过程,却有些模糊不清。这一周的研究学
  • 专业扎实:专业书本(textbook)一般是讲广泛接受的、陈旧的知识。这个知识肯定要懂,而且对一些数据、公式、或者专业常识能做到非常熟练。我不喜欢看专业书本,只是把它们当作参考书籍,因为个人认为它们对激发自己的...
  • 软件测试基础知识整理

    万次阅读 多人点赞 2018-06-05 13:54:50
    一、软件测试工程师须知良好的沟通和表达能力具有怀疑与破坏的精神扎实的软件测试基础知识缜密的业务逻辑分析能力处在用户的角度进行换位思考足够的耐心、细心、信心、责任心积极乐观向上的心态和团队协作能力要有...
  • 小白入门知识图谱构建与应用

    千次阅读 2019-12-15 21:33:23
    文章从知识图谱的概念和技术架构出发,综述知识图谱构建的关键技术,包括知识抽取、知识表示、知识融合、知识推理四大主要内容。同时,对于知识图谱的当下的现实应用作进一步阐述。 目录 1知识...
  • 5.2 我们要什么样的知识和能力结构? 计算学科的方向 计算机类专业培养什么样的人才 设计自己的学习内容  5.2 我们要什么样的知识和能力结构? 学习了计算机类专业,这只是一个大体的分类。在专业内分工渐细...
  • 知乎上的一个问题“2019年秋招的AI岗位竞争激烈吗”得到了330万人次的浏览,整理200多个有效回答,发现理论基础扎实的毕业生才更能受到企业青睐,只会跑几个项目代码的成为了重灾区。究其原因,在于企业往往面临不同...
  • 计算机理论奠基名人

    千次阅读 2010-08-11 01:58:00
    一些计算机理论奠基人的简介
  • JAVA相关基础知识 1、面向对象的特征有哪些方面  1.抽象: 抽象就是忽略一个主题中与当前目标无关的那些方面,以便更充分地注意与当前目标有关的方面。抽象并不打算了解全部问题,而只是选择其中的一部分,暂时...
  • 需求说明:IC设计基础 内容 :异步时钟处理 来自 :时间的诗 原文:... 这里我总结一下自己对这个问题的一些了接和认识,希望具有实际项目经验和扎实理论基础的 EE
  • 怎样系统的学习单片机的知识

    千次阅读 2014-12-03 17:29:13
    第一步:基础理论知识学习 基础理论知识包括 模拟电路 、 数字电路 和 C 语言 知识。模拟电路和数字电路属于抽象学科,要把它学好还得费点精神。在你学习单片机之前,觉得模拟电路和数字电路基础不好的话,不要急...
  • 人工智能的风口,入行容易,高薪难真正在行业内能发展得风生水起的,都是有扎实核心能力的,而不是浮于表面之辈。作为AI较热门的两个方向,NLP和机器学习,对以下技能路径和项目实战有所掌握,拿...
  • 机器学习面试知识

    2017-05-12 10:53:05
    最近一直在准备面试,本来自我感觉还是比较良好的,面试几轮下来发现自己的严重不足,主要是机器学习方面的实践不够,理论也不扎实,对于应届生来讲,实践经验缺少很正常,毕竟毕设课题就那么多,刻下自己没有多动手...
  • 计算机科学数学理论

    千次阅读 2011-12-08 11:23:39
    关于数值分析学的一个学习误区就是仅仅学习理论知识,而很难和程序设计结合起来,实际上通过上面的论述,大家已经能够初步地认识到这个学科是应当与程序设计紧密联系才能够体现它的重要性的。关于理论的学习,推荐...
  • 一个技术人的知识管理方法论

    千次阅读 2014-02-07 01:20:29
     本文最早源于一系列关于解决问题方法论的思考,从解决问题的一般原则到探索如何让解决问题依赖知识积累和思维工具而不是偶发灵感.这样关注点逐渐从解决问题演变为个人知识体系的构建和知识的管理.    2009年 ...
  • Java基础知识

    千次阅读 2020-11-30 15:05:33
    前言 有人说, 有些面试题很变态,个人认为其实是因为我们基础不扎实或者没有深入。本篇文章来自一位很资深的前辈对于最近java面试题目所做的总结归纳,有170道题目 ,知识面很广 ,而且这位前辈对于每个题都自己测试...
  • PHP基础知识系统复习

    千次阅读 2016-06-29 19:44:34
    本文可以作为一篇自我考察的指导,看看自己在基础方面,是否都扎实的掌握了。如果你已经会了,温故而知新,也总是一个好习惯。 本文速读: 1. PHP编码 2. 数据库 3. linux基础 4. 网络基础 5. 服务器基础 正文:...
  • 经过很多个很多个夜晚,编辑了很多个很多个公式,理顺了很多个很多个射频知识点的重要内容,具有一定的参考价值。

空空如也

空空如也

1 2 3 4 5 ... 20
收藏数 12,921
精华内容 5,168
关键字:

具有扎实的理论知识