精华内容
下载资源
问答
  • 平均值的增长率:多个周期数据,计算平均值,然后根据平均值计算增长率。 增长率平均值:增长率加和的平均 平均增长率:增长率乘积的开方 结论:数据趋势稳定,具体那种方法计算增长率,差异并不大。 ...

    在这里插入图片描述

    在这里插入图片描述

    在这里插入图片描述
    在这里插入图片描述

    平均值的增长率:多个周期数据,计算平均值,然后根据平均值计算增长率。
    增长率平均值:增长率加和的平均
    平均增长率:增长率乘积的开方

    结论:数据趋势稳定,具体那种方法计算增长率,差异并不大。

    展开全文
  • matlab人脸识别论文

    万次阅读 多人点赞 2019-10-11 17:41:51
    再由PCA算法对人脸图像进行主成分特征提取,进--步降低图像数据的处理;最后使用经过训练后的BP神经网络对待测人脸进行分类识别。详细介绍了离散小波变换PCA特征提取以及BP神经网络分类设计。通过系统仿真实验与分析...

    摘 要

     本文设计了一种基于BP神经网络的人脸识别系统,并对其进行了性能分析。该系统首先利用离散小波变换获取包含人脸图像大部分原始信息的低频分量,对图像数据进行降维;再由PCA算法对人脸图像进行主成分特征提取,进--步降低图像数据的处理量;最后使用经过训练后的BP神经网络对待测人脸进行分类识别。详细介绍了离散小波变换PCA特征提取以及BP神经网络分类设计。通过系统仿真实验与分析发现:人脸特征的提取是该系统的关键;同时,由于人脸灰度信息的统计特征与有监督训练BP神经网络分类器,使该系统只在固定类别,并且光照均匀的人脸识别应用场景中具有较高的识别准确率。因此,很难在复杂环境中应用。
    

    关键词:人脸识别;人工神经网络;离散小波变换; PCA; BP神经网络
    Abstract
    In this paper, a face recognition system based on BP neural network is designed and its performance is analyzed. The system first uses discrete wavelet transform to obtain the low-frequency components which contain most of the original information of the face image, and then uses PCA algorithm to extract the principal component features of the face image, progressively reducing the processing capacity of the image data. Finally, the trained BP neural network is used to classify and recognize the tested face. Discrete wavelet transform PCA feature extraction and BP neural network classification design are introduced in detail. Through the system simulation experiment and analysis, it is found that the extraction of facial features is the key of the system. At the same time, because of the statistical features of gray information and the supervised training of BP neural network classifier, the system only has a high recognition accuracy in fixed categories and uniform illumination of face recognition application scenarios. Therefore, it is difficult to apply in complex environment.

    Key words: face recognition; artificial neural network; discrete wavelet transform; PCA; BP neural network
    1绪论

      人脸识别是模式识别研究的一个热点,它在身份鉴别、信用卡识别,护照的核对及监控系统等方面有着I泛的应用。人脸图像由于受光照、表情以及姿态等因索的影响,使得同一个人的脸像矩阵差异也比较大。因此,进行人脸识别时,所选取的特征必须对上述因素具备-一定的稳定性和不变性。主元分析(PCA)方法是一种有效的特征提取方法,将人脸图像表示成一一个列向量,经过PCA变换后,不仅可以有效地降低其维数,同时又能保留所需要的识别信息,这些信息对光照、表情以及姿态具有一定的不敏感性。 在获得有效的特征向量后,关键问题是设计具有良好分类能力和鲁棒性的分类器、支持向量机(SVI )模式识别方法,兼顾调练误差和泛化能力,在解决小样本、非线性及高维模式识别问题中表现出许多特有的优势。
    

    1.1人脸识别技术的细节

    一般来说,人脸识别系统包括图像提取、人脸定位、图形预处理、以及人脸识别(身份确认或者身份查找)。系统输入一般是一张或者一系列含有未确定身份的人脸图像,以及人脸数据库中的若干已知身份的人脸图像或者相应的编码,而其输出则是一系列相似度得分,表明待识别的人脸的身份。
    1.2人脸识别技术的广泛应用

    一项技术的问世和发展与人类的迫切需求是密切相关的,快速发展的社会经济和科学技术使得人类对安全(包括人身安全、隐私保护等)得认识越来越重视。人脸识别得一个重要应用就是人类的身份识别。一-般来说, 人类得身份识别方式分为三类:
    1.特征物品,包括各种证件和凭证,如身份证、驾驶证、房门钥匙、印章等;
    2.特殊知识,包括各种密码、口令和暗号等;

    3.人类生物特征,包括各种人类得生理和行为特征,如人脸、指纹、手形、掌纹、虹膜. DNA、签名、语音等。前两类识别方式属于传统的身份识别技术,其特点是方便、快捷,但致命的缺点是安全性差、易伪造、易窃取。特殊物品可能会丢失、偷盗和复制,特殊知识可以被遗忘、混淆和泄漏。相比较而言,由于生物特征使人的内在属性,具有很强的自身稳定性和个体差异性,因此生物特征是身份识别的最理想依据。基于以上相对独特的生物特征,结合计算机技术,发展了众多的基于人类生物特征的身份识别技术,如DNA识别技术、指纹识别技术、虹膜识别技术、语音识别技术和人脸识别技术等。生物识别技术在上个世纪已经有了- -定得发展,其中指纹识别技术已经趋近成熟,但人脸识别技术的研究还处于起步阶段。指纹、虹膜、掌纹等识别技术都需要被识别者的配合,有的识别技术还需要添置复杂昂贵的设备。人脸识别可以利用已有的照片或是摄像头远距离捕捉图像,无需特殊的采集设备,系统的成本低。并且自动人脸识别可以在当事人毫无觉察的情况下完成身份确认识别工作,这对反恐怖活动有非常重要的意义。基于人脸识别技术具有如此多的优势,因此它的应用前最非常广阔,已成为最具潜力的生物特征识别技术之一
    1.3人脸识别技术的难点

      虽然人类可以毫不困难地根据人脸来辨别一个人,但是利用计算机进行完全自动的人脸识别仍然有许多困难。人脸模式差异性使得人脸识别成为-个非常困难的问题,表现在以下方面:
    
      1.人脸表情复杂,人脸具有多样的变化能力,人的脸上分布着Ii十多块面部肌肉,这些肌肉的运动导致不同面部表情的出现,会造成人脸特征的显著改变。
    
      2.随着年龄而改变,随着年龄的增长,皱纹的出现和面部肌肉的松驰使得人脸的结构和纹理都将发生改变。
    
      3.人脸有易变化的附加物,例如改变发型,留胡须,戴帽子或眼镜等饰物。4.人脸特征遮掩,人脸全部、部分遮掩将会造成错误识别。
    
      5.人脸图像的畸变,由于光照、视角、摄取角度不同,可能造成图像的灰度。
    

    1.4国内外研究状况

    人脸识别是人类视觉最杰出的能力之-。 它的研究涉及模式识别、图像处理、生物学、心理学、认知科学,与基于其它生物特征的身份鉴别方法以及计算机人机感知交互领域都有密切联系。人脸识别早在六七十年代就引起了研究者的强烈兴趣。20世纪60年代,Bledsoe 提出了人脸识别的半自动系统模式与特征提取方法。70年代,美、英等发达国家开始重视人脸识别的研究工作并取得进展。1972 年,Harmon 用交互人脸识别方法在理论上与实践上进行了详细的论述。同年,Sakai 设计了人脸图像自动识别系统。80年代初
    T. Minami 研究出了优于Sakai的人脸图像自动识别系统。但早期的人脸识别一般都需要人的某些先验知识,无法摆脱人的干预。进入九十年代,由于各方面对人脸识别系统的迫切需求,人臉识别的研究变的非常热门。人脸识别的方法有了重大突破,进入了真正的机器自动识别阶段,如Kartbunen-Loeve变换等或新的神经网络技术。人脸识别研究

    得到了前所未有的重视,国际上发表有关人脸识别等方面的论文数量大幅度增加,仅从1990年到2000年之间,sCl 及EI可检索到的相关文献多达数千篇,这期间关于人脸识别的综述也屡屡可见。国外有许多学校在研究人脸识别技术,研究涉及的领域很广。这些研究受到军方、警方及大公司的高度重视和资助,国内的一些知名院校也开始从事人脸识别的研究。

      人脸识别是当前模式识别领域的一个前沿课题,但目前人脸识别尚处于研究课题阶段,尚不是实用化领域的活跃课题。虽然人类可以毫不困难地由人脸辨别一个人,但利用计算机进行完全自动的人脸识别存在许多困难,其表现在:人脸是非刚体,存在表情变化:人脸随年龄增长面变化:发型、眼镜等装饰对人脸造成遮挡:人脸所成图像受光照、成像角度、成像距离等影响。人脸识别的困难还在于图像包括大量的数据,输入的像素可能成百上千,每个像素都含有各自不同的灰度级,由此带来的计算的复杂度将会增加。现有的识别方法中,通过从人脸图像中提取出特征信息,来对数据库进行检索的方法速度快,而利用拓扑属性图匹配来确定匹配度的方法则相对较快。
    

    1.5人脸识别的研究内容

    人脸识别技术(AFR)就是利用计算机技术,根据数据库的人脸图像,分析提取出有效的识别信息,用来“辨认”身份的技术。人脸识别技术的研究始于六十年代末七十年代初,其研究领城涉及图像处理、计算机视觉、模式识别、计算机智能等领城,是伴随着现代化计算机技术、数据库技术发展起来的综合交叉学科。
    1.5.1人脸识别研究内容

      人脸识别的研究范围广义上来讲大致包括以下hi个方面的内容。
    
      1.人脸定位和检测(Face Detection) :即从动态的场景与复杂的背景中检测出人臉的存在并且确定其位置,最后分离出来。这一任务主要受到光照、噪声、面部倾斜以及各种各样遮挡的影响。
    
      2.人脸表征(Face Representation) (也称人脸特征提取) :即采用某种表示方法来表示检测出人脸与数据库中的已知人脸。通常的表示方法包括几何特征(如欧氏距离、曲率、角度)、代数特征(如矩阵特征向量)、固定特征模板等。
    
      3.人脸识别(Face Recogni tion) :即将待识别的人脸与数据库中已知人脸比较,得出相关信息。这一过程的核心是选择适当的人脸表征方法与匹配策略。
    
      4.表情姿态分析(Expression/Gesture Analysis) :即对待识别人脸的表情或姿态信息进行分析,并对其加以归类。
    
    
      5.生理分类(Physical Classi fication) :即对待识别人脸的生理特征进行分析,得出其年龄、性别等相关信息,或者从几幅相关的图像推导出希望得到的人脸图像,如从父母图像推导出孩子脸部图像和基于年龄增长的人脸图像估算等。
    
      人臉识别的研究内容,从生物特征技术的应用前景来分类,包括以下两个方面:人脸验证与人脸识别。
    
      1.人脸验证((Face Veri ficat ion/Authenticat ion):即是回答“是不是某人?"的问题.它是给定一幅待识别人脸图像,判断它是否是某人的问题,属于一对一的两类模式分类问题,主要用于安全系统的身份验证。
    
      2.人脸识别(Face 。Recognition) :即是回答“是谁”的问题。它是给定-幅待识别人脸图像,再已有的人脸数据库中,判断它的身份的问题。它是个“-对多”的多类模式分类问题,通常所说的人脸识别即指此类问题,这也是本文的主要研究内容。
    

    1.5.2人脸识别系统的组成

      在人脸识别技术发展的几十年中,研究者们提出了多种多样的人脸识别方法,但大部分的人脸识别系统主要由三部分组成:图像预处理、特征提取和人脸的分类识别。一个完整的自动人脸识别系统还包括人脸检测定位和数据库的组织等模块,如图1.1.其中人脸检测和人脸识别是整个自动人脸识别系统中非常重要的两个环节,并且相对独立。下面分别介绍这两个环节。
    

    人脸检测与定位,检测图像中是否由人脸,若有,将其从背景中分割出来,并确定其在图
    像中的位置。在某些可以控制拍摄条件的场合,如警察拍罪犯照片时将人脸限定在标尺内,此时人脸的定位很简单。证件照背景简单,定位比较容易。在另一些情况下,人脸在图像
    中的位置预先是未知的,比如在复杂背景下拍摄的照片,这时人脸的检测与定位将受以下因素的影响: :

      1.人脸在图像中的位置、角度、不固定尺寸以及光照的影响:
    
      2.发型、眼睛、胡须以及人脸的表情变化等,3.图像中的噪声等。
    
      特征提取与人脸识别,特征提取之前一般都要敌几何归一化和灰度归一化的工作。前者指根据人脸定位结果将图像中的人脸变化到同一位置和大小:后者是指对图像进行光照补偿等处理,以克服光照变化的影响,光照补偿能够一定程度的克服光照变化的影响而提高识别率。提取出待识别的人脸特征之后,即进行特征匹配。这个过程是一对多或者一对一的匹配过程,前者是确定输入图像为图象库中的哪一个人(即人脸识别),后者是验证输入图像的人的身份是否属实(人脸验证).  
    

    以上两个环节的独立性很强。在许多特定场合下人脸的检测与定位相对比较容易,因此“特征提取与人脸识别环节”得到了更广泛和深入的研究。近几年随着人们越来越关心各种复杂的情形下的人臉自动识别系统以及多功能感知研究的兴起,人脸检测与定位才作为一个独立的模式识别问题得到了较多的重视。本文主要研究人脸的特征提取与分类识别的问题。

    2基于bp神经网络的人脸识别算法

      虽然人脸识别方法的分类标准可能有所不同,但是8前的研究主要有两个方向,一类是从人脸图像整体(Holistic Approaches)出发,基于图像的总体信息进行分类识别,他重点考虑了模式的整体属性,其中较为著名的方法有:人工神经网络的方法、统计模式的方法等。另一类是基于提取人脸图像的几何特征参数(Feature-Based Approaches), 例如眼、嘴和鼻子的特征,再按照某种距离准则进行分类识别。这种方法非常有效,因为人脸不是刚体,有着复杂的表情,对其严格进行特征匹配会出现困难。面分别介绍- -些常 用的方法,前两种方法属于从图像的整体方面进行研究,后三种方法主要从提取图像的局部特征讲行研究。
    
    
      2.1基于特征脸的方法
    

    特征脸方法(cigenface)是从生元分析方法PCA c Principal ComponentAnalysis 导出的一种人脸分析识别方法,它根据一-组人脸图像构造主元子空间,由于主元具有人脸的形状也称作特征脸。识别时将测试图像投影到主元子空间上得到了-组投影系数,然后和各个已知人的人脸图像进行比较识别,取得了很好的识别效果。在此基础上出现了很多特征脸的改进算法。

      特征脸方法原理简单、易于实现,它把人脸作为一个整体来处理,大大降低了识别复杂度。但是特征脸方法忽视了人脸的个性差异,存在着一定的理论缺陷。研究表明:特征脸方法随光线角度及人脸尺寸的影响,识别率会有所下降。
    

    2.2基于bp神经网络的方法

    一、实验要求采用三层前馈BP神经网络实现标准人脸YALE数据库的识别,编程语言为C系列语言。
    二、BP神经网络的结构和学习算法实验中建议采用如下最简单的三层BP神经网络,输入层为,有n个神经元节点,输出层具有m个神经元,网络输出为,隐含层具有k个神经元,采用BP学习算法训练神经网络。BP神经网络的结构BP网络在本质上是一种输入到输出的映射,它能够学习大量的输入与输出之间的映射关系,而不需要任何输入和输出之间的精确的数学表达式,只要用已知的模式对BP网络加以训练,网络就具有输入输出对之间的映射能力。BP网络执行的是有教师训练,其样本集是由形如(输入向量,期望输出向量)的向量对构成的。在开始训练前,所有的权值和阈值都应该用一些不同的小随机数进行初始化。BP算法主要包括两个阶段:

    2.2.1向前传播阶段

    ①从样本集中取一个样本(Xp,Yp),将Xp输入网络,其中Xp为输入向量,Yp为期望输出向量。
    ②计算相应的实际输出Op。在此阶段,信息从输入层经过逐级的变换,传送到输出层。这个过程也是网络在完成训练后正常运行时执行的过程。在此过程中,网络执行的是下列运算:

    (2) 向后传播阶段
    ①计算实际输出Op与相应的理想输出Yp的差;
    ②按极小化误差的方法调整权矩阵。这两个阶段的工作一般应受到精度要求的控制

    (1)作为网络关于第p个样本的误差测度(误差函数)。

    (2)如前所述,之所以将此阶段称为向后传播阶段,是对应于输入信号的正常传播而言的,也称之为误差传播阶段。为了更清楚地说明本文所使用的BP网络的训练过程,首先假设输入层、中间层和输出层的单元数分别是N、L和M。X=(x0,x1,…,xN-1)是加到网络的输入矢量,H=(h0,h1,…,hL-1)是中间层输出矢量,Y=(y0,y1,…,yM-1)是网络的实际输出矢量,并且用D=(d0,d1,…,dM-1)来表示训练组中各模式的目标输出矢量。输出单元i到隐单元j的权值是Vij,而隐单元j到输出单元k的权值是Wjk。另外用θk和Φj来分别表示输出单元和隐单元的阈值。于是,中间层各单元的输出为:

    (3)而输出层各单元的输出是:

    其中f(*)是激励函数,采用S型函数:

    2.2.2在上述条件下,网络的训练过程如下:

    (1) 选定训练集。由相应的训练策略选择样本图像作为训练集。
    (2) 初始化各权值Vij,Wjk和阈值Φj,θk,将其设置为接近于0的随机值,并初始化精度控制参数ε和学习率α。
    (3) 从训练集中取一个输入向量X加到网络,并给定它的目标输出向量D。
    (4) 利用式(3)计算出一个中间层输出H,再用式(4)计算出网络的实际输出Y。
    (5) 将输出矢量中的元素yk与目标矢量中的元素dk进行比较,计算出M个输出

    误差项:

    对中间层的隐单元也计算出L个误差项:

    (6) 依次计算出各权值和阈值的调整量:

    (8) 当k每经历1至M后,判断指标是否满足精度要求:E≤ε,其中E是总误差函数。

    如果不满足,就返回(3),继续迭代。如果满足,就进入下一步。
    (9) 训练结束,将权值和阈值保存在文件中。这时可以认为各个权值已经达到稳定,分类器形成。再一次进行训练时,直接从文件导出权值和阈值进行训练,不需要进行初始化。

    YALE数据库是由耶鲁大学计算视觉与扼制中心创立,包括15位志愿者,每个人有11张不同姿势、光照和表情的图片,共计165张图片,图片均为80*100像素的BMP格式图像。我们将整个数据库分为两个部分,每个人的前5幅图片作为网络的训练使用,后6副图片作为测试使用。测试样例:

    输入输出:

      神经网络在人脸识别应用中有很长的历史。早期用于人脸识别的神经网络主要是Kohonen自联想映射神经网络,用于人脸的“回忆”。所谓“回忆”是指当输入图像上的人脸受噪声污染严重或部分缺损时,能用Kohonen网络恢复出原来完整的人脸。Intrator 等人用一个无监督/监督混合神经网络进行人脸识别。其输入是原始图像的梯度图像,以此可以去除光照的变化。监督学习目的是寻找类的特征,有监督学习的目的是减少训练样本被错分的比例。这种网络提取的特征明显,识别率高,如果用几个网络同时运算,求其平均,识别效果还会提高。
    
      与其他类型的方法相比,神经网络方法在人脸识别上有其独到的优势,它避免了复:杂的特征提取工作,可以通过学习的过程获得其他方法难以实现的关于人脸识别的规律和规则的隐性表达。此外,神经网络以时示方式处理信息,如果能用硬件实现,就能显著提高速度。神经网络方法除了用于人脸识别外,还适用于性别识别、种族识别等。
    

    2.3弹性图匹配法

    弹性图匹配方法是-种基于动态链接结构DLA C Dynamic Link Architecture的方法。它将人脸用格状的稀疏图表示,图中的节点用图像位置的Gabor小波分解得到的特征向量标记,图的边用连接节点的距离向量标记。匹配时,首先J找与输入图像最相似的模型图,再对图中的每个节点位置进行最佳匹配,这样产生-一个变形图,其节点逼近模型图的对应点的位置。弹性图匹配方法对光照、位移、旋转及尺度变化都敏感。此方法的主要缺点是对每个存储的人臉需计算其模型图,计算量大,存储量大。为此,Wiskott 在原有方法的基础上提出聚東图匹配,部分克服了这些缺点。在聚束图中,所有节点都已经定位在相应目标上。对于大量数据库,这样可以大大减少识别时间。另外,利用聚束图还能够匹配小同人的最相似特征,因此可以获得关于未知人的性别、胡须和眼镜等相关信息。
    2.4基于模板匹配的方法
    模板匹配法是一-种经典的模式识别方法,这种方法大多是用归一一化和互相关,直接计算两副图像之间的匹配程度。由于这种方法要求两副图像上的目标要有相同的尺度、取向和光照条件,所以预处理要做尺度归一化和灰度归一化的工作。最简单的人脸模板是将人脸看成-一个椭圆,检测人臉也就是检测图像中的椭圆。另一种方法是将人脸用一-组独立的小模板表示,如眼睛模板、嘴巴模板、鼻子模板、眉毛模板和下巴模板等。但这些模板的获得必须利用各个特征的轮廓,而传统的基于边缘提取的方法很难获得较高的连续边缘。即使获得了可靠度高的边缘,也很难从中自动提取所需的特征量。模板匹配方法在尺度、光照、旋转角度等各种条件稳定的状态下,它的识别的效果优于其它方法,但它对光照、旋转和表情变化比较敏感,影响了它的直接使用。2.5基于人脸特征的方法人脸由眼睛、鼻子、嘴巴、下巴等部件构成,正因为这些部件的形状、大小和结构上的各种差异才使得世界上每个人脸千差万别,因此对这些部件的形状和结构关系的几何描述,可以作为人脸识别的重要特征。几何特征最早是用于人脸检测轮廓的描述与识别,首先根据检测轮廓曲线确定若干显著点,并由这些显著点导出- -组用于识别的特征度量如距离、角度等。采用儿何特征进行正面人脸识别一般是通过提取人眼、口、鼻等重要特征点的位置和眼睛等重要器官的几何形状作为分类特征。
    定位眼睛往往是提取人脸几何特征的第-步。由于眼睛的对称性以及眼珠呈现为低灰度值的圆形,因此在人脸图像清晰瑞正的时候,眼睛的提取是比较容易的。但是如果人脸图像模糊,或者噪声很多,则往往需要利用更多的信息(如眼睛和眉毛、鼻子的相对位置等),而且.这将使得眼睛的定位变得很复杂。而且实际图像中,部件未必轮廓分明,有时人用眼看也只是个大概,计算机提取就更成问题,因而导致描述同-一个人的不同人脸时,其模型参数可能相差很大,面失去识别意义。尽管如此,在正确提取部件以及表情变化微小的前提下,该方法依然奏效,因此在许多方面仍可应用,如对标准身份证照片的应用。

    2.5九个人脸库介绍

    1. FERET人脸数据库
      http://www.nist.gov/itl/iad/ig/colorferet.cfm
      由FERET项目创建,此图像集包含大量的人脸图像,并且每幅图中均只有一个人脸。该集中,同一个人的照片有不同表情、光照、姿态和年龄的变化。包含1万多张多姿态和光照的人脸图像,是人脸识别领域应用最广泛的人脸数据库之一。其中的多数人是西方人,每个人所包含的人脸图像的变化比较单一。

    2. CMU Multi-PIE人脸数据库
      http://www.flintbox.com/public/project/4742/
      由美国卡耐基梅隆大学建立。所谓“PIE”就是姿态(Pose),光照(Illumination)和表情(Expression)的缩写。CMU Multi-PIE人脸数据库是在CMU-PIE人脸数据库的基础上发展起来的。包含337位志愿者的75000多张多姿态,光照和表情的面部图像。其中的姿态和光照变化图像也是在严格控制的条件下采集的,目前已经逐渐成为人脸识别领域的一个重要的测试集合。

    3. YALE人脸数据库(美国,耶鲁大学)
      http://cvc.cs.yale.edu/cvc/projects/yalefaces/yalefaces.html
      由耶鲁大学计算视觉与控制中心创建,包含15位志愿者的165张图片,包含光照、表情和姿态的变化。
      Yale人脸数据库中一个采集志愿者的10张样本,相比较ORL人脸数据库Yale库中每个对象采集的样本包含更明显的光照、表情和姿态以及遮挡变化。

    4. YALE人脸数据库B
      https://computervisiononline.com/dataset/1105138686
      包含了10个人的5850幅在9种姿态,64种光照条件下的图像。其中的姿态和光照变化的图像都是在严格控制的条件下采集的,主要用于光照和姿态问题的建模与分析。由于采集人数较少,该数据库的进一步应用受到了比较大的限制。

    5. MIT人脸数据库
      由麻省理工大学媒体实验室创建,包含16位志愿者的2592张不同姿态(每人27张照片),光照和大小的面部图像。

    6. ORL人脸数据库
      https://www.cl.cam.ac.uk/research/dtg/attarchive/facedatabase.html
      由英国剑桥大学AT&T实验室创建,包含40人共400张面部图像,部分志愿者的图像包括了姿态,表情和面部饰物的变化。该人脸库在人脸识别研究的早期经常被人们采用,但由于变化模式较少,多数系统的识别率均可以达到90%以上,因此进一步利用的价值已经不大。
      ORL人脸数据库中一个采集对象的全部样本库中每个采集对象包含10幅经过归一化处理的灰度图像,图像尺寸均为92×112,图像背景为黑色。其中采集对象的面部表情和细节均有变化,例如笑与不笑、眼睛睁着或闭着以及戴或不戴眼镜等,不同人脸样本的姿态也有变化,其深度旋转和平面旋转可达20度。

    7. BioID人脸数据库
      https://www.bioid.com/facedb/
      包含在各种光照和复杂背景下的1521张灰度面部图像,眼睛位置已经被手工标注。

    8. UMIST图像集
      由英国曼彻斯特大学建立。包括20个人共564幅图像,每个人具有不同角度、不同姿态的多幅图像。

    9. 年龄识别数据集IMDB-WIKI
      https://data.vision.ee.ethz.ch/cvl/rrothe/imdb-wiki/
      包含524230张从IMDB和Wikipedia爬取的名人数据图片。应用了一个新颖的化回归为分类的年龄算法。本质就是在0-100之间的101类分类后,对于得到的分数和0-100相乘,并将最终结果求和,得到最终识别的年龄

    3matlab分析人脸方法介绍
    人脸识别之一:查找图片中的人脸并用方框圈出
    这种类似于智能手机拍照时,屏幕里那个框任务头部的红框。大致步骤为:获取RGB图片—>转换为灰度图像—>图像处理—>人脸识别。代码如下:clear all
    clc

    %获取原始图片
    i=imread(‘face.jpg’);
    I=rgb2gray(i);
    BW=im2bw(I); %利用阈值值变换法将灰度图像转换成二进制图像
    figure(1);
    imshow(BW);
    %最小化背景
    [n1 n2]=size(BW);
    r=floor(n1/10);
    c=floor(n2/10);
    x1=1;x2=r;
    s=r*c;

    for i=1:10
    y1=1;y2=c;
    for j=1:10
    if(y2<=c || y2>=9c) || (x11 || x2r10)
    loc=find(BW(x1:x2,y1:y2)==0);
    [o p]=size(loc);
    pr=o*100/s;
    if pr<=100
    BW(x1:x2,y1:y2)=0;
    r1=x1;r2=x2;s1=y1;s2=y2;
    pr1=0;
    end
    imshow(BW);
    end
    y1=y1+c;
    y2=y2+c;
    end
    x1=x1+r;
    x2=x2+c;
    end
    figure(2)
    subplot(1,2,1);
    imshow(BW)
    title(‘图像处理’);
    %人脸识别
    L=bwlabel(BW,8);
    BB=regionprops(L,‘BoundingBox’);
    BB1=struct2cell(BB);
    BB2=cell2mat(BB1);

    [s1 s2]=size(BB2);
    mx=0;
    for k=3:4:s2-1
    p=BB2(1,k)*BB2(1,k+1);
    if p>mx && (BB2(1,k)/BB2(1,k+1))<1.8
    mx=p;
    j=k;
    end
    end
    subplot(1,2,2);
    title(‘人脸识别’);
    imshow(I);
    hold on;
    rectangle(‘Position’,[BB2(1,j-2),BB2(1,j-1),BB2(1,j),BB2(1,j)],‘EdgeColor’,‘r’)实验效果图:

             从实验效果图中,可以看出红框框出了人脸部分。
    

    人脸识别之二:由输入的人像识别出数据库中人像
    这种情况类似于手机人脸解锁,通过当前的人脸去和保存的人脸做比对来实现解锁等功能;从网上看了好多资料,由于个人能力有限大多都没仿真出来,最后通过学习PCA算法,了解到可通过PCA算法对输入矩阵降维,提取特征值和特征向量的方式来做人脸比对。具体的PCA的东西在这里不作介绍,主要介绍一下如何实现人脸比对。
    大致步骤:制作人脸数据样本—>PCA提取样本数据特征值—>人脸比对1.人脸样本
    从网上搜集了10张人脸图片,来制作成样本。

                         %读取转换10张图片,生成数据矩阵function ImgData = imgdata()  
    

    %导入图片
    picture1 = rgb2gray(imread(‘1.jpg’));
    picture2 = rgb2gray(imread(‘2.jpg’));
    picture3 = rgb2gray(imread(‘3.jpg’));
    picture4 = rgb2gray(imread(‘4.jpg’));
    picture5 = rgb2gray(imread(‘5.jpg’));
    picture6 = rgb2gray(imread(‘6.jpg’));
    picture7 = rgb2gray(imread(‘7.jpg’));
    picture8 = rgb2gray(imread(‘8.jpg’));
    picture9 = rgb2gray(imread(‘9.jpg’));
    picture10 = rgb2gray(imread(‘10.jpg’));
    [m,n] = size(picture1);
    picture_ten = {picture1,picture2,picture3,picture4,picture5,picture6,picture7,picture8,picture9,picture10};
    for i=1:10
    %把mn的矩阵变换成1(mn)的矩阵
    ImgData(i,:) = reshape(picture_ten{i},1,m
    n);
    end
    %数据范围缩小到0到1之间
    ImgData = double(ImgData)/255;

    PCA分析function Cell_ten = PCA(imgdata,k)
    [m,n] = size(imgdata);
    img_mean = mean(imgdata); %计算每列平均值
    img_mean_ten = repmat(img_mean,m,1); %复制m行平均值至矩阵img_mean_ten
    Z = imgdata - img_mean_ten;
    T = Z’Z;%协方差矩阵
    [V,D] = eigs(T,k); %计算T中最大的前k个特征值与特征向量
    img_new = imgdata
    V*D; %低维度下的各个人脸的数据
    Cell_ten = {img_new,V,D};3.通过输入测试人脸从数据库中找到相对应人脸function face= facefind(Cell_ten,testdata)%此函数代码借鉴于他人,还未征求其同意,这里就暂时略过这里testdata是测试图片的数据4.主程序调用img=imgdata(); %图片矩阵数据
    Cell_ten=PCA(img,2);% PCA
    face1=facefind(Cell_ten,imread(‘test.jpg’));%识别
    subplot(1,2,1)
    imshow(‘test.jpg’)
    title(‘测试图像’)
    subplot(1,2,2)
    imshow(strcat(num2str(face1),’.jpg’))
    title(‘数据库图像’)测试效果: 使用这个方式可以实现简单的人脸识别,但精确度不高;

    4 分析算法
    在人脸识别系统中有许多关键环节,其中最重要的莫过于特征提取。利用主成分分析法(PCA)进行特征提取是目前应用最多的提取方法。作为一种科学的统计方法,它在模式识别、信号处理、数字图像处理等等领域都有广泛涉猎。基于PCA中空间原始数据主要特征提取,减少数据冗余的思想,一些在低维特征空间的数据被处理,并合理保留了原始数据中有用的信息,数据空间中维数过高的问题也得以解决。
    4.1  主成分分析的基本原理

    实际上主成分分析就是一种数学降维演算方法,用若干个综合变量来代替原本更多的变量,让这些综合变量尽可能的实现对原有变量信息的取代,并保持彼此之间不存在关联。这种多变量化为少数相互无关的变量且信息量不变的统计分析方法就叫做主成分分析法。
      假设F1表示原变量的首个线性组合所组成的主要成分指标,就有F1=a11X1+a21X2+…ap1Xp。根据这个数学式可知,如果在每一个主成分中提取一个信息量,即可用方差(F1)进行度量,随着方差F1的增大,F1所包含的信息也就越多,同时它的线性组合选取也可表示为X1、X2…XP,它们都被称为方差F1中的第一主成分。如果第一主成分不足以代表原有的P个变量信息时,就可以考虑选取F2,即第二个线性组合,借由它来反映原本的有效信息。在F2中可以不显示第一主成分中已有的信息,以数学语言来表达要求的话即Cov(F1,F2)=0,其中F2为第二主成分。所以按照实际原变量的变化需求,就可以构造出多个主成分指标。
      4.2人脸识别的技术特点

    人脸识别是模式识别中的重要分支,它是指通过计算机系统来分析人脸图像,从中获取有价值的识别信息,从而辨识身份。所以说从技术特点上来看,人脸识别具有以下几个关键特色。
     1、PCA算法
    算法大致步骤:
    设有m条n维数据。
    1)将原始数据按列组成n行m列矩阵X;
    2)将X的每一行(这里是图片也就是一张图片变换到一行)进行零均值化,即减去这一行的均值(样本中心化和标准化);将所有的样本融合到一个矩阵里面特征向量就是变换空间的基向量U=[u1,u2,u3,u4,…],脑袋里面要想到一个样本投影变换就是该空间的一个点,然后对于许多点可以用KNN等不同的方法进行分类。
    3)求出协方差矩阵C=1mXXTC=1mXXT C=\frac {1 }{m } XX^TC=m1XXT;
    4)求出协方差矩阵的特征值及对应的特征向量;
    5)将特征向量按对应特征值大小从上到下按行排列成矩阵,取前k行组成矩阵P;
    6)Y=PXY=PX Y=PXY=PX即为降维到kk kk维后的数据。
      对数据进行中心化预处理,这样做的目的是要增加基向量的正交性,便于高维度向低纬度的投影,即便于更好的描述数据。
      对数据标准化的目的是消除特征之间的差异性,当原始数据不同维度上的特征的尺度不一致时,需要标准化步骤对数据进行预处理,使得在训练神经网络的过程中,能够加速权重参数的收敛。
      过中心化和标准化,最后得到均值为0,标准差为1的服从标准正态分布的数据。
      求协方差矩阵的目的是为了计算各维度之间的相关性,而协方差矩阵的特征值大小就反映了变换后在特征向量方向上变换的幅度,幅度越大,说明这个方向上的元素差异也越大(越有投影的必要,矩阵相乘的过程就是投影),故而选取合适的前k个能以及小的损失来大量的减少元数据的维度。

    2、PCA原理推导
    基于K-L展开的PCA特征提取:

    5.算法优化方法
    我用了三种方法对其进行优化
    1.采用动量梯度下降算法训练 BP 网络。
    训练样本定义如下:
    输入矢量为
    p =[-1 -2 3 1
    -1 1 5 -3]
    目标矢量为 t = [-1 -1 1 1]
    2. 采用贝叶斯正则化算法提高 BP 网络的推广能力。在本例中,我们采用两种训练方法,即 L-M 优化算法(trainlm)和贝叶斯正则化算法(trainbr),用以训练 BP 网络,使其能够拟合某一附加有白噪声的正弦样本数据。其中,样本数据可以采用如下MATLAB 语句生成:
    输入矢量:P = [-1:0.05:1];
    目标矢量:randn(’seed’,78341223);
    T = sin(2piP)+0.1randn(size§);
    3. 采用“提前停止”方法提高 BP 网络的推广能力。对于和例 2相同的问题,在本例中我们将采用训练函数 traingdx 和“提前停止”相结合的方法来训练 BP 网络,以提高 BP 网络的推广能力。在利用“提前停止”方法时,首先应分别定义训练样本、验证样本或测试样本,其中,验证样本是必不可少的。在本例中,我们只定义并使用验证样本,即有
    验证样本输入矢量:val.P = [-0.975:.05:0.975]
    验证样本目标矢量:val.T = sin(2
    pival.P)+0.1randn(size(val.P))
    值得注意的是,尽管“提前停止”方法可以和任何一种 BP 网络训练函数一起使用,但是不适合同训练速度过快的算法联合使用,比如 trainlm 函数,所以本例中我们采用训练速度相对较慢的变学习速率算法 traingdx 函数作为训练函数。
    参考文献

    [1] HongZiquan.AlgbricFeatureExcaciofmftfoReonino[JPatteo Recognition. 1991. 22 (1) :43~44.
    [2] Yuille A L Detcction Templates for Face Recognitio[JCognitive Neuroscience , 1991. 191-200
    [3]卢春雨张长水局城区城特征的快速人脸检测法[D北京:清华大学学报.1999.96 (1) ;4-6.
    [4]陈刚,减飞虎实用人脸识别系统的本征脸法实现[D]2001年5月230():45-46.
    [
    5]杜平,徐大为,刘重庆,基F整体特征的人脸识别方法的研究[12003年6月49 (3) ;382-383.
    [6] Chow G, Li X. Towards A System for Automatic Facial Feature Detctio[U] 1993. 2903)2-3.
    [7]杨变若,王煎法,杨未来人脸全局特iE识别研究[Z]1997年11月3(5):; 871-875.
    [8]边肇棋,张学工阎平凡等模式识别D]北京:清华大学出版社2000 302)16-17.

    致 谢

      从毕业设计的选题到论文的指导到最后定稿,期间遇到了无数的困难和阻碍,也曾想过对自己降低要求,也曾想过放弃最初想要坚持的设计,但是最后在孙老师和同学的鼓励和陪伴下,努力克服了所有的困难,独立完成了毕业设计和论文的书写。尤其是要感射我的论文指导老师孙老师,不厌其烦的对我的设计进行指导修改,耐心的帮助我改进设计帮助我搜集相关的资料,感谢孙老师如母亲--般的关怀,在孙老师身上不仅学习到了对学术严谨的态度,更被孙老师亲切无私的个人魅力所感染。
    
      还要感谢我的同学和其他所有的老师,他们严谨的学术态度,宽容待人严于律己的处世风范都使我受益良多。
    
    展开全文
  • 2019工程伦理慕课答案(2019秋)习题及期末答案

    万次阅读 多人点赞 2019-11-08 18:19:53
    第一章习题(下) 单选题 (1/1 point) 下列哪一项不是工程与技术的区别 内容和性质 目的 活动主体 任务、对象和思维方式 单选题 (1/1 point) 下列哪一项不是工程活动的特征 ...计划、设计、建造...

    第一章~第十章习题(上)及期末考试答案

    下面是第一章~第十章习题答案(下)

    第一章习题(下)

    单选题 (1/1 point)

    下列哪一项不是工程与技术的区别

    • 内容和性质
    • 目的
    • 活动主体
    • 任务、对象和思维方式

    单选题 (1/1 point)

    下列哪一项不是工程活动的特征

    • 自主性
    • 创造性
    • 社会性
    • 确定性

    多选题 (1points)

    下列哪项是工程的完整生命周期中的环节

    • 计划
    • 设计
    • 评估
    • 完成

    判断题 (1/1 point)

    计划、设计、建造、使用和结束构成了工程完整的生命周期

    • 正确
    • 错误

    判断题 (1/1 point)

    工程包括哲学、技术、经济、管理、社会、生态、伦理这7个维度。

    • 正确
    • 错误

    You have used 1 of 1 submissions
    单选题 (1points)

    以下哪项不是规范伦理学的立场

    • 功利论 功利论
    • 义务论
    • 契约论
    • 存在论

    单选题 (1points)

    下列哪项不是罗斯为直觉主义义务论提出的道德原则

    • 忠诚
    • 公平
    • 感恩
    • 不行恶

    单选题 (1/1 point)

    下列职业社团名称缩写错误的是

    • 美国土木工程师协会(ASCE)
    • 电子和电子工程师协会(IEEE)
    • 美国机械工程师学会(ABET)
    • 美国化学工程师学会(AIChE)

    判断题 (1/1 point)

    根据伦理规范得到社会认可和被制度化的程度,我们可以把伦理规范分为制度性的伦理规范和描述性的伦理规范两种情况。

    • 正确
    • 错误

    判断题 (1/1 point)

    伦理是个体性、主观性的,侧重个体的意识、行为与准则、法则的关系;道德则是社会性和客观性的,侧重社会“共体”。

    • 正确
    • 错误

    多选题 (1/1 point)

    当工程实践出现“超越于道德的”的情形时,我们可以通过道德慎思为自己的伦理行为划分优先顺序,审慎地思考和处理存在的几对重要的伦理关系。这几对重要的伦理关系指的是

    • 自主与责任
    • 效率与公正
    • 个人与集体
    • 环境与社会

    单选题 (1/1 point)

    下列哪项不是工程伦理问题的特点

    • 历史性
    • 社会性
    • 复杂性
    • 简明性

    单选题 (1/1 point)

    下列哪项不是处理工程伦理问题的基本原则

    • 人道主义
    • 功利主义
    • 社会公正
    • 人与自然和谐发展

    判断题 (1/1 point)

    工程活动是一种集成多种自然与社会资源,协调多种利益诉求和冲突的社会活动,是一种极其复杂的社会实践,需要众多的行动者参与。

    • 正确
    • 错误

    单选题 (1/1 point)

    下列哪项不是依据工程伦理问题的对象来划分伦理问题的?

    • 因伦理意识缺失或者对行为后果估计不足导致的问题
    • 因工程相关的各方利益冲突所造成的伦理困境
    • 工程共同体内部意见不合,或者工程共同体的伦理准则与规范等与其他伦理原则之间不一致导致的问题
    • 因工程伦理章程缺乏或者不足而导致的问题

    多选题 (1/1 point)

    “博帕尔MIC毒气泄漏事件”主要涉及哪几方面的问题

    • 企业和政府在维护公共安全和环境安全方面所肩负的责任和各自扮演的角色问题
    • 跨国工程活动中发达国家向发展中国家的环境成本转移问题
    • 跨国公司的双重技术标准问题
    • 如何通过相关法规和制度来保障工程活动中的弱势群体权益的问题

    判断题 (1/1 point)

    从处理工程与人、社会和自然的关系的三个层面看,处理工程中伦理问题要坚持以下三个基本原则:人道主义———处理工程与人关系的基本原则;社会公正———处理工程与社会关系的基本原则;人与自然和谐发展———处理工程与自然关系的基本原则。

    • 正确
    • 错误

    第二章习题(下)

    判断题 (1/1 分数)
    从普利高津耗散结构理论的视角来看,工程必然会伴随风险的发生

    • 正确
    • 错误

    判断题 (1/1 分数)
    在讨论工程设计理念时,只需要工程师代表参与决策

    • 正确
    • 错误

    单选题 (1/1 分数)
    意外风险的应对通常采取的措施包括风险回避、风险转移等,其中风险转移的目的是?

    • 降低风险发生的概率
    • 降低不利后果的大小
    • 在风险发生时将损失分散
    • 保护工人的安全

    单选题 (1/1 分数)
    在制定事故应急预案时,不恰当的做法是?()

    • 预防为主,防治结合
    • 保留现场,等待救援
    • 以人为本,生命第一
    • 统一指挥,协同联动

    单选题 (1/1 分数)
    下列哪项属于工程风险中的技术因素?()

    • 自然灾害
    • 工程设计理念的缺陷
    • 施工质量缺陷
    • 控制系统失灵

    多选题 (1/1 分数)
    工程风险的来源有哪些?()

    • 技术因素的不确定性
    • 环境因素的不确定性
    • 文化因素的不确定性
    • 人为因素的不确定性

    多选题 (1/1 分数)
    对于不能及时进行处理的工程质量缺陷,应填写质量缺陷备案表,表中应包括哪些信息?()

    • 缺陷产生的部位和原因
    • 对工程安全性的分析
    • 使用功能和运用影响分析
    • 处理方案和不处理原因分析

    文字填空题 (1/1 分数)
    操作人员是预防工程风险的核心环节,也是防止工程风险发生的最后一道屏障,必须要加强对操作人员安全意识的教育,时时刻刻以“ ”为行动准则。(四个字)

    答案:安全第一

    判断题 (1/1 分数)
    在制度层面,目前公众参与工程主要以网络投票为参与途径。

    • 正确
    • 错误

    判断题 (1/1 分数)
    公众参与工程风险伦理评估的前提是信息的公开。

    • 正确
    • 错误

    单选题 (1/1 分数)
    下列工程风险的伦理评估原则中哪项属于预防为主的原则?

    • 尊重当事人的“知情同意”权
    • 要加强安全知识教育,提升人们的安全意识
    • 考虑对社会环境和生态环境造成的影响
    • 建立并落实安全生产问责机制

    单选题 (1/1 分数)
    下列属于工程风险的外部评估主体的是()?

    • 工程师
    • 社会公众
    • 工人
    • 管理者

    单选题 (1/1 分数)
    对于可接受风险,以下哪种视角是专家视角()?

    • 可接受的风险是这样风险,在可以选择的情况下,伤害的风险至少相等于产生收益的可能性
    • 可接受的风险指的是这样风险,它是通过行使自由和知情同意权而自愿认可的,或者它是得到适当赔偿的,并且它是公正地分配的
    • 可接受的风险是这样风险,其保护公众免遭伤害的重要性远远超过了使公众获利的重要性
    • 采取任何手段,只要让公众自愿接收的风险

    判断题 (1/1 分数)
    当工程风险发生时,往往不能把全部责任归结于某一个人,而需要工程共同体共同承担

    • 正确
    • 错误

    判断题 (1/1 分数)
    伦理责任就是法律责任

    • 正确
    • 错误

    单选题 (1/1 分数)
    下列不属于“职业”的特征是?()

    • 理智性
    • 长期性
    • 自主性
    • 非垄断性

    单选题 (1满分)
    下列哪项不属于工程伦理责任类型?()

    • 职业伦理责任
    • 社会伦理责任
    • 环境伦理责任
    • 家庭伦理责任

    单选题 (1/1 分数)
    下列哪项超出了工程伦理责任类型?()

    • 过失-责任
    • 赔偿-责任
    • 角色-责任
    • 义务-责任

    第三章习题(下)

    判断题 (1/1 point)
    由工程的目标价值导向性引出一个重要的伦理问题,这就是工程为什么人服务,为什么目的服务?()

    • 正确
    • 错误

    单选题 (1/1 point)
    下列哪一项体现了工程的文化价值?()

    • 标志性工程是所属民族的精神纽带
    • 工程的“普遍接入”和“普遍服务”
    • 工程制造的科学仪器
    • 环境保护和生态修复工程

    判断题 (1/1 point)
    工程社会价值的一个极端表现是其军事价值。()

    • 正确
    • 错误

    单选题 (1/1 point)
    工程的()价值具有非道德性质,这决定了工程的最终价值取决于工程应用于什么目的,即工程的实际价值取决于社会的要求和社会环境。

    • 工具价值
    • 内在价值
    • 伦理价值
    • 社会价值

    多选题 (1/1 point)
    工程具有多元的价值,主要包括()

    • 科学价值
    • 政治价值
    • 社会价值
    • 文化价值

    单选题 (1/1 point)
    如何确定什么人可以首先享受到工程成果,或者如何确定人们享受的顺序,这属于工程的()问题。

    • 管理问题
    • 技术问题
    • 资源分配问题
    • 制度问题

    判断题 (1/1 point)
    讨论工程的利益分配可以从宏观和微观两个层面来进行,宏观层面是指企业内部工程项目的活动情况。

    • 正确
    • 错误

    单选题 (1/1 point)
    产品价格过高,会使得普通大众难以分享工程的好处,妨碍了实现工程成果为更多人()。

    • 所及和普惠
    • 接受
    • 认可
    • 理解

    判断题 (1/1 point)
    工程受益人群的确定由市场来调控,我们把不能获得工程产品和服务的现象,称作“排除”。()

    • 正确
    • 错误

    多选题 (1/1 point)
    下列哪些因素会影响工程产品和服务的可及性和普惠性?()

    • 用户的经济状况
    • 用户的知识水平
    • 用户的技术水平
    • 用户的能力问题

    判断题 (1满分)
    “邻避”行为突出反映了工程项目建设的利益—损失分配不公正的问题。()

    • 正确
    • 错误

    单选题 (1/1 point)
    “邻避”事件发生的原因很复杂,不一定是现实的危害,而是()。

    • 利益分配不公平
    • 居民对危害的心理担忧和风险感知
    • 利益补偿不合理
    • 公众参与不充分

    判断题 (1/1 point)
    传统的工程观主要考虑企业本身的收益和付出,很少考虑用户为工程付出的代价。()

    • 正确
    • 错误

    单选题 (1/1 point)
    一些工程建设引起的大规模的拆迁移民,可能增加社会秩序的不安定因素,这属于工程对()的影响。

    • 环境
    • 经济
    • 社会
    • 资源

    多选题 (1/1 point)
    米切尔认为,利益相关者必须具备以下哪些条件。()

    • 创造力
    • 影响力
    • 合法性
    • 紧迫性

    文字填空题 (1/1 point)
    公正是指,每个人都应获得其应得的权益,对平等的事物平等对待,不平等的事物()对待。(两个字)
    答案:区别

    单选题 (1满分)
    分配公正的基本实现途径是在不同利益与价值追求的个人与团体间的对话的基础上,达成有普遍约束力的()原则。

    • 社会公正
    • 利益协调
    • 分配与补偿
    • 道德伦理

    判断题 (1/1 point)
    吸收利益攸关方参加工程的决策、建设、运营是为了保证补偿公正。()

    • 正确
    • 错误

    多选题 (1/1 point)
    美国伦理学家理查德·T.德·乔治将公正分为以下哪些类型?()

    • 补偿公正
    • 惩罚公正
    • 分配公正
    • 程序公正

    多选题 (1/1 point)
    下列哪些属于工程项目社会评价的社会公平指标?()

    • 基尼系数
    • 恩格尔系数
    • 就业率
    • 公众参与度

    第四章习题(下)

    单选题
    提出保护资源的目的是为了自然本身的利益,而不是人类的利用,这是()主义的主张。

    • 社会保护主义
    • 环境保护主义
    • 资源保护主义
    • 自然保护主义

    单选题
    ()主张把道德关怀的范围从人类扩展到非人类的生命或自然存在物上。

    • 人类中心主义者
    • 非人类中心主义者
    • 价值主观论者
    • 价值客观论者

    判断题
    “大地伦理”的提出者利奥波德认为:一件事情当有助于保护自然的和谐、稳定和美丽时,它就是正确的,反之,就是错误的。()

    • 正确
    • 错误

    文字填空题
    如果我们承认了自然事物拥有内在价值,我们就认可了自然事物的(),我们就与道德义务维护自然事物。(四个字)
    答案:道德权利

    判断题
    认为自然界的价值不依人的存在或人的评价而存在,只要对地球生态系统的完善和健康有益的事物就有价值,是价值客观论者的主要观点。()

    • 正确
    • 错误

    多选题
    "尊重自然"的伦理体系包括以下哪几部分?()

    • 尊重自然的态度
    • 深层生态学
    • 生物中心主义
    • 人类中心主义

    多选题
    下列哪些选项属于非人类中心主义思想?()

    • 动物解放论
    • 动物权利论
    • 生物中心主义
    • 生态中心主义

    文字填空题
    对工程活动进行分析、预测和评估,提出预防或者减轻不良环境影响的对策和措施,这是对工程进行()评价。(四个字)
    答案: 环境影响

    判断题
    工程理念是工程活动的出发点和归宿,是工程活动的灵魂。()

    • 正确
    • 错误

    单选题
    好的工程会把()和合人的目的性有机结合起来。

    • 合工程的目的性
    • 合自然的规律性
    • 合社会的进步性
    • 合技术的发展性

    单选题
    在权衡人与自然利益的优先秩序上应遵循()高于基本需要、基本需要高于非基本需要。

    • 社会需要
    • 伦理需要
    • 生存需要
    • 发展需要

    单选题
    ()原则是我们对自然环境的首要态度,也是我们行动的首要原则。

    • 公平性原则
    • 整体性原则
    • 尊重原则
    • 平等性原则

    多选题
    工程建设对环境产生的影响主要包括()。

    • 消耗能源和资源
    • 造成的固废污染和水污染
    • 噪声和振动影响
    • 排出的有害气体威胁人们的健康

    单选题
    工程共同体的环境伦理主要指,工程过程应切实考虑()及社会的承受性。

    • 政府
    • 自然生态
    • 雇主
    • 公众

    文字填空题
    随着工程对自然的干预和破坏能力越来越巨大、后果越来越危险,工程师需要发展一种新的责任意识,即()(六个字)
    答案:环境伦理责任

    单选题
    工程师的环境伦理责任不只是赋予工程师责任和义务,同时也赋予他相应的(),使得他在必要时及时中止他的责任和义务。

    • 资源
    • 利益
    • 自由
    • 权利

    判断题
    对工程师的评价标准不是工程师是否把工作做好了,而是是否做了一项好到工作,既促进了经济发展,又避免了环境遭到破坏。()

    • 正确
    • 错误

    判断题
    工程共同体通常由项目投资人、设计者、工程师、工人构成。()

    • 正确
    • 错误

    多选题
    下列选项哪些属于工程师的环境伦理责任?()

    • 维护人类健康
    • 维护自然生态环境
    • 忠诚于雇主
    • 维护公司的利益

    第五章习题(下)

    判断题
    职业的行为规范强调的是“自我机制”,技术规范强调“社会机制”

    • 正确
    • 错误

    文字填空题
    工程领域中的“职业”是指“那些涉及高深的专业知识、()和对公共善协调服务的工作方式”。(四个字)
    自我管理

    单选题
    以下哪项是对职业共同体中工程师负责任的职业行为的错误理解?()

    • 工程师的责任就是他或她在工程生活中必须履行的角色责任
    • 工程师可以对履行特定义务作出回应
    • 工程师接受自己的工作职责和社会责任,并自觉地为实现这些义务努力
    • 工程师须对行为的危害承担责任,不能为自己行为的功绩要求荣誉

    判断题
    工程社团是工程职业的生活形态。

    • 正确
    • 错误

    单选题
    工程职业制度不包括()

    • 职业准入制度
    • 职业资格制度
    • 执业资格制度
    • 职业准出制度

    单选题
    以下哪项是注册工程师执业资格制度的首要环节?()

    • 职业实践
    • 资格考试
    • 高校工程专业教育
    • 注册执业管理

    多选题
    有关职业伦理章程的正确描述是()

    • 职业伦理章程一般采用规范和准则的形式
    • 职业伦理章程为职业行为提供一种普遍的和协商一致的标准
    • 职业伦理章程的主要关注点是促进负责任的职业行为
    • 职业伦理章程表达了对职业共同体内从业者的职业行为的期待

    判断题
    作为职业伦理的工程伦理是一种预防性、规范性的实践伦理

    • 正确
    • 错误

    单选题
    以下哪项是工程师的首要责任?()

    • 公众的安全、健康及福祉
    • 雇主的利益
    • 客户的利益
    • 可持续发展

    单选题
    以下哪项是工程师最新的职业责任观?()

    • 雇主的命令
    • 工程师的反叛
    • 承担社会责任
    • 对自然和生态负责

    多选题
    以下哪项是对工程师自律的正确理解?()

    • 工程师的自律是对职业责任的主动担当
    • 自律是工程师对工程-人-自然-社会整体必然存在的一种道德自觉
    • 自律使工程师从朦胧未显的工程伦理意识走向明确自主的对责任的担当
    • 工程师的自律表现为一种从向善到行善的自觉、自愿与自然的职业精神

    判断题
    举报是举报者一种最明智之举

    • 正确
    • 错误

    单选题
    作为职业人员,工程师不能享有以下哪项权利:()

    • 在规定范围内从事执业活动
    • 对他人执业活动进行解释和辩护
    • 接受继续教育
    • 在本人执业活动中形成的文件上签字并加盖执业印章

    单选题
    “工程师遵守甚至超越职业标准的积极责任”属于工程师的哪一种责任?()

    • 义务-责任
    • 过失-责任
    • 角色-责任
    • 岗位-责任

    单选题
    从职业伦理的角度看,工程师的()美德体现了工程伦理的核心

    • 诚实可靠
    • 忠实服务
    • 尽职尽责
    • 善良

    文字填空题
    工程师最综合的美德是()的职业精神。(三个字)
    答案:负责任
    判断题
    服务是工程师开展职业活动的一项基本内容和基本方式。

    • 正确
    • 错误

    单选题
    以下哪项不属于工程师的角色冲突?

    • 工程师与企业雇员
    • 工程师与管理者
    • 工程师与社会公众
    • 工程师与同事

    单选题
    工程中利益冲突的种类不包括()

    • 个体利益之间的冲突
    • 个体利益与群体利益之间的冲突
    • 个体利益与整体利益之间的冲突
    • 群体利益与整体利益之间的冲突

    第六章习题(下)

    多选题 (1/1 point)
    水利工程的影响深远体现在()

    • 水利工程对于促进国民经济和社会发展具有全方位的深远影响。
    • 水利工程会引起空间大范围的连锁反应。
    • 水利工程的影响常常跨越数十年甚至上百年。
    • 水利工程对人文和生态环境均产生深远影响。

    文字填空题 (1/1 point)
    水利工程就是对自然界中的水资源进行有效控制、按需调配、持续利用及()的工程。(四个字)
    答案: 全面保护
    判断题 (1/1 point)
    我国水资源丰富,人均水资源占有量为世界平均水平的四分之一。

    • 正确
    • 错误

    单选题 (1/1 point)
    以下哪项是新时期水利工程的崭新内容?

    • 港口与航道工程
    • 水力发电工程
    • 河湖环境生态工程
    • 水土保持工程

    判断题 (1/1 point)
    中国水利工程建设经历了工程水利、资源水利和生态水利三个阶段的演变

    • 正确
    • 错误

    判断题 (1/1 point)
    政府的行政意愿对水利工程建设的影响巨大。

    • 正确
    • 错误

    单选题 (1/1 point)
    水权的核心是哪项权利?()

    • 所有权
    • 配置权
    • 经营权
    • 使用权

    多选题 (1/1 point)
    水资源公正配置的原则包括()

    • 邻近优先
    • 尊重历史
    • 利益补偿
    • 重视生态

    单选题 (1/1 point)
    以下哪项是对跨地区调水的错误理解?()

    • 实施跨地区调水时,水源地的用水需求应该优先得到满足
    • 跨地区调水时要统筹兼顾调出和调入流域的用水需要
    • 水资源配置向水资源调出区倾斜时很有可能会成为利益驱动下的默认选择
    • 在具体工作中,并非总能优先考虑水源地的用水需求和实际利益

    单选题 (1/1 point)
    以下哪项说法是正确的?

    • 涉及水资源分配的国际水法条款与国际水条约非常多
    • 存在普适的水资源分配法则
    • 现有国际水法过多地强调上游国家对水资源地利用
    • 通过协商来解决水资源的分配与利用问题常常是唯一可行的途径

    判断题 (1/1 point)
    在我国,工业用水一直占水资源总量的最大比重。

    • 正确
    • 错误

    判断题 (1/1 point)
    对水利工程风险进行完全的定量评价是现实的。

    • 正确
    • 错误

    判断题 (1/1 point)
    我国已建成的水利工程在数量和规模上均居世界第二。

    • 正确
    • 错误

    单选题 (1/1 point)
    以下哪项不是从人类生存和发展的维度看河流的价值?()

    • 政治
    • 生态
    • 审美
    • 文化

    单选题 (1/1 point)
    以下哪项不是从河流的外在价值观察到的河流生命的特征?()

    • 周期性
    • 柔性
    • 独特性
    • 庄严性

    判断题 (1/1 point)
    水利工程对河流健康生命没有正面的促进作用。

    • 正确
    • 错误

    单选题 (1/1 point)
    以下哪项是对水利工程对河流健康生命造成巨大冲击的错误表述?()

    • 水利工程导致诸多天然美景的消失
    • 水利工程破化了河流生态系统的空间连续性
    • 水利工程减弱甚至切断了物质和能量沿水流的传递
    • 水利工程对河流生态系统的扰动是不可恢复的。

    文字填空题 (1满分)
    在实践中,通过法律、技术和()手段,努力维护河流健康生命。(两个字)
    答案: 管理

    单选题 (1/1 point)
    以下哪项原则是移民工作成败的核心?()

    • 顾全大局
    • 公平公正
    • 因地制宜
    • 可持续发展

    单选题 (1/1 point)
    以下哪项是对核定补偿标准的错误描述?()

    • 无形的损失难以估量
    • 要避免同一工程的不同区域、不同群体补偿方面存在不公平的现象
    • 要避免不同时间段(主要指可比的相邻时段内)移民补偿存在不公平的现象。
    • 与其他行业相比,水利工程补偿标准偏高。

    判断题 (1/1 point)
    通过努力,水利工程师在职业生涯中可以充分掌握全部的知识。

    • 正确
    • 错误

    第七章习题(下)

    多选题 (1满分)
    生物医药工程伦理问题包括()

    • 不可接受的“风险-受益”比
    • 环境污染问题
    • 学术不端问题
    • 公平可及性问题

    多选题 (1/1 point)
    生物医药工程中造成不可接受的“风险-受益”比的原因包括:()

    • 科研人员伦理意识淡薄
    • 伦理审查不规范
    • 没有把受试者安全放在首位
    • 忽视受试者的权益

    判断题 (1/1 point)
    现有的多数药品是针对成人进行的临床试验,增加了患儿的用药风险

    • 正确
    • 错误

    判断题 (1/1 point)
    多数制药企业喜欢投资孤儿药品。

    • 正确
    • 错误

    多选题 (1满分)
    生物医药研发和应用领域的知情同意问题十分突出,表现在()

    • 有些生物医药工程技术研发人员有意抹杀了“治疗”与“研究”的区别
    • 淡化了临床研究的潜在疗效
    • 夸大了可能的风险
    • 误导受试者

    文字填空题 (1/1 point)
    公正原则包括:程序公正、回报公正和()(四个字)
    答案:分配公正

    多选题 (1/1 point)
    生物医药研发和应用应尽量减少的风险包括()

    • 对受试人群的身心伤害
    • 给受试人群带来的经济负担
    • 造成的公共卫生风险
    • 造成的生态环境风险

    文字填空题 (1/1 point)
    自主性是指有行为能力的人在不受干扰的状态下,自愿选择行动方案的意识和()。(两个字)
    答案: 能力

    单选题 (1满分)
    以下哪项可以从"受益最大化原则"从推导出来?()

    • 生物医药研发和应用应将预防作为主要目标
    • 将工程的社会经济效益放在首位
    • 当经济回报、优先权、奖励等与受试者利益冲突时,把受试者的权益放在首位。
    • 国家利益始终大于患者健康需要的满足。

    单选题 (1满分)
    生物医药工程的伦理问题的主要来源不包括()

    • 因经济利益冲突而提出的“应该”问题
    • 因政治利益冲突而提出的“应该”问题
    • 因道德义务冲突而引起的伦理难题
    • 因宗教文化冲突而产生的伦理“应该”问题。

    单选题 (1/1 point)
    伦理审查委员会的基本职能不包括()

    • 改变研究方案
    • 监督
    • 咨询
    • 指导

    单选题 (1满分)
    动物研究的伦理要求实行3R原则不包括()

    • 考虑能够不使用动物
    • 减少动物使用量及使用中减少动物的痛苦
    • 权衡对动物的可能伤害及人类的受益以及动物伦理审查委员会的独立审查。
    • 考虑能否循环使用动物

    单选题 (1/1 point)
    医疗器械临床试验伦理审查要点不包括()

    • 试验的科学设计
    • 试验的风险和受益
    • 平等对待受试者
    • 知情同意

    判断题 (1/1 point)
    基因是有“好”或“坏”、“优”或“劣”之分的。

    • 正确
    • 错误

    判断题 (1/1 point)
    获知遗传基因信息不一定有利于个人对自己的生活作出理性的安排

    • 正确
    • 错误

    多选题 (1/1 point)
    基因信息泄露会引发哪些问题:()

    • 泄露家族成员的遗传倾向。
    • 可能在就学、就业、婚姻等方面受到歧视
    • 如果有基因缺陷,有些保险公司可能会拒绝为他们在医疗
    • 引发个人的不安和焦虑

    单选题 (1/1 point)

    • 以下哪项是对基因治疗临床试验的伦理审查的错误表述?()
    • 慎重选择受试者,确立准入和排除的严格标准。
    • 筛选程序要公平,并接受审查和监督。
    • 要预先进行方案的风险-受益分析
    • 有其他替代的有效常规疗法时,也可以使用基因治疗临床方案。

    单选题 (1满分)
    以下哪项不属于不征求提供者再次同意的条件:()

    • 样本是匿名的,不与其他可识别信息相联系
    • 样本提供者有机会自由撤回样本
    • 不征求再次同意对提供者更有利
    • 满足上述条件,就可以不接受伦理审查委员会的审查和批准。

    单选题 (1/1 point)
    以下哪项是对“治疗”和“研究”的错误理解?()

    • 治疗是将已被证明有效的方法用于病人
    • 病人从治疗中受益,病人应该付费。
    • 研究者无需给予受试者补偿
    • 研究如果对受试者造成损害,研究者应予以赔偿。

    文字填空题 (1满分)
    捐赠器官问题有两种同意方式:自愿捐献和()(四个字)
    答案:推定同意

    判断题 (1/1 point)
    活体器官移植是解决器官供应的根本途径。

    • 正确
    • 错误

    多选题 (1/1 point)
    以下哪项是对制药工程的正确表述?()

    • 制药工程以提升广大患者的健康需求为导向
    • 制药工程涉及众多利益主体,各方的角色分工和利益诉求不同,需要协同互助,信守承诺。
    • 制药工程受到市场需求、国家政策、研发资金等诸多因素的综合影响。
    • 制药企业是制药工程创新的主体,制药工程人员要有企业家精神。

    单选题 (1/1 point)
    以下哪项是对中国制药企业的社会责任的正确表述?()

    • 社会责任履行情况整体较好。
    • 新药研发水平相对滞后,资金投入不足,创新能力较低。
    • 制药企业或药物研发机构一般会主动公开负面报道。
    • 药品质量事故较少。

    第八章习题(下)

    判断题 (1/1 point)
    中国是仅次于美国的第二大二氧化碳排放国

    • 正确
    • 错误

    判断题 (1/1 point)
    煤电比核电更清洁

    • 正确
    • 错误

    单选题 (1/1 point)
    我国第一颗原子弹爆炸成功是在哪一年()

    • 1950
    • 1964
    • 1967
    • 1971

    单选题 (1满分)
    核工程应遵循的伦理原则包括

    • 以人为本原则
    • 可持续发展原则
    • 生态原则
    • 公正原则

    多选题 (1/1 point)
    核工程应该遵循的伦理原则主要有()
    以人为本原则, 可持续发展原则, 生态原则, 公正原则, - 正确

    • 以人为本原则
    • 可持续发展原则
    • 生态原则
    • 公正原则

    单选题 (1/1 point)
    对伦理规范的审查应该在项目建设的什么时期()

    • 初期
    • 中期
    • 运行期
    • 后期

    判断题 (1/1 point)
    “零风险”是可以实现的

    • 正确
    • 错误

    多选题 (1/1 point)
    风险主要包括哪些要素()

    • 事件诱因
    • 事件概率
    • 事件后果
    • 事件过程

    判断题 (1满分)
    系统的正反馈效应能够维持系统平衡与稳定

    • 正确
    • 错误

    多选题 (1/1 point)
    公众在核工程中的权利有()

    • 知情权
    • 决策权
    • 参与权
    • 讨论权

    多选题 (1/1 point)
    影响核事故信息公开的主要因素有()

    • 政治因素
    • 经济因素
    • 社会因素
    • 个人因素

    多选题 (1满分)
    核安全基本原则主要有()

    • 管理责任
    • 纵深防御
    • 技术防御
    • 公民参与

    单选题 (1/1 point)
    核安全文化的主导和核心是()

    • 系统
    • 设备
    • 环境

    多选题 (1满分)
    放射性废物主要造成的危害有()

    • 职业照射
    • 公众照射
    • 持续急性照射
    • 隐性照射

    多选题 (1满分)
    核电站的环境影响主要包括()

    • 放射性污染
    • 热污染
    • 内陆核电站的影响
    • 硫化物污染

    判断题 (1/1 point)
    工程师可以代替民众进行工程决策

    • 正确
    • 错误

    第九章习题(下)

    多选题 (1/1 分数)
    下列哪几项属于信息技术的特点

    • 连接能力
    • 交互能力
    • 渗透特性
    • 融合能力

    判断题 (1/1 分数)
    “互联网+”指以互联网为主的一整套信息技术在经济、社会生活各部门的扩散和应用过程,其本质是传统产业和生产过程的在线化、数据化。

    • 正确
    • 错误

    多选题 (1/1 分数)
    下列哪几项属于大数据的特点

    • 数量大
    • 类别多
    • 增长速度快
    • 真实可信

    多选题 (1/1 分数)
    大数据时代背景下,我们将面临哪些新的、更为集中的伦理挑战

    • 身份困境
    • 隐私边界
    • 数据权利
    • 数据治理

    判断题 (1/1 分数)
    大数据与以往数据应用不同之处表现在三方面:可以获得全体数据而非采样数据;允许获取的数据呈现混乱、复杂状态而不再强求干净、精确,即大方向的正确比微观精准更重要;聚焦发现和分析事物的相关性而非因果性。

    • 正确
    • 错误

    单选题 (1/1 分数)
    下列哪项不是“数字身份”的特点

    • 多样性
    • 可变性
    • 允许匿名和假名
    • 唯一性

    多选题 (1/1 分数)
    在计算机和网络应用中,常见的用户身份管理技术有

    • 用户名+密码+校验码
    • 第三方认证,如 U 盾
    • 预存的个性化问题
    • 生物特征

    判断题 (1/1 分数)
    人的身份(identity),用来界定一个人是谁或是什么,具有可识别性、独特性、唯一性。

    • 正确
    • 错误

    多选题 (1/1 分数)
    由于网络和信息技术的特点,保护数据隐私面临一系列技术和非技术的挑战,下列哪项属于所面临的挑战?

    • 可信性与可靠性
    • 快速扩散性与放大器效应
    • 挖掘技术与关联发现
    • 身份盗窃与冒用

    多选题 (1/1 分数)
    大数据时代,收集个人数据包括哪些手段?

    • 开放API
    • Web应用
    • 黑客攻击
    • 交易(公开或秘密)

    判断题 (1/1 分数)
    隐私权指自然人享有的私人生活安宁与私人信息依法受保护,不被非法侵扰、知悉、搜集、利用和公开的一种人格权.

    • 正确
    • 错误

    判断题 (1/1 分数)
    要为大数据创新应用提供高质量的数据基础,必须坚持尊重、公平交易、诚信这三个价值判断原则,谨慎对待各方数据权利

    • 正确
    • 错误

    判断题 (1/1 分数)
    个人信息是指与特定个人相关联的、反映个体特征的具有可识别性的符号系统,包括个人身份、工作、家庭、财产、健康等各方面的信息

    • 正确
    • 错误

    多选题 (1/1 分数)
    脱胎于“家国天下”传统社会伦理的中华价值观,表现出了哪些特色

    • 责任先于自由
    • 义务先于权利
    • 群体高于个人
    • 和谐高于冲突

    单选题 (1/1 分数)
    数据伦理责任是具有普遍意义的伦理责任在大数据时代的具体化,那么,下列哪项不属于大数据伦理责任的特点?

    • 自律性
    • 强制性
    • 广泛性
    • 实践性

    判断题 (1/1 分数)
    大数据创新科技人员的伦理责任主要表现在尊重个人自由、 强化技术保护、严格操作规程、加强行业自律、承担社会责任这五个方面

    • 正确
    • 错误

    多选题 (1满分)

    • 人际关系虚拟化
    • 正当的网络行为
    • 平等与公正、知识产权争议
    • 全球化信息交互与治理困境

    第十章习题(下)

    下一个
    单选题 (1/1 point)
    环境工程是人类为减少工业化生产过程和人类生活过程对环境的影响进行()的工程手段。

    • 政策治理
    • 经济治理
    • 社会治理
    • 污染治理

    单选题 (1/1 point)
    环境问题主要是指由于人类经济和社会活动引起的环境破坏,实质是经济发展与环境保护的冲突,是()关系的失调。

    • 经济与社会
    • 自然与社会
    • 人与自然
    • 人与社会

    判断题 (1/1 point)
    任何物质的创造都会使用资源、消耗资源,在消耗资源的过程中必然会有废弃物的排放。()

    • 正确
    • 错误

    判断题 (1/1 point)
    由于环境工程师的工作直接涉及环境保护,相对其他工程师及非环境工作者来说,环境工程师应该负有更加特殊和更加重要的环境伦理责任。

    • 正确
    • 错误

    文字填空题 (1/1 point)
    环境正义的实现应该以()为本位,所有公民(不包括后代人和自然体)对大自然都负有环境保护的责任和义务。(四个字)
    答案:环境义务

    单选题 (1/1 point)
    现代工业生产活动是人、机器与环境共同存在、相互影响的系统,()保证了系统的可靠。

    • 制度管理
    • 安全生产
    • 科学技术
    • 应急防范

    单选题 (1/1 point)
    公共安全问题主要发生在公共工程运营中,是由于其()给非工程直接利益相关的社会公众带来的安全问题。

    • 社会性
    • 特殊性
    • 风险性
    • 公共性

    多选题 (1满分)
    工程师作为工程设计的主要承担者和执行者,下列哪些工程阶段会面临遵守职业规范和服从雇主命令之间的冲突。

    • 工程设计阶段
    • 工程保养阶段
    • 工程建造和生产阶段
    • 工程维护阶段

    判断题 (1满分)
    在企业发生的工伤事故中,70%左右的事故在不同程度上与人的失误有关,而出现这些问题的最根本的原因是环境保护意识薄弱。()

    • 正确
    • 错误

    PS: 实在不懂工伤事故的根本原因为什么是环境保护意识薄弱,找不到逻辑在哪?要么就是答案错了……

    判断题 (1/1 point)
    所有对社会有价值的存在形式都应得到尊重和保护,每个个体都会对环境产生影响并应承担相应的责任。

    • 正确
    • 错误

    单选题 (1/1 point)
    企业应保持寻求自身发展与社会经济可持续发展目标的一致性,把()纳入生产成本中。

    • 工程代价
    • 经济代价
    • 社会代价
    • 环境代价

    单选题 (1/1 point)
    环境工程的社会责任是在()的同时,不阻碍或促进经济的健康发展,以及保护其他社会利益。

    • 企业管理
    • 保护环境
    • 工程建设
    • 社会生产

    多选题 (1/1 point)
    环境问题涉及哪些利益相互协调的问题?()

    • 社会公共利益
    • 政治利益
    • 生态利益
    • 经济利益

    判断题 (1/1 point)
    环境工程师可以通过环保工程改善环境,也可能因为采用的技术或实施过程的不合理而破坏环境。()

    • 正确
    • 错误

    单选题 (1/1 point)
    现代工程需要广阔的基础知识,因此要求环境工程师必须具备自然科学知识、社会科学知识等基础知识和较高的()。

    • 环保意识
    • 职业精神
    • 专业知识
    • 科学态度

    单选题 (1/1 point)
    环境工程作为调节人与人、人与社会之间关于()利益关系的工程,其基本原则就是生态整体利益和长远利益高于一切。

    • 社会发展
    • 生态环境
    • 经济增长
    • 工程管理

    多选题 (1/1 point)
    下列哪些行为属于不诚实的表现形式?()

    • 篡改数据
    • 伪造数据
    • 修饰拼凑
    • 抄袭剽窃

    判断题 (1满分)
    作为环境保护技术的主体,尽管环境工程师可以通过各种环保工程建设来影响人类社会,但宣传环保知识不属于环境工程师应该承担的责任。()

    • 正确
    • 错误

    判断题 (1/1 point)
    有意不传达听众所合理期望的不被省略的信息,是工程师的不诚实行为。()

    • 正确
    • 错误

    最后恭喜大家完成工程伦理慕课的学习!!!

    展开全文
  • 【知识图谱】知识图谱的基础概念与构建流程

    千次阅读 多人点赞 2019-11-09 18:46:49
    当前主流的并列相似度计算方法有分布相似度法(distributional similarity) 和模式匹配法(pattern Matching)。分布相似度方法[23-24]基于哈里斯(Harris)的分布假设(distributional hypothesis)[25],即经常...

    目录

    1、引言

    2、知识图谱的定义

    3、知识图谱的架构

    3.1 知识图谱的逻辑结构

    3.2 知识图谱的体系架构

    4、代表性知识图谱库

    5、知识图谱构建的关键技术

    5.1 知识提取

    5.2 知识表示

    5.3 知识融合


    【导读】知识图谱技术是人工智能技术的组成部分,其强大的语义处理和互联组织能力,为智能化信息应用提供了基础。我们专知的技术基石之一正是知识图谱-构建AI知识体系-专知主题知识树简介。下面我们特别整理了关于知识图谱的技术全面综述,涵盖基本定义与架构、代表性知识图谱库、构建技术、开源库和典型应用。

    1、引言

    随着互联网的发展,网络数据内容呈现爆炸式增长的态势。由于互联网内容的大规模、异质多元、组织结构松散的特点,给人们有效获取信息和知识提出了挑战。知识图谱(Knowledge Graph) 以其强大的语义处理能力和开放组织能力,为互联网时代的知识化组织和智能应用奠定了基础。最近,大规模知识图谱库的研究和应用在学术界和工业界引起了足够的注意力[1-5]。一个知识图谱旨在描述现实世界中存在的实体以及实体之间的关系。知识图谱于2012年5月17日由[Google]正式提出[6],其初衷是为了提高搜索引擎的能力,改善用户的搜索质量以及搜索体验。随着人工智能的技术发展和应用,知识图谱作为关键技术之一,已被广泛应用于智能搜索、智能问答、个性化推荐、内容分发等领域。

    2、知识图谱的定义

    在维基百科的官方词条中:知识图谱是Google用于增强其搜索引擎功能的知识库。本质上, 知识图谱旨在描述真实世界中存在的各种实体或概念及其关系,其构成一张巨大的语义网络图,节点表示实体或概念,边则由属性或关系构成。现在的知识图谱已被用来泛指各种大规模的知识库。 在具体介绍知识图谱的定义,我们先来看下知识类型的定义:

    知识图谱中包含三种节点:

    实体: 指的是具有可区别性且独立存在的某种事物。如某一个人、某一个城市、某一种植物等、某一种商品等等。世界万物有具体事物组成,此指实体。如图1的“中国”、“美国”、“日本”等。,实体是知识图谱中的最基本元素,不同的实体间存在不同的关系。

    语义类(概念):具有同种特性的实体构成的集合,如国家、民族、书籍、电脑等。 概念主要指集合、类别、对象类型、事物的种类,例如人物、地理等。

    内容: 通常作为实体和语义类的名字、描述、解释等,可以由文本、图像、音视频等来表达。

    属性(值): 从一个实体指向它的属性值。不同的属性类型对应于不同类型属性的边。属性值主要指对象指定属性的值。如图1所示的“面积”、“人口”、“首都”是几种不同的属性。属性值主要指对象指定属性的值,例如960万平方公里等。

    关系: 形式化为一个函数,它把kk个点映射到一个布尔值。在知识图谱上,关系则是一个把kk个图节点(实体、语义类、属性值)映射到布尔值的函数。

    基于上述定义。基于三元组是知识图谱的一种通用表示方式,即,其中,是知识库中的实体集合,共包含|E|种不同实体; 是知识库中的关系集合,共包含|R|种不同关系;代表知识库中的三元组集合。三元组的基本形式主要包括(实体1-关系-实体2)和(实体-属性-属性值)等。每个实体(概念的外延)可用一个全局唯一确定的ID来标识,每个属性-属性值对(attribute-value pair,AVP)可用来刻画实体的内在特性,而关系可用来连接两个实体,刻画它们之间的关联。如下图1的知识图谱例子所示,中国是一个实体,北京是一个实体,中国-首都-北京 是一个(实体-关系-实体)的三元组样例北京是一个实体 ,人口是一种属性2069.3万是属性值。北京-人口-2069.3万构成一个(实体-属性-属性值)的三元组样例。

    微信图片_20170930152906.jpg

    图1 知识图谱示例

    3、知识图谱的架构

    知识图谱的架构包括自身的逻辑结构以及构建知识图谱所采用的技术(体系)架构。

    3.1 知识图谱的逻辑结构

    知识图谱在逻辑上可分为模式层与数据层两个层次,数据层主要是由一系列的事实组成,而知识将以事实为单位进行存储。如果用(实体1,关系,实体2)、(实体、属性,属性值)这样的三元组来表达事实,可选择图数据库作为存储介质,例如开源的Neo4j[7]、Twitter的FlockDB[8]、sones的GraphDB[9]等。模式层构建在数据层之上,是知识图谱的核心,通常采用本体库来管理知识图谱的模式层。本体是结构化知识库的概念模板,通过本体库而形成的知识库不仅层次结构较强,并且冗余程度较小。

    3.2 知识图谱的体系架构

    图2 知识图谱的技术架构

    知识图谱的体系架构是其指构建模式结构,如图2所示。其中虚线框内的部分为知识图谱的构建过程,也包含知识图谱的更新过程。知识图谱构建从最原始的数据(包括结构化、半结构化、非结构化数据)出发,采用一系列自动或者半自动的技术手段,从原始数据库和第三方数据库中提取知识事实,并将其存入知识库的数据层和模式层,这一过程包含:信息抽取、知识表示、知识融合、知识推理四个过程,每一次更新迭代均包含这四个阶段。知识图谱主要有自顶向下(top-down)与自底向上(bottom-up)两种构建方式。自顶向下指的是先为知识图谱定义好本体与数据模式,再将实体加入到知识库。该构建方式需要利用一些现有的结构化知识库作为其基础知识库,例如Freebase项目就是采用这种方式,它的绝大部分数据是从维基百科中得到的。自底向上指的是从一些开放链接数据中提取出实体,选择其中置信度较高的加入到知识库,再构建顶层的本体模式[10]。目前,大多数知识图谱都采用自底向上的方式进行构建,其中最典型就是Google的Knowledge Vault[11]和微软的Satori知识库。现在也符合互联网数据内容知识产生的特点。

    4、代表性知识图谱库

    根据覆盖范围而言,知识图谱也可分为开放域通用知识图谱和垂直行业知识图谱[12]。开放通用知识图谱注重广度,强调融合更多的实体,较垂直行业知识图谱而言,其准确度不够高,并且受概念范围的影响,很难借助本体库对公理、规则以及约束条件的支持能力规范其实体、属性、实体间的关系等。通用知识图谱主要应用于智能搜索等领域。行业知识图谱通常需要依靠特定行业的数据来构建,具有特定的行业意义。行业知识图谱中,实体的属性与数据模式往往比较丰富,需要考虑到不同的业务场景与使用人员。下图展示了现在知名度较高的大规模知识库。

    微信图片_20170930153056.jpg

    图3 代表性知识图谱库概览

    5、知识图谱构建的关键技术

    大规模知识库的构建与应用需要多种技术的支持。通过知识提取技术,可以从一些公开的半结构化、非结构化和第三方结构化数据库的数据中提取出实体、关系、属性等知识要素。知识表示则通过一定有效手段对知识要素表示,便于进一步处理使用。然后通过知识融合,可消除实体、关系、属性等指称项与事实对象之间的歧义,形成高质量的知识库。知识推理则是在已有的知识库基础上进一步挖掘隐含的知识,从而丰富、扩展知识库。分布式的知识表示形成的综合向量对知识库的构建、推理、融合以及应用均具有重要的意义。接下来,本文将以知识抽取、知识表示、知识融合以及知识推理技术为重点,选取代表性的方法,说明其中的相关研究进展和实用技术手段 。

    5.1 知识提取

    知识抽取主要是面向开放的链接数据,通常典型的输入是自然语言文本或者多媒体内容文档(图像或者视频)等。然后通过自动化或者半自动化的技术抽取出可用的知识单元,知识单元主要包括实体(概念的外延)、关系以及属性3个知识要素,并以此为基础,形成一系列高质量的事实表达,为上层模式层的构建奠定基础。

    1.1 实体抽取

    实体抽取也称为命名实体学习(named entity learning) 或命名实体识别 (named entity recognition),指的是从原始数据语料中自动识别出命名实体。由于实体是知识图谱中的最基本元素,其抽取的完整性、准确率、召回率等将直接影响到知识图谱构建的质量。因此,实体抽取是知识抽取中最为基础与关键的一步。参照文献[13],我们可以将实体抽取的方法分为4种:基于百科站点或垂直站点提取、基于规则与词典的方法、基于统计机器学习的方法以及面向开放域的抽取方法。基于百科站点或垂直站点提取则是一种很常规基本的提取方法;基于规则的方法通常需要为目标实体编写模板,然后在原始语料中进行匹配;基于统计机器学习的方法主要是通过机器学习的方法对原始语料进行训练,然后再利用训练好的模型去识别实体;面向开放域的抽取将是面向海量的Web语料[14]。

    1) 基于百科或垂直站点提取

    基于百科站点或垂直站点提取这种方法是从百科类站点(如维基百科、百度百科、互动百科等)的标题和链接中提取实体名。这种方法的优点是可以得到开放互联网中最常见的实体名,其缺点是对于中低频的覆盖率低。与一般性通用的网站相比,垂直类站点的实体提取可以获取特定领域的实体。例如从豆瓣各频道(音乐、读书、电影等)获取各种实体列表。这种方法主要是基于爬取技术来实现和获取。基于百科类站点或垂直站点是一种最常规和基本的方法。

    2) 基于规则与词典的实体提取方法

    早期的实体抽取是在限定文本领域、限定语义单元类型的条件下进行的,主要采用的是基于规则与词典的方法,例如使用已定义的规则,抽取出文本中的人名、地名、组织机构名、特定时间等实体[15]。文献[16]首次实现了一套能够抽取公司名称的实体抽取系统,其中主要用到了启发式算法与规则模板相结合的方法。然而,基于规则模板的方法不仅需要依靠大量的专家来编写规则或模板,覆盖的领域范围有限,而且很难适应数据变化的新需求。

    3) 基于统计机器学习的实体抽取方法

    鉴于基于规则与词典实体的局限性,为具更有可扩展性,相关研究人员将机器学习中的监督学习算法用于命名实体的抽取问题上。例如文献[17]利用KNN算法与条件随机场模型,实现了对Twitter文本数据中实体的识别。单纯的监督学习算法在性能上不仅受到训练集合的限制,并且算法的准确率与召回率都不够理想。相关研究者认识到监督学习算法的制约性后,尝试将监督学习算法与规则相互结合,取得了一定的成果。例如文献[18]基于字典,使用最大熵算法在Medline论文摘要的GENIA数据集上进行了实体抽取实验,实验的准确率与召回率都在70%以上。近年来随着深度学习的兴起应用,基于深度学习的命名实体识别得到广泛应用。在文献[19],介绍了一种基于双向LSTM深度神经网络和条件随机场的识别方法,在测试数据上取得的最好的表现结果。

    微信图片_20170930153146.jpg

    图4 基于BI-LSTM和CRF的架构

    4) 面向开放域的实体抽取方法

    针对如何从少量实体实例中自动发现具有区分力的模式,进而扩展到海量文本去给实体做分类与聚类的问题,文献[20]提出了一种通过迭代方式扩展实体语料库的解决方案,其基本思想是通过少量的实体实例建立特征模型,再通过该模型应用于新的数据集得到新的命名实体。文献[21]提出了一种基于无监督学习的开放域聚类算法,其基本思想是基于已知实体的语义特征去搜索日志中识别出命名的实体,然后进行聚类。

    1.2 语义类抽取

    语义类抽取是指从文本中自动抽取信息来构造语义类并建立实体和语义类的关联, 作为实体层面上的规整和抽象。以下介绍一种行之有效的语义类抽取方法,包含三个模块:并列度相似计算、上下位关系提取以及语义类生成 [22]。

    1) 并列相似度计算

    并列相似度计算其结果是词和词之间的相似性信息,例如三元组(苹果,梨,s1)表示苹果和梨的相似度是s1。两个词有较高的并列相似度的条件是它们具有并列关系(即同属于一个语义类),并且有较大的关联度。按照这样的标准,北京和上海具有较高的并列相似度,而北京和汽车的并列相似度很低(因为它们不属于同一个语义类)。对于海淀、朝阳、闵行三个市辖区来说,海淀和朝阳的并列相似度大于海淀和闵行的并列相似度(因为前两者的关联度更高)。

    当前主流的并列相似度计算方法有分布相似度法(distributional similarity) 和模式匹配法(pattern Matching)。分布相似度方法[23-24]基于哈里斯(Harris)的分布假设(distributional hypothesis)[25],即经常出现在类似的上下文环境中的两个词具有语义上的相似性。分布相似度方法的实现分三个步骤:第一步,定义上下文;第二步,把每个词表示成一个特征向量,向量每一维代表一个不同的上下文,向量的值表示本词相对于上下文的权重;第三步,计算两个特征向量之间的相似度,将其作为它们所代表的词之间的相似度。 模式匹配法的基本思路是把一些模式作用于源数据,得到一些词和词之间共同出现的信息,然后把这些信息聚集起来生成单词之间的相似度。模式可以是手工定义的,也可以是根据一些种子数据而自动生成的。分布相似度法和模式匹配法都可以用来在数以百亿计的句子中或者数以十亿计的网页中抽取词的相似性信息。有关分布相似度法和模式匹配法所生成的相似度信息的质量比较参见文献。

    2) 上下位关系提取

    该该模块从文档中抽取词的上下位关系信息,生成(下义词,上义词)数据对,例如(狗,动物)、(悉尼,城市)。提取上下位关系最简单的方法是解析百科类站点的分类信息(如维基百科的“分类”和百度百科的“开放分类”)。这种方法的主要缺点包括:并不是所有的分类词条都代表上位词,例如百度百科中“狗”的开放分类“养殖”就不是其上位词;生成的关系图中没有权重信息,因此不能区分同一个实体所对应的不同上位词的重要性;覆盖率偏低,即很多上下位关系并没有包含在百科站点的分类信息中。

    在英文数据上用Hearst 模式和IsA 模式进行模式匹配被认为是比较有效的上下位关系抽取方法。下面是这些模式的中文版本(其中NPC 表示上位词,NP 表示下位词):

    NPC { 包括| 包含| 有} {NP、}* [ 等| 等等]
    NPC { 如| 比如| 像| 象} {NP、}*
    {NP、}* [{ 以及| 和| 与} NP] 等 NPC
    {NP、}* { 以及| 和| 与} { 其它| 其他} NPC
    NP 是 { 一个| 一种| 一类} NPC

    此外,一些网页表格中包含有上下位关系信息,例如在带有表头的表格中,表头行的文本是其它行的上位词。

    3) 语义类生成

    该模块包括聚类和语义类标定两个子模块。聚类的结果决定了要生成哪些语义类以及每个语义类包含哪些实体,而语义类标定的任务是给一个语义类附加一个或者多个上位词作为其成员的公共上位词。此模块依赖于并列相似性和上下位关系信息来进行聚类和标定。有些研究工作只根据上下位关系图来生成语义类,但经验表明并列相似性信息对于提高最终生成的语义类的精度和覆盖率都至关重要。

    1.3 属性和属性值抽取

    属性提取的任务是为每个本体语义类构造属性列表(如城市的属性包括面积、人口、所在国家、地理位置等),而属性值提取则为一个语义类的实体附加属性值。属性和属性值的抽取能够形成完整的实体概念的知识图谱维度。常见的属性和属性值抽取方法包括从百科类站点中提取,从垂直网站中进行包装器归纳,从网页表格中提取,以及利用手工定义或自动生成的模式从句子和查询日志中提取。

    常见的语义类/ 实体的常见属性/ 属性值可以通过解析百科类站点中的半结构化信息(如维基百科的信息盒和百度百科的属性表格)而获得。尽管通过这种简单手段能够得到高质量的属性,但同时需要采用其它方法来增加覆盖率(即为语义类增加更多属性以及为更多的实体添加属性值)。

    微信图片_20170930153321.jpg

    图5 爱因斯坦信息页

    由于垂直网站(如电子产品网站、图书网站、电影网站、音乐网站)包含有大量实体的属性信息。例如上图的网页中包含了图书的作者、出版社、出版时间、评分等信息。通过基于一定规则模板建立,便可以从垂直站点中生成包装器(或称为模版),并根据包装器来提取属性信息。从包装器生成的自动化程度来看,这些方法可以分为手工法(即手工编写包装器)、监督方法、半监督法以及无监督法。考虑到需要从大量不同的网站中提取信息,并且网站模版可能会更新等因素,无监督包装器归纳方法显得更加重要和现实。无监督包装器归纳的基本思路是利用对同一个网站下面多个网页的超文本标签树的对比来生成模版。简单来看,不同网页的公共部分往往对应于模版或者属性名,不同的部分则可能是属性值,而同一个网页中重复的标签块则预示着重复的记录。

    属性抽取的另一个信息源是网页表格。表格的内容对于人来说一目了然,而对于机器而言,情况则要复杂得多。由于表格类型千差万别,很多表格制作得不规则,加上机器缺乏人所具有的背景知识等原因,从网页表格中提取高质量的属性信息成为挑战。

    上述三种方法的共同点是通过挖掘原始数据中的半结构化信息来获取属性和属性值。与通过“阅读”句子来进行信息抽取的方法相比,这些方法绕开了自然语言理解这样一个“硬骨头”而试图达到以柔克刚的效果。在现阶段,计算机知识库中的大多数属性值确实是通过上述方法获得的。但现实情况是只有一部分的人类知识是以半结构化形式体现的,而更多的知识则隐藏在自然语言句子中,因此直接从句子中抽取信息成为进一步提高知识库覆盖率的关键。当前从句子和查询日志中提取属性和属性值的基本手段是模式匹配和对自然语言的浅层处理。图6 描绘了为语义类抽取属性名的主框架(同样的过程也适用于为实体抽取属性值)。图中虚线左边的部分是输入,它包括一些手工定义的模式和一个作为种子的(词,属性)列表。模式的例子参见表3,(词,属性)的例子如(北京,面积)。在只有语义类无关的模式作为输入的情况下,整个方法是一个在句子中进行模式匹配而生成(语义类,属性)关系图的无监督的知识提取过程。此过程分两个步骤,第一个步骤通过将输入的模式作用到句子上而生成一些(词,属性)元组,这些数据元组在第二个步骤中根据语义类进行合并而生成(语义类,属性)关系图。在输入中包含种子列表或者语义类相关模式的情况下,整个方法是一个半监督的自举过程,分三个步骤:

    模式生成:在句子中匹配种子列表中的词和属性从而生成模式。模式通常由词和属性的环境信息而生成。

    模式匹配。

    模式评价与选择:通过生成的(语义类,属性)关系图对自动生成的模式的质量进行自动评价并选择高分值的模式作为下一轮匹配的输入。

    1.3 关系抽取

    关系抽取的目标是解决实体语义链接的问题。关系的基本信息包括参数类型、满足此关系的元组模式等。例如关系BeCapitalOf(表示一个国家的首都)的基本信息如下:

    参数类型:(Capital, Country)
    模式:

    微信图片_20170930153412.jpg

    元组:(北京,中国);(华盛顿,美国);Capital 和 Country表示首都和国家两个语义类。

    早期的关系抽取主要是通过人工构造语义规则以及模板的方法识别实体关系。随后,实体间的关系模型逐渐替代了人工预定义的语法与规则。但是仍需要提前定义实体间的关系类型。 文献[26]提出了面向开放域的信息抽取框架 (open information extraction,OIE),这是抽取模式上的一个巨大进步。但OIE方法在对实体的隐含关系抽取方面性能低下,因此部分研究者提出了基于马尔可夫逻辑网、基于本体推理的深层隐含关系抽取方法[27]。

    开放式实体关系抽取

    开放式实体关系抽取可分为二元开放式关系抽取和n元开放式关系抽取。在二元开放式关系抽取中,早期的研究有KnowItAll[28]与TextRunner[27]系统,在准确率与召回率上表现一般。文献[29]提出了一种基于Wikipedia的OIE方法WOE,经自监督学习得到抽取器,准确率较TextRunner有明显的提高。针对WOE的缺点,文献[30]提出了第二代OIE ReVerb系统,以动词关系抽取为主。文献[31]提出了第三代OIE系统OLLIE(open language learning for information extraction),尝试弥补并扩展OIE的模型及相应的系统,抽取结果的准确度得到了增强。

    然而,基于语义角色标注的OIE分析显示:英文语句中40%的实体关系是n元的[32],如处理不当,可能会影响整体抽取的完整性。文献[33]提出了一种可抽取任意英文语句中n元实体关系的方法KPAKEN,弥补了ReVerb的不足。但是由于算法对语句深层语法特征的提取导致其效率显著下降,并不适用于大规模开放域语料的情况。

    基于联合推理的实体关系抽取

    联合推理的关系抽取中的典型方法是马尔可夫逻辑网MLN(Markov logic network)[34],它是一种将马尔可夫网络与一阶逻辑相结合的统计关系学习框架,同时也是在OIE中融入推理的一种重要实体关系抽取模型。基于该模型,文献[35]提出了一种无监督学习模型StatSnowball,不同于传统的OIE,该方法可自动产生或选择模板生成抽取器。在StatSnowball的基础上,文献[27,36]提出了一种实体识别与关系抽取相结合的模型EntSum,主要由扩展的CRF命名实体识别模块与基于StatSnowball的关系抽取模块组成,在保证准确率的同时也提高了召回率。文献[27,37]提出了一种简易的Markov逻辑TML(tractable Markov logic),TML将领域知识分解为若干部分,各部分主要来源于事物类的层次化结构,并依据此结构,将各大部分进一步分解为若干个子部分,以此类推。TML具有较强的表示能力,能够较为简洁地表示概念以及关系的本体结构。

    5.2 知识表示

    传统的知识表示方法主要是以RDF(Resource Description Framework资源描述框架)的三元组SPO(subject,property,object)来符号性描述实体之间的关系。这种表示方法通用简单,受到广泛认可,但是其在计算效率、数据稀疏性等方面面临诸多问题。近年来,以深度学习为代表的以深度学习为代表的表示学习技术取得了重要的进展,可以将实体的语义信息表示为稠密低维实值向量,进而在低维空间中高效计算实体、关系及其之间的复杂语义关联,对知识库的构建、推理、融合以及应用均具有重要的意义[38-40]。

    2.1 代表模型

    知识表示学习的代表模型有距离模型、单层神经网络模型、双线性模型、神经张量模型、矩阵分解模型、翻译模型等。详细可参见清华大学刘知远的知识表示学习研究进展。相关实现也可参见 [39]。

    1)距离模型

    距离模型在文献[41] 提出了知识库中实体以及关系的结构化表示方法(structured embedding,SE),其基本思想是:首先将实体用向量进行表示,然后通过关系矩阵将实体投影到与实体关系对的向量空间中,最后通过计算投影向量之间的距离来判断实体间已存在的关系的置信度。由于距离模型中的关系矩阵是两个不同的矩阵,使得协同性较差。

    2)单层神经网络模型

    文献[42]针对上述提到的距离模型中的缺陷,提出了采用单层神经网络的非线性模型(single layer model,SLM),模型为知识库中每个三元组(h,r,t) 定义了以下形式的评价函数:

    微信图片_20170930153950.png

    式中, ut的T次幂∈R的k次幂为关系 r 的向量化表示;g()为tanh函数; Mr,1×Mr,2∈R的k次幂是通过关系r定义的两个矩阵。单层神经网络模型的非线性操作虽然能够进一步刻画实体在关系下的语义相关性,但在计算开销上却大大增加。

    3)双线性模型

    双 线 性 模 型 又 叫 隐 变 量 模 型 (latent factor model,LFM),由文献[43-44]首先提出。模型为知识库中每个三元组 定义的评价函数具有如下形式:

    微信图片_20170930154623.png

    式中,Mr∈R的d×d次幂是通过关系r 定义的双线性变换矩阵;
    lh×lt∈R的d次幂是三元组中头实体与尾实体的向量化表示。双线性模型主要是通过基于实体间关系的双线性变换来刻画实体在关系下的语义相关性。模型不仅形式简单、易于计算,而且还能够有效刻画实体间的协同性。基于上述工作,文献[45]尝试将双线性变换矩阵r M 变换为对角矩阵, 提出了DISTMULT模型,不仅简化了计算的复杂度,并且实验效果得到了显著提升。

    4)神经张量模型

    文献[45]提出的神经张量模型,其基本思想是:在不同的维度下,将实体联系起来,表示实体间复杂的语义联系。模型为知识库中的每个三元组(h,r,t)定义了以下形式的评价函数:

    微信图片_20170930154916.png

    式中, ut的T次幂∈R的k次幂为关系 r 的向量化表示;g()为tanh函数; Mr∈d×k×k是一个三阶张量;Mr,1×Mr,2∈R的k次幂是通过关系r定义的两个矩阵。

    神经张量模型在构建实体的向量表示时,是将该实体中的所有单词的向量取平均值,这样一方面可以重复使用单词向量构建实体,另一方面将有利于增强低维向量的稠密程度以及实体与关系的语义计算。

    5)矩阵分解模型

    通过矩阵分解的方式可得到低维的向量表示,故不少研究者提出可采用该方式进行知识表示学习,其中的典型代表是文献[46]提出的RESACL模型。在RESCAL模型中,知识库中的三元组集合被表示为一个三阶张量,如果该三元组存在,张量中对应位置的元素被置1,否则置为0。通过张量分解算法,可将张量中每个三元组(h,r,t)对应的张量值解为双线性模型中的知识表示形式lh的T次幂×Mr×lt并使|Xhrt-lh的T次幂×Mr×l|尽量小。

    6)翻译模型

    文献[47]受到平移不变现象的启发,提出了TransE模型,即将知识库中实体之间的关系看成是从实体间的某种平移,并用向量表示。关系lr可以看作是从头实体向量到尾实体向量lt的翻译。对于知识库中的每个三元组(h,r,t),TransE都希望满足以下关系|lh+lt≈lt|:,其损失函数为:fr(h,t)=|lh+lr-lt|L1/L2, 该模型的参数较少,计算的复杂度显著降低。与此同时,TransE模型在大规模稀疏知识库上也同样具有较好的性能和可扩展性。

    2.2 复杂关系模型

    知识库中的实体关系类型也可分为1-to-1、1-to-N、N-to-1、N-to-N4种类型[47],而复杂关系主要指的是1-to-N、N-to-1、N-to-N的3种关系类型。由于TransE模型不能用在处理复杂关系上[39],一系列基于它的扩展模型纷纷被提出,下面将着重介绍其中的几项代表性工作。

    1)TransH模型

    文献[48]提出的TransH模型尝试通过不同的形式表示不同关系中的实体结构,对于同一个实体而言,它在不同的关系下也扮演着不同的角色。模型首先通过关系向量lr与其正交的法向量wr选取某一个超平面F, 然后将头实体向量lh和尾实体向量lt法向量wr的方向投影到F, 最后计算损失函数。TransH使不同的实体在不同的关系下拥有了不同的表示形式,但由于实体向量被投影到了关系的语义空间中,故它们具有相同的维度。

    2)TransR模型

    由于实体、关系是不同的对象,不同的关系所关注的实体的属性也不尽相同,将它们映射到同一个语义空间,在一定程度上就限制了模型的表达能力。所以,文献[49]提出了TransR模型。模型首先将知识库中的每个三元组(h, r,t)的头实体与尾实体向关系空间中投影,然后希望满足|lh+lt≈lt|的关系,最后计算损失函数。

    文献[49]提出的CTransR模型认为关系还可做更细致的划分,这将有利于提高实体与关系的语义联系。在CTransR模型中,通过对关系r 对应的头实体、尾实体向量的差值lh-lt进行聚类,可将r分为若干个子关系rc 。

    3)TransD模型

    考虑到在知识库的三元组中,头实体和尾实体表示的含义、类型以及属性可能有较大差异,之前的TransR模型使它们被同一个投影矩阵进行映射,在一定程度上就限制了模型的表达能力。除此之外,将实体映射到关系空间体现的是从实体到关系的语 义联系,而TransR模型中提出的投影矩阵仅考虑了不同的关系类型,而忽视了实体与关系之间的交互。因此,文献[50]提出了TransD模型,模型分别定义了头实体与尾实体在关系空间上的投影矩阵。

    4)TransG模型

    文献[51]提出的TransG模型认为一种关系可能会对应多种语义,而每一种语义都可以用一个高斯分布表示。TransG模型考虑到了关系r 的不同语义,使用高斯混合模型来描述知识库中每个三元组(h,r,t)头实体与尾实体之间的关系,具有较高的实体区分度。

    5)KG2E模型

    考虑到知识库中的实体以及关系的不确定性,文献[52]提出了KG2E模型,其中同样是用高斯分布来刻画实体与关系。模型使用高斯分布的均值表示实体或关系在语义空间中的中心位置,协方差则表示实体或关系的不确定度。

    知识库中,每个三元组(h,r,t)的头实体向量与尾实体向量间的

    微信图片_20170930160102.png

    关系r可表示为:

    微信图片_20170930160147.png

    5.3 知识融合

    通过知识提取,实现了从非结构化和半结构化数据中获取实体、关系以及实体属性信息的目标。但是由于知识来源广泛,存在知识质量良莠不齐、来自不同数据源的知识重复、层次结构缺失等问题,所以必须要进行知识的融合。知识融合是高层次的知识组织[53],使来自不同知识源的知识在同一框架规范下进行异构数据整合、消歧、加工、推理验证、更新等步骤[54],达到数据、信息、方法、经验以及人的思想的融合,形成高质量的知识库。

    3.1 实体对齐

    实体对齐 (entity alignment) 也称为实体匹配 (entity matching)或实体解析(entity resolution)或者实体链接(entity linking),主要是用于消除异构数据中实体冲突、指向不明等不一致性问题,可以从顶层创建一个大规模的统一知识库,从而帮助机器理解多源异质的数据,形成高质量的知识。

    在大数据的环境下,受知识库规模的影响,在进行知识库实体对齐时,主要会面临以下3个方面的挑战[55]:1) 计算复杂度。匹配算法的计算复杂度会随知识库的规模呈二次增长,难以接受;2) 数据质量。由于不同知识库的构建目的与方式有所不同,可能存在知识质量良莠不齐、相似重复数据、孤立数据、数据时间粒度不一致等问题[56];3) 先验训练数据。在大规模知识库中想要获得这种先验数据却非常困难。通常情况下,需要研究者手工构造先验训练数据。

    基于上述,知识库实体对齐的主要流程将包括[55]:1) 将待对齐数据进行分区索引,以降低计算的复杂度;2) 利用相似度函数或相似性算法查找匹配实例;3) 使用实体对齐算法进行实例融合;4) 将步骤2)与步骤3)的结果结合起来,形成最终的对齐结果。对齐算法可分为成对实体对齐与集体实体对齐两大类,而集体实体对齐又可分为局部集体实体对齐与全局集体实体对齐。

    1)成对实体对齐方法

    ① 基于传统概率模型的实体对齐方法

    基于传统概率模型的实体对齐方法主要就是考虑两个实体各自属性的相似性,而并不考虑实体间的关系。文献[57]将基于属性相似度评分来判断实体是否匹配的问题转化为一个分类问题,建立了该问题的概率模型,缺点是没有体现重要属性对于实体相似度的影响。文献[58]基于概率实体链接模型,为每个匹配的属性对分配了不同的权重,匹配准确度有所提高。文献[59]还结合贝叶斯网络对属性的相关性进行建模,并使用最大似然估计方法对模型中的参数进行估计。

    ② 基于机器学习的实体对齐方法

    基于机器学习的实体对齐方法主要是将实体对齐问题转化为二分类问题。根据是否使用标注数据可分为有监督学习与无监督学习两类,基于监督学习的实体对齐方法主要可分为成对实体对齐、基于聚类的对齐、主动学习。

    通过属性比较向量来判断实体对匹配与否可称为成对实体对齐。这类方法中的典型代表有决策树 [60]、支持向量机[61]、集成学习[62]等。文献[63]使用分类回归树、线性分析判别等方法完成了实体辨析。文献[64]基于二阶段实体链接分析模型,提出了一种新的SVM分类方法,匹配准确率远高于TAILOR中的混合算法。

    基于聚类的实体对齐算法,其主要思想是将相似的实体尽量聚集到一起,再进行实体对齐。文献[65]提出了一种扩展性较强的自适应实体名称匹配与聚类算法,可通过训练样本生成一个自适应的距离函数。文献[66]采用类似的方法,在条件随机场实体对齐模型中使用监督学习的方法训练产生距离函数,然后调整权重,使特征函数与学习参数的积最大。

    在主动学习中,可通过与人员的不断交互来解决很难获得足够的训练数据问题,文献[67]构建的ALIAS系统可通过人机交互的方式完成实体链接与去重的任务。文献[68]采用相似的方法构建了ActiveAtlas系统。

    2)局部集体实体对齐方法

    局部集体实体对齐方法为实体本身的属性以及与它有关联的实体的属性分别设置不同的权重,并通过加权求和计算总体的相似度,还可使用向量空间模型以及余弦相似性来判别大规模知识库中的实体的相似程度[69],算法为每个实体建立了名称向量与虚拟文档向量,名称向量用于标识实体的属性,虚拟文档向量则用于表示实体的属性值以及其邻居节点的属性值的加权和值[55]。为了评价向量中每个分量的重要性,算法主要使用TF-IDF为每个分量设置权重,并为分量向量建立倒排索引,最后选择余弦相似性函数计算它们的相似程度[55]。该算法的召回率较高,执行速度快,但准确率不足。其根本原因在于没有真正从语义方面进行考虑。

    3)全局集体实体对齐方法

    ① 基于相似性传播的集体实体对齐方法

    基于相似性传播的方法是一种典型的集体实体对齐方法,匹配的两个实体与它们产生直接关联的其他实体也会具有较高的相似性,而这种相似性又会影响关联的其他实体[55]。

    相似性传播集体实体对齐方法最早来源于文献[70-71]提出的集合关系聚类算法,该算法主要通过一种改进的层次凝聚算法迭代产生匹配对象。文献[72]在以上算法的基础上提出了适用于大规模知识库实体对齐的算法SiGMa,该算法将实体对齐问题看成是一个全局匹配评分目标函数的优化问题进行建模,属于二次分配问题,可通过贪婪优化算法求得其近似解。SiGMa方法[55]能够综合考虑实体对的属性与关系,通过集体实体的领域,不断迭代发现所有的匹配对。

    ② 基于概率模型的集体实体对齐方法基于概率模型的集体实体对齐方法主要采用统计关系学习进行计算与推理,常用的方法有LDA模型[73]、CRF模型[74]、Markov逻辑网[75]等。

    文献[73]将LDA模型应用于实体的解析过程中,通过其中的隐含变量获取实体之间的关系。但在大规模的数据集上效果一般。文献[74]提出了一种基于图划分技术的CRF实体辨析模型,该模型以观察值为条件产生实体判别的决策,有利于处理属性间具有依赖关系的数据。文献[66]在CRF实体辨析模型的基础上提出了一种基于条件随机场模型的多关系的实体链接算法,引入了基于canopy的索引,提高了大规模知识库环境下的集体实体对齐效率。文献[75]提出了一种基于Markov逻辑网的实体解析方法。通过Markov逻辑网,可构建一个Markov网,将概率图模型中的最大可能性计算问题转化为典型的最大化加权可满足性问题,但基于Markov网进行实体辨析时,需要定义一系列的等价谓词公理,通过它们完成知识库的集体实体对齐。

    3.2 知识加工

    通过实体对齐,可以得到一系列的基本事实表达或初步的本体雏形,然而事实并不等于知识,它只是知识的基本单位。要形成高质量的知识,还需要经过知识加工的过程,从层次上形成一个大规模的知识体系,统一对知识进行管理。知识加工主要包括本体构建与质量评估两方面的内容。

    1)本体构建

    本体是同一领域内不同主体之间进行交流、连通的语义基础,其主要呈现树状结构,相邻的层次节点或概念之间具有严格的“IsA”关系,有利于进行约束、推理等,却不利于表达概念的多样性。本体在知识图谱中的地位相当于知识库的模具,通过本体库而形成的知识库不仅层次结构较强,并且冗余程度较小。

    展开全文
  • 图像分割综述

    万次阅读 多人点赞 2019-07-09 22:03:48
    (2)算法复杂,计算量大; (3)分裂有可能破怪区域的边界。 在实际应用当中通常将区域生长算法和区域分裂合并算法结合使用,该类算法对某些复杂物体定义的复杂场景的分割或者对某些自然景物的分割等类似先验知识...
  • 6:增长量计算 ①已知现期,基期,增长量= 现期 - 基期 ②已知现期,增长率,增长量= 现期1+r\frac{现期}{1+r}1+r现期​*r 技巧:百化分 (1)第一步:|r|=1/n。必须化成 1/n 的形式,分子必须为 1。 (2)第二步...
  • 【数据库学习】数据库总结

    万次阅读 多人点赞 2018-07-26 13:26:41
    实体化视图是用于汇总,预计算,复制或分发数据的对象, 在大型的数据库中使用它可以提高涉及到的SUM,COUNT,AVG,MIN,MAX等的表的查询的速度。 物化视图的快速刷新采用了增量的机制,在刷新时,只针对基表上发生变化的...
  • 安全库存计算方法 在仓储工作中掌握安全库存的...用最古老的公式 安全库存=预计最大消耗-平均消耗*采购提前 期 如果用统计学的观点可以变更为 安全库存=日平均消耗*一定服务水平下的前置期标准差 计算方法 安全库
  • 史上最全面Java面试汇总(面试题+答案)

    万次阅读 多人点赞 2018-07-06 14:09:25
    void wait(long timeout) 导致当前的线程等待,直到其他线程调用此对象的notify()方法或notifyAll()方法,或者超过指定的时间。 void wait(long timeout, int nanos) 导致当前的线程等待,直到其他线程调用此对象...
  • 灰色预测

    千次阅读 多人点赞 2019-12-04 20:46:42
    计算方法如下: Step6: 建立模型求解时间响应函数并进行预测 GM(1,1)模型X(k)+aZ(k)=b的白化方程: 的时间响应函数为: Step7:精确度检验 相对残差检验 方差比检验 ...
  • 算术平均、几何平均、调和平均、平方平均和移动平均计算编程有什么关系:Just One Word,不能只会算术平均数,还有其他很多选择,以及不同场景使用不同的平均数。 算术平均 算术平均(Arithmetic mean)是最...
  • 安全库存 又称保险库存德文Sicherheitsbestand是指当不确定因素 订货期间需求增长到货延期等 已导致更高的预期需求或导致完成周期更长 时的缓冲存货安全库存用于满足提前期需求在给定安全库存的条件下平均 ...
  • 数据分析入门(一)

    千次阅读 多人点赞 2020-02-29 11:17:19
    1.数据分析概念 1.1数据分析 是指用适当的统计分析方法对收集来的大量数据进行...常见的分析方法包括:对比分析法、平均分析法、交叉分析法等。Excel可以实现。 探索性数据分析(高级数据分析):EDA指对已有数据在...
  • 数学建模——灰色预测模型及matlab代码实现

    万次阅读 多人点赞 2019-09-02 20:52:58
    其核心体系是灰色模型(Grey Model,简称GM),即对原始数据作累加生成(或其他方法生成)得到近似的指数规律再进行建模的方法。 优点是不需要很多的数据,一般只需要4个数据就够。缺点是只适合于中短期的预测,只...
  • 卷积神经网络入门详解

    万次阅读 多人点赞 2017-11-08 15:52:14
    计算量 。注意是 计算量 而不是 参数 。 2.1.1 卷积层作用   1. 滤波器的作用或者说是卷积的作用 。卷积层的参数是有一些可学习的滤波器集合构成的。每个滤波器在空间上(宽度和高度)都比较小, 但是深度...
  • 基于MATLAB的水果分级设计

    万次阅读 多人点赞 2018-06-14 14:19:35
    基于MATLAB的水果分级识别技术研究摘 要本次毕业设计介绍了基于MATLAB的水果分级自动识别,利用手机端获取苹果的样本图像,应用MATLAB软件编程... 在苹果大小识别方面,比较了不同的大小计算方法,选择了利用图...
  • 比如:高低气温、某商品日成交、股票日收盘价格、公司历年利润额。 时间序列形式上由反映客观现象的观测值和这些数值所属的时间两个基本要素构成。 时期序列:反映现象在某一段时期内发展过程的总量,不同时期的...
  • 【JAVA面试】java面试题整理(3)

    千次阅读 2018-10-28 12:50:13
    若允许担保失败,则检查老年代最大可用的连续空间是否大于历次晋升到老年代对象的平均大小,若大于,则尝试进行Minor GC;若小于,则要改为Full GC 垃圾收集器:   Serial(串行收集器) 特性:单...
  • tps系统吞吐量计算公式

    千次阅读 2015-05-06 12:50:43
    PS:下面是性能测试的主要概念和计算公式,记录下:一.系统吞度量要素:一个系统的吞度量(承压能力)与request对CPU的消耗、外部接口、IO等等紧密关联。单个reqeust 对CPU消耗越高,外部系统接口、IO影响速度越慢...
  • SWA(随机权重平均)——一种全新的模型优化方法

    千次阅读 多人点赞 2018-11-13 23:33:56
    然而,SWA 刚好补充了 SGD 的这几点不足,在 计算方面,SWA 相对于 SGD 的计算量增长可以忽略不记,只多了一个周期性 的权重平均而已。但是在稳定性和最优值域的寻找方面,SWA 是要远好于 SGD 的。尤其是这种训练...
  • Stata: 空间面板数据模型及Stata实现

    万次阅读 多人点赞 2019-05-10 10:37:56
    基于社会经济因素的空间权重矩阵,由于不同年份的社会经济指标值不同,其通常是随着时间变化而改变,但是此时模型通常较为复杂,实证中常取平均值构造空间权重矩阵 (此外,时变空间权重矩阵也被提出)。 为了对模型...
  • 夏普比率和最大回撤计算方法

    千次阅读 2019-10-22 09:59:31
    一、夏普比率的计算 夏普比例(TheSharpe ratio)=(预期收益率 - 无风险利率)/投资组合标准差,也叫报酬与波动性比率,可能是最常用的投资组合管理度量标准。它采用的方法是,组合中超过无风险利率的那部分收益要...
  • 数据分析面试题

    万次阅读 多人点赞 2018-12-14 12:46:24
    通过计算平均数来反映总体在一定时间、地点条件下某一数量特征的一般水平。但由于其忽略了个体间可能存在的巨大差异,有时候并不一定反映出某一指标的一般水平。因此,很多时候平均分析法是不可取的。 综合...
  •  假如需要预测该类房地产2002年1月的价格,则计算方法如下:由于最后一个移动平均数762与2002年1月相差3个月,所以预测该类房地产2002年1月的价格为:762 + 12 × 3 =798(元/平方米) ARMA 自回归滑动平均模型...
  • 计算机网络自顶向下方法第七版课后习题答案第一章 复习题 1.1节 R1: 没有区别。 在全文中,“主机”和“终端系统”一词可互换使用。 终端系统包括PC,工作站,Web服务器,邮件服务器,PDA,连接Internet的游戏机等...
  • 深度学习常见算法的介绍和比较

    万次阅读 多人点赞 2018-02-08 22:00:06
    它把输入信号分割成不重叠的区域,对于每个区域通过池化(下采样)运算来降低网络的空间分辨率,比如最大值池化是选择区域内的最大值,均值池化是计算区域内的平均值。通过该运算来消除信号的偏移和扭曲。 全连接...
  • 移动平均法是用一组最近的实际数据值来预测未来一期或几期内产品的需求的一种常用方法。移动平均法适用于即期预测。当产品需求既不快速增长也不快速下降,且不存在季节性因素时,移动平均法能有效地消除预测中的...
  • 在本文中,我将讨论两篇有趣的近期论文,这些论文通过使用智能的集合方式提供了一种简单的方法来提高任何给定神经网络的性能。他们是: “ 损耗表面,模式连通性和DNN的快速集成 ”,Garipov等。人 Izmailov等人...
  • 增长黑客是硅谷当下热门的新商业方法论,其精髓在于通过快节奏测试和迭代,以极低甚至零成本获取并留存用户。 作为最早提出“增长黑客”概念的理论先驱、带领 Dropbox 实现500%增长的实战领军人物,作者在...

空空如也

空空如也

1 2 3 4 5 ... 20
收藏数 64,470
精华内容 25,788
关键字:

平均增长量的计算方法