精华内容
下载资源
问答
  • 数据挖掘中的概念描述

    千次阅读 2015-09-02 17:31:00
    从数据分析角度出发,数据...描述型数据挖掘又称为概念描述概念描述是数据挖掘的一个重要部分。概念描述基本知识描述型数据挖掘最简单的类型就是概念描述概念描述描述的是数据的特征和比较描述。 特征:给定数据集
    数据挖掘一般可分为描述型数据挖掘和预测型数据挖掘,概念描述讲的就是描述型数据挖掘。
    

    一、概念描述基本知识

    1.1 两种类型的数据挖掘

    从数据分析角度出发,数据挖掘可分为两种类型:

    • 描述型数据挖掘:以简洁概要方式描述数据
    • 预测型数据挖掘:预测性数据挖掘则是通过对所提供数据集应用特定方法分析所获得的一个或一组数据模型,并将该模型用于预测未来新数据的有关性质。

    1.2 概念描述

    描述型数据挖掘又称为概念描述,概念描述是数据挖掘的一个重要部分。描述型数据挖掘最简单的类型就是概念描述。概念描述描述的是数据的特征和比较描述:

    • 特征描述:给定数据集的简洁汇总
    • 比较描述:多用于两个或多个数据集

    数据泛化也是一种概念描述,这类似于数据仓库中的OLAP,但两者之间也是有区别的:

    • 复杂的数据类型和聚集:概念描述可以处理更加复杂的数据类型属性和他们的聚集
    • 用户控制和自动处理:OLAP多是用户的控制和操作,而数据挖掘中的概念描述更努力成为自动化的过程,具备自动知识发现的能力,要远远复杂的多

    二、特征描述

    数据泛化也是一种特征描述。数据泛化的概念:它是一个过程,它将庞大、任务相关的数据集从较低的概念层次抽象到较高的概念层次。具体泛化方法有两类:

    1. 数据立方:类似OLAP
    2. 面向属性的归纳

    数据泛化是非常有用的,举个例子:一个销售系统中的数据库中商品项目可能由诸如itemid,name,brand,price,category,place-made等低层次的属性构成,但销售和市场经理都希望得到在圣诞节期间大量商品基本信息的汇总描述来获得一些信息。

    2.1 面向属性的归纳

    面向属性归纳的基本思想是:首先使用关系数据库查询收集任务相关数据,然后通过观察任务相关数据中每个属性的不同值的个数进行泛化。泛化可以通过属性删除,或者通过属性泛化进行。

    2.1.1 收集任务相关数据

    通过数据挖掘查询或者关系查询获取相关数据,假设我们有如下关系查询语句:

    use Big_university_DB
    select name,gender,major,birth_place,birth_date,residence,phone,gpa
    from student
    where status in {"M.Sc","M.A","M.B.A","Ph.D"}
    

    把词语在关系数据库中执行,返回如下表所示数据。该表一般被称作初始工作表,是要进行归纳的数据。

    namegendermajorbirth_placebirth_dateredidencephonegpa
    JimMCSVancouver,BC,Canada76-12-83511,Main St,Richmand687-45983.67
    ScottMCSMontreal,Que,Canada75-7-28345,IstSt,Vancouver253-91063.70
    LeeFPhysicsSeattle,WA,USA70-8-25231,Austin,Burnaby420-52323.83

    数据已经准备好,下面就开始进行属性归纳,面向属性归纳的基本操作是数据泛化,它有两种方法:属性删除

    2.1.2 属性删除

    顾名思义,属性删除就是删除我们不需要的数据。我们基于如下规则盘点是否采用属性删除方法:如果初始工作表中某个属性有大量不同的值,(1)但是在此属性上没有泛化操作符;或者(2)它的较高层概念可以用其它属性表示,该属性应当从工作关系表中删除。

    举个例子,对于情况1,因为它没有泛化操作符,就意味着它不能被泛化,保留它则与产生简洁的描述规则相矛盾,比如初始工作表中的姓名字段。对于情况2,比如属性street可以被较高的属性city表示,所以删除city属性。

    2.1.3 属性泛化

    属性泛化基于如下规则:如果初始工作表中某个属性有大量不同的值,并且该属性上存在泛化操作符,则应当选择该泛化操作符,并将它用于该属性。

    2.1.4 属性泛化控制

    属性删除和属性泛化两个规则都表明,如果某个属性存在大量的不同取值,就应当进一步泛化,那多大才算是大?这个控制过程我们就称作属性泛化控制。有一些方法可以控制泛化的过程,下面介绍两种常用的方法:

    1. 属性泛化阈值控制,对所有属性设置一个泛化阈值,或对每个属性设置一个泛化阈值,如果属性不同值个数大于这个阈值,就应当进一步进行属性删除或泛化。
    2. 泛化关系阈值控制,如果泛化关系中不同元组的个数超过该阈值,则应当进一步泛化。

    2.1.5 面向属性归纳实例

    现在,我们就对上面的初始工作表中的每个属性进行泛化,泛化过程如下:

    1. name:由于name存在大量不同的值,并且没有泛化操作符,删除之。
    2. gender:只有两个不同值,保留,无需泛化。
    3. major:假设major数量有20,属性泛化阈值为5,并且已定义了一个向上攀升的概念分层{arts,engineering,business},则对major进行泛化。
    4. birth_place:有大量不同取值,应当泛化。可以将birth_place属性删除,泛化到birth_country。
    5. birth_date:泛化到age。
    6. resident:可以泛化到resident_country,像是的概念层次的number,street可以删除。
    7. phone:从泛化中删除。
    8. gpa:存在概念分层,可以泛化到{excellent,very good,…}
      所泛化过程将产生相等元组的组。例如,初始工作表中前两个元组被泛化成相同的元组(即第一个元组),这些相同的元组被合并成一个,同时累计它们的计数值,这一过程最终得到如下泛化关系表:
    gendermajorbirth_countryage_rangeredidence_citygpacount
    MScienceCanada20Richmonverygood1
    MScienceCanada20Vancouveverygood2
    FengineerUSA25Burnabyexcellent2

    2.2 数据泛化的导出表示

    • 二维表
    • 3d交叉表
    • 条形图、饼形图
    • 数据方

    三、解析特征:属性相关性分析

    有时候我们很难确定哪些属性应当纳入类特征或类比较中,我们可以借助某些属性相关分析方法来识别不相关或者弱相关属性。

    3.1 为什么要进行属性分析

    我们已经在上面介绍过,数据仓库和OLAP工具有两个局限性:处理复杂对象和泛化过程难以自动化。

    对用户来说,确定哪些维应当纳入到类特征分析中并不是一件很容易的事,数据关系通常有很多属性(多的有成百上千个),对于有效的数据挖掘,应当选择哪些属性或维,用户所知甚少。另一方面,用户也可能包含了太多的分析属性。

    所以我们应当引进一些方法进行属性相关性分析,以过滤统计不相关或弱相关属性,保留对手头挖掘任务最相关的属性。包含属性/维相关性分析的类特征成为解析特征,包含这种分析的类比较成为解析比较

    3.2 属性相关分析的方法

    关于属性相关分析,在机器学习、统计、模糊和粗糙集理论等方面都有很多研究。属性相关分析基本思想是计算某种度量,用于量化属性与给定类或概念的相关性。这种度量包括信息增益、Gini索引、不确定性相关系数

    展开全文
  • 设备描述概念及使用

    千次阅读 2016-09-01 15:13:29
    设备描述概念及使用 1设备描述表概述  当Windows要在显示器或其他设备上绘制图形或文本时,其不像DOS系统把图像和文本直接输出到硬件,而是使用一个设备描述表来替代硬件设备的逻辑表示。  设备描述表(Device ...

    设备描述表概念及使用

    1设备描述表概述

        当Windows要在显示器或其他设备上绘制图形或文本时,其不像DOS系统把图像和文本直接输出到硬件,而是使用一个设备描述表来替代硬件设备的逻辑表示。

        设备描述表(Device Context, 缩写为DC)也称设备上下文或设备环境。简单来说,就是一种包含各种绘图属性(字体,颜色)和方法(绘图函数)的数据结构。设备描述表定义了设备,绘图工具和画图信息,其不仅可以绘制各种图形,还可以确定在应用窗口中绘制图形的方式和图形的样式。

    说明:Windows所有的绘制操作及图形输出都必须通过设备描述表这个虚拟用户工作区来进行。用户在绘制之前,必须获取绘制窗口区域的一个设备环境DC,接着才能进行GDI函数的调用,执行适合与设备环境的命令。

    2获取设备描述表

        在窗口绘图之前必须首先获取窗口的设备描述表。若没有设备描述表。任何绘图函数都无法工作。Windows不允许直接访问显示设备,儿必须通过Windows返回的设备描述表句柄与显示设备通信。

        一般来说有三种方式获取对应的DC:

    2.1使用GetDC()函数

        如果Windows应用程序的绘图操作不是有WM_PAINT消息驱动,就需要调用GetDC()函数来进行获取。其常用显示是CWnd类的成员函数,格式如下:

        CDC * GetDC();

        该函数用于获取窗口工作区的显示器设备描述表,其不带任何参数。如果函数条用成功,则返回标识CWnd客户区的设备环境,否则返回NULL。

    说明:在完成绘图之后,用GetDC函数获取的设备描述表必须通过ReleaseDC函数来释放。

    Demo:

    结果:

    2.2使用BeginPaint()函数

        Windows应用程序响应WM_PAINT消息进行图形刷新时,会通过调用BeginPaint()函数来获取DC。其常用的形式是CWnd类的成员函数,格式如下:

        CDC * BeginPaiint(LPPAINTSTRUCT lpPaint);

        该函数只有一个参数,就是指向结构PAINTSTRUCT变量的指针。系统无论调用哪种形式的BeginPaint函数,都需要填写PAINTSTRUCT结构以标识需要刷新的无效矩形。只有在响应WM_PAINT消息时才调用BeginPaint函数,但是在返回处理消息的结果之前,必须调用EndPaint函数来释放资源。

    Demo:

    结果:

    2.3直接构造CDC对象

          该方法用声明一个CDC类或其派生类对象的方式来获取,也就是使用比较简单的一种方法。构造方法如下:

        CClientdc dc(CWnd *);

        此时构造的是一个对象。这种方法实际上是间接使用了GetDC()成员函数。因为当一个C++类声明一个对象时,系统会自动调用该类的构造函数,而在CClient类的构造函数中就调用GetDC()函数。当这个对象被释放时,又会自动调用该类的析构函数,在析构函数中,则调用ReleaseDC()函数来释放设备描述表。

    Demo:

    结果:

    DEMO下载CSDN:http://download.csdn.net/detail/u012377333/9619046

    展开全文
  • from:http://www.cnblogs.com/fantasy01/p/4581803.html?utm_source=tuicool and参考:周志华《机器学习》 ... 关于对信息、熵、信息增益是信息论里的概念,是对数据处理的量化,这几个概念主要...

    from:http://www.cnblogs.com/fantasy01/p/4581803.html?utm_source=tuicool

     

    关于对信息、熵、信息增益是信息论里的概念,是对数据处理的量化,这几个概念主要是在决策树里用到的概念,因为在利用特征来分类的时候会对特征选取顺序的选择,这几个概念比较抽象,我也花了好长时间去理解(自己认为的理解),废话不多说,接下来开始对这几个概念解释,防止自己忘记的同时,望对其他人有个借鉴的作用,如有错误还请指出。

    1、信息

    这个是熵和信息增益的基础概念,我觉得对于这个概念的理解更应该把他认为是一用名称,就比如‘鸡‘(加引号意思是说这个是名称)是用来修饰鸡(没加引号是说存在的动物即鸡),‘狗’是用来修饰狗的,但是假如在鸡还未被命名为'鸡'的时候,鸡被命名为‘狗’,狗未被命名为‘狗’的时候,狗被命名为'鸡',那么现在我们看到狗就会称其为‘鸡’,见到鸡的话会称其为‘鸡’,同理,信息应该是对一个抽象事物的命名,无论用不用‘信息’来命名这种抽象事物,或者用其他名称来命名这种抽象事物,这种抽象事物是客观存在的。

    引用香农的话,信息是用来消除随机不确定性的东西,当然这句话虽然经典,但是还是很难去搞明白这种东西到底是个什么样,可能在不同的地方来说,指的东西又不一样,从数学的角度来说可能更加清楚一些,数学本来就是建造在悬崖之上的一种理论,一种抽象的理论,利用抽象来解释抽象可能更加恰当,同时也是在机器学习决策树中用的定义,如果带分类的事物集合可以划分为多个类别当中,则某个类(xi)的信息定义如下:         

    I(x)用来表示随机变量的信息,p(xi)指是当xi发生时的概率,这里说一下随机变量的概念,随机变量时概率论中的概念,是从样本空间到实数集的一个映射,样本空间是指所有随机事件发生的结果的并集,比如当你抛硬币的时候,会发生两个结果,正面或反面,而随机事件在这里可以是,硬币是正面;硬币是反面;两个随机事件,而{正面,反面}这个集合便是样本空间,但是在数学中不会说用‘正面’、‘反面’这样的词语来作为数学运算的介质,而是用0表示反面,用1表示正面,而“正面->1”,"反面->0"这样的映射便为随机变量,即类似一个数学函数。

    2、熵

    既然信息已经说完,熵说起来就不会那么的抽象,更多的可能是概率论的定义,熵是约翰.冯.诺依曼建议使用的命名(当然是英文),最初原因是因为大家都不知道它是什么意思,在信息论和概率论中熵是对随机变量不确定性的度量,与上边联系起来,熵便是信息的期望值,可以记作:

                             

     

    n为:类别的个数。

    熵只依赖X的分布,和X的取值没有关系,熵是用来度量不确定性,当熵越大,概率说X=xi的不确定性越大,反之越小,在机器学期中分类中说,熵越大即这个类别的不确定性更大,反之越小,当随机变量的取值为两个时,熵随概率的变化曲线如下图:

                        

    当p=0或p=1时,H(p)=0,随机变量完全没有不确定性,当p=0.5时,H(p)=1,此时随机变量的不确定性最大

    条件熵

    条件熵是用来解释信息增益而引入的概念,概率定义:随机变量X在给定条件下随机变量Y的条件熵,对定义描述为:X给定条件下Y的条件干率分布的熵对X的数学期望,在机器学习中为选定某个特征后的熵,公式如下:

                    

    这里可能会有疑惑,这个公式是对条件概率熵求期望,但是上边说是选定某个特征的熵,没错,是选定某个特征的熵,因为一个特征可以将待分类的事物集合分为多类,即一个特征对应着多个类别,因此在此的多个分类即为X的取值。

    3、信息增益

    信息增益在决策树算法中是用来选择特征的指标,信息增益越大,则这个特征的选择性越好,在概率中定义为:待分类的集合的熵和选定某个特征的条件熵之差(这里只的是经验熵或经验条件熵,由于真正的熵并不知道,是根据样本计算出来的),公式如下:

                    

    注意:这里不要理解偏差,因为上边说了熵是类别的,但是在这里又说是集合的熵,没区别,因为在计算熵的时候是根据各个类别对应的值求期望来等到熵

     

    4、信息增益算法(举例,摘自统计学习算法)

    训练数据集合D,|D|为样本容量,即样本的个数(D中元素个数),设有K个类Ck来表示,|Ck|为Ci的样本个数,|Ck|之和为|D|,k=1,2.....,根据特征A将D划分为n个子集D1,D2.....Dn,|Di|为Di的样本个数,|Di|之和为|D|,i=1,2,....,记Di中属于Ck的样本集合为Dik,即交集,|Dik|为Dik的样本个数,算法如下:

    输入:D,A

    输出:信息增益g(D,A)

    (1)D的经验熵H(D)

            

    此处的概率计算是根据古典概率计算,由于训练数据集总个数为|D|,某个分类的个数为|Ck|,在某个分类的概率,或说随机变量取某值的概率为:|Ck|/|D|

    (2)选定A的经验条件熵H(D|A)

            

     

    此处的概率计算同上,由于|Di|是选定特征的某个分类的样本个数,则|Di|/|D|,可以说为在选定特征某个分类的概率,后边的求和可以理解为在选定特征的某个类别下的条件概率的熵,即训练集为Di,交集Dik可以理解在Di条件下某个分类的样本个数,即k为某个分类,就是缩小训练集为Di的熵

    (3)信息增益

            

     

    4、基尼指数

    1、是一种不等性度量;
    2、通常用来度量收入不平衡,可以用来度量任何不均匀分布;
    3、是介于0~1之间的数,0-完全相等,1-完全不相等;
    4、总体内包含的类别越杂乱,GINI指数就越大(跟熵的概念很相似)

     

    基尼不纯度指标

    在CART算法中, 基尼不纯度表示一个随机选中的样本在子集中被分错的可能性。基尼不纯度为这个样本被选中的概率乘以它被分错的概率。当一个节点中所有样本都是一个类时,基尼不纯度为零。
    假设y的可能取值为{1, 2, ..., m},令fi是样本被赋予i的概率,则基尼指数可以通过如下计算:

    使用基尼系数作为特征划分规则时:

    上述使用jini指数作为特征分类标准时,以特定的一个属性作为一部分,另外的全部属性作为另外一部分,来计算jini指数。

    《统计学习》中CART树的gini指数计算:
    计算的表格数据,是一个分类问题:

    计算最佳的特征值和属性值

     


     

     

    5、 python实现信息增益和基尼系数 的计算

    1.输入数据集

    #!/usr/bin/env python
    # -*- coding: utf-8 -*-
    """
    __title__ = ''
    __author__ = 'mike_jun'
    __mtime__ = '2019-7-12'
    #目的:
    """
    import numpy as np
    import pandas as pd
    import matplotlib.pyplot as plt
    import io
    
    # 计算两个特征的基尼指数
    data_str = output = io.StringIO('''编号,色泽,根蒂,敲声,纹理,脐部,触感,密度,含糖率,好瓜
    1,青绿,蜷缩,浊响,清晰,凹陷,硬滑,0.697,0.46,是  
    2,乌黑,蜷缩,沉闷,清晰,凹陷,硬滑,0.774,0.376,是  
    3,乌黑,蜷缩,浊响,清晰,凹陷,硬滑,0.634,0.264,是  
    4,青绿,蜷缩,沉闷,清晰,凹陷,硬滑,0.608,0.318,是  
    5,浅白,蜷缩,浊响,清晰,凹陷,硬滑,0.556,0.215,是  
    6,青绿,稍蜷,浊响,清晰,稍凹,软粘,0.403,0.237,是  
    7,乌黑,稍蜷,浊响,稍糊,稍凹,软粘,0.481,0.149,是  
    8,乌黑,稍蜷,浊响,清晰,稍凹,硬滑,0.437,0.211,是  
    9,乌黑,稍蜷,沉闷,稍糊,稍凹,硬滑,0.666,0.091,否  
    10,青绿,硬挺,清脆,清晰,平坦,软粘,0.243,0.267,否  
    11,浅白,硬挺,清脆,模糊,平坦,硬滑,0.245,0.057,否  
    12,浅白,蜷缩,浊响,模糊,平坦,软粘,0.343,0.099,否  
    13,青绿,稍蜷,浊响,稍糊,凹陷,硬滑,0.639,0.161,否  
    14,浅白,稍蜷,沉闷,稍糊,凹陷,硬滑,0.657,0.198,否  
    15,乌黑,稍蜷,浊响,清晰,稍凹,软粘,0.36,0.37,否  
    16,浅白,蜷缩,浊响,模糊,平坦,硬滑,0.593,0.042,否  
    17,青绿,蜷缩,沉闷,稍糊,稍凹,硬滑,0.719,0.103,否  ''')
    
    data = pd.read_csv(data_str)
    data.set_index('编号', inplace=True)
    print(data)

    2.计算系统信息熵

    def entropy(data):
        length = data.size
        ent = 0
        for i in data.value_counts():
            print(i)
            prob = i / length
            ent += - prob * (np.log2(prob))
        return ent
    print('--------')
    print(entropy(data['好瓜'])) # 0.9975025463691153

    3.计算信息增益

    def gain(data, input_column, output_colum):
        """
        :param data: 输入DataFrame 的数据
        :param input_column: 特征的名称
        :param output_colum: 好瓜or 坏
        :return:
        """
        ret = 0
        lens = data[output_colum].size
        all_attribute = data[input_column].value_counts()  # 保存特征全部属性的取值个数
        for name in data[input_column].unique(): # 特征的不同属性名
            print(name)
            temp = 0
            for i in range(len(data[output_colum].unique())):  # 好瓜 or 坏瓜
                attribute_num = data[input_column].where(data[output_colum] == data[output_colum].unique()[i]).value_counts()
                # print(attribute_num[name]) # 当刚好 好瓜 中没有 硬挺这一属性值的时候,使用异常处理机制
                try:
                    prob = int(attribute_num[name]) / int(all_attribute[name])
                except:
                    prob = 0
    
                if prob == 0:
                    temp += 0
                else:
                    temp += - prob * np.log2(prob)
                # 还需要乘以 该属性出现的概率
            temp *= all_attribute[name] / lens
            ret += temp
        return ret
    print(gain(data, '根蒂', '好瓜'))
    entD = entropy(data['好瓜'])
    for name in data.columns[:-3]:
        print('打印出全部的特征的信息增益')
        ret = gain(data, name, '好瓜')
        print(name)
        gain_ = entD - ret
        print(gain_)
    print(entD)

    4.计算基尼系数

    # 计算基尼系数, 基尼系数越小,越应该选择该特征作为分裂结点
    def gini_index(data, input_column, output_colum):
        ret = 0
        lens = data[output_colum].size
        all_attribute = data[input_column].value_counts()  # 保存全部属性的取值个数
        for name in data[input_column].unique(): # 特征的不同属性
            print(name)
            temp = 0
            for i in range(len(data[output_colum].unique())):  # 输出值的取值个数
                # 当 为好瓜时,
                attribute_num = data[input_column].where(data[output_colum] == data[output_colum].unique()[i]).value_counts()
                # print(attribute_num[name]) # 当刚好 好瓜中没有 硬挺这一属性值的时候,使用异常处理机制
                try:
                    prob = int(attribute_num[name]) / int(all_attribute[name])
                except:
                    prob = 0
    
                if prob == 0:
                    temp += 0
                else:
                    temp += np.square(prob)
                # 还需要乘以 该属性出现的概率
            temp = all_attribute[name] / lens * (1-temp)
            ret += temp
        return ret
    
    print('打印出全部的特征的基尼系数')
    for name in data.columns[:-3]:
        ret = gain(data, name, '好瓜')
        print(name)
        print(ret)

     


    项目推荐:

    2000多G的计算机各行业电子资源分享(持续更新)

    2020年微信小程序全栈项目之喵喵交友【附课件和源码】

    Spring Boot开发小而美的个人博客【附课件和源码】

    Java微服务实战296集大型视频-谷粒商城【附代码和课件】

    Java开发微服务畅购商城实战【全357集大项目】-附代码和课件

    最全最详细数据结构与算法视频-【附课件和源码】

    在这里插入图片描述

     

    展开全文
  • 几个描述逻辑中的概念

    千次阅读 2008-12-12 02:59:00
    描述逻辑(DescriptionLogic)是基于对象的知识表示的形式化,它吸取了KL-ONE的主要思想,是一阶谓词逻辑的一个可判定子集。它与一阶谓词逻辑不同的是,描述逻辑系统能提供可判定的推理服务。除了知识表示以外,描述...
      描述逻辑(DescriptionLogic)是基于对象的知识表示的形式化,它吸取了KL-ONE的主要思想,是一阶谓词逻辑的一个可判定子集。它与一阶谓词逻辑不同的是,描述逻辑系统能提供可判定的推理服务。除了知识表示以外,描述逻辑还用在其它许多领域,它被认为是以对象为中心的表示语言的最为重要的归一形式。描述逻辑的重要特征是很强的表达能力和可判定性,它能保证推理算法总能停止,并返回正确的结果。在众多知识表示的形式化方法中,描述逻辑在十多年来受到人们的特别关注,主要原因在于:它们有清晰的模型-理论机制;很适合于通过概念分类学来表示应用领域;并提供了很用的推理服务。 
      
      由于描述逻辑在很多不同应用领域中都有较好的应用,这使得描述逻辑的结果变得越来越重要。实际上描述逻辑在许多领域中被作为知识表示的工具,如信息系统(Catarci,1993),数据库(Borgida,1995;Bergamaschi1992;Sheth,1993)软件工程(Devambu,1991),网络智能访问(Levy,1996;Blanco,1994)和规划(Seida,1992)。上述的许多文章中都指出,对许多相应的应用领域通常需要DL的整体能力。(Doyle1991)
      
      描述逻辑最开始只是用来表示静态知识的。为了考虑在时间上的变化,或者在一定动作下的变化,以及保持其语言的相对简单性,很自然地我们需要通过相应的模态算子来扩展它,以保留其命题模态状态。众所周知,即使只是对简单的模态系统的综合,也可能会导致很复杂的系统。Schild,Schmiedel等人最初所构造的时序描述逻辑和认知逻辑要么就是因为表达能力太强而导致不可判定性,要么就是太弱(时态算子仅仅对公式或者概念是可用的)。Baader和Laux[2]则进行了折中,将描述逻辑ALC与多态K相结合,允许将模态算子使用到公式和概念上,并证明在扩展领域模型中的结果语言的满足性问题是可判定的。Wolter等对具有模态算子的描述逻辑进行了深入系统的调查分析,并证明在恒定的领域假设下多种认知和时序描述逻辑是可判定的。他将将描述逻辑和命题动态逻辑PDL相结合,提出了动态描述逻辑。
      
      为了对动作和规划能在统一的框架下进行表示和推理,A.Artale和E.Franconi(1998)提出了一个知识表示系统,用时间约束的方法将状态、动作和规划的表示统一起来。为了能使该表示方法进行有效的推理和具有明确的语义,它又和描述逻辑结合起来,从而形成了一个很好的知识表示方法。它具有以下优点:(i)能用统一的方法表示状态、动作和规划,这一点与情景演算不同;(ii)能进行高效的推理,该框架下的可满足性问题和包含检测问题等都是多项式时间;(iii)有明确的语义;(iv)能自动进行规划识别。
      
      可满足性问题是描述逻辑推理中的核心问题,因为其它许多问题(如包含检测、一致性问题等)都可化为可满足性问题。为了能用计算机自动判断描述逻辑中可满足性问题,Schmidt-Schaub和Smolka首先建立了基于描述逻辑ALC的Tableau算法,该算法能在多项式时间内判断描述逻辑ALC概念的可满足性问题。目前,Tableau算法已用于各种描述逻辑中(如ALCN、ALCQ等),并且Tableau算法也可用于判断实例检测等问题。现在主要研究各种描述逻辑中Tableau算法的扩展、复杂性及优化策略等。
      
      为了能让描述逻辑处理模态(modal)词,F.Baader将模态操作引入描述逻辑。证明了该描述逻辑公式的可满足性问题是可判定的。结合可能世界语义和可达关系,引入时间依赖和信念等模态操作,提出了多维描述逻辑框架,该描述逻辑较好的刻画了多主体系统模型。目前,主要研究工作集中在建立合理的模态公理及多维描述逻辑。在描述逻辑中第一个整合时间的方法是由A.Schmiedel提出来的。他使用了两个时间运算符来扩展描述逻辑,提出了在时间段上受限的全称和存在量词。Schild提出了一种简单的时序扩张,利用时态逻辑(tenselogic)中在时间点“自从”Since和“直到”Until上的时序运算符来讨论ALC逻辑。
      
      PS:
      ALC是DL的一种,DL包括很多种子语言,最基本的语言是 AL(Attributive Language), ALC是AL的一个子语言,C表示Complement,但是这个Complement是对于任意的一个概念(因为在AL定义的仅仅是原子否定),你可以理解为对任意一个概念的否定,所以ALC(Attribute Language Complement)是在AL语言上加上可以对任意一个概念否定。
    展开全文
  • 数据库 - 概念结构设计

    万次阅读 2015-05-08 10:15:46
    将需求分析得到的用户需求抽象为信息结构即概念模型的过程就是概念结构设计 概念结构是各种数据模型的共同基础,它比数据模型更独立于机器、更抽象,从而更加稳定 概念结构设计是整个数据库设计的关键 概念结构...
  • 自动化(Automation)基础概念:接口描述语言(IDL)与类型库(TypeLib)许式伟 (版权声明)2007-4-26在前文,我们已经解释了: 自动化(Automation)基础概念:COM组件(Component)与接口(Interface) 自动化...
  • 关于熵的知识——信息论基本概念

    千次阅读 2018-09-06 17:40:18
    信息论 1 信息量 首先是信息量。假设我们听到了两件事,分别如下:  事件A:巴西队进入了2018世界杯决赛圈。  事件B:中国队进入了2018世界杯决赛圈。  仅凭直觉来说,显而易见事件B的信息量比事件A的信息量要...
  • 最近着手开始做毕业设计,为了更好的进行项目开发和毕业论文的编写,所以决定使用 Powerdesigner来...数据库概念模型用于信息世界的建模,是现实世界到信息世界的第一层抽象,是数据库设计人员进行数据库设计的有力工
  • 是对信息的一种符号表示。在计算机科学中是指所有能输入到计算机中并被计算机程序处理的符号的总称。如图象、声音等都可以通过编码而归之于数据的范畴。 2、数据元素(Data Element) 是数据的基本单位,在计算机...
  • 封装的概念

    千次阅读 2019-03-10 17:53:08
    首先,属性可用来描述同一类事物的特征,方法可描述一类事物可做的操作。封装就是把属于同一类事物的共性(包括属性与方法)归到一个类中,以方便使用。 1.概念 封装也称为信息隐藏,是利用抽象数据类型将数据和基于...
  • Elasticsearch最佳实践之核心概念与原理

    万次阅读 多人点赞 2018-12-03 22:29:58
    作为专栏文章的第二篇,本文从数据组织、数据分布、集群角色、数据写入与存储结构多个方面对Elasticsearch的核心概念进行整理,尽可能由浅入深的交代清楚每个概念
  • RocketMQ概念模型

    万次阅读 2017-06-16 15:45:13
    由于RocketMQ并没有遵循业界现有的JMS或AMQP规范,而且功能集比后两者更加丰富,描述该中间件产品的概念模型是一项比较有挑战的任务。RocketMQ的官方文档《RocketMQ 原理简介》对产品的概念模型给出了比较简洁而清晰...
  • 概念模型就是在了解了用户的需求,用户的业务领域工作情况以后,经过分析和总结,提炼出来的用以描述用户业务需求的一些概念的东西。...要实现概念模型所描述的东西,需要那些具体的功能和处理那些具体的信息
  • NFV基本概念

    万次阅读 多人点赞 2019-07-29 11:26:27
    1.NFV相关基本概念 NFV(网络功能虚拟化) SDN(软件定义网络) 一个NFV的标准架构包括NFV infrastructure(NFVI),MANO(Management and Orchestration)和VNFs,三者是标准架构中顶级的概念实体。 NFVI(NFV ...
  • URL的概念

    千次阅读 多人点赞 2019-06-02 10:04:13
    URL的引入 在生活中,我们经常会看到你要在网上查找东西,会在浏览器中输入一个“www.baidu.com”之类的地址,...192.168.0.xxx/路径 这个就是局域网的URL URL(Uniform Resource Locator)地址用于描述一个网络上的...
  • SQL Server基础知识概念要点详细讲解

    万次阅读 多人点赞 2018-03-30 14:41:57
    SQL Server基础知识概念要点详细讲解 ...模式:在数据库三级模式结构中,对数据库中全部的数据逻辑结构、特征进行描述。 内模式:最接近于物理存储设备一级的结构,是对数据库物理存储方式的...
  • GIS地图学习笔记一之基础概念

    万次阅读 2017-11-29 19:40:18
    基础概念地理信息系统 (GIS) 是以可视化和分析地理配准信息为目的,用于描述和表征地球及其他地理现象的一种系统。GIS 地图是一种新型地图,其所呈现的内容远非静态地图所能及。它为访问和使用所有地理信息描述性...
  • 数据库系统基本概念(二)

    千次阅读 热门讨论 2013-11-30 14:01:49
     从现实世界的信息到数据库存储的数据以及用户使用的数据,这是一个逐步抽象的过程。分成四个级别:概念模型,逻辑模型,外部模型,和内部模型。概念模型是对现实世界的抽象,是一种高级的数据模型。逻辑模型是用...
  • 数据库分析之概念结构设计

    万次阅读 2018-07-01 23:54:56
    概念结构设计:将需求分析得到的用户需求抽象为信息结构(即概念模型)的过程。 一、概念模型 在需求分析阶段所得到的应用需求应该首先抽象为信息世界的结构,然后才能更改、更准确地用某一数据库管理系统实现...
  • 数据库基础知识(概念型)

    万次阅读 多人点赞 2019-06-10 20:58:46
    第一章 概念 1、数据:描述事物的符号记录称为数据。特点:数据和关于数据的解释不可分。 2、数据库:长期存储在计算机内、有组织、可共享的大量的数据的集合。数据库中的数据按照一定的数据模型组织、描述和存储...
  • 信息对象(InfoObject) 是SAP BI 系统中对现实生活中的的业务评价对象的模拟。 比如客户、销售额等,在SAPBI 中都体现为一个信息对象。 它是SAPBI 中数据存储的最小单位,是数据模型的建立基础。 信息对象是...
  • RDF基本概念

    千次阅读 2017-01-25 14:37:58
    比如网页的标题、作者、修改日期、内容以及版权信息。  资源描述框架用于描述WEB上的资源是W3C推荐标准可被计算机读取,不是为了向用户展示 使用XML编写 RDF应用举例 描述购物项目的属性,如价格web事件...
  • 数据库的概念模型

    万次阅读 2017-11-04 09:24:57
    (1)定义:现实世界到信息世界的第一层抽象,确定领域实体属性关系等。 (2)表示方式:E-R图。   2、逻辑模型: (1)定义: a、将概念模型转化为数据模型。 b、根据选定的DBMS
  • 统计学的基本概念

    千次阅读 2016-09-13 17:34:49
    首先,我们给定一个含有n个样本的集合,下面给出这些概念的公式描述:均值:标准差:方差:均值描述的是样本集合的中间点,它告诉我们的信息是有限的,而标准差给我们描述的是样本集合的各个样本点到均值的距离之...
  • Spring AOP(一)——基础概念

    万次阅读 2016-10-12 23:39:12
    前文的一些内容更多是针对Spring容器内部的一些特性的描述,接下来一个专题将描述Spring AOP的一些信息,配置细节等等。介绍面向切面编程(AOP)是一种新的针对程序结构的思路,它补足了面向对象编程(OOP)的一些...
  • Flink中的一些核心概念

    万次阅读 2016-05-02 22:46:23
    Flink中的一些基础而又关键的核心概念。了解这些概念有助于更进一步理解Flink的设计。
  • 1.MySQL基础概念

    万次阅读 2021-08-17 15:29:15
    mysql基础概念
  • 统计学中的基本概念

    千次阅读 2016-05-12 17:33:47
    描述统计(descriptive statistics):利用数字或者图标的方法,寻找数据的规律,总结其中的信息,以恰当的方式展示这些信息。 推断统计(inferential statisticss):利用样本数据信息,对总体情况估计、推断、...
  • 领域驱动设计整理——概念&架构

    万次阅读 2015-12-13 16:53:15
    领域、子域、限界上下文DDD...对于领域的概念其实很好理解,就如字面意思一样,比如出版书籍领域,广告设计领域。圈定了一定的范畴,并且在这个范畴内,所有团队成员对于某一概念的理解是一致的。比如书籍就是我们需
  • 财务会计基础(一)概念

    万次阅读 2017-04-19 10:35:57
    财务会计概念框架是以财务会计的基本假设为前提、以目标为导向而形成的一整套相互关联、协调一致的概念(理论)体系。它由基本假设、会计目标、会计信息质量特征和会计要素的确认及计量四部分组成。一、会计基本假设...

空空如也

空空如也

1 2 3 4 5 ... 20
收藏数 613,971
精华内容 245,588
关键字:

对于信息的概念描述