精华内容
下载资源
问答
  • 数据仓库之元数据
    万次阅读
    2020-06-29 22:32:50

    元数据概述

    元数据:描述其它数据的数据(data about other data)

    元数据是关于数据的数据,在某些时候不特指某个单独的数据,可以理解为是一组用来描述数据的信息组/数据组,该信息组/数据组中的一切数据、信息,都描述/反映了某个数据的某方面特征,则该信息组/数据组可称为一个元数据。

    元数据可以为数据说明其元素或属性(名称、大小、数据类型等),或其结构(长度、字段、数据列),或其相关数据(位于何处、如何联系、拥有者)。

    在日常生活中,元数据无所不在。只要有一类事物,就可以定义一套元数据。

    元数据的分类

    ①管理元数据

    管理元数据主要为负责开发,维护数据仓库的人员使用。管理元数据时存储关于数据仓库系统技术细节的数据,是用于开发和管理数据仓库使用的数据。

    ②用户元数据

    用户元数据从业务角度描述了数据仓库中的数据,它提供了介于使用者和实际系统之间的语义层,使得不懂计算机技术的业务人员也能够读懂数据仓库中的数据。

    元数据的作用

    ①元数据是进行数据集成所必须的。
    ②元数据可以帮助最终用户理解数据仓库中的数据。
    ③元数据是保证数据质量的关键。
    ④元数据可以支持需求化。

    参考资料 《数据仓库与数据挖掘实践》

    更多相关内容
  • 数据结构_二元

    万次阅读 多人点赞 2018-07-09 20:03:49
    今天在牛客网上看到这样个题目:当时做的时候直接没反应过来,后来看解析的时候,才知道,二元,图论上学过嘛。而且,我们以前也经常接触,图(V,E)就是嘛。下面的解释转载自:...

    今天在牛客网上看到这样一个题目:

    当时做的时候直接没反应过来,后来看解析的时候,才知道,二元组,图论上学过嘛。而且,我们以前也经常接触,图(V,E)就是嘛。

    下面的解释转载自:https://www.cnblogs.com/larryzeal/p/5095522.html

    数据结构分为:逻辑结构、存储结构。

    逻辑结构分为:集合、线性结构、树形结构、图形结构。
        --线性表、栈、队列、树、图等逻辑结构。

            --其中线性表、栈、队列为线性结构,树和图都是非线性结构。

    物理存储结构分为:顺序存储结构、链式存储结构,索引结构,哈希结构。

            
    逻辑结构可以采用两种方法来描述:二元组、图形。
        --二元组表示形式: DS = ( D, S )   【Data Structure】
            --其中 D 是数据元素的集合; S 是 D 中数据元素之间的关系集合,并且数据元素之间的关系是使用序偶来表示的。序偶是由两个元素 x 和 y 按一定顺序排列而成的二元组,记作<x , y>, x 是它的第一元素, y 是它的第二元素。
            

        --当使用图形来表示数据结构时,是用图形中的点来表示数据元素,用图形中的弧来表示数据元素之间的关系。如果数据元素 x 与 y 之间有关系<x , y>,则在图形中有从表示 x 的点出发到达表示 y 的点的一条弧。

    现在,另数据结构的二元组形式为:DS = (D, S),则:

    1. 如果 D != null,而S == null,则该数据结构为集合结构。
    2. 如果 D = {01, 02, 03, 04, 05},S = {<02,04>, <03,05>, <05,02>, <01,03>},则该数据结构是线性结构。
      在这些数据元素中有一个可以被称为“第一个”的数据元素;还有一个可以被称为“最后一个”的数据元素;除第一个元素以外每个数据元素有且仅有一个直接前驱元素,除最后一个元素以外每个数据元素有且仅有一个直接后续元素。这种数据结构的特点是数据元素之间是 11 的联系,即线性关系。
    3. D = {01, 02, 03, 04, 05, 06}
      S = {<01,02>, <01,03>, <02,04>, <02,05>, <03,06>}
      除了一个数据元素(元素 01)以外每个数据元素有且仅有一个直接前驱元素,但是可以有多个直接后续元素。这种数据结构的特点是数据元素之间1 N 的联系,即树结构。
    4. D = {01, 02, 03, 04, 05}
      S = {<01,02>, <01,05>, <02,01>, <02,03>, <02,04>, <03,02>,<04,02>, <04,05>, <05,01>, <05,04>}:
      每个数据元素可以有多个直接前驱元素,也可以有多个直接后续元素。这种数据结构的特点是数据元素之间是 M N 的联系,即图结构。

    展开全文
  • SQL 获取每一组第一条记录

    万次阅读 2018-04-11 09:22:06
    1.先将数据分组并一组进行排序; over(partition by 分组字段 order by 排序字段) 2.根据需要获取序号1的数据 SELECT * FROM ( SELECT RECEIVE_ID,LINE_CD,REC_TIME ,ROW_NUMBER() over(partition by...

    根据分组取出每个分组的第一条记录数据

    1.先将数据分组并对每一组进行排序;

    over(partition by 分组字段 order by 排序字段)


    2.根据需要获取序号1的数据

    SELECT * FROM (
    SELECT RECEIVE_ID,LINE_CD,REC_TIME
    ,ROW_NUMBER() over(partition by LINE_CD order by REC_TIME DESC) as NEWINDEX 
    FROM MES_BM_RECEIVE 
    ) t
    where t.NEWINDEX = 1


    展开全文
  • 数据元与元数据

    万次阅读 多人点赞 2019-06-05 17:35:22
    数据是关于数据数据,在某些时候不特指某个单独的数据,可以理解为是一组用来描述数据的信息组/数据组,该信息组/数据组中的一切数据、信息,都描述/反映了某个数据的某方面特征,则该信息组/数据组可称为一个元...

    元数据:描述其它数据的数据(data about other data)

    元数据是关于数据的数据,在某些时候不特指某个单独的数据,可以理解为是一组用来描述数据的信息组/数据组,该信息组/数据组中的一切数据、信息,都描述/反映了某个数据的某方面特征,则该信息组/数据组可称为一个元数据。

    元数据可以为数据说明其元素或属性(名称、大小、数据类型等),或其结构(长度、字段、数据列),或其相关数据(位于何处、如何联系、拥有者)。

    在日常生活中,元数据无所不在。只要有一类事物,就可以定义一套元数据。

    举个例子:在电影数据库IMDB上可以查到每一部电影的信息。IMDB本身也定义了一套元数据,用来描述每一部电影。下面是它的一级元数据,每一级下面又列出了二级元数据,总共加起来,可以从100多个方面刻画一部电影:

    Cast and Crew(演职人员)、Company Credits(相关公司)、Basic Data(基本情况)、Plot & Quotes(情节和引语)、Fun Stuff(趣味信息)、Links to Other Sites(外部链接)、Box Office and Business(票房和商业开发)、Technical Info(技术信息)、Literature(书面内容)、Other Data(其他信息)。

    元数据最大的好处是,它使信息的描述和分类可以实现结构化,从而为机器处理创造了可能。

    数据元:可理解为数据的基本单元

    卫生信息基本数据元规范和定义了医药卫生领域所有相关信息的唯一中文名称与代码,并且代码以字母、汉字、数字式的字符串形式表示。

    数据元列举并定义了特定语义环境中的一种信息资源。

    完整的数据元名称=对象类术语+特征类术语+表示类术语+(限定类术语)

    其中:

    一个数据元有且仅有一个对象类术语(object class):是现实世界或抽象概念中事物的集合,有清楚的边界和含义,因其特性和行为遵循同样的规则而能加以标识。

    一个数据元有且仅有一个特征类术语(property):是对象类的所有个体所共有的某种性质,也是对象有别于其他成员的依据,是用来区分和识别事物的一种手段。特征类术语是任何一个数据元名称所必须的成分,在数据元概念可完整、准确、无歧义表达的情况下,其他术语可以酌情简略。

    一个数据元有且仅有一个表示类术语(representation):是值域、数据类型和表示方式的组合,也包括计量单位和字符集等信息。当表示类术语与特征类术语有重复或部分重复时,可从名称中将冗余词删除。

    限定类术语由专业领域给定,限定类术语是可选的。

    数据元基本模型

    数据元与元数据的区别和联系

    1. 元数据不可能涵盖理解数据元所要表示的数据所必需的所有信息。

    2. 数据元的相关信息是任何一个(组织的)元数据的一个完整的组成部分。

    3. 元数据的每一个元素都是一个数据元,用符合数据元标准的元数据属性和描述方法来说明元数据。

    4. 将元数据存储于一个库中,并使之条理化就需要建模,建模就需要从数据元的注册系统中或库中获取元数据。

    5. 元数据,它是以一种一致、标准的方式来表达的数据元。

    6. 元数据与数据元字典格式均由行号、中文名称、英文名称、标识符(短语)、定义、约束/条件、最大出现次数、数据类型、数据的值域等属性组成。不同之处是数据元字典格式中另有语境和同义词名称等属性。

    总而言之,元数据和数据元的定义是从不同角度论述的。由于描述的侧重面不同,元数据和数据元的描述属性也有些区别,但是元数据和数据元的字典格式是基本一致的。

    ------------------------------------------------------------------------------------------------

    1元数据Metadata

    1.1元数据概念

    1、主要是描述数据属性(property)的信息;

    2、描述数据的数据;

    3、关于数据的结构化数据;

    4、描述数据的内容、覆盖范围、质量、管理方式、数据的所有者、数据的提供方式等信息,是数据和数据用户之间的桥梁。

    举例:

    学生信息表包括:姓名、性别、学号等。

    姓名、性别、学号都是数据元,但是这些数据元有自己的元数据,即描述数据,分别是长度、类型、值域等。

    对于学生信息表而言,姓名、性别、学号是描述学生信息的数据,是它的元数据。

    数据是手提箱,而元数据是它上面的标牌。

    数据是文件夹,而元数据是文件夹上面的标签。

    1.2元数据的作用

    1、数据描述:对信息对象的内容属性等的描述能力是元数据最基本的功能。

    2、数据检索:支持用户发现资源的能力,即利用元数据来更好地组织信息对象建立他们之间的关系为用户提供多层次多途径的检索体系,从而有利于用户便捷快速的发现其真正需要的信息资源。

    3、数据选择:支持用户在不必浏览信息对象本身的情况下能够对信息对象有基础的了解和认识从而决定对检出信息的取舍。

    4、数据定位:提供信息资源本身的位置方面的信息,如DOI、URL、URN等信息,由此可准确获知信息对象之所在,便于信息的获取。

    5、数据管理:保存信息资源的加工存档结构使用管理等方面的相关信息权限管理版权、所有权、使用权、防伪措施、电子水印、电子签名等。

    6、数据评估:保存资源被使用和被评价的相关信息,通过对这些信息的使用分析,方便资源的建立与管理者更好的组织资源并在一定程度上帮助用户确定该信息资源在同类资源中的重要性。

    2数据元(Data element)

    2.1数据元概念

    1、用一组属性描述定义、标识、表示和允许值的数据单元。

    2、又称数据类型,通过定义、标识、表示以及允许值等一系列属性描述的数据单元。在特定的语义环境中被认为是不可再分的最小数据单元。

    3、数据元一般由三部分组成:对象、特性、表示

    举例:

    “执业类别代码”为数据元,“01”为数据元的值。

    “执业类别代码”中,“执业”为对象词,“类别”是该数据元的特性词,“代码”是该数据元的表示词。

    2.2数据元的作用

    1、数据元本身也是数据单元,即也是数据。

    2、它是一个用来对各行业的数据进行自身规范化的一个方法或一套指导的理论。

    3、用这一套方法对行业数据进行统一的名、型、值规范及分类。

    4、规划好行业数据元之后,可以为行业构建出统一、集成的、稳定的数据模型奠定基础,同时它也为数据交换奠定基础。

    3元数据管理

    3.1元数据管理的建设目标

    3.2元数据管理的范围

    4资源目录

    4.1资源目录要解决的问题

    4.2业务流程示意图

    4.3资源目录功能特点

    5参考资料

    https://baike.baidu.com/item/%E5%85%83%E6%95%B0%E6%8D%AE/1946090?fr=aladdin

    https://wenku.baidu.com/view/9789bb30f68a6529647d27284b73f242336c31ff.html

    https://baike.baidu.com/item/%E6%95%B0%E6%8D%AE%E5%85%83/7681154?fr=aladdin

    展开全文
  • 数据维度

    万次阅读 2018-02-27 13:53:06
    一个数据表达的是一个含义,如何理解一组数据表达的含义?通过摘要来提取一组数据表达的信息。摘要,是有损地提取数据特征的过程。提取一组数据的信息:基本统计(含排序)、分布/累计统计、数据特征(相关性、周期性等...
  • 数据结构与算法分析—C语言描述 高清版

    千次下载 热门讨论 2008-04-05 21:01:56
    7.7.3 小数 7.7.4 实际的快速排序例程 7.7.5 快速排序的分析 7.7.6 选择的线性期望时间算法 7.8 大型结构的排序 7.9 排序的一般下界 7.9.1 决策树 7.10 桶式排序 7.11 外部排序 7.11.1 为什么需要新的算法 7.11.2 ...
  • 输入第行是个整数T,表示有T测试实例; 每输入包括两行: 第个数n表示接下来会有n个整数; 第二行空格隔开的n个数。 输出 对于每输入,在行输出n个数的和(保证和不会超出int类型的范围)! 样例...
  • IP播基础及工作原理——1

    万次阅读 多人点赞 2017-12-25 13:33:44
    学好IP播基础知识及配置与管理方法,网络管理员来说非常必要。 IP播就像IP单播一样是个相对独立的领域,涉及的知识面非常广。所包含的协议也非常多,如三层的IGMP、MLD、PIM、MSDP、MBGP和IGMP SMM Mapping...

空空如也

空空如也

1 2 3 4 5 ... 20
收藏数 3,986,725
精华内容 1,594,690
关键字:

对一组数据