元数据_元数据管理 - CSDN
元数据 订阅
元数据(Metadata),又称中介数据、中继数据,为描述数据的数据(data about data),主要是描述数据属性(property)的信息,用来支持如指示存储位置、历史数据、资源查找、文件记录等功能。元数据算是一种电子式目录,为了达到编制目录的目的,必须在描述并收藏数据的内容或特色,进而达成协助数据检索的目的。都柏林核心集(Dublin Core Metadata Initiative,DCMI)是元数据的一种应用,是1995年2月由国际图书馆电脑中心(OCLC)和美国国家超级计算应用中心(National Center for Supercomputing Applications,NCSA)所联合赞助的研讨会,在邀请52位来自图书馆员、电脑专家,共同制定规格,创建一套描述网络上电子文件之特征。元数据是关于数据的组织、数据域及其关系的信息,简言之,元数据就是关于数据的数据。 [1] 展开全文
元数据(Metadata),又称中介数据、中继数据,为描述数据的数据(data about data),主要是描述数据属性(property)的信息,用来支持如指示存储位置、历史数据、资源查找、文件记录等功能。元数据算是一种电子式目录,为了达到编制目录的目的,必须在描述并收藏数据的内容或特色,进而达成协助数据检索的目的。都柏林核心集(Dublin Core Metadata Initiative,DCMI)是元数据的一种应用,是1995年2月由国际图书馆电脑中心(OCLC)和美国国家超级计算应用中心(National Center for Supercomputing Applications,NCSA)所联合赞助的研讨会,在邀请52位来自图书馆员、电脑专家,共同制定规格,创建一套描述网络上电子文件之特征。元数据是关于数据的组织、数据域及其关系的信息,简言之,元数据就是关于数据的数据。 [1]
信息
优    点
自描述,设计
外文名
Metadata
拼    音
yuánshùjù
本    质
描述数据属性的信息
中文名
元数据
目    的
识别、评价、追踪资源达有效管理
解    释
关于数据的数据
元数据定义
元数据被定义为:描述数据的数据,对数据及信息资源的描述性信息。元数据(Metadata)是描述其它数据的数据(data about other data),或者说是用于提供某种资源的有关信息的结构数据(structured data)。元数据是描述信息资源或数据等对象的数据,其使用目的在于:识别资源;评价资源;追踪资源在使用过程中的变化;实现简单高效地管理大量网络化数据;实现信息资源的有效发现、查找、一体化组织和对使用资源的有效管理。 元数据的基本特点主要有:a)元数据一经建立,便可共享。元数据的结构和完整性依赖于信息资源的价值和使用环境;元数据的开发与利用环境往往是一个变化的分布式环境;任何一种格式都不可能完全满足不同团体的不同需要;b)元数据首先是一种编码体系。元数据是用来描述数字化信息资源,特别是网络信息资源的编码体系,这导致了元数据和传统数据编码体系的根本区别;元数据的最为重要的特征和功能是为数字化信息资源建立一种机器可理解框架。元数据体系构建了电子政务的逻辑框架和基本模型,从而决定了电子政务的功能特征、运行模式和系统运行的总体性能。电子政务的运作都基于元数据来实现。其主要作用有:描述功能、整合功能、控制功能和代理功能。由于元数据也是数据,因此可以用类似数据的方法在数据库中进行存储和获取。如果提供数据元的组织同时提供描述数据元的元数据,将会使数据元的使用变得准确而高效。用户在使用数据时可以首先查看其元数据以便能够获取自己所需的信息。在数据仓库领域中,元数据按用途分成技术元数据和业务元数据。首先,元数据能提供基于用户的信息,如记录数据项的业务描述信息的元数据能帮助用户使用数据。其次,元数据能支持系统对数据的管理和维护,如关于数据项存储方法的元数据能支持系统以最有效的方式访问数据。具体来说,在数据仓库系统中,元数据机制主要支持以下五类系统管理功能:(1)描述哪些数据在数据仓库中;(2)定义要进入数据仓库中的数据和从数据仓库中产生的数据;(3)记录根据业务事件发生而随之进行的数据抽取工作时间安排;(4)记录并检测系统数据一致性的要求和执行情况;(5)衡量数据质量。软件构造领域的定义在软件构造领域,元数据被定义为:在程序中不是被加工的对象,而是通过其值的改变来改变程序的行为的数据。它在运行过程中起着以解释方式控制程序行为的作用。在程序的不同位置配置不同值的元数据,就可以得到与原来等价的程序行为。在图书馆与信息界,元数据被定义为:提供关于信息资源 或数据的一种结构化的数据,是对信息资源的结构化的描述。其作用为:描述信息资源或数据本身的特征和属性,规定数字化信息的组织,具有定位、发现、证明、评估、选择等功能。一般认为,所谓元数据是关于数据的数据,或关于数据的结构化的数据。从已有的结论看,元数据的含义是逐渐发展的。元数据一词,早期主要指网络资源的描述数据,用于网络信息资源的组织;其后,逐步扩大到各种以电子形式存在的信息资源的描述数据。元数据这一术语实际用于各种类型信息资源的描述记录。此外,元数据在地理界,生命科学界等领域也有其相应的定义和应用。
收起全文
精华内容
参与话题
  • 什么是元数据?为何需要元数据

    千次阅读 2017-10-22 15:59:57
    转 ... 作者:贺易之 ... 来源:知乎 著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。...要理解这个问题,首先要知道“”是什么。...(meta),一般被我们翻译成

    转 https://www.zhihu.com/question/20679872

    作者:贺易之
    链接:https://www.zhihu.com/question/20679872/answer/65565699
    来源:知乎
    著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。

    要理解这个问题,首先要知道“元”是什么。
    元(meta),一般被我们翻译成“关于……的……”。
    事实上,这个前缀来源于希腊文,表示“在……之后”,在某样事情结束之后,就含有了“归纳”、“总结”的意思呢?因此,元,就代表着“本原”、“体系”的意思。
    以文学领域为例,后现代主义文学中有一种小说叫作“元小说”,也就是“关于小说的小说”。“传统小说往往关心的是人物、事件,是作品所叙述的内容;而元小说则更关心作者本人是怎样写这部小说的,小说中往往喜欢声明作者是在虚构作品,喜欢告诉读者作者是在用什么手法虚构作品,更喜欢交代作者创作小说的一切相关过程。(摘自百度百科)”。
    比如英国作家伊恩·麦克尤恩的作品《赎罪》。这本书讲述的是妹妹布里奥妮幼时因为爱上了姐姐塞西莉娅的男友罗比却被他拒绝,因报复心理作祟而陷害他入狱,长大成人之后为了弥补心中的愧疚而应征入伍来赎罪的故事。在本书中,主人公布里奥妮即是“主人公”,也是本书的“作者”。它着重于描述布里奥妮是如何写这本的书的。这就是“关心作者是怎么写这本小说”的小说。



    在了解了元(meta)的含义之后,我们来看元数据
    元数据(meta data)——“data about data” 关于数据的数据,一般是结构化数据(如存储在数据库里的数据,规定了字段的长度、类型等)。
    元数据是指从信息资源中抽取出来的用于说明其特征、内容的结构化的数据(如题名,版本、出版数据、相关说明,包括检索点等),用于组织、描述、检索、保存、管理信息和知识资源。
    比如,关于一本书(信息资源),我们在图书馆系统中检索可以得到如下信息


    一个基本的元数据由元数据项目和元数据内容的构成。这里,“题名”就是它的元数据项目,“史蒂夫·乔布斯传 (美) 沃尔特·艾萨克森著 = Steve Jobs Walter Isaacson eng”就是元数据内容。再比如,“著者”、“出版者”都是元数据项目,而“艾萨克森 (Isaacson, Walter) 著”和“中信出版社”就是元数据内容。学过数据库的应该不难理解~


    利用元数据来描述资源后,我们就可以用来做很多的事情。比如确定资源,为资源提供检索点,在不同系统之间进行数据交换。

    可是,我们每个人都可以对资源进行描述,取的名字(元数据项目)和值的样子(元数据内容)会千奇百怪怎么办呢?
    因此,就有了元数据标准。
    元数据标准包括元数据结构标准(即元数据包含那些项目,都柏林核心集,MARC元素集)、元数据内容标准、元数据取值标准、元数据编码标准(用于机读记录的存储和交换,比如MARC(Machine Readable Cataloging), XML)

    在这里我们详细看一下MARC格式(一种元数据标准)。
    在传统的图书馆中,我们购买了很多的书。图书馆员们怎么能知道自己有什么书了呢?我们就需要把每本图书的信息,写在一张小卡片上(有些老图书馆还有),存放在自己的图书馆里。
    但是随着计算机的发展,我们认为把书目的信息存到电脑里是更好的方法。又随着网络的发展,我们觉得应该来一个图书馆大联合,把所有的图书信息都一起存起来。但是每个图书馆都有自己的一套记录方法。因此,MARC格式就应运而生了。MARC就是在计算机出现后为系统间交换书目数据和相关信息而设计的。

    当然啦,在传统图书馆的手工编目时期,使用的术语与现在的计算机编目不同。比如那时候我们把一本书的“元数据”写在一张张卡片上,称之为“款目(entry)”,而在计算机里,关于一本书的记录,就叫做“记录(record)”。在机读编目中,我们把要著录的项目(著录项目area)叫作“字段(field),还有等等的区别。

    说了这么多,MARC格式是什么样的呢?
    可以看一下中国使用的CN-MARC格式。(CNMARC是我国参照UNIMARC(国际图联制定UNIMARC规范各国的MARC格式)编写的中国MARC格式。)




    它规定了关于文献资源应该如何记录。比如说在数据字段区,它对于101字段是这么规定的:
    101 0 $a正文语种$b中间语种$c原作语种
    那么我们就要编目成:
    101 1 $achi $ceng (chi是中文,eng是英文)
    再比如它规定210字段的编目形式如下:
    210 $a出版、发行地$c出版、发行者名称$d出版、发行日期
    根据这个要求我们就要写成
    210 $a北京 $c机械工业出版社 $d2003

    接下来,互联网发展的越来越快,元数据的格式越来越多,人们对它的互操作要求也越来越高,就出现了XML
    在利用XML描述一个文档的时候,我们可以自己定义标签,如”<title>”。这些小标签都是元数据。
    在网络时代,XML作为元数据的一种表现形式是非常有潜力的。

    最后我们在来看一下XML的好朋友HTML。
    HTML的head里有一个meta标签。那么它是什么呢?
    根据上面的解释,我们应该知道它是“关于文档的信息”了
    meta的属性有两种,name和http-equiv.

    name属性用来描述网页的内容,以便搜索引擎查找。比如这个网页的keywords呀。
    http-equiv属性指示服务器在发送实际的文档之前先在要传送给浏览器的 MIME 文档头部包含名称/值对。
    比如
    <meta http-equiv="Content-Language" contect="zh-CN">用以说明主页制作所使用的文字以及语言

    如果有哪里不对请务必告之!

    展开全文
  • 什么是元数据元数据)?

    千次阅读 2018-06-08 14:24:10
    数据是指普通文件中的实际数据,而元数据指用来描述一个文件的特征的系统数据,诸如访问权限,文件拥有者以及文件数据块的分布信息(索引节点的......)等等。在集群文件系统中,分布信息包括文件在磁盘上的位置以及...

    什么是元数据
    任何文件系统中的数据分为数据和元数据。数据是指普通文件中的实际数据,而元数据指用来描述一个文件的特征的系统数据,诸如访问权限、文件拥有者以及文件数据块的分布信息(inode…)等等。在集群文件系统中,分布信息包括文件在磁盘上的位置以及磁盘在集群中的位置。用户需要操作一个文件必须首先得到它的元数据,才能定位到文件的位置并且得到文件的内容或相关属性。

    元数据管理方式
    元数据管理有两种方式。集中式管理和分布式管理。集中式管理是指在系统中有一个节点专门司职元数据管理,所有元数据都存储在该节点的存储设备上。所有客户端对文件的请求前,都要先对该元数据管理器请求元数据。分布式管理是指将元数据存放在系统的任意节点并且能动态的迁移。对元数据管理的职责也分布到各个不同的节点上。大多数集群文件系统都采用集中式的元数据管理。因为集中式管理实现简单,一致性维护容易,在一定的操作频繁度内可以提供较满意的性能。缺点是单一失效点问题,若该服务器失效,整个系统将无法正常工作。而且,当对元数据的操作过于频繁时,集中的元数据管理成为整个系统的性能瓶颈。
    分布式元数据管理的好处是解决了集中式管理的单一失效点问题, 而且性能不会随着操作频繁而出现瓶颈。其缺点是,实现复杂,一致性维护复杂,对性能有一定影响。

    展开全文
  • 元数据(MetaData)学习

    万次阅读 多人点赞 2018-08-21 14:51:25
    元数据(MetaData): 元数据(MetaData),即定义数据的数据.比如,我们要搜索一首歌(歌本身就是数据),可以通过歌名,歌手,专辑等信息来搜索,这些 歌名,歌手,专辑就是这首歌的元数据.因此数据库的元数据就是一些注明数据库...

    元数据(MetaData):

     元数据(MetaData),即定义数据的数据.比如,我们要搜索一首歌(歌本身就是数据),可以通过歌名,歌手,专辑等信息来搜索,这些歌名,歌手,专辑就是这首歌的元数据.因此数据库的元数据就是一些注明数据库信息的数据.


    JDBC来处理数据库的接口主要有三个,即:

       Connection : 由Connection对象的getMetaData()方法获取的是DatabaseMetaData对象。
       PreparedStatement : 由PreparedStatement对象的getParameterMetaData ()方法获取的是ParameterMetaData对象。
       ResultSet : 由ResultSet对象的getMetaData()方法获取的是ResultSetMetaData对象。

    一、DatabaseMetaData(数据库元数据)

     DatabaseMetaData是由Connection对象通过getMetaData方法获取而来,主要封装了数据库本身的一些综合信息,例如数据库的产品名称,数据库的版本号,数据库的URL,是否支持事务等等,能获取的信息比较多,具体可以参考DatabaseMetaData的API文档。
     以下有一些关于DatabaseMetaData的常用方法:

       getDatabaseProductName:获取数据库的产品名称
       getDatabaseProductVersion:获取数据库的版本号
       getUserName:获取数据库的用户名
       getURL:获取数据库连接的URL
       getDriverName:获取数据库的驱动名称
       driverVersion:获取数据库的驱动版本号
       isReadOnly:查看数据库是否只允许读操作
       supportsTransactions:查看数据库是否支持事务

    代码演示:

        @Test
        public void dataBaseMetaDataTest() throws Exception {
            // 得到Connection对象
            Connection con = JdbcUtil.getConnection();
            // 得到DataBaseMetaData对象
            DatabaseMetaData metaData = con.getMetaData();
    
            System.out.println("获取数据库的产品名称: " + metaData.getDatabaseProductName());
            System.out.println("获取数据库的版本号: " + metaData.getDatabaseProductVersion());
            System.out.println("获取数据库的用户名: " + metaData.getUserName());
            System.out.println("获取数据库的URL: " + metaData.getURL());
            System.out.println("获取数据库的驱动名称: " + metaData.getDriverName());
            System.out.println("获取数据库的驱动版本号: " + metaData.getDriverVersion());
            System.out.println("查看数据库是否只允许读操作: " + metaData.isReadOnly());
            System.out.println("查看数据库是否支持事务: " + metaData.supportsTransactions());
        }
    运行结果:
    获取数据库的产品名称: MySQL
    获取数据库的版本号: 5.7.22-log
    获取数据库的用户名: root@localhost
    获取数据库的URL: jdbc:mysql://localhost:3306/day16?characterEncoding=utf-8
    获取数据库的驱动名称: MySQL-AB JDBC Driver
    获取数据库的驱动版本号: mysql-connector-java-5.1.7 ( Revision: ${svn.Revision} )
    查看数据库是否只允许读操作: false
    查看数据库是否支持事务: true
    

    二、ParameterMetaData(参数元数据)

     ParameterMetaData是由PreparedStatement对象通过getParameterMetaData方法获取而来,主要是针对PreparedStatement对象和其预编译的SQL命令语句提供一些信息,比如像”insert into account(id,name,money) values(?,?,?)”这样的预编译SQL语句,ParameterMetaData能提供占位符参数的个数,获取指定位置占位符的SQL类型等等.
     以下有一些关于ParameterMetaData的常用方法:

        getParameterCount:获取预编译SQL语句中占位符参数的个数

    代码演示:

        @Test
        public void parameterMetaDataTest() throws Exception{
            //得到Connection对象
            Connection con = JdbcUtil.getConnection();
            //创建SQL
            String sql = "select * from dept where id=? and sname=?";
            //预编译SQL,得到prepareStatement对象
            PreparedStatement prepareStatement = con.prepareStatement(sql);
            //得到parameterMetaData对象
            ParameterMetaData parameterMetaData = prepareStatement.getParameterMetaData();
            //获取参数个数
            int count = parameterMetaData.getParameterCount();
    
            //输出
            System.out.println("占位符个数为: " + count);
        }
    输出结果:

    占位符个数为: 2


    三、ResultSetMetaData(结果集元数据)

     ResultSetMetaData是由ResultSet对象通过getMetaData方法获取而来,主要是针对由数据库执行的SQL脚本命令获取的结果集对象ResultSet中提供的一些信息,比如结果集中的列数、指定列的名称、指定列的SQL类型等等,可以说这个是对于框架来说非常重要的一个对象。
     以下有一些关于ResultSetMetaData的常用方法:

        getColumnCount:获取结果集中列项目的个数
        getColumnType:获取指定列的SQL类型对应于Java中Types类的字段
        getColumnTypeName:获取指定列的SQL类型
        getClassName:获取指定列SQL类型对应于Java中的类型(包名加类名)

    代码演示:

    对应表:

    这里写图片描述

        @Test
        public void resultSetMetaDataTest(){
            Connection con = null;
            PreparedStatement stmt = null;
            ResultSet rs = null;
            try {
                //得到Connection对象
                con = JdbcUtil.getConnection();
                String sql = "select * from student";
                //预编译sql语句,得到PreparedStatement对象
                stmt = con.prepareStatement(sql);
                //执行sql
                rs = stmt.executeQuery();
                //得到结果集元对象
                ResultSetMetaData metaData = rs.getMetaData();
    
                System.out.println("获取结果集的列数: " + metaData.getColumnCount());
                System.out.println("获取指定列的名称: " + metaData.getColumnName(1));
                System.out.println("获取指定列的SQL类型对应于java.sql.Types类的字段: " + metaData.getColumnType(2));
                System.out.println("获取指定列的SQL类型: " + metaData.getColumnTypeName(1));
                System.out.println("获取指定列SQL类型对应于Java的类型: " + metaData.getColumnClassName(1));
                System.out.println("获取指定列所在的表的名称: " + metaData.getTableName(1));
            } catch (Exception e) {
                // TODO Auto-generated catch block
                //e.printStackTrace();
                throw new RuntimeException(e);
            }finally{
                JdbcUtil.close(con, stmt, rs);
            }
        }
    运行结果:
    获取结果集的列数: 3
    获取指定列的名称: id
    获取指定列的SQL类型对应于java.sql.Types类的字段: 12
    获取指定列的SQL类型: INT
    获取指定列SQL类型对应于Java的类型: java.lang.Integer
    获取指定列所在的表的名称: student
    

    代码演示:

        @Test
        public void resultSetMetaDataTest2(){
            Connection con = null;
            PreparedStatement stmt = null;
            ResultSet rs = null;
            try {
                //得到Connection对象
                con = JdbcUtil.getConnection();
                String sql = "select * from student";
                //预编译sql语句,得到PreparedStatement对象
                stmt = con.prepareStatement(sql);
                //执行sql
                rs = stmt.executeQuery();
                //得到结果集元对象
                ResultSetMetaData metaData = rs.getMetaData();
    
                //迭代每一行
                while(rs.next()){
                    //获取列数
                    int count = metaData.getColumnCount();
                    //遍历,获取每一列的列名和值
                    for (int i = 0; i < count; i++) {
                        //获取列名
                        String columnName = metaData.getColumnName(i+1);
                        //获取列名对应的值
                        Object object = rs.getObject(columnName);
                        //输出
                        System.out.print(columnName + "=" + object + " ");
                    }
                    System.out.println();
                }
            } catch (Exception e) {
                // TODO Auto-generated catch block
                //e.printStackTrace();
                throw new RuntimeException(e);
            }finally{
                JdbcUtil.close(con, stmt, rs);
            }
        }
    运行结果:
    id=1 sname=陈柯佛 gender=男 
    id=2 sname=王思聪 gender=男 
    id=3 sname=方文山 gender=男 
    id=4 sname=德泽 gender=男 
    id=5 sname=海超 gender=男 
    id=6 sname=海阳 gender=男 
    id=7 sname=海荣 gender=男 
    

    应用:

    代码演示:

    /**
     * @author chenkefo 
     * 通用的dao,自己写的所有的dao都继承此类 
     * 此类定义了2个同用的方法:
     *   1.更新(insert/update/delete)
     *   2.查询
     */
    public class BaseDao {
        // 初始化参数
        private Connection conn;
        private PreparedStatement stmt;
        private ResultSet rs;
    
        /**
         * 更新通用方法
         */
        public void update(String sql, Object[] paramsValue) {
            try {
                // 获取Connection对象
                conn = JdbcUtil.getConnection();
                // 预编译sql,获取preparedstatement
                stmt = conn.prepareStatement(sql);
                // 得到参数元数据
                ParameterMetaData parameterMetaData = stmt.getParameterMetaData();
                // 得到占位符个数
                int count = parameterMetaData.getParameterCount();
                // 占位符赋值
                if (paramsValue != null && paramsValue.length > 0) {
                    for (int i = 0; i < count; i++) {
                        stmt.setObject(i + 1, paramsValue[i]);
                    }
    
                }
                // 执行sql
                stmt.executeUpdate();
            } catch (Exception e) {
                // TODO Auto-generated catch block
                // e.printStackTrace();
                throw new RuntimeException(e);
            } finally {
                // 关闭资源
                JdbcUtil.close(conn, stmt, null);
            }
        }
    
        /**
         * 查询通用方法
         */
        public <T> List<T> query(String sql, Object[] paramsValue, Class<T> clazz) {
            try {
                //创建返回集合
                List<T> list = new ArrayList<T>();
                //得到Connection对象
                conn = JdbcUtil.getConnection();
                //预编译sql,得到preparedStatement
                stmt = conn.prepareStatement(sql);
                //得到参数元对象
                ParameterMetaData parameterMetaData = stmt.getParameterMetaData();
                //得到占位符个数
                int count = parameterMetaData.getParameterCount();
                //为占位符赋值
                if (paramsValue != null && paramsValue.length > 0) {
                    for (int i = 0; i < count; i++) {
                        stmt.setObject(i + 1, paramsValue[i]);
                    }
                }
                //执行sql
                rs = stmt.executeQuery();
                //得到结果集元
                ResultSetMetaData metaData = rs.getMetaData();
                //获取列数
                int columnCount = metaData.getColumnCount();
                //遍历结果集
                while (rs.next()) {
                    //创建对象
                    T t = clazz.newInstance();
                    //遍历每一列
                    for (int i = 0; i < columnCount; i++) {
                        //获取每一列的名字
                        String columnName = metaData.getColumnName(i + 1);
                        //通过列名,获取值
                        Object object = rs.getObject(columnName);
                        //通过beanUtils为对象赋值
                        BeanUtils.copyProperty(t, columnName, object);
                    }
                    //把对象添加至集合
                    list.add(t);
                }
                //返回集合
                return list;
            } catch (Exception e) {
                // TODO Auto-generated catch block
                // e.printStackTrace();
                throw new RuntimeException();
            } finally {
                //关闭资源
                JdbcUtil.close(conn, stmt, rs);
            }
        }
    }
    展开全文
  • 数据元与元数据

    万次阅读 2019-06-05 17:35:22
    元数据:描述其它数据的数据(data about other data) 元数据是关于数据的数据,在某些时候不特指某个单独的数据,可以理解为是一组用来描述数据的信息组/数据组,该信息组/数据组中的一切数据、信息,都描述/反映...

    元数据:描述其它数据的数据(data about other data)

    元数据是关于数据的数据,在某些时候不特指某个单独的数据,可以理解为是一组用来描述数据的信息组/数据组,该信息组/数据组中的一切数据、信息,都描述/反映了某个数据的某方面特征,则该信息组/数据组可称为一个元数据。

    元数据可以为数据说明其元素或属性(名称、大小、数据类型等),或其结构(长度、字段、数据列),或其相关数据(位于何处、如何联系、拥有者)。

    在日常生活中,元数据无所不在。只要有一类事物,就可以定义一套元数据。

    举个例子:在电影数据库IMDB上可以查到每一部电影的信息。IMDB本身也定义了一套元数据,用来描述每一部电影。下面是它的一级元数据,每一级下面又列出了二级元数据,总共加起来,可以从100多个方面刻画一部电影:

    Cast and Crew(演职人员)、Company Credits(相关公司)、Basic Data(基本情况)、Plot & Quotes(情节和引语)、Fun Stuff(趣味信息)、Links to Other Sites(外部链接)、Box Office and Business(票房和商业开发)、Technical Info(技术信息)、Literature(书面内容)、Other Data(其他信息)。

    元数据最大的好处是,它使信息的描述和分类可以实现结构化,从而为机器处理创造了可能。

    数据元:可理解为数据的基本单元

    卫生信息基本数据元规范和定义了医药卫生领域所有相关信息的唯一中文名称与代码,并且代码以字母、汉字、数字式的字符串形式表示。

    数据元列举并定义了特定语义环境中的一种信息资源。

    完整的数据元名称=对象类术语+特征类术语+表示类术语+(限定类术语)

    其中:

    一个数据元有且仅有一个对象类术语(object class):是现实世界或抽象概念中事物的集合,有清楚的边界和含义,因其特性和行为遵循同样的规则而能加以标识。

    一个数据元有且仅有一个特征类术语(property):是对象类的所有个体所共有的某种性质,也是对象有别于其他成员的依据,是用来区分和识别事物的一种手段。特征类术语是任何一个数据元名称所必须的成分,在数据元概念可完整、准确、无歧义表达的情况下,其他术语可以酌情简略。

    一个数据元有且仅有一个表示类术语(representation):是值域、数据类型和表示方式的组合,也包括计量单位和字符集等信息。当表示类术语与特征类术语有重复或部分重复时,可从名称中将冗余词删除。

    限定类术语由专业领域给定,限定类术语是可选的。

    数据元基本模型

    数据元与元数据的区别和联系

    1. 元数据不可能涵盖理解数据元所要表示的数据所必需的所有信息。

    2. 数据元的相关信息是任何一个(组织的)元数据的一个完整的组成部分。

    3. 元数据的每一个元素都是一个数据元,用符合数据元标准的元数据属性和描述方法来说明元数据。

    4. 将元数据存储于一个库中,并使之条理化就需要建模,建模就需要从数据元的注册系统中或库中获取元数据。

    5. 元数据,它是以一种一致、标准的方式来表达的数据元。

    6. 元数据与数据元字典格式均由行号、中文名称、英文名称、标识符(短语)、定义、约束/条件、最大出现次数、数据类型、数据的值域等属性组成。不同之处是数据元字典格式中另有语境和同义词名称等属性。

    总而言之,元数据和数据元的定义是从不同角度论述的。由于描述的侧重面不同,元数据和数据元的描述属性也有些区别,但是元数据和数据元的字典格式是基本一致的。

    ------------------------------------------------------------------------------------------------

    1元数据Metadata

    1.1元数据概念

    1、主要是描述数据属性(property)的信息;

    2、描述数据的数据;

    3、关于数据的结构化数据;

    4、描述数据的内容、覆盖范围、质量、管理方式、数据的所有者、数据的提供方式等信息,是数据和数据用户之间的桥梁。

    举例:

    学生信息表包括:姓名、性别、学号等。

    姓名、性别、学号都是数据元,但是这些数据元有自己的元数据,即描述数据,分别是长度、类型、值域等。

    对于学生信息表而言,姓名、性别、学号是描述学生信息的数据,是它的元数据。

    数据是手提箱,而元数据是它上面的标牌。

    数据是文件夹,而元数据是文件夹上面的标签。

    1.2元数据的作用

    1、数据描述:对信息对象的内容属性等的描述能力是元数据最基本的功能。

    2、数据检索:支持用户发现资源的能力,即利用元数据来更好地组织信息对象建立他们之间的关系为用户提供多层次多途径的检索体系,从而有利于用户便捷快速的发现其真正需要的信息资源。

    3、数据选择:支持用户在不必浏览信息对象本身的情况下能够对信息对象有基础的了解和认识从而决定对检出信息的取舍。

    4、数据定位:提供信息资源本身的位置方面的信息,如DOI、URL、URN等信息,由此可准确获知信息对象之所在,便于信息的获取。

    5、数据管理:保存信息资源的加工存档结构使用管理等方面的相关信息权限管理版权、所有权、使用权、防伪措施、电子水印、电子签名等。

    6、数据评估:保存资源被使用和被评价的相关信息,通过对这些信息的使用分析,方便资源的建立与管理者更好的组织资源并在一定程度上帮助用户确定该信息资源在同类资源中的重要性。

    2数据元(Data element)

    2.1数据元概念

    1、用一组属性描述定义、标识、表示和允许值的数据单元。

    2、又称数据类型,通过定义、标识、表示以及允许值等一系列属性描述的数据单元。在特定的语义环境中被认为是不可再分的最小数据单元。

    3、数据元一般由三部分组成:对象、特性、表示

    举例:

    “执业类别代码”为数据元,“01”为数据元的值。

    “执业类别代码”中,“执业”为对象词,“类别”是该数据元的特性词,“代码”是该数据元的表示词。

    2.2数据元的作用

    1、数据元本身也是数据单元,即也是数据。

    2、它是一个用来对各行业的数据进行自身规范化的一个方法或一套指导的理论。

    3、用这一套方法对行业数据进行统一的名、型、值规范及分类。

    4、规划好行业数据元之后,可以为行业构建出统一、集成的、稳定的数据模型奠定基础,同时它也为数据交换奠定基础。

    3元数据管理

    3.1元数据管理的建设目标

    3.2元数据管理的范围

    4资源目录

    4.1资源目录要解决的问题

    4.2业务流程示意图

    4.3资源目录功能特点

    5参考资料

    https://baike.baidu.com/item/%E5%85%83%E6%95%B0%E6%8D%AE/1946090?fr=aladdin

    https://wenku.baidu.com/view/9789bb30f68a6529647d27284b73f242336c31ff.html

    https://baike.baidu.com/item/%E6%95%B0%E6%8D%AE%E5%85%83/7681154?fr=aladdin

    展开全文
  • 什么是元数据(Metadata)?

    万次阅读 2016-11-30 10:09:14
    什么是元数据  任何文件系统中的数据分为数据和元数据。数据是指普通文件中的实际数据,而元数据指用来描述一个文件的特征的系统数据,诸如访问权限、文件拥有者以及文件数据块的分布信息(inode...)等等。在集群...
  • 元数据(Metadata)

    千次阅读 2015-09-25 14:34:52
    什么是元数据 任何文件系统中的数据分为数据和元数据。数据是指普通文件中的实际数据,而元 数据指用来描述一个文件的特征的系统数据,诸如访问权限、文件拥有者以及文件数据 块的分布信息(inode...)等等。在集群...
  • 3分钟全面了解元数据和数据元

    千次阅读 2019-05-14 10:45:26
    元数据:描述其它数据的数据(data about other data) 元数据是关于数据的数据,在某些时候不特指某个单独的数据,可以理解为是一组用来描述数据的信息组/数据组,该信息组/数据组中的一切数据、信息,都描述/反映...
  • 大数据平台-元数据管理系统解析

    万次阅读 多人点赞 2018-03-14 09:26:30
    什么是元数据?在前面的集成开发环境建设相关文章中,我们也提到过,元数据MetaData狭义的解释是用来描述数据的数据,广义的来看,除了业务逻辑直接读写处理的那些业务数据,所有其它用来维持整个系统运转所需的信息...
  • 什么是元数据 (MetaData)

    万次阅读 多人点赞 2013-03-11 19:19:19
    什么是元数据?  元数据(Meta Date),关于数据的数据或者叫做用来描述数据的数据或者叫做信息的信息。  这些定义都很是抽象,我们可以把元数据简单的理解成,最小的数据单位。元数据可以为数据说明其元素或...
  • 元数据(MetaData)

    2020-03-20 14:13:48
    元数据是用来描述数据的数据(Data that describes other data)。单单这样说,不太好理解,我来举个例子。 下面是契诃夫的小说《套中人》中的一段,描写一个叫做瓦莲卡的女子: (她)年纪已经不轻,三十岁上下...
  • 元数据

    千次阅读 2019-10-08 16:48:32
    1.1 元数据的基本概述: 元数据(Metadata),为描述数据的数据(data about data),主要是描述数据属性(property)的信息, 为了更好理解别人数据库工具类底层的原理。 1.2 ParameterMetaData(参数...
  • 数据治理系列2:元数据管理—企业数据治理的基础

    千次阅读 多人点赞 2019-11-06 10:34:48
    导读:元数据管理是对企业涉及的业务元数据、技术元数据、管理元数据进行盘点、集成和管理,按照科学、有效的机制对元数据进行管理,并面向开发人员、最终用户提供元数据服务,以满足用户的业务需求,对企业业务系统...
  • 关于元数据与主数据

    万次阅读 2016-01-19 15:42:00
    企业数据管理的内容和范畴通常包含交易数据、主数据以及元数据。企业主数据是用来描述企业核心业务实体的数据,比如客户、合作伙伴、员工、产品、物料单、账户等;元数据(Meta Data)是关于数据的数据,是数据管控...
  • 数据仓库与元数据

    万次阅读 2012-02-17 14:42:53
    数据仓库是一种面向决策主题、由多数据源集成、拥有当前及历史总结数据、以读为主的数据库系统,其目的是支持决策。数据仓库要根据决策的需要收集来自企业内外的有关数据,并加以适当的组织处理,使其能有效地为决策...
  • 数据仓库与元数据管理

    万次阅读 2011-01-06 17:54:00
    数据仓库与元数据管理 1. 前言 在事务处理系统中的数据,主要用于记录和查询业务情况。随着数据仓库(DW)技术的不断成熟,企业的数据逐渐变成了决策的主要依据。数据仓库中的数据是从许多业务处理...
  • 数据仓库主题设计及元数据设计

    万次阅读 2016-04-15 15:06:29
    数据仓库主题设计及元数据设计
  • 主数据与元数据

    万次阅读 2018-07-10 12:39:51
    企业数据管理的内容和范畴通常包含交易数据、主数据以及元数据。以下主要讨论主数据、元数据的概念及应用。主数据和主数据管理的概念企业主数据是用来描述企业核心业务实体的数据,比如客户、合作伙伴、员工、产品、...
  • 目前,很多企业已经意识到,由于业务人员看不懂系统中存储的数据,所以难以通过大数据来提升业务创新能力,本文就来谈谈解决这个问题的方法——业务元数据管理。(同系列文章请点击王轩的文章《面向业务的企业元数据...
  • 什么是元数据

    千次阅读 2016-12-11 13:02:28
    什么是元数据?  元数据(Meta Date),关于数据的数据或者叫做用来描述数据的数据或者叫做信息的信息。  这些定义都很是抽象,我们可以把元数据简单的理解成,最小的数据单位。元数据可以为数据说明其元素或...
  • 数据仓库元数据介绍

    千次阅读 2018-12-05 19:07:55
    元数据(Metadata)类似于这样的电话黄页。 元数据的定义 数据仓库的元数据是关于数据仓库中数据的数据。它的作用类似于数据库管理系统的数据字典,保存了逻辑数据结构、文件、地址和索引等信息。广义上讲,在数据...
1 2 3 4 5 ... 20
收藏数 917,524
精华内容 367,009
关键字:

元数据