精华内容
下载资源
问答
  • 以企业资源理论、企业治理理论和企业战略管理理论为基础,从国有企业内部治理机制入手,实证检验中国国有企业内部治理机制对企业技术创新活动的影响。结果表明:中国国有上市公司资产收益率、领导权结构和资产负债率...
  • 云计算环境下企业内部控制风险治理机制研究——基于COBIT框架.pdf
  • 借鉴企业价值链模型,提出教育价值链概念,以此构建高校内部治理价值链机制模型。在此基础上,基于行政权力与学术权力互动与协同机制,进一步构建高校内部治理价值链机制效率评价指标体系,其中辅助活动与基本活动评价...
  • 现代企业是以所有权和经营权相分离为主要特征的,而所有权和 经营权相分离的直接后果是委托—代理问题的产生,即作为委托人的 股东怎样才能以最小的代价...目标利益而努力工作,这就是公司治理的制衡机制所要解决的问题
  • 选取我国2008―2010年制造业A股上市公司为样本进行回归分析,在控制样本自选择偏误的基础上,探讨内外部公司治理机制企业非效率投资的约束作用。实证结果表明:内部治理中,第一大股东持股比例与投资过度正相关,对投资...
  • 企业内部控制环境是企业治理的重要因素,但现阶段我国企业内部控制环境还待成熟,特别是在用人机制、领导者的管理、董事会责任等方面存在很多问题。通过对这些问题的研究得出了相应的解决办法:建立合理的治理机制确保...
  • 采用标准的IT治理(ITGovernance)架构可以给企业带来诸多收益。如美国堪萨斯州把COBIT标准作为虚拟政府策略的一部分,结果降低了运营成本,并为它的客户和委托人提供了很高质量的服务。Proctor&Gamble在采用ITIL...
  • 互联网时代下的合作治理机制及其应用:以开源软件项目为例 陈晓红 伴随着国家战略层面的推动,互联网在2015年成为了全国瞩目的焦点。“互联网+”开放数据、分享经济、大众创业万众创新,所有改革都寄托于互联网...

    互联网时代下的合作治理机制及其应用:以开源软件项目为例

    陈晓红

    伴随着国家战略层面的推动,互联网在2015年成为了全国瞩目的焦点。“互联网+”开放数据、分享经济、大众创业万众创新,所有改革都寄托于互联网作为一种技术工具、组织模式、文化理念在改造传统产业方面的积极作用。互联网模式由此成为最受人关注的概念之一。但究竟什么才是互联网模式的内涵?谁又代表了互联网模式的潜在生产力?对此问题的答案却不甚清晰。值得注意的是,以“平台”形式出现的互联网公司(尤其是互联网巨头)在当前改革中正占据着越来越重要的地位,且因存在压制草根创新之趋势而受质疑。但这是否就是互联网模式呢,或者说这是否就是互联网模式的全部呢?答案可能并非如此。事实上,以开源软件、维基百科为代表的“基于公地的大众生产模式”更为纯粹地体现了互联网去中心化、分散化的特性,也更为纯粹地体现了“人的创造力的发挥作为经济增长的根本源泉”,更彰显着草根合作创新的潜力、可能性和尊严。正因为此,本期公号文章刊发关于开源软件治理模式的案例研究,以丰富人们对于互联网模式竞争乃至斗争复杂程度的初步认识,以及对于当前“互联网热”的思考。

    导读

    “右版权”(Copyright)和“左版权”(Copyleft)是信息社会争论的焦点,前者强调“知识产权”,后者强调“知识共享”。以Copyleft为制度设计的开源软件突破了传统的知识产权理论和公共物品理论,成功地解决了私人供给动力不足及“搭便车”的问题,是克服“公地悲剧”并实现“公地喜剧”的典型代表。本文以两个绩效相反的案例为对比,分析了开源软件项目在合作治理中所遇到的关键问题,以及与传统生产组织关系在合约安排方面的异同。

     

    1左版权(Copyleft)与右版权(Copyright)之争

    1976年,比尔.盖茨(Bill Gates)在《致电脑爱好者的一封信》中指出,“谁会从事专业的软件开发而分文无获?哪有业余爱好者花费3年时间去编写软件,修改软件却免费供别人使用?”盖茨用不公开源代码的软件私有制缔造出本世纪最强大的知识霸权帝国Windows。自由软件运动的发起人,理查德.斯托曼(Richard Stallman)在《GNU宣言》中反击,以不公开源代码的方式进行软件的商业化,是阻碍开发员学习和帮助他人的不道德行为。

    两个宣言分别代表两条对立的道路:向右走下去,是“知识产权”,路标上显示的是Copyright(右版权);向左走下去,是“知识共享”,路标上显示的是Copyleft(左版权)。CopyrightCopyleft针锋相对,成为21世纪信息社会的争论核心。前者的表现形式是闭源的商业软件,以确立私有产权的方式鼓励知识生产,但以有条件的使用限制了代码共享和使用的自由;Copyleft反其道而行之,以产权共有阻止个人私有的形式保护知识共享。具体的做法就是,源代码免费开放,保障任何人对作品及其派生品使用、修改、发布的权利,唯一的前提就是以Copyleft许可发布。简单地说,就是“源码共享,私有必究;知识共享,私有必究”。

    如果说Copyright的背后意味着控制和垄断,Copyleft则意味着自由和共享。互联网时代的到来,使得对“知识产权”的讨论变得更加焦灼。哈佛大学法学院教授劳伦斯.莱斯格(Lawrence Lessig)坚决反对“知识产权的原教旨主义”,认为将现实社会的产权保护体系复制到网络社会,那无疑会将互联网由开放变为封闭,在摧毁信息化的同时,阻碍人类文明的进程和文化的繁荣与创新。代码作为互联网的心脏,是网络创新的公共资源,本应该在成员之间共享,如果Copyright要被作为商业利益的障眼法用在网络社会,那么以Copyleft为制度设计的开源软件就是最有利的回击。

     

    2开源对知识产权理论与公共物品理论的挑战与突破

    第一,开源软件许可证(License)的制度设计,将产权共有——打破了传统的知识产权只保护专有产权的观点,是对原有知识产权理论的丰富与跨越。

    传统的知识产权通过法律保护私人对劳动成果所享有的专有产权,任何人需要以有条件的许可,比如付费等形式获得产品的使用权。以享有专有产权的商业软件和产权共有的开源软件进行对比,其中蕴含的核心假说在于:在私人供给模式中,任何私人知识成果的“外泄”都会导致其收益的下降,因此大多数的私人供给者会尽量地减少知识共享,并以知识产权的形式保护个人对产品的专有产权(Audretsch & Feldman,1996; Audretsch & Stephan, 1999; Harhoff et al, 2000)。

    开源软件以许可证的形式,使得任何人都可以免费的使用、修改以及发布源代码软件,产品权利完全对外开放,产权共有。许可证的制度设计打破了传统的知识产权认知误区:以为产权共有的开源软件不需要版权的保护,这是错误的。许可证保护开源软件版权的方式,就在于有效地避免共有知识产品被私人占有。由于开发员对于参与贡献有一定的稳定预期,因而能够激励其持续地志愿贡献,从而解决了动力不足的问题(Lakhani & Wolf, 2001)。

    第二,开源软件以左版权(Copyleft,又称“逆版权”或“著佐权”)许可证的传导性质,严格控制产品的后续发布,保证源代码永久开放,实现了公共物品的私人供给——挑战和丰富了原有的公共物品理论。

    知识具有公有性(Merton,1942)。根据公共物品理论,传统的知识供给主要分为私人供给(Private Investment Model)和公共供给(Collective Action Model)两种模式。私人供给主要指由私人提供,并且通过知识产权,如专利、版权、商业机密等赋予物品的专有产权,获得排他性的收益,以此来保护和鼓励个人的知识创新。公共供给主要指基于市场失灵,由公共部门提供非竞争性和非排他性的公共物品(Samuelson, 1954)。由于任何人都可以无条件的过度使用,很容易出现私人供给的动力不足,以及“搭便车”的问题(Olson, 1965——“公地悲剧”就产生了(Hardin, 1968)。开源软件打破了传统的公共物品理论,实现了知识供给的第三种模式——公共物品的私人供给:开发员通过个人的志愿活动,提供免费的开放源代码,而产品可以供任何人使用、修改和发布(von Hippel & von Krogh, 2003; Simon et al, 2004)。开源软件的出现,成功地解决了公共物品的私人供给不足,以及“搭便车”的问题——是“反公地悲剧”,创造“公地喜剧”的最佳代表(Rose, 1986)。

    开源软件许可证分为左版权许可证(Copyleft)和非左版权许可证(Non-Copyleft),前者要求作品的修改和演绎版本必须采用与原作品相同的许可条款,如限制最严格的GPL 许可证;后者则不做限制,如商业友好型的BSD许可证。左版权的“左”,就在于能够保证开源软件永久开源;而采纳非左版权许可证的开源软件,其后续产品则可能变为专有的商业软件。

    开源软件中左版权的传导性质,能够较好地解决集体活动中的“搭便车”现象。原因在于,参与者意识到,他们之间的博弈不是出于某一阶段,而是无限阶段的博弈,短期的产权专有软件并不能使其长久获益,相反,因为左版权机制使得开源软件不可能被私有,开发者愿意在集体活动中采取合作和信任,从而放弃短期搭便车的机会主义行为。

     

    3、开源的创新合作治理模式

    开源软件实现了公共物品的私人供给,是私人供给和公共供给之外的第三种创新模式(von Hippel & vonKrogh, 2003)。之所以能够不断地创造新的知识,离不开阶段性的创新治理。根据de Noni 等人(2013)的观点,开源的创新治理模式可以分为三个阶段:自发治理(Spontaneous)、内部治理(Internal)和外部治理(External Governance)。第一阶段:成员基于对开源的认知规范,开展非正式的治理和知识共享。第二阶段:治理的正式机制逐渐形成,主要目的在于实现项目合作效率与效力的最大化。第三阶段:治理机制逐渐制度化,外部参与者扩大,这一阶段的治理主要在于多方参与主体的互动,增强成员对开源社区规则、行为、文化等的认同,提升成员之间的信任感。

    1)自发治理

    1970年代,在自发式治理阶段,愿意与他人自由交流并共享源代码的黑客们多属于“学院派”,以码会友是极为正常的一件事。在70年代末期,随着商业软件的兴起,黑客们开始另辟蹊径,建立自己的开源项目,推动源代码的自由交流和共享。

    这一时期社区形成主要有以下几点原因:(1)黑客们将软件编程作为艺术(Raymond, 1999;Bonaccorsi & Rossi, 2003),能够从中感知足够的乐趣(Himanen, 2001)。(2)自由交流和集体协作的需要(Yamauchi et al, 2000; Crowston etal, 2005)。(3)由于对不同许可证的态度各异,黑客们各成一派。一种以Richard Stallman 为代表,强调软件的自由理念,主推以GPL 为许可的自由软件,禁止源代码被商业化或专有倾向。另一种则以开源软件协会为代表,从实用主义出发,强调以源代码开源为途径,允许开源软件的商业化。这两个学派的共同点都强调开发员的自由交流与知识共享(de Laat, 2007)。

    2)内部治理

    从自发治理到内部治理转变的基因就在于社区规模的不断扩大,关注点在于如何提高治理的效率和效能。根据模块化、角色分工、决策者、培训、流程与文档、制度化、领导力综合维度的高低,可将这一阶段的治理结构分为两种:独裁的治理结构(Autocratic MechanisticStructure)和民主的治理结构(Democratic OrganicStructure)。前者强调管理的自上而下;后者强调自下而上。需要说明的是,无论哪种结构,在社区具备决策影响力的人物大多建立在对项目积极贡献和具备把控能力的基础之上(de Laat, 2007)。

    3)外部治理

    外部参与主体的增多,使得对开源的治理逐渐进入外部阶段,即目前所处的阶段。各主体包括公司、国际组织以及非政府组织等,且组织间关系不断发生变化(Dahlander & Wallin,2006; de Laat, 2007; West & O’Mahony, 2008)。外部治理阶段,主要发挥作用以及影响成员间知识共享的主体分为三种:基金会、公司以及公司衍生社区。

    第一类外部参与主体是基金会。基金会的参与可能会在一定程度改变开源项目的发展方向和进展。目前介入开源的基金会主要有两种:第一种积极支持社区及其成员发展,且给与其充分的自由决策权,包括对软件的版权许可。第二种,如GNOME Apache 基金会,直接支持开源软件项目,公司或社区一旦使用其核心代码作为商业软件,需要注明该基金会的版权,基金会对于软件的更新、发布、商标等有直接责任(de Laat, 2007)。

    第二类外部参与主体是公司。公司参与开源,多从战略角度出发,利用商业模式不同程度地介入开源软件项目(Cohen & Levinthal,1990);或者与开源社区合作开发的形式间接影响项目发展(West & Gallagher,2006)。根据商业模式的不同,公司可以分为三种(Feller&Fitzgerald,2002):混合型、纯开源、以开源为过程的公司。混合型公司是开源和内部发展的整合;纯的开源公司通过提供技术支持和培训获取利润;以开源为过程的公司借由开源获取更高的经济利益。

    公司与社区之间的合作目的有所不同,前者聚焦在经济动机,后者更注重社会动机(Bonaccorsi & Rossi,2003; West & O’Mahony, 2004)。根据二者合作关系的不同(表1),可以分为共赢型(Symbiotic)、通约型(Commensalistic)、寄生型(Parasitic)关系。具体来说,共赢型关系指公司与社区双赢,公司为了开发产品而创建衍生社区,并以提供人力支持、发展销售工具等方式发挥作用,对社区的影响较大。通约型关系强调公司从社区寻找获利点,为了经济动机向社区输送开发员,对社区影响较小。寄生型关系指公司以社区的亏损为代价而发展自身,所面对的最大的管理挑战就在于如何避免与社区成员之间的直接冲突。尽管公司作为外部参与主体,会影响开源软件项目的发展,但必须承认公司对社区及其成员财力方面的贡献(Dahlander&Magnusson2005)。

    类社区多由公司直接支持和产生,比如GoogleIBMApple。公司设立社区的目的在于通过与外界的交流,不断修正产品的用户体验,提高公司的美誉度。比如,谷歌设立安卓社区来促进其手机开源系统的应用。需要说明的是,商业公司直接运营的开源社区多会受到身份上的质疑(Mockus et al, 2002; West& O’ Mahony, 2008),因此,较为推荐的方式是,公司能够提供和建立一个透明化的运营环境,而非直接对开源项目的把控和影响(Garud et al, 2002;Mockus et al, 2002)。

     

    4、案例研究

    4.1 案例选择

    本文选取了绩效相反的两个开源软件项目作为研究对象。案例选择标准如下:(1)案例数据的可获取性。本文案例数据获取历经4个月,在掌握70个案例数据库的基础上,着重对10个案例进行深入分析,最终选择2个案例在本文呈现。(2)案例选择的典型性。本文选取的 A(成功)、B(失败)两则项目是开源界关注度极高、评价鲜明的项目,能够相对全面地获取项目细节。(3)案例结果的互斥性。本文选取的案例在绩效方面存在一定差异,通过可对比的案例研究,可以提高研究设计的周延性和外在效度,进而提升结论的说服力。案例的基本情况如表2所示。

     

    4.2 数据收集与分析

        在数据收集方面,主要以“线上”(Skype meeting、邮件、邮件列表、IRC、论坛、群组等)和“线下”(面对面访谈)两种方式为载体获取两则案例数据。每个案例的平均访谈为1小时20分钟,访谈结束后即请访谈对象对案例内容予以审核和确认。在数据分析方面,研究者对两组案例结果的一致性和稳定性进行测度,确保研究内容的信度。对每个案例运用访谈、观察、档案等多种方法获取和分析证据, 以提高案例研究的建构效度。再者,不断将案例与理论进行对比,涌现要素与要素之间的关系,并请访谈者对“推论”进行确认,保证案例研究的内在效度。最后,在对单个案例结论进行分析性归纳后,运用“复制”原则,通过对多案例的研究和对比来确定案例研究的外部效度。

    4.3 案例简介

    1)成功案例:项目

    A项目是Application Product Development Platform的缩写,意为应用级产品开发平台。A项目的雏形可以追溯到2008年,并于4年后即201249日在Github开源。其用户群是广大的JAVA工程师,对于JAVA初级开发者,能从A项目中学到众多的架构设计原则及编码技巧,对于JAVA中的高级开发者,能使用A项目从事基于B/S多层架构的管理信息系统,从而快速开发工作。项目底层全部采用JAVA开源框架,开放透明,安全可靠。

    在中国开源软件推进联盟主办、全球最大中文IT社区CSDN与程序员杂志协办的“2013年度中国优秀开源项目评选”活动中,A项目以2094票位居第三。经过2年多的时间,A项目目前在Github上面已经有949个开发员对其进行跟踪、研究和使用,是较为成功的开源软件项目。

    2)失败案例:项目

    B项目于2012927日建立,起初源于国内某知名电商公司高级技术副总裁,看到同行程序员无法在网络成功预订火车票,遂牵头成立B项目开源技术组,旨在为国内建立一套新的火车票订购系统。B项目建立的背景在于铁道部12306网站在国庆双节期间频现技术事故,对人民铁路出行造成很大影响。

    在这种情况下,B项目的推出,引来全国众多网民及程序员的广泛关注。项目有10个子模块,每个模块设立相应的针对性问题,以独立运作的模块化产品和所有模块的系统整合为预期目标。项目自2012930日正式启动,到同年1110日,已有超过10000名开发员注册并参与,核心成员80名左右,项目历时6个月之久,以没有任何标志性的产出而宣告失败。

    4.4 案例分析

    A项目中,项目创始人的最初目标就是为了面向广大的Java 工程师,提供效能精简的用户平台和技术助力。通过平常的技术培训,目前的收入也已经超过了当时工作的支出,既能造福他人,又能够缓解生活压力。同时,创始人一直以来对编程的热爱和参与其中对自身技术能力的帮助也是非常重要的原因。项目中,成员认为解决用户实际问题的重要前提在于辨别真开源和假开源。对项目目标认同对和开源的品牌效应是促使成员加入的重要原因。交流方式主要分为线上和线下,更多的时候以email 为交流载体。由于项目参与人数近千人,交流过程中难免产生“噪音”,然而大多数的建议对于推进项目有帮助,成员也较为尊重项目规则。项目的发起人坦言,非常崇拜以及信奉Richard Stallman提倡的自由软件精神,因此采用GPLV3作为开源软件项目的许可证。成员之间积极进行合作,但知识产权方面的问题难以得到有效保障。A项目中,用户乐意花费时间,目前已有1000余人次向项目创建者咨询和反馈,代码和文档的质量也因此得到提高。成员主要通过QQemail、博客等形式交流。由于项目主要用户群定位在JAVA 工程师,并帮助其将复杂技术简化,市场化非常成功,很多软件公司主动邀请其进行技术支持和服务。程序员和用户的社区交流非常频繁和密集,目前已有超过949名开发员fork

    B项目的创建,源于某知名电商公司高级技术副总裁的号召,因为看到铁道部官网经常崩溃,同行程序员无法解决买票难得问题,于是打算和开源爱好者一起开发新软件,作为对社会的回馈。成员有共有的网络平台进行交流,为解决票池问题,项目在Github 上托管且公开源代码。每周日8点,以微信群聊方式开会,并对票池方案进行讨论。但成员间观点不一,加之核心成员较多且熟识和信任程度不够,很难有效率地形成统一意见或决策。项目中,按照开源项目要求,所有信息公开。项目预期较高,希望在一年之后设计出可以替换官网系统的软件。成员花较多时间讨论和设计工作模块,每个模块有2-3人管理,4-5人进行开发,10个子模块有80余名核心成员,但整个项目在前期路线图设计方面花费过多时间,鲜有实质成果产出。B项目中,用户的参与热情很高,但技术能力普遍一般,极少有实质性的贡献。B项目中,尽管成员在论坛上积极相应,但几乎无线下沟通。由于参与人数太多且水平一般,很难有效地推进项目。社区繁荣但以无任何代码、文档等的产出而从未有机会实现市场化。

    4.5 案例小结

    可以发现,两个项目中开发员之所以愿意主动贡献,或多或少地出于不同的动力和目的,而非盲目行为。参与者的参与动机在很大程度上驱动着知识共享行为。A项目在社会网络方面表现较佳,由于成员之间在关系、认知和结构维度情况较好,因而成员间知识共享较好。项目成员间合作较为顺畅,且对于技术精进有较高的追求,虽然技术水平较高,影响力更为本土化,但由于国内相关制度环境建设不健全,开发员在合作共享中的较为缺乏安全感。用户有较强的参与意愿,且积极提供用户反馈。A项目中,成员主要通过QQemail、博客等形式交流。由于项目主要用户群定位在JAVA 工程师,并帮助其将复杂技术简化,市场化非常成功,很多软件公司主动邀请其进行技术支持和服务。程序员和用户的社区交流非常频繁和密集,目前已有超过949名开发员fork

    B项目中,尽管参与人数较多且互动频繁,然而由于成员水平参差不齐,且缺乏有效的项目决策机制,有效的知识共享较弱。成员在文化认同,特别是自由开放方面都较为认同,然而在合作共享和极客精神方面出现偏差。众多的参与人员将时间花在框架的制定,由于成员水平参差不齐,对于实际操作几乎无实质性推进。B项目的用户参与热情更为强烈,然而用户实际贡献都较少。尽管成员在论坛上积极相应,但几乎无线下沟通。由于参与人数太多且水平一般,很难有效地推进项目。社区繁荣但以无任何代码、文档等的产出而从未有机会实现市场化。

     

    5本文结尾

    如果说商业软件代表的是Copyright,体现的是知识产权在网络社会的强化和极致追求;自由软件作为更为严格的开源软件,代表的是Copyleft,体现的是对传统产权保护弊端的批判与叛逆;那么,开源软件则更为实用主义,既是对自由软件的回归,又是对商业软件的异化。

    互联网的发展,客观上使得组织和交易成本大大下降,传统的生产组织方式受到影响,必然催生出新的生产组织方式。随着软件产业的发展,开源软件及其生产组织关系受到越来越多的关注和肯定。Eric Raymond2001)在《大教堂与集市》中对开源软件的生产组织方式进行了精彩地描述:传统的软件开发模式更像企业组织方式,“像建大教堂一样,需要一群与世隔绝的奇才的细心工作”,由于等级严格而分工明确,组织效率相对迟滞。像Linux这样的开源软件组织方式,更像是乱哄哄的集市,但奇迹就从此诞生。DemilLecocq2003)将这种组织方式称为“集市化的治理结构”(Bazaar Governance)。

    开源软件许可证从制度上确立其知识共享的属性,成员间通过网络协作完成产品,是一种新型的知识共享合作R&D模式。开源模式下的知识共享合作R&D,其不同之处在于合约安排保证产权共有。具体区别如下:(1)合作成员方面,传统的知识共享合作R&D多为企业或机构,成员进入退出有严格程序;开源模式下的R&D多为个人且无人数限制,成员流动较快,进入退出自由开放。(2)知识产权方面,前者多为合作研发组织私人拥有;后者对所有人开放,产权共有。(3)使用方式方面,传统合作R&D需要通过付费获得许可;开源模式的R&D 中任何人均可免费使用。(4)合作目标方面,前者有明确的目标和期限;后者则无。(5)合作方式方面,传统合作R&D管理规范,有明确的技术分工;开源模式的合作R&D管理松散,成员各尽所能。(6)收益方式,前者通过研发降低企业产品成本,增加产品收入;后者通过免费使用产品获得收益。

     

     

     

     

     

    展开全文
  • 导读:元数据管理是对企业涉及的业务元数据、技术元数据、管理元数据进行盘点、集成和管理,按照科学、有效的机制对元数据进行管理,并面向开发人员、最终用户提供元数据服务,以满足用户的业务需求,对企业业务系统...

    在这里插入图片描述
    导读:元数据管理是对企业涉及的业务元数据、技术元数据、管理元数据进行盘点、集成和管理,按照科学、有效的机制对元数据进行管理,并面向开发人员、最终用户提供元数据服务,以满足用户的业务需求,对企业业务系统和数据分析平台的开发、维护过程提供支持。元数据管理是企业数据治理的基础。

    认识元数据

    元数据(Metadata),元数据是关于数据的组织、数据域及其关系的信息,简言之,元数据就是描述数据的数据。这么说对于没有技术背景的人来说还是比较抽象的,我给大家举几个例子。

    在这里插入图片描述
    在我之前写的一篇文章《关于“数据”的一些概念的整理和总结》中,有一个关于元数据的例子,歌曲《小芳》中有一段台词:“村里有个姑娘叫小芳,长得好看又善良” 这首耳熟能详的歌,我们分析一下,姓名:小芳、性别:姑娘(女)、长相:好看、性格:善良,住址:村里。这里面,小芳是被描述的对象也就是我们所谓的实体数据,而姓名、性别、长相、性格、住址就是描述“小芳”的元数据。

    再举个栗子:元数据就像“户口本”,户口本中除了有姓名、出生日期、住址、民族等信息外,还有家庭的血缘关系,父子关系、兄弟关系等。这些信息就构成了对这个人的详细描述,那这些信息就是描述这个人的元数据。

    再举个栗子:元数据好比“字典”,针对每个字都注音、含义、组词、举例等信息,同时也有关于字体结构、相关引用、出处等。另外,我们可以通过拼音、偏旁部首都能查到这个字。所有的这些信息都是对这个字的详细描述,那这些信息就是描述这个字的元数据。

    再举个栗子:元数据就如“地图”,通过这张“地图”能够找到你所处的地点,以及你从哪来来,到哪里去,途中都需要路过哪些地方……

    这下大家理解了吧,元数据是对数据的结构化描述,使得数据更容易理解、查找、管理和使用。

    元数据的分类

    根据数据的性质特点,业内一般将元数据划分为三类:业务元数据、技术元数据和管理元数据。
    在这里插入图片描述

    业务元数据 是描述数据的业务含义、业务规则等。通过明确业务元数据让人们更容易理解和使用业务元数据,元数据消除了数据二义性,让人们对数据有一致的认证,避免“各说自话”,进而为数据分析和应用提供支撑。常见的业务元数据包括:业务定义、业务术语、业务规则、业务指标等。

    技术元数据 是对数据的结构化,方便计算机或数据库之间对数据进行识别、存储、传输和交换。技术元数据可以服务于开发人员,让开发人员对数据的存储、结构更明确,从而为应用的开发和系统的集成奠定基础。技术元数据也可服务于业务人员,通过元数据理清数据关系,让业务人员能够更快速的找到想要的数据,进而对数据的来源去向进行分析,支持数据血缘追溯和影响分析。常见的技术元数据包括:存储位置、数据模型、数据库表、字段长度、字段类型、ETL脚本、SQL脚本、接口程序、数据关系等。

    管理元数据 描述了数据的管理属性,包括管理部门、管理责任人等,通过明确管理属性,有利于数据管理责任到部门和个人,是数据安全管理的基础。常见的管理元数据包括:数据所有者、数据质量定责、数据安全等级等。

    表:元数据分类实例

    元数据类型 元数据描述 元数据描述
    业务定义 数据的含义 客户的完整名称,并具有法律效力
    元数据类型 元数据描述 元数据描述
    业务规则 数据录入规则 企业的营业执照、组织机构代码证书,统一社会信用代码证书等具有法律效力的证明文件中的中文名称全称
    识别规则 企业的组织机构代码或者统一社会信用代码或者统一纳税号必须完全匹配,则认为是同一客户。
    质量规则 客户名称为非空,并且与营业执照的中文名称一致
    存储位置 数据的存储什么地方 ERP系统
    数据库表 存储数据的库表名称和路径 ERP/Customers
    字段类型 数据的技术类型 字符型
    字段长度 数据存储的最大长度 [200]
    更新频率 数据的更新频率 每年更新一次
    管理部门 数据责任部门 客户管理部
    管理责任人 数据责任部门 客户管理部业务员

    元数据管理成熟度

    在实施元数据管理的过程中,可以参照元数据管理的成熟度模型确定企业当前元数据管理所在层次,并根据业务需要制定路线图实现元数据管理水平的提升。下图是元数据管理成熟度模型:
    在这里插入图片描述

    元数据管理成熟度评估模型

    L0: 初始状态
    元数据分散于日常的业务和职能管理中,由某个人或某一组人员在局部产生或获取,并在局部使用。在局部环境工作数月或数年后,人们使这些元数据以及对它的理解内在化,使对这种信息有习惯性的理解。这些元数据会永远保存在某个人那儿,一旦这个人调离,这些元数据将永远消失。

    L1: 从属于业务系统
    在这个阶段,随着各个业务系统自动化构建完成,相应的元数据也随着需求整理、设计、开发、实施和维护等过程被各个业务系统孤立的全部或部分管理起来。业务元数据可能分散在各种业务规章、流程规定、需求、需求分析和概要设计等文档以及业务系统中,技术元数据可能分散在详细设计、模型设计和部署方案等各种文档和各种中间件以及业务系统中。由于各个业务系统处于一个个竖井之中,元数据之间互通互联困难,如果需要获取其他系统的元数据,除了调阅各种文档外,对分散在各种中间件和业务系统中的技术元数据需要一定的集成方式实现互通互联。

    L2:元数据统一存储
    元数据依然在局部产生和获取,但会集中到中央存储库进行存储,业务元数据会手工录入到中央存储库中,技术元数据分散在文档中的部分也通过手工录入到中央存储库中,而散落在各个中间件和业务系统中的技术元数据则通过数据集成的方式被读取到中央存储库中。业务元数据和技术元数据之间全部或部分通过手工方式做了关联。中央存储库的构建,使得元数据在整个企业层面可被感知和搜索,极大地方便了企业获取和查找元数据。缺点是,元数据仍然在各业务系统上维护,然后更新到中央存储库,各业务竖井之间仍然使用不同的命名法,经常会造成相同的名字代表不同意义的事情,而同一件事情则使用了多个不同的名字,有些没有纳入业务系统管理的元数据则容易缺失。元数据没有有效的权限管理,局部元数据更改后也不自动通知其他人。

    L3: 元数据集中管理
    在 L2 的基础上做了改进,增强了元数据的集中控制,局部业务单元或开发小组如不事先通知其他人,将无法对元数据进行修改。局部元数据的修改完成后将被广播给其他人。和其他中间件和应用系统的交互,仍然通过桥集成的方式进行,中央存储库中的业务元数据和技术元数据之间还是通过手工方式进行映射。

    L4:元模型驱动管理
    在 L3 的基础上,通过构建元模型以及元元模型,优化各业务单元之间的各种冲突和各种副本,创建、管理和共享业务词汇表和分类系统(基于主题领域的层次结构)。业务词汇表(业务元数据)包含与企业相关的词汇、词汇业务含义以及词汇与信息资产(技术元数据)的关系,可以有效帮助企业用户了解其业务元数据和技术元数据对应的业务含义。分类是基于主题领域的层次结构,用以对业务术语归类。和其他中间件和应用系统的交换,通过基于 CWM 的适配器方式进行连接。

    L5: 元数据管理自动化
    在 L5 元数据管理是高度自动化的,当逻辑层次元数据变更时,会被传播到物理层次,同样物理层次变更时逻辑层次将被更新。元数据中的任何变化将触发业务工作流,以便其他业务系统进行相应的修改。由于各个业务系统遵照相同的业务词汇表和分类系统(元模型),他们之间的关系可以通过知识本体进行推断,因此各个应用系统之间的数据格式的映射自动产生。

    元数据管理平台架构

    元数据管理平台从应用层面,可以分类:元数据采集服务,应用开发支持服务,元数据访问服务、元数据管理服务和元数据分析服务。
    在这里插入图片描述

    元数据采集服务

    在数据治理项目中,通常涉及到的元数据还包括:数据源的元数据,数据加工处理过程的元数据,数据仓库或数据主题库的元数据,数据应用层的元数据,数据接口服务的元数据等等。元数据采集服务提供各类适配器满足以上各类元数据的采集,并将元数据整合处理后统一存储于中央元数据仓库,实现元数据的统一管理。这个过程中,数据采集适配器十分重要,元数据采集要能够适配各种DB、各类ETL、各类DW和Report产品,同时还需要适配各类结构化或半结构化数据源。目前市场上的主流元数据产品还没有哪一家能做到“万能适配”,都需要在实际应用过程中做或多或少的定制化开发。

    元模型驱动的设计与开发

    通过元数据管理平台实现对应用的逻辑模型、物理模型、UI模型等各类元模型管理,支撑应用的设计和开发。应用开发的元模型有三个状态,分别是:设计态的元数据模型,通常由ERWin、PowerDesigner的等设计工具产生。测试态的元数据模型,通常是关系型数据:Oracle、DB2、Mysql、Teradata等,或非关系型数据库:MongDB、HBase、Hive、Hadoop等。生产态的元模型,本质上与测试态元数据差异不大。通过元数据平台对应用开发三种状态的统一管理和对比分析,能够有效降低元数据变更带来的风险,为下游ODS、DW的数据应用提供支撑。另外,基于元数据的MDD(代码生成服务),可以通过模型(元数据)完成业务对象元数据到UI元数据的关联和转换,自动生成相关代码,表单界面,减少了开发人员的设计和编码量,提升应用和服务的开发效率。

    在这里插入图片描述

    元数据管理服务
    市场上主流的元数据管理产品,基本都包括:元数据查询、元模型管理、元数据维护、元数据版本管理、元数据对比分析、元数据适配器、元数据同步管理、元数据生命周期管理等功能。此类功能,各家产品大同小异,此处不再赘述。

    元数据访问服务
    元数据访问服务是元数据管理软件提供的元数据访问的接口服务,一般支持REST或Webservice等接口协议。通过元数据访问服务支持企业元数据的共享,是企业数据治理的基础。

    元数据分析服务
    在这里插入图片描述

    血缘分析: 是告诉你数据来自哪里,都经过了哪些加工。其价值在于当发现数据问题时可以通过数据的血缘关系,追根溯源,快速地定位到问题数据的来源和加工过程,减少数据问题排查分析的时间和难度。这个功能常用于数据分析发现数据问题时,快速定位和找到数据问题的原因。

    影响分析: 是告诉你数据都去了哪里,经过了哪些加工。其价值在于当发现数据问题时可以通过数据的关联关系,向下追踪,快速找到都哪些应用或数据库使用了这个数据,从而避免或降低数据问题带来的更大的影响。这个功能常用于数据源的元数据变更对下游ETL、ODS、DW等应用应用的影响分析。

    冷热度分析: 是告诉你哪些数据是企业常用数据,哪些数据属于“僵死数据”。其价值在于让数据活跃程度可视化,让企业中的业务人员、管理人员都能够清晰的看到数据的活跃程度,以便更好的驾驭数据,激活或处置“僵死数据”,从而为实现数据的自助式分析提供支撑。

    关联度分析: 是告诉你数据和其他数据的关系以及它们的关系是怎样建立的。关联度分析是从某一实体关联的其它实体和其参与的处理过程两个角度来查看具体数据的使用情况,形成一张实体和所参与处理过程的网络,从而进一步了解该实体的重要程度,如:表与ETL 程序、表与分析应用、表与其他表的关联情况等。本功能可以用来支撑需求变更的影响评估。

    数据资产地图: 是告诉你有哪些数据,在哪里可以找到这些数据,能用这些数据干什么。通过元数据可以对企业数据进行完整的梳理、采集和整合,从而形成企业完整的数据资产地图。数据资产地图支持以拓扑图的形式进行可视化展示各类元数据和数据处理过程,通过不同层次的图形展现粒度控制,满足业务上不同应用场景的数据查询和辅助分析需要。

    元数据管理价值

    一图在手,天下我有
    通过元数据以企业全局视角对企业各业务域的数据资产进行盘点,实现企业数据资源的统一梳理和盘查,有助于发现分布在不同系统、位置或个人电脑的数据,让隐匿的数据显性化。数据地图包括了数据资源的基本信息,存储位置信息、数据结构信息、各数据之间关系信息,数据和人之间的关系信息,数据使用情况信息等,使数据资源信息详细、统一、透明,降低“找数据”的沟通成本,为数据的使用和大数据挖掘提供支撑。

    追根溯源,发现数据问题本质
    企业在做数据分析的时候,数据分析结果不正确,原因可能是数据分析过程出现数据问题,也可能是数据源本身就有问题,还可能是数据在加工处理过程中出现了数据问题……。通过元数据血缘分析,能够快速定位数据来源和加工处理过程,能够帮助数据分析人员快速定位数据问题。另外,通过元数据血缘关系分析,可以理解不同数据指标间的关系,分析产生指标的数据源头波动情况带来的影响。
    在这里插入图片描述

    模型驱动,敏捷开发
    基于元数据模型的数据应用规划、设计和开发是企业数据应用的一个高级阶段。当企业元数据管理达到一定水平(实现自动化管理的时候),企业中各类数据实体模型、数据关系模型、数据服务模型、数据应用模型的元数据统一在元数据平台进行管理,并自动更新数据间的关联关系。基于元数据、可扩展的MDA,才是快速满足企业数据应用个性化定制需求的最好解决方案。通过将大量的业务进行模型抽象,使用元数据进行业务描述,并通过相应的模型驱动引擎在运行时驱动,使用高度抽象的领域业务模型作为构件,完成代码转换,动态生成相关代码,降低开发成本,应对复杂需求变更。

    在这里插入图片描述

    总结:
    元数据是企业数据资源的应用字典和操作指南,元数据管理有利于统一数据口径、标明数据方位、分析数据关系、管理数据变更,为企业级的数据战略规划、数据模型设计、数据标准管理、主数据管理、数据质量管理、数据安全管理以及数据的全生命周期管理提供支持,是企业实现数据自服务、推动企业数据化运营的可行路线。企业以元数据为抓手进行数据治理,帮助企业更好地对数据资产进行管理,理清数据之间的关系,实现精准高效的分析和决策。

    作者:石秀峰,公众号:learning-bigdata(谈数据)

    展开全文
  • 分享一份企业大数据治理的有效解决方案 未来,随着应用领域的拓展、技术的提升、数据共享开放机制的完善,以及产业生态的成熟,具有更大潜在价值的预测性和指导性应用将是发展的重点。 下面是小编从网上整理的一个数据...

    分享一份企业大数据治理的有效解决方案

    未来,随着应用领域的拓展、技术的提升、数据共享开放机制的完善,以及产业生态的成熟,具有更大潜在价值的预测性和指导性应用将是发展的重点。

    在这里插入图片描述

    下面是小编从网上整理的一个数据治理的案例,一起来分享吧!

    01、数据集成:构建聚合的数据仓库

    将客户需要的数据通过网络爬虫、结构化数据、本地数据、物联网设备、人工录入等进行全位实时的汇总采集,为企业构建自由独立的数据库。消除了客户数据获取不充分,不及时的问题。目的是将客户生产、运营中所需要的数据进行收集存储。

    02、数据管理:建立一个强大的数据湖

    将数据库中的数据经过抽取、清洗、转换将分散、零乱、标准不统一的数据整合到一起,通过在分析数据库中建模数据来提高查询性能。

    合并来自多个来源的数据,构建复杂的连接和聚合,以创建数据的可视化图标使用户能更直观获得数据价值。为内部商业智能系统提供动力,为您的业务提供有价值的见解。

    03、数据应用:将数据产品化

    将数据湖中的数据,根据客户所处的行业背景、需求、用户体验等角度将数据真正的应用化起来生成有价值的应用服务客户的商务办公中。将数据真正做到资产化的运作。

    聚云化雨的处理方式

    聚云:某公司全面覆盖各类数据的处理应用。以数据为原料,通过网络数据采集、生产设备数据采集的方式将各种原始数据凝结成云,为客户打造强大的数据存储库;

    化雨:利用模型算法和人工智能等技术对存储的数据进行计算整合让数据与算法产生质变反应化云为雨,让真正有价值的数据流动起来;

    开渠引流,润物无声:将落下“雨水”汇合成数据湖泊,对数据进行标注与处理根据行业需求开渠引流,将一条一条的数据支流汇合集成数据应用中,为行业用户带来价值,做到春风化雨,润物无声。

    展开全文
  • 分析我国实施债转股的背景,认为可以通过本轮债转股来实现国有煤炭企业产权多元化,从而有效降低国有企业法人治理中一股独大和内部人控制等问题,并通过改善股权结构构建更好的对外部投资者的保护机制,提高国有企业经营...
  • 从公司治理的含义出发,分析了山西国有煤炭企业目前存在的内部管理失控等问题,同时客观分析了这些问题产生的深层次原因,并结合山西国有煤炭企业以公司制为基本模式的现代企业制度改造现状与实际中的案例,最后从优化...
  • 内部控制在组织结构中是存在科层结构的,治理控制作为企业内部控制的上层建筑,是管理控制和交易控制的基础和前提。通过构建大股东、经理人以及审计委员会的三方博弈模型,本文分析了审计委员会在公司治理控制中的作用...
  • 来源:数据工匠俱乐部企业需要协调多个提供和使用数据的参与方之间发生的复杂关系,由于企业缺乏数据治理可能导致数据滥用/误用等破坏性后果,并导致市场失灵。传统的数据治理侧重于...
        

    来源:数据工匠俱乐部

    企业需要协调多个提供和使用数据的参与方之间发生的复杂关系,由于企业缺乏数据治理可能导致数据滥用/误用等破坏性后果,并导致市场失灵。传统的数据治理侧重于数据的内部控制,对互联网企业数据治理的研究尚处于起步探索阶段,而企业需要一个参考模型来支持正确的数据战略,但目前还没有特别好的数据治理理论模型作支撑。

    本文为互联网企业提出了数据治理策略,为了保证数据的有效管理和使用,企业需要制定并执行数据治理策略。笔者调查了部分互联网企业的实践案例并查阅了治理框架和文献,本文通过展示如何执行已识别的策略,向实践者提供了一些想法和考虑。

    背景


    2018年,Facebook Cambridge Analytica 丑闻被公开披露,许多新闻报道称这一事件严重影响了Facebook的股价和声誉。2008年也发现了类似的案例,一个研究项目组从Facebook上收集了1700个用户资料,然后公开了这些数据。2006年发生了一起美国在线的案例,美国在线向公众公布了用户的搜索日志数据,这些数据在披露后不久就被确认为个人身份信息(PII)数据,美国在线没有公开任何PII数据,然而,由于日志数据是由用户分类的,并且提供了大量的个人信息,因此很容易将其转换为PII数据。这3起事件都是因为数据治理出现了问题,比如数据的未经授权使用和数据使用中控制机制的缺失。

    目前,互联网企业的数据治理尚不成熟,缺乏对谁拥有或使用非用户内容(如日志或关键字)的明确定义,数据的使用方式、时间和使用者都不清楚。这是互联网企业数据治理的一个关键性挑战,为了平台所有者和用户之间的信任以及业务的成功,这一问题应该得到解决。现有行业治理策略和学术著作的分析大多数是针对传统企业的,而互联网企业的数据治理仍处于相对萌芽的阶段。

    策略制定的关键原则


    数据治理必须找到对以下两个问题的答案:需要做出哪些策略?哪些角色以及这些角色应该如何参与策制定过程?

    本文集中于第一个问题即需要做出哪些策略,以确定关键的数据治理领域,数据治理策略通常建立在基本原则之上,这些基本原则为所有策略提供了一套指导方针和考虑因素。

    2.1与企业战略保持一致

    业务目标影响数据治理的方向和设计,数据治理目标应与业务目标和更高级别的治理目标保持一致,以最大化互联网企业的价值。如果一个互联网企业宗旨在提高用户满意度,它需要严格的控制机制来提高数据质量。

    角色、收入共享、信任和控制是平台治理的关键职能。数据治理中的角色指的是一种责任明确的数据所有权形式,它允许互联网企业保护数据和数据所有者/使用者的权利。收入共享要求平台所有者应该考虑对数据贡献者的奖励。信任被认为是成功的先决条件,为了提高信任,数据使用的高透明度在数据治理中至关重要,可以通过与平台用户共享决定权来增加信任。否则,必须由平台所有者实施严格的控制机制,并且决策的结果或过程必须向所有用户开放。

    2.2考虑所有参与者

    在传统的数据治理中,数据管理有简单明确的角色,如创建存储、更新、归档和删除,而互联网企业的数据治理则需要处理多个方面之间复杂的关系。

    互联网企业的参与者由平台所有者(包括平台发起人、协调人和提供者的角色)和平台用户(供应侧和需求侧用户)组成,所有参与者在互联网企业的数据治理中都扮演着关键的角色。因此,治理政策应同样适用于所有当事人,以便对每个人都适用,每一个用户都应该得到同样的机会和可获得性,因为它会带来更多的参与和想法,最终会带来新的创新。

    这一原则使互联网企业能够开发出现实的数据治理策略,该策略应传递给所有用户。如果一个互联网企业需要更多的参与和信任,平台所有者可以给用户更多的机会以某种方式加入决策过程,帮助互联网企业从各方的角度设计和实现数据治理。

    2.3覆盖所有类型的数据

    互联网平台数据是从各种来源收集的,比如人或系统。互联网企业通常关注用户内容,在数据治理的策略过程中,其他类型的数据常常被忽略,由此可能导致不明确和不完整的治理策略。

    互联网企业通常关注隐私法来保护个人身份信息(PII)数据,而PII和非PII并不是不可变的,非PII数据可以通过组合额外信息(如美国在线数据泄漏案件)成为PII数据。因此,必须强调非用户内容对于安全平台的重要性。除此之外,非用户内容的价值因为广告而增加,而广告是大多数互联网企业的主要收入来源。非用户内容如服务使用信息(如日志)被互联网企业用于定向广告,有针对性的广告机制显示了这些数据是如何通过无形和隐藏的市场使用的。

    我们越来越担心数据滥用和侵犯隐私的道德问题,为了降低风险,互联网企业的数据治理应该考虑如何为互联网企业中的所有类型的数据建立可见的供应链。

    2.4考虑不同的条件和环境

    一个尺码的鞋子,不可能适合所有人的脚,否则就会出现削足适履的笑话。企业必须考虑自身不同的业务策略、目标和市场监管要求。该原则提供了这样一种思想,即可以基于平台的背景灵活的制定数据治理策略。

    例如,苹果公司和Facebook在控制机制上明确显示了不同的治理策略。苹果的目标是提供高质量的服务,因此它通过人工审核进行严格控制。相比之下,Facebook则不受任何限制地允许用户输入任何内容,因而控制松散。治理策略常常导致严重后果,facebook分析丑闻就是一个例子,因为Facebook允许应用程序收集用户数据(甚至朋友的数据)以获得更高的市场份额和收入,数据误用或滥用和侵犯隐私的风险增加很多。与此相反,苹果公司的政策不允许应用程序收集用户数据,并限制使用用户数据的广告。

    数据治理关键领域


    640?wx_fmt=png

    图1 数据治理关键领域及关系

    3.1监管环境

    这个领域的策略是“应该考虑哪些法规、特定的政策、标准和指导方针?”和“监管环境如何影响数据的使用?”

    对于第一个策略,必须确定外部法律要求和内部政策以及合同协定。例如互联网企业处理个人信息,如姓名或地址时,应该考虑“2017年6月1日起施行的《中华人民共和国网络安全法》”来确定法律要求。

    必须确定外部/内部合规要求,制定合规目标并对其进行审核。数据的使用应在法律允许的情况下予以确认,特别是当数据被取出并可能传播以供二次使用时,必须检查数据是否满足开放策略要求。所有这些流程必须由第三方进行审计,以避免偏见或利益冲突,并保持互联网企业的透明度。

    3.2数据所有权和访问定义

    这个领域指的是“谁拥有和使用互联网企业中的数据?”,一直是平台设计的核心概念。这些策略使互联网企业能够明确所有相关用户的角色、责任和对数据的全部权利。

    所有类型数据的数据所有权和访问权都需要被明确的定义和执行,为了支持实施并保持执行结果的完整性和一致性,有必要与其他领域协作。应使用在数据用例域中定义的所有数据类型的数据分类。数据所有权和访问定义的清晰性得到了提高。必须使用监管环境领域中确定的相关法规来开发数据所有权/访问权的策略模型。如前所述,该决定应根据相关法规、法律或法院案件做出。

    定义清晰的访问权限有助于提高平台的透明度,利益相关者应采用某种方法提供适当的信息和安全。然而,数据贡献者对数据的可访问性可能受到互联网企业策略或背景的限制。出于安全原因,平台禁止用户访问最后一个密码。治理策略者需要为互联网企业中的每一种数据类型考虑这种特定的背景。笔者建议一个贡献、拥有和访问(COA)矩阵来支持和简化这种复杂的情况。它允许用户清楚地了解哪些数据可以拥有/访问(或不可以访问)的定义,并正确地使用数据的合法权限。

    表1 COA矩阵的使用示例

    640?wx_fmt=jpeg


    3.3数据用例

    对于互联网企业来说,如何利用数据是赢得市场的关键。因此,有一系列的问题,如“收集了哪些类型的数据以及数据对业务的用途是什么?”及“如何在不失去控制的情况下使用数据?”应该在这个领域解决。

    为了支持策略,定义数据分类可以很好地理解不同类型的数据,因为互联网企业从各种来源收集数据。大多数数据来自用户上传的内容,如视频、图像或用户信息(人为数据)。当用户使用平台服务时,平台系统会留下日志、搜索关键字或位置(机器生成的数据)等数据,这种类型的数据通常称为服务使用信息。数据也可以通过系统流程和事务,引用表或交互收集。应该考虑所有类型的数据,并将其包含在数据分类中。

    举个例子,我们通过分析策略来确定Facebook的数据分类的三个层次。第一个层次包括用户资料(来自人)和服务使用信息(来自机器和流程),第二个层次分为8类(分别为6类和2类),最后一层的数据分类包括70多种类型的数据。

    表2 Facebook数据分类

    640?wx_fmt=jpeg

    此外,企业需要根据业务目标决定收集数据的适当数据用例,用例必须包含可以使用的数据类型的信息,帮助平台检测和防止数据供应链中未经授权的数据使用。数据使用的监控应该基于已定义的用例信息来实现,以供可见和可靠的数据使用。数据来源允许平台保留关于数据的所有活动,识别所有相关的涉众,并防止拒绝数据操纵,当存在多个所有权问题时,可以使用它准确地度量数据提供者的贡献。

    3.4贡献测量

    互联网企业的成功与否取决于参与者的贡献,因此,收益共享是互联网企业的关键治理理念之一。许多研究指出,互联网企业应该考虑诸如“数据的业务价值是什么?”和“数据所有者的贡献需要什么奖励?”等问题,鼓励用户的贡献,分享互联网企业成长的收益。

    每一个参与团队都希望得到即时的回报或未来的利益,第一步是确定与业务成功相关的贡献度量模型的具体参数。根据互联网企业的业务类型,参数可以是多种多样的。Facebook或YouTube等一些平台通常依赖广告,并通过用户内容增长,上传的内容对于吸引其他用户和达到临界质量起着重要作用。由于有针对性的广告,用户偏好、喜欢程度和关联群组也很有价值。同时,对于Uber等不同类型的商业平台来说,服务提供/购买的数量或数量是最重要的,因为该平台向用户收取服务费。

    下一步,应该为用户确定合适的奖励类型。有3种主要类型的奖励可以被普遍认为是激励贡献者:曝光、补贴(例如以广告收入共享形式的直接现金转移、信用、实物、免费信息或技术支持)和声誉。

    根据互联网企业的能力和背景,不同类型的奖励可以单独使用,也可以组合使用。补贴被认为是私募股权投资的重要启动策略之一。然而,对于谷歌等占主导地位的互联网企业来说,敞口可能是一个不错的选择,因为它的边际成本为零,但却为受益者提供了巨大的优势。下图显示了贡献度量管理的概念。

    640?wx_fmt=png

    图2 贡献评估管理


    确定奖励的受益者可以很简单,也可以很复杂。如果只有一个贡献者,那么贡献度量将非常简单。同时,使用派生数据(聚合或转换的数据)可能导致度量问题,因为数据可能包含复杂的所有权结构。数据来源管理(数据用例域)有助于解决这个问题,它允许平台识别所有相关的涉众,并通过保存数据使用的所有记录来准确地度量每个数据所有者的贡献。

    总结


    理论上重要的治理策略在现实世界中得到了解决,在互联网企业的数据治理中发现了四个策略(监管环境、数据所有权/访问权、数据用例和贡献度量)的实现。在此基础上,互联网企业可以根据自身情况灵活调整或改进数据治理策略。


    作者简介

    李然辉,1982年9月出生,从事IT行业13年以上,其中拥有数据治理及数据资产管理6年从业经验,获得数据管理专业认证(CDMP),拥有丰富的数据战略规划、数据管理能力成熟度评估、数据治理体系搭建、数据标准管理、企业数据模型设计、数据仓库构建与数据应用等领域的理论和实践经验,先后为政府、能源、金融、互联网等行业提供服务,近几年专注于数据资产价值评估领域研究,拥有扎实的理论和实践经验。


    展开全文
  • SOA治理企业视图

    2008-12-12 18:06:00
    大约两年前开始,许多企业刚刚转向SOA,因此可以从所谓的“绿地”开始。为什么却没有对SOA治理给予适当的关注呢?这也许可以有各种不同的解释,但这个情况提醒了我软件开发者的一条“金科玉律”——先试试,不行的话...
  • 企业的安全管理和防护机制不健全往往忽略了数据安全重要性,导致数据安全事件频发。近期多家互联网企业接受网络安全审查,一时间数据安全再次成为关注焦点,中央纪委国家监委刊文更是强调“数据安全关乎国家安全”。...
  • 本文讲的是如何构建有效的企业级SOA治理,【IT168 资讯】企业级面向服务架构(EnterpriseSOA)能够在不断变化的市场环境下迅速做出业务反应,并能有效控制成本。这是一个以业务驱动为基础的软件架构体系,更好的让企业...
  • 数字经济时代,科技革命和产业变革日新月异,深刻改变着社 会生产生活方式和社会治理体系。企业作为社会治理体系中重要的 一环,在数字经济时代加速数字化转型的过程中,同时面临着严峻 的治理挑战。...
  • 企业内部的API

    2019-06-11 20:50:14
    如今API在企业内部也得到大量普及,尤其是部分公司随着业务的发展,规模会日益扩大,公司的业务也会越来越丰富,公司内部的部门也会越来越多,不同的业务将会由不同的部门来负责,每个部门都有自己的一亩三分地。...
  • 企业上云的现状与趋势 云计算,如今已经成为了像水和电一般关系到国计民生的国家基础设施。云计算为企业带了前所未有的资源交付效率和运维效率的提升,同时也用全新的技术帮助企业在新的价值网络中创造新的商业赛道...
  • 本文分为三个部分:第一部分探讨区块链不同治理机制的优劣,第二部分研究Dfinity的治理机制流程,第三部分分析Dfinity治理机制特点及发展方向。 区块链治理机制 区块链通常需要治理机制来帮助社区对整个生态网络...
  • 近年来,国内诸多行业龙头企业包括中国电信、海尔、长虹、阿里巴巴、腾讯纷纷建立内部创业孵化机制,鼓励员工内部创业或者设立投资基金以及创业孵化...究竟制约企业内部创业的瓶颈在哪?哪些制度设计的内部创业才能真正
  •  第十一条 企业应当根据国家有关法律法规和企业章程,建立规范的公司治理结构和议事规则,明确决策、执行、监督等方面的职责权限,形成科学有效的职责分工和制衡机制。  股东(大)会享有法律法规和企业章程规定的...
  • 本文主要阐述使用微服务架构时,治理框架或者平台需要解决的主要问题,微服务落地...伴随互联网、云计算、大数据等技术的快速发展,越来越多的企业在信息化之后,将企业上云和数字化提上日程。软件架构的微服务方...
  • 随着云计算、物联网、移动互联网等新一代信息技术的快速发展,人类产生的数据量呈指数级增长。...大数据治理将组织的部门、流程、人等元素与数据的整个生命周期联系在了一起,对企业数据管理和数据资...

空空如也

空空如也

1 2 3 4 5 ... 20
收藏数 12,295
精华内容 4,918
关键字:

企业内部治理机制