精华内容
下载资源
问答
  • 2021-05-03 20:56:09

    载入外部数据文件

    在MATLAB中,Load函数用于载入生成的包含矩阵的二进制文件,或者读取包含数值、数据的文本文件。文本文件中的数字应当排列成矩形,每行只能包含矩阵的一行元素,元素与元素之间用空格分隔,各行元素的个数必须相等。例如:文件名为data.txt。
    可在命令窗口中输入:

    Load data.txt
    
    更多相关内容
  • 本文内容包括:一、简介二、ClearQuest外部数据管理概述三、外部数据导入导出功能四、结论免责说明参考资料为方便用户在多个用户数据库之间或者在RationalClearQuest与其他变更管理系统之间移动数据,ClearQuest提供...
  • 用于PostgreSQLMongoDB外部数据包装器该MongoDB扩展实现了PostgreSQL外部数据包装器。 请注意,此版本的mongo_fdw可与PostgreSQL和EDB Postgres Advanced Server 9.3、9.4和用于PostgreSQLMongoDB外部数据包装器一起...
  • 获取数据一般分为外部数据获取和内部数据获取。基于不同的数据维度需求,具体的获取渠道也不相同。 先说获取外部数据的渠道方法。对于外部数据获取渠道,小编介绍几种常见的渠道和一些整理好的具体渠道供大家参考。...

    分析师确定好需求,基于需求确定好数据维度后,接下来要考虑的就是获取数据了。获取数据一般分为外部数据获取和内部数据获取。基于不同的数据维度需求,具体的获取渠道也不相同。
    先说获取外部数据的渠道方法。对于外部数据获取渠道,小编介绍几种常见的渠道和一些整理好的具体渠道供大家参考。常见的获取外部数据的渠道有:1 互联网公开数据 2 付费数(数据提供商)3 网络采集数据 4 通过人脉获取数据 5 通过猎头等挖墙脚方法从内部员工口中获取(该方法比较灰色,缺乏正能量,仅做参考)6 百度指数、站长工具等检测工具
    具体的数据渠道链接:
    https://blog.csdn.net/datacastle/article/details/52182301
    https://blog.csdn.net/datacastle/article/details/52182301
    https://www.jianshu.com/p/813a306d1a9a
    http://data.chongbuluo.com/
    类似于如上的数据获取渠道的整理,网上很多,找起来也很容易,所以小编就不做更详细的陈列了。关于获取外部数据需要注意的两个点1 外部数据需审慎对待 由于外部数据一般都是其他网站或者机构提供的,每个公司,无论是数据平台、咨询公司还是合作伙伴都可能会为了某些利益而使得公布的数据更加好看或者更具有一定的偏向性。所以我们在分析外部数据时候需要更加严格的验证和深入的分析 2高效低成本的获取数据 目前数据的获取成本越来越高,大数据复杂而又多变,很多数据都是伪价值。因此需要考虑好成本和实际价值之间的权衡。
    在这里插入图片描述

    获取外部数据,数据的可靠真实性和全面性其实很难保证。在所有获取外部数据的渠道中,网络采集越来越受到大家的关注。因此小编也想重点介绍下网络采集数据方法。网络采集最常用的方法是通过爬虫获取数据,相比较而言,编写爬虫程序获取到的海量数据更为真实、全面,在信息繁荣的互联网时代更为行之有效。因此编写爬虫程序成为大数据时代信息收集的必备技能。接下来,小编就拿一个简单的python爬虫实例给大家介绍下如何进行网络采集。
    在这里插入图片描述
    爬虫的工具、方法很多,选择适合自己的一种即可。希望上面的例子能让大家对爬虫有所认识和理解。谢谢阅读,嘿嘿。。。

    展开全文
  • 外部数据源作为金融机构判客群风险最重要的征信维度,其作用不需多言,在信贷行业最风控的时候,某家机构公司数据成本占比居高不下,甚至是成本中较重的支出,比如在某集团公司里就会接入以下这些数据源: ...

    序言:
    外部数据源作为金融机构判客群风险最重要的征信维度,其作用不需多言,在信贷行业最风控的时候,某家机构公司数据成本占比居高不下,甚至是成本中较重的支出,比如在某集团公司里就会接入以下这些数据源:
    在这里插入图片描述
    (历史数据维度,现有变动仅供参考)

    但很明显随着断直连跟个人信息保护法的一系列政策强监管,数据的获取跟使用也势必越来越合规,当下对于各家机构其外部的数据源还能如何运用,评估外部数据源的维度相较以往还是否有所改变。
    今天我们综合了星球同学的一些需求,给大家梳理了这样一篇关于外部数据的使用的文章,希望对所有的风控人员在数据的使用上都有所启发。

    并且,在文章中我们会跟大家介绍目前大家最关注的百行征信。他们家的机构又有哪些特点,在运用百行征信数据上又有哪些问题需要注意,请看今日文章介绍。

    因为完整内容较长,本次整体的内容将分成四大部分跟大家介绍,整体目录如下:
    part1.外部数据的构成和分类
    Part 2.外部数据的评估流程
    PART 3.外部数据在决策流的上线及监控
    PART 4.百行个人征信报告的应用
    此外关于三方数据的测试,在知识星球中更会手把手讲解具体的实操内容,包括数据展示(excel)、数据案例跟代码(python),基本一看就懂,一跑就会。

    PART 1.外部数据的构成和分类
    随着国家对数据的监管越来越严格,信贷机构的自有数据已经无法满足风控的需要,尤其对于新客来说,机构只能采集到个人的设备和通讯录信息,且需要用户主动授权才能获取。所以目前信贷机构都非常依赖外部的第三方数据,那对于外部数据的选取,评估,应用就显得尤为重要。
    相比于几年前盛行的爬虫类数据,现在的外部数据更加注重合规性和个人隐私保护,很多三方公司通常不会输出个人的明细类数据,而是以模型分,特征脱敏加工等形式输出。据我们了解,目前市面上常见的外部数据包括以下几类:
    1)黑名单类:主要是逾期黑名单和欺诈类名单
    2)多头共债类:一般以指标形式输出,通过对时间窗口,申请平台类型等维度交叉衍生成
    3)电商消费类:一般以模型分的形式输出,少数机构会输出消费类的衍生指标
    4)支付类:一般以模型分的形式输出,少数机构会输出支付类的衍生指标
    5)信用风险类:包括逾期,还款类的指标,信用分,欺诈分等。
    6)数据校验类:三要素校验,手机号码状态校验,在网状态校验等。
    7)运营商类:包括用户的通信消费情况,还有根据流量使用生成的偏好标签
    8)行为类:常见的有用户在各类app上的使用行为
    以上这些数据第三方平台是怎么获取到的呢?这里例举一些常见的获取途径:
    1.第三方征信:通过获取信贷平台的贷前,贷后等记录,提取多头共债,逾期还款特征。另外像百行征信这种持牌机构的数据来源则是信贷平台向其提报的征信记录。
    2.短信通道:有些机构会通过用户的短信内容,从中提取借款,逾期,催收等特征。
    3.支付通道:跟支付公司合作,通过支付记录来提取用户的消费,收入的数据。
    4.手机输入内容:输入法软件会记录用户的输入内容,从中可以提取个人偏好等标签。

    PART 2.外部数据的评估流程
    外部数据的应用可概括为以下几个步骤:
    ①确定接入三方的目的
    ②了解三方的产品构成
    ③向三方沟通测试的产品和测试的样本数量
    ④准备样本让三方回溯数据
    ⑤测试三方数据的效果
    ⑥反馈给商务进行产品报价
    ⑦接入三方
    ⑧三方上线陪跑
    ⑨正式启用三方
    ⑩三方数据监控
    其中的重点在于线下数据的评估和接入后的数据监控,下面会针对这两部分详细阐述下:
    在评估前要先确定接入三方的目的,不同的目的对于数据选择及评估角度都会不一样,常见的目的有以下这些:
    1)用于优化贷前贷中的风控策略,这种会优先考虑接入信贷类指标,黑名单或者模型分
    2)用于做风险定价或者额度策略,会考虑接入能反映收入负债情况的数据
    3)用于优化现有模型或者用外部数据单独做个定制模型,这种一般要接指标类的数据
    确定目的后寻找合适的数据服务商,并了解对方的产品构成,数据获取途径,产品报价等,获取的途径可以反映数据的真实性和有效性,产品报价则关系到风控调用数据的成本。这些了解后就要准备测试的样本,由于调用外部数据需要成本,所以测试的样本是有限的,一般三方机构免费的测试量级在5000-30000之间,所以在准备样本时会考虑以下几点:
    1)样本要代表测试的客群,例如目的是对新客策略做优化,且针对的是某个大渠道的用户,则要选取这个渠道的新客样本。
    2)选取的样本中客群的稳定性,没有处于特殊的时间段,例如逾期潮,产品刚上线阶段,策略重大变动阶段等,这个稳定也可以体现在时间维度上badrate的变化。如果客群一直不太稳定,则尽量选择近段时间的样本。
    3)样本在时间维度上的连续性,可以评估数据在时间上分布及效果的稳定程度。
    4)样本是否需要抽样,如果三方机构免费测试量比较少,会考虑进行抽样,常见的有随机抽样和分层抽样,分层抽样适用于badrate较低的样本,这种情况会对好用户进行欠采样来提高坏用户的占比。不过分层抽样后建模会有badrate失真的影响。最好的情况下是做随机抽样或者不抽样,这样评估的结果更趋近于真实情况。

    数据评估的角度要根据接入目的和数据类型出发,这里先列一下常见的评估角度,再结合具体情况来说明:
    在这里插入图片描述
    根据接入目的出发,如果是用来做拒绝策略,则评估时更关注指标/模型分尾部的lift表现,以及尾部lift在时间维度上是否稳定。如果用来做风险定价和额度策略,则更关注整体的一个排序性表现,对好坏用户都要有好的区分能力。如果用来做模型,则关注外部数据对已有模型的增量效果,或者外部数据本身的一个区分能力。
    根据接入数据的类型来考虑,黑名单类关注命中样本的精确率,精确率要尽量高。评分类要考量查得率,区分能力,稳定性等,另外也要考虑价格。现在很多三方机构会根据数据类型,客群类型的交叉生成很多的模型分,例如根据多头,设备,电商,社交这4类数据生成“多头+设备分”, “ 社交+电商分”,“多头+设备+电商分”…,数据类型用的越多,价格越贵,这时候选择一个性价比高的评分产品就很重要。对于指标类的产品,通常会看尾部的lift来反映拒绝的精准度,业务上的可解释性也会考虑。

    另外对于评分类的产品,或者根据指标类数据做的定制模型分。如果评估后效果还不错,我们还会考虑这个模型分跟已接入三方模型分的相关性,这个相关性体现在:
    1)业务角度:根据模型分底层用的数据,例如新接的模型分A用的是支付类数据,已上线的模型分B也是支付类,那两者存在一定的相似度,如果接的都是同一家支付公司,那相似度就更大了,这种情况考虑选择其中一个即可。
    2)统计角度:即计算两者之间的皮尔逊相关系数,根据经验,系数绝对值在0-0.2之间是极弱相关,0.2-0.4为弱相关,0.4-0.6是中等程度相关,0.6-0.8是强相关,0.8-1是极强相关。如果两个模型分的相关系数很高,则说明他们对于决策的作用是重叠的,要考虑舍弃其中一个来降低数据调用成本。

    PART 3.外部数据在决策流的上线及监控
    针对串行式决策流,要考虑接的数据放在哪个决策节点,一般是根据效果和价格综合考虑。如果本身数据调用成本就比较高了,则更考虑价格,价格高的话可以放在下游节点来降低调用成本。如果更看重效果,则效果比较好的话建议放在上游节点,因为上游调用的用户多,这样做可以提高整体风控的精准度。
    数据上线后建议先空跑个一两天,观察调用接口的稳定性和空跑出的模型分分布是否符合预期。正式启用后需要做监控来观察实际的线上效果。监控包括:
    1.前期监控(上线初期无贷后表现):
    1)数据的查得率,是否和线下测试时一致。
    2)数据分布的稳定性,可根据规则拒绝率和PSI来衡量。
    3)上线前订单通过率VS上线后订单通过率,衡量数据上线后对风控通过率的影响。

    2.后期监控(有贷后表现):
    1)线下评估结果与线上真实效果的比对,观察通过样本尾部的lift表现是否一致。
    2)当有了一段时间的贷后样本时,可分析数据线上真实效果的稳定性,例如模型分的KS是否出现随时间变化有下滑趋势。
    3)上线前整体坏账表现VS上线后整体坏账表现,评估数据对于降低坏账的真实效果。

    PART 4.百行个人征信报告的应用
    在目前征信业务合规化的背景下,百行征信作为一家持牌的征信公司,很多信贷机构都在陆续接入使用它的数据,下面简单介绍下百行个人征信报告在风控中的应用。
    本次关于百行征信的内容,我们会将相关的数据分为:

    简版跟明细版跟大家介绍

    其中简版内容包括:
    ①个人基本信息
    ②居住信息
    ③工作信息
    ④信贷信息
    这四个模块

    明细版本包括:

    ①个人基础信息

    ②居住信息

    ③工作信息
    ④指标类的信贷信息
    ⑤明细类的指标信息
    这五个模块

    在这里插入图片描述
    在以上的内容中,除了会详细介绍百行征信的组成部分外,还会详细介绍每个模块的详细细则与具体的指标加工信息,另外涉及大的百行的应用与目前存在的问题都会分别跟大家进行介绍。

    以上详细内容,未完待续…
    各位同学可以提前到知识星球平台了解剩余内容。
    在这里插入图片描述
    另外关于本次三方数据的测试,我们更会将整体内容以文件包(数据集+代码)同步到知识星球平台,跟大家进行具体的实操演示。

    ~原创文章

    end

    展开全文
  • Python-使用外部数据源 该存储库包含在Python中使用外部数据源进行写入和读取外部数据源的示例。 包括文件合并
  • 解决方案一,利用导入外部数据的现有连接功能。 解决方案二,使用Microsoft Query导入外部源数据。 扩展 解决方案一,利用导入外部数据的现有连接功能。 通过OLE DB接口获取外部数据源 OLE DB是微软战略性的...

    目录

    解决方案一,利用导入外部数据的现有连接功能。

    解决方案二,使用Microsoft Query导入外部源数据。

    扩展


    解决方案一,利用导入外部数据的现有连接功能。

          通过OLE DB接口获取外部数据源

        OLE DB是微软战略性的通向不同数据源的低级应用程序接口,其中不仅包括微软资助的标准数据接口开放数据库连通性(ODBC)的SQL语言能力,还具有面向其他非SQL数据类
    型的通路。作为微软组件对象模型的一种设计,OLE DB是一组读/写数据的方法。
        OLE DB的存在为用户提供了一种统一的方法来访问不同种类的数据源。OLE DB可以在不同的数据源中进行转换,本例就是从Excel数据库中提取相关记录。通过OLE DB接口,可
    以在Excel中自如地使用SQL语句。

        1  在任意目录下新建一个工作簿,将其命名为“001”,然后打开该工作簿,删除Sheet2工作表和Sheet3工作表,并将Sheet1工作表改名为“结果表”。
        2  选择“数据”选项卡,单击“获取外部数据”组中的“现有连接”按钮,在弹出的”现有连接”对话框中单击“浏览更多”按钮,弹出“选取数据源”对话框,如图所示。

        3  在“选取数据源”对话框的“导航窗格”中,选择需要导入的目标文件所在路径,双击“客户订单表.xlsx”,单击“打开”按钮,打开“选择表格”对话框,如图所示。

        4  保留“选择表格”对话框中的默认设置,单击“确定”按钮,激活”导入数据“对话框,指定返回的查询数据位置为现有工作表的“=$A$1",如图所示,然后单击
    “确定”按钮,即可将外部源数据导入当前工作表中。

    解决方案二,使用Microsoft Query导入外部源数据。

        1  选择“数据”选项卡,单击“获取外部数据”组中的“自其他来源”按钮,在下拉菜单中选择“来自Microsoft Query"选项,弹出“选择数据源”对话框,取消”使用‘查询向导’创建,编辑查询”复选框的选择,在“数据库”列表框中选择材Excel Files *”选项,如图所示,单击“确定”按钮。


        2  弹出“选择工作簿”对话框,选择“客户订单表.xlsx”,如图所示,单击“确定”按钮。

       3  在弹出的“查询向导“对话框中,选中”客户订单$”表,单击“>”按钮,然后下一步,直至完成

                    

     

      在使用过程中,可能会遇到如图所示的情况而无法添加表。此时需要“表选项”对话框中的所有复选框即可。

         

        4  在查询向导——完成对话框中可以选择将数据返回Excel,也可以选择在在“Microsoft Query”中查看数据,然后选择菜单“文件“一“将数据返回Microsoft Excel”命令,弹出”导入数据”对话框,指定“数据的放置位置”为“现有工作表”的A1单元格,单击“确定”按钮,关闭对话框,即可返回外部源数据。或者直接关闭“Microsoft Query”窗口,则弹出导入数据对话框

        Microsoft Query是用于将外部数据源检索到Microsoft Office程序(特别是MicrosoftExcel)中的一种程序。通过使用Query可以从企业的数据库和文件中检索数据,而不必重新输入需要在Excel中分析的数据,也可以在每次更新数据库时,自动通过源数据库中的数据来更新Excel报表和汇总数据。
        一般在导入外部源数据时,常常用到Microsoft Query结合SQL语句来进行数据查询或者数据重构。

    扩展

        一、在OLE DB中使用SQL语句的操作过程如下;
        1  重复解决方案一中的步骤1至步骤3。
        2  保留“选择表格”对话框中对名称的默认选择,单击“确定”按钮,激活“导入数据”对话框,单击“属性”按钮,打开“连接属性”对话框,在“定义片选项卡下清除“命令文本”框中的原有内容,如图所示,输入SQL语句:

       
     Select *
    From [客户订单$]
        单击“确定”按钮,关闭“连接属性”对话框并返回“导入数据”对话框,指定返回的查询数据位置为现有工作表的“$A$1”,然后单击“确定”按钮,即可结合SQL语句将外部源数据导入到当前工作表。

        二、在Microsoft Query中使用SQL语句又该如何操作?具体步骤如下:
        1  重复解决方案二中的步骤l至步骤4。
        2  在“Microsoft Query"视图中,单击按钮SQL,即可弹出“SQL”文本框,如图所示。在本例中自动生成的SQL语句如下:

        利用“Microsoft Query”视图操作界面,可以自动生成最原始的SQL语句,然后对其进行修改简化,即可写出专业的SQL语句。
        简化后的SQL语句如下:
        SELECT *
        FROM  [客户订单$]
       3  将简化后的SQL语句输入“SQL"文本框中,并单击“确定”按钮,在弹出的“Microsoft Query”对话框中单击“确定”按钮,如图所示.

    4.关闭“Microsoft Query”窗口即可

    展开全文
  • 002SAS读取外部数据.pdf

    2020-06-04 09:59:20
    SAS培训PDF文档,系列教程初级1-8篇,进阶1-9篇。初级包含了001Base基础,002SAS读取外部数据,003对单一数据集处理,004对多个数据集处理,005数据汇总与展现,006SAS SQL语言,007SAS 宏语言,008多语言支持。
  • 数据结构课程是计算机类专业的专业基础课程,在IT...系列课程包含11个部分,本课为第10部分外部排序。外部排序针对数据量很大时,排序过程必须要在内、外存之间交换数据时的应用,介绍磁盘排序和磁带排序的相关算法。
  • 现提出另一种数据传递方式,即在这两种语言间共享公用外部数据包括全局变量和共用区/结构体.示例结果表明,只要采取适当措施,Fortran与C/C++共享公用外部数据是完全可行的,从而为这两种语言间传递数据提供了一...
  •   本文主要对GEE中的各类外部数据导入、下载与管理以及数据与代码分享等操作加以介绍。本文是谷歌地球引擎(Google Earth Engine,GEE)系列教学文章的第七篇,更多GEE文章请参考专栏:GEE学习与应用...
  • 银行由于内部数据源单一大都面临着用户冷启动困难的挑战,而合规地引入外部数据可以大幅提升用户画像的准确率和营销效果。虽然隐私计算为外部数据合规应用提供了新的解决途径,但仍需进一步探索落实。
  • 将Hive数据导入到外部

    千次阅读 2022-03-17 20:47:43
    根据调研情况,可以在Hive上创建外部表,通过写SQL的形式将数据导出到Es,有个注意事项需要说明的是:写入到Es中的数据是无法覆盖的。根据使用情况,简单总结了一下。 2. 环境说明 Hive:2.1.1 ElasticSearch:7.17...
  • 一、内置数据源 (1)文件数据源 在 StreamExecutionEnvironment 中,可以使用 readTextFile 方法直接读取文本文件,也可以使用 readFile 方法通过指定文件 InputFormat 来读取特定数据类型的文件,如 ...
  • 文件数据储存之外部储存

    万次阅读 多人点赞 2019-03-01 23:39:06
    Android官方Api:每个兼容 Android 的设备都支持可用于保存文件的共享“外部存储”。 该存储可能是可移除的存储介质(例如 SD 卡)或内部(不可移除)存储。 保存到外部存储的文件是全局可读取文件,而且,在计算机...
  • 实时更新Excel文档外部数据源的数据 单元格区域、Excel 表、数据透视表或数据透视图均可以连接到外部数据源(数据源:用于连接数据库的一组存储的“源”信息。数据源包含数据库服务器的名称和位置、数据库驱动程序...
  • greenplum使用PXF访问外部数据

    千次阅读 2019-10-10 11:22:41
    Greenplum平台扩展框架(PXF...这些连接器可以将外部数据源映射到Greenplum数据库表,通过外部表的形式查询外部数据源。 PXF可支持访问的外部数据源有HDFS,Hive和HBase。其中可以对HDFS数据进行读和写操作。 下面介...
  • 什么外部排序?

    千次阅读 2021-08-18 14:36:59
    因此,需要将待排序的记录存储在外存中,排序时再把数据一部分一部分地调入内存进行排序,在排序过程中需要多次进行内存和外存之间地交换。这种排序方法就称为外部排序。 外部排序指待排序文件较大,内存中一次性...
  • 八、使用pxf读取写外部数据

    千次阅读 2019-04-09 19:12:51
    使用PXF读写外部数据 Greenplum平台扩展框架(PXF)实现了一个名为的协议pxf,您可以使用该协议创建引用外部数据存储中的数据的外部表。PXF协议和Java服务打包为Greenplum数据库扩展。 如果想通过pxf访问外部数据源...
  • 导入数据到hive外部

    千次阅读 2018-09-04 13:26:36
    导入数据到hive外部表; 1.hive命令创建外部表。 create EXTERNAL table applogsnew ( applogid string, msgtype string, clienttype string, userid bigint ) PARTITIONED BY (create_time string)  row format ...
  • 安全生产PHP开发不能违背的安全规则外部数据提交的处理 规则1绝不要信任外部数据或输入 关于Web应用程序安全性必须认识到的第壹件事是不应该信任外部数据外部数据(outsidedata)包括不是由程序员在PHP代码中直接输入...
  • spark内部调用外部数据源包的类是下面,包括解析BaseRelation,提取schema等 package org.apache.spark.sql.execution.datasources 文件接口 扩展外部文件数据源 需要实现的接口所在文件fileSourceInterf...
  • 在使用 access 导入表时,报错:该属性在外部数据源或用低版本的microsoft jet所创建的数据库中不受支持。 报错原因:表的列名中包含空格或其他不规范字符 解决方法:修改数据源中不规范的列名,或者在 “第一...
  • 外部设备概述

    千次阅读 2021-07-28 22:06:44
    它们主要用来完成数据的输入、输出、存储以及对数据的加工处理. 外部设备的分类 外部设备的种类很多,从它们的功能及其在计算机系统中的作用来看,可以分为以下5类. 1.输入输出设备 从计算机的角度出发,向计算机...
  • 这里写自定义目录标题原理新的改变功能快捷键合理的创建标题,有助于目录的...在Excel表格中,引用单元格(包括引用其他工作簿)的数据时,==“显示公式”==的功能可以让Excel直接显示公式和所引用的单元格地址,然后我
  • 数据集市是什么

    千次阅读 2021-08-31 07:48:59
    文章目录一、数据集市简介1.1、数据集市与数据仓库二、数据集市的类型...从属数据集市获取已经创建的数据,而独立数据集市从外部源和数据仓库获取数据。我们可以将数据集市称为数据仓库的逻辑子集。 1.1、数据集市与数
  • 数据仓库的基本架构

    2018-10-10 11:59:45
    其实数据仓库本身并不“生产”任何数据,同时自身也不需要“消费”任何的数据数据来源于外部,并且开放给外部应用,这也是为什么叫“仓库”,而不叫“工厂”的原因。因 此数据仓库的基本架构主要包含的是数据流入...
  • 为了让大家更好地了解什么是元数据,亿信华辰小编针对元数据的类型,举例说明什么是元数据。 元数据分类及举例说明 一、技术元数据 1.物理元数据描述物理资源的元数据,例如:服务器,操作系统,计算机机房位置和...
  • hive是基于Hadoop的一个数据仓库工具,用来进行数据提取、转化、加载,这是一种可以存储、查询和分析存储在Hadoop中的大规模数据的机制。hive数据仓库工具能将结构化的数据文件映射为一张数据库表,并提供SQL查询...

空空如也

空空如也

1 2 3 4 5 ... 20
收藏数 962,784
精华内容 385,113
关键字:

外部数据包括什么