精华内容
下载资源
问答
  • etl oracle
    2021-05-03 02:27:56

    ETL,Extraction-Transformation-Loading的缩写,中文名称为数据抽取、转换和加载。

    ETL负责将分布的、异构数据源中的数据如关系数据、平面数据文件等抽取到临时中间层后进行清洗、转换、集成,最后加载到数据仓库或数据集市中,成为联机分析处理、数据挖掘的基础。

    ETL是数据仓库中的非常重要的一环。它是承前启后的必要的一步。相对于关系数据库,数

    据仓库技术没有严格的数学理论基础,它更面向实际工程应用。所以从工程应用的角度来考虑,按着物理数据模型的要求加载数据并对数据进行一些系列处理,处理

    过程与经验直接相关,同时这部分的工作直接关系数据仓库中数据的质量,从而影响到联机分析处理和数据挖掘的结果的质量。

    数据仓库是一个独立的数据环境,需要通过抽取过程将数据从联机事务处理环境、外部数据源

    和脱机的数据存储介质导入到数据仓库中;在技术上,ETL主要涉及到关联、转换、增量、调度和监控等几个方面;数据仓库系统中数据不要求与联机事务处理系

    统中数据实时同步,所以ETL可以定时进行。但多个ETL的操作时间、顺序和成败对数据仓库中信息的有效性至关重要。

    ETL(Extract-Transform-Load的缩写,即数据抽取、转换、装载 的过程)作为BI/DW(Business

    Intelligence)的核心和灵魂,能够按照统一的规则集成并提高数据的价值,是负责完成数据从数据源向目标数据仓库转化的过程,是实施数据仓库的

    重要步骤。如果说数据仓库的模型设计是一座大厦的设计蓝图,数据是砖瓦的话,那么ETL就是建设大厦的过程。在整个项目中最难部分是用户需求分析和模型设

    计,而ETL规则设计和实施则是工作量最大的,约占整个项目的60%~80%,这是国内外从众多实践中得到的普遍共识。

    ETL是数据抽取(Extract)、转换(Transform)、清洗(Cleansing)、装载(Load)的过程。是构建数据仓库的重要一环,用户从数据源抽取出所需的数据,经过数据清洗,最终按照预先定义好的数据仓库模型,将数据加载到数据仓库中去。

    信息是现代企业的重要资源,是企业运用科学管理、决策分析的基础。目前,大多数企业花费

    大量的资金和时间来构建联机事务处理OLTP的业务系统和办公自动化系统,用来记录事务处理的各种相关数据。据统计,数据量每2~3年时间就会成倍增长,

    这些数据蕴含着巨大的商业价值,而企业所关注的通常只占在总数据量的2%~4%左右。因此,企业仍然没有最大化地利用已存在的数据资源,以致于浪费了更多

    的时间和资金,也失去制定关键商业决策的最佳契机。于是,企业如何通过各种技术手段,并把数据转换为信息、知识,已经成了提高其核心竞争力的主要瓶颈。而

    ETL则是主要的一个技术手段。如何正确选择ETL工具?如何正确应用ETL?

    目前,ETL工具的典型代表有:Informatica、Datastage、OWB、微软DTS……

    开源的工具有eclips的etl插件。http://www.cloveretl.org/clover/

    数据集成:快速实现ETL

    ETL的质量问题具体表现为正确性、完整性、一致性、完备性、有效性、时效性和可获取性

    等几个特性。而影响质量问题的原因有很多,由系统集成和历史数据造成的原因主要包括:业务系统不同时期系统之间数据模型不一致;业务系统不同时期业务过程

    有变化;旧系统模块在运营、人事、财务、办公系统等相关信息的不一致;遗留系统和新业务、管理系统数据集成不完备带来的不一致性。

    实现ETL,首先要实现ETL转换的过程。它可以集中地体现为以下几个方面:

    空值处理

    可捕获字段空值,进行加载或替换为其他含义数据,并可根据字段空值实现分流加载到不同目标库。

    规范化数据格式

    可实现字段格式约束定义,对于数据源中时间、数值、字符等数据,可自定义加载格式。

    拆分数据 依据业务需求对字段可进行分解。例,主叫号

    861084613409,可进行区域码和电话号码分解。

    验证数据正确性

    可利用Lookup及拆分功能进行数据验证。例如,主叫号861084613409,进行区域码和电话号码分解后,可利用Lookup返回主叫网关或交换机记载的主叫地区,进行数据验证。

    数据替换 对于因业务因素,可实现无效数据、缺失数据的替换。

    Lookup 查获丢失数据

    Lookup实现子查询,并返回用其他手段获取的缺失字段,保证字段完整性。

    建立ETL过程的主外键约束

    对无依赖性的非法数据,可替换或导出到错误数据文件中,保证主键惟一记录的加载。

    为了能更好地实现ETL,笔者建议用户在实施ETL过程中应注意以下几点:

    第一,如果条件允许,可利用数据中转区对运营数据进行预处理,保证集成与加载的高效性;

    第二,如果ETL的过程是主动“拉取”,而不是从内部“推送”,其可控性将大为增强;

    第三,ETL之前应制定流程化的配置管理和标准协议;

    第四,关键数据标准至关重要。目前,ETL面临的最大挑战是当接收数据时其各源数据的异

    构性和低质量。以电信为例,A系统按照统计代码管理数据,B系统按照账目数字管理,C系统按照语音ID管理。当ETL需要对这三个系统进行集成以获得对客

    户的全面视角时,这一过程需要复杂的匹配规则、名称/地址正常化与标准化。而ETL在处理过程中会定义一个关键数据标准,并在此基础上,制定相应的数据接

    口标准。

    ETL过程在很大程度上受企业对源数据的理解程度的影响,也就是说从业务的角度看数据集成非常重要。一个优秀的ETL设计应该具有如下功能:

    管理简单;采用元数据方法,集中进行管理;接口、数据格式、传输有严格的规范;尽量不在

    外部数据源安装软件;数据抽取系统流程自动化,并有自动调度功能;抽取的数据及时、准确、完整;可以提供同各种数据系统的接口,系统适应性强;提供软件框

    架系统,系统功能改变时,应用程序很少改变便可适应变化;可扩展性强。

    数据模型:标准定义数据

    合理的业务模型设计对ETL至关重要。数据仓库是企业惟一、真实、可靠的综合数据平台。

    数据仓库的设计建模一般都依照三范式、星型模型、雪花模型,无论哪种设计思想,都应该最大化地涵盖关键业务数据,把运营环境中杂乱无序的数据结构统一成为

    合理的、关联的、分析型的新结构,而ETL则会依照模型的定义去提取数据源,进行转换、清洗,并最终加载到目标数据仓库中。

    模型的重要之处在于对数据做标准化定义,实现统一的编码、统一的分类和组织。标准化定义

    的内容包括:标准代码统一、业务术语统一。ETL依照模型进行初始加载、增量加载、缓慢增长维、慢速变化维、事实表加载等数据集成,并根据业务需求制定相

    应的加载策略、刷新策略、汇总策略、维护策略。

    元数据:拓展新型应用

    对业务数据本身及其运行环境的描述与定义的数据,称之为元数据(metadata)。元

    数据是描述数据的数据。从某种意义上说,业务数据主要用于支持业务系统应用的数据,而元数据则是企业信息门户、客户关系管理、数据仓库、决策支持和B2B

    等新型应用所不可或缺的内容。

    元数据的典型表现为对象的描述,即对数据库、表、列、列属性(类型、格式、约束等)以及

    主键/外部键关联等等的描述。特别是现行应用的异构性与分布性越来越普遍的情况下,统一的元数据就愈发重要了。“信息孤岛”曾经是很多企业对其应用现状的

    一种抱怨和概括,而合理的元数据则会有效地描绘出信息的关联性。

    而元数据对于ETL的集中表现为:定义数据源的位置及数据源的属性、确定从源数据到目标

    数据的对应规则、确定相关的业务逻辑、在数据实际加载前的其他必要的准备工作,等等,它一般贯穿整个数据仓库项目,而ETL的所有过程必须最大化地参照元

    数据,这样才能快速实现ETL。

    ETL体系结构

    下图为ETL体系结构,它体现了主流ETL产品框架的主要组成部分。ETL是指从源系统中提取数据,转换数据为一个标准的格式,并加载数据到目标数据存储区,通常是数据仓库。

    ETL体系结构图

    Design manager

    提供一个图形化的映射环境,让开发者定义从源到目标的映射关系、转换、处理流程。设计过程的各对象的逻辑定义存储在一个元数据资料库中。

    Meta data management

    提供一个关于ETL设计和运行处理等相关定义、管理信息的元数据资料库。ETL引擎在运行时和其它应用都可参考此资料库中的元数据。

    Extract

    通过接口提取源数据,例如ODBC、专用数据库接口和平面文件提取器,并参照元数据来决定数据的提取及其提取方式。

    Transform

    开发者将提取的数据,按照业务需要转换为目标数据结构,并实现汇总。

    Load

    加载经转换和汇总的数据到目标数据仓库中,可实现SQL或批量加载。

    Transport services

    利用网络协议或文件协议,在源和目标系统之间移动数据,利用内存在ETL处理的各组件中移动数据。

    Administration and operation

    可让管理员基于事件和时间进行调度、运行、监测ETL作业、管理错误信息、从失败中恢复和调节从源系统的输出。

    转自:http://zhangqchang.blog.163.com/blog/static/46498973200922005021462/

    更多相关内容
  • etl.rar_Table_etl_etl oracle

    2022-09-24 15:59:43
    etl to explain oracle external table
  • 写的一个ETL工具,从oracle数据库导数据到mysql数据库
  • Oracle常用命令记录1、表空间以及剩余大小使用率统计。 1、表空间以及剩余大小使用率统计。 SELECT a.tablespace_name AS "表空间名", total "表空间大小", free "表空间剩余大小", (total - free) "表空间使用大小...

    1、表空间以及剩余大小使用率统计。

    SELECT a.tablespace_name AS "表空间名",
    total "表空间大小",
    free "表空间剩余大小",
    (total - free) "表空间使用大小",
    total / (1024 * 1024 * 1024) "表空间大小(G)",
    free / (1024 * 1024 * 1024) "表空间剩余大小(G)",
    (total - free) / (1024 * 1024 * 1024) "表空间使用大小(G)",
    round((total - free) / total, 4) * 100 "使用率 %"
    FROM (SELECT tablespace_name, SUM(bytes) free
    FROM dba_free_space
    GROUP BY tablespace_name) a,
    (SELECT tablespace_name, SUM(bytes) total
    FROM dba_data_files
    GROUP BY tablespace_name) b
    WHERE a.tablespace_name = b.tablespace_name;
    
    

    2、查看数据库的版本。

    SELECT version
    FROM product_component_version
    WHERE substr(product, 1, 6) = 'Oracle';
    

    3、查询Oracle正在执行的sql语句及执行该语句的用户。

    SELECT b.sid oracleID,  
           b.username Oracle用户,  
           b.serial#,  
           spid 操作系统ID,  
           paddr,  
           sql_text 正在执行的SQL,  
           b.machine 计算机名  
    FROM v$process a, v$session b, v$sqlarea c  
    WHERE a.addr = b.paddr  
       AND b.sql_hash_value = c.hash_value;
    

    4、查看具体表占用空间

    SELECT OWNER,T.segment_name,T.segment_type,SUM(T.BYTES/1024/1024)||'M'
      FROM dba_segments t
     WHERE t.segment_type = 'TABLE'
     AND T.segment_name = 'CRM_A_CUST_CLASS_INFO_ZONE'
     GROUP BY OWNER,T.segment_name,T.segment_type
    

    5、查看空间占用 (递归查询)

    du -h --max-depth=1
    

    6、锁表、解锁

    SELECT B.OBJECT_NAME, A.SESSION_ID, A.LOCKED_MODE
      FROM V$LOCKED_OBJECT A, USER_OBJECTS B
     WHERE B.OBJECT_ID = A.OBJECT_ID;
     
    SELECT *
      FROM V$SESSION T1, V$LOCKED_OBJECT T2
     WHERE T1.SID = T2.SESSION_ID;
    
    ALTER SYSTEM KILL SESSION '377,47987';
    

    7、信息收集

    DECLARE
    BEGIN
    
    FOR i IN (SELECT table_name FROM USER_tables WHERE to_char(SYSDATE,'yyyymmdd')> to_char(last_analyzed,'yyyymmdd'))
      LOOP
    --    dbms_output.put_line(i.table_name);
         DBMS_STATS.GATHER_TABLE_STATS(OWNNAME         => 'CRM',
                                      TABNAME          => i.table_name,
    								  PARTNAME         => V_PARTNAME,
                                      CASCADE          => TRUE,
                                      DEGREE           => 8,
                                      ESTIMATE_PERCENT => 1,
                                      NO_INVALIDATE    => FALSE);
      END LOOP;
    END;
    

    8、查找文件中的内容

    find -type f -name '*.sql'|xargs grep '23-4月 -20'
    

    9、概要设计表结构查找

    SELECT A.COLUMN_NAME,
           B.COMMENTS,
           A.DATA_TYPE,
           DECODE(a.NULLABLE,'Y','是','否') 是否为空,
           DECODE(C.CONSTRAINT_NAME, NULL, '否', '是') 是否主键,
           '否' 是否外键,
           B.COMMENTS
      FROM USER_TAB_COLUMNS A
     INNER JOIN USER_COL_COMMENTS B
        ON A.TABLE_NAME = B.TABLE_NAME
       AND A.COLUMN_NAME = B.COLUMN_NAME
      LEFT JOIN (SELECT A.TABLE_NAME,A.CONSTRAINT_NAME, A.COLUMN_NAME
                   FROM USER_CONS_COLUMNS A
                   JOIN USER_CONSTRAINTS B
                     ON A.CONSTRAINT_NAME = B.CONSTRAINT_NAME
                  WHERE B.CONSTRAINT_TYPE = 'P') C
        ON A.TABLE_NAME = C.TABLE_NAME
       AND a.COLUMN_NAME = c.COLUMN_NAME
     WHERE A.TABLE_NAME = 'CRM_A_CUST_CLASS_INFO_ZONE';
    

    10、用户创建

    su - oracle 
    sqlplus / as sysdba 
    create user etl identified by etl; 
    grant CONNECT,RESOURCE,dba to etl; 
    grant select on V_$SESSION to etl; 
    grant select on V_$SQL to etl; 
    

    11、表空间创建

    以下的路径/u01/oradata/etldb/根据实际情况修改(找个大一些的空间,至少有个100G左右的地方) 
    su - oracle 
    mkdir -p /u01/oradata/etldb/
    sqlplus / as sysdba 
    CREATE TABLESPACE "CRMDM_DATA" DATAFILE '/u01/oradata/etldb/crmdm01.dbf' SIZE 10G AUTOEXTEND ON; 
    alter TABLESPACE CRMDM_DATA add DATAFILE '/u01/oradata/etldb/crmdm02.dbf' SIZE 10G AUTOEXTEND ON; 
    CREATE TABLESPACE "CRMDM_INDEX" DATAFILE '/u01/oradata/etldb/crmdm_index01.dbf' SIZE 10G AUTOEXTEND ON; 
    alter TABLESPACE CRMDM_INDEX add DATAFILE '/u01/oradata/etldb/crmdm_index02.dbf' SIZE 10G AUTOEXTEND ON;
    

    12、查询活动进程、生成批量杀死进程脚本

    select COUNT(*) from v$session where username = 'CRM' and status = 'ACTIVE';
    SELECT 'alter system kill session '||''''||a.sid||','||a.serial#||''''||';' FROM v$session a WHERE a.username ='CRM' AND status = 'ACTIVE';
    

    13、创建用户

    useradd -d /app/etl etl (创建用户,主目录/app/etl)
    

    14、修改用户组

    usermod -a -G dba etl (追加给etl用户赋予dba组)
    

    15、DBlink创建与修改

    drop database link CRM169; 
    create database link CRM169
      connect to CRM IDENTIFIED BY CRM
      using '(DESCRIPTION =(ADDRESS_LIST = (ADDRESS = (PROTOCOL = TCP)(HOST = 190.2.11.111)(PORT = 1521)) ) (CONNECT_DATA = (SERVICE_NAME = CRMDB)))';
    

    16、表字段、主键==的操作

    --修改表字段
    alter table cx_01 modify(org_id varchar2(100));
    --增加字段名称
    alter table cx_01 add org_name varchar2(200);
    --删除表字段
    alter table cx_01 drop column CUST_ID;
    --重命名表字段
    alter table cx_01 rename column ORG_NAME to MIN_ORG_ID;
    --修改表名
    alter table  cx_01 rename column org_id to supper_org_id;
    --添加【索引】
    create index index_01 on cx_01(org_id,supper_org_id);
    --建表后添加主键
    alter table cx_01 add primary key(org_id); --建主键会自动建索引
    --删除主键
    alter table cx_01 drop primary key;
    --主键修改
    alter table cx_01 drop constraint PK_cx_01;
    drop index cx_01 PK_cx_01;
    --重新建主键索引  
    alter table cx_01 add constraint PK_cx_03 primary key (org_id) using index tablespace CRM_INDEX	;
    --添加唯一【约束】
    alter table cx_01 add constraint PK_cx_02 unique (org_id,val);  
    

    
    

    
    

    
    

    
    
    展开全文
  • 前言【IT168 专稿】经常听到客户抱怨一些企业级的数据仓库软件许可证过于昂贵;也曾经见到过一次性的...实际上一些简单的ETL流程完全可以使用Oracle内建的功能完成。本文的主旨在于说明这一思想,文中代码未必是...

    前言

    【IT168 专稿】经常听到客户抱怨一些企业级的数据仓库软件许可证过于昂贵;也曾经见到过一次性的Access到 Oracle的数据迁移就使用了DataStage(这是真的!在发现 Server版本不能连接Access后,还专门购买了DataStage for ODBC --__--!)。实际上一些简单的ETL流程完全可以使用Oracle内建的功能完成。本文的主旨在于说明这一思想,文中代码未必是最佳实践。本文中所有的代码经过了测试,但一些错误与疏忽还是难免的。如果你发现了错误,或者有不同的观点,欢迎讨论。

    概述

    假如把一个完整的数据仓库系统比作一个提供美味菜肴的餐馆,那么ETL系统就是这个餐馆的厨房。在大多数情况下,ETL对最终用户来说是透明的,正像食客往往不需要进入厨房获取服务,厨房也不会对食客开放。但是,ETL模块常常占用整个数据仓库项目70%以上的资源,实际情况也大概也是如此,厨师的工资比侍者要高出很多。

    在当前的数据仓库项目中,企业级ETL工具昂贵的许可证、培训费用常常使许多中小型用户望而却步。真实世界的应用中相当一部分的数据源(E) 都是以文件或数据库的方式提供,进行的转换 (T) 也可以在数据库之内完成,基于这一实际情况,利用Oracle自身的一些功能,我们可以构建相对简单的ETL流程。

    在Oracle9i中引入了外部表(External Table)的概念,通过访问驱动程序ORACLE_LOADER可以对数据库之外的文件进行只读的SQL查询。在Oracle10g中,提供了第二个访问驱动程序ORACLE_DATAPUMP,允许用户对外部表进行写操作,写出的结果文件以特定的结构保存并允许DPAPI访问,即该结果文件可以被加载到另一个数据库中。同时,新的访问驱动程序也支持列对象的投影。

    配合10g中新增的DBMS_SCHEDULER包,可以很方便地实现ETL工具的定时调度功能。这个新的DBMS_SCHEDULER包取代了原有的DBMS_JOB包,并提供了更加强大完善的功能,笔者在本文中仅举一简单示例说明。

    200741893258.JPG

    Ralph Kimball在他的中提出了ECCD(Extract-Clean-Conform-Deliver)的架构,在此文章中笔者将使用ECCD的四个步骤进行描述:源系统通过FTP提供文件格式的数据源文件,使用ORACLE_LOADER访问驱动程序使用该文件构建外部表(抽取),与数据库中的标准数据表进行校验并写入对应的Staging表(清洗与整合),处理的结果通过ORACLE_DATAPUMP访问驱动程序写入目标文件(分发)。

    200741893628.JPG

    展开全文
  • etl工具kettle的 数据库jar包 oracle mysql
  • Oracle ETL Toolkit-开源

    2021-07-19 23:46:15
    Oracle ETL Toolkit 是一些用于开发 Oracle ETL 应用程序的包,第一个版本将包含一个 OET_Scheduler,一个简单的过程调度程序。
  • 由于公司要把oracle 数据库迁移到hive ,hbase 环境,特建议使用kettle做数据迁移,调试3个小时,终于调试成功,顺手写了个配置文档。
  • 一不小心听说了oracle 数据库快照,这个词我当初一听就楞了,不知道这个是什么玩意,然后花了点时间研究了下,以下是我通过网络学习总结的 快照主要是用于分布式数据库,我们有数据库A,A中有个表a,我们在数据库B中...
  • Oracle创建DBlink连接远程数据库(dba、ETL必备) 文章目录Oracle创建DBlink连接远程数据库(dba、ETL必备)前言一、查询当前数据库用户是否有权限1.查询是否有权限2.赋权二、创建BD实例名1.创建实例名2查询数据库实例...

    Oracle创建DBlink连接远程数据库(dba、ETL必备)




    前言

    当用户需要跨越本地数据库,访问远程数据库的数据时,Oracle提供了DBlink的方式,让用户可以很方便访问远程数据库像本地一样方便,下面介绍创建DBlink的方法。


    提示:以下是本篇文章正文内容,下面案例可供参考

    一、查询当前数据库用户是否有权限

    1.查询是否有权限

    SELECT * FROM USER_SYS_PRIVS T WHERE T.PRIVILEGE LIKE UPPER('%LINK%');
    

    效果截图
    在这里插入图片描述

    2.赋权

    给zhx用户赋权

    GRANT CREATE PUBLIC DATABASE LINK,CREATE DATABASE LINK TO zhx;
    

    1、CREATE DATABASE LINK
    所创建的dblink只能是创建者能使用,别的用户使用不了
    2、CREATE PUBLIC DATABASE LINK
    PUBLIC 表示所创建的dblink所有用户都可以使用

    二、创建BD实例名

    1.创建实例名

    创建实例bms,DBlink名称是CSZHX

    create database  link CSZHX connect to zhx identified by zhx 
    using '(DESCRIPTION =(ADDRESS_LIST =(ADDRESS =(PROTOCOL = TCP)(HOST = 192.168.137.10)(PORT = 1521)))(CONNECT_DATA =(SERVICE_NAME = bms)))';
    

    CSZHX : 表示dblink名字
    zhx :表示 远程数据库的用户
    zhx :表示 远程数据库的密码
    HOST : 表示远程数据库IP
    PORT : 表示远程数据库端口
    SERVICE_NAME : 远程数据库的实例名

    2查询数据库实例名

    SELECT NAME,VALUE FROM V$PARAMETER WHERE NAME='service_names'
    

    在这里插入图片描述

    三、使用DBlink访问远程的数据库

    1.测试调用查询远程数据库

    select * from dept@CSZHX;
    

    dept为表名,CSZHX为创建的dblink名称

    2.调用失败情况处理

    在调用远程数据库的时候可能会出现,DBlink调用失效的情况,这个问题出现的原因有很多比如:数据库版本不一致、环境配置不一致、数据库编码不一致等等原因,如果出现上述情况具体问题具体分析。

    解决方案(不唯一,按实际问题处理)
    服务器上要改tnsnames.ora文件配置ip、端口号、数据库实例名称

    BMS =
      (DESCRIPTION =
        (ADDRESS = (PROTOCOL = TCP)(HOST = 192.168.137.10)(PORT = 1521))
        (CONNECT_DATA =
          (SERVER = DEDICATED)
          (SERVICE_NAME = BMS)
        )
      )
    

    总结

    以上把配置ip、端口号、数据库实例名称等信息改为你自己需要操作数据的远程数据库的信息即可,如果出现问题具体情况具体分析。

    展开全文
  • 视图 windows 批处理 导出 4.1 使用win32 脚本调用sqlplus 导出视图 4.2 使用python 执行视图导出 参考 大数据ETL 系列文章简介 本系列文章主要针对ETL大数据处理这一典型场景,基于python语言使用Oracle、aws、...
  • python etl oracle导出 2

    千次阅读 2016-01-08 16:57:01
    python etl oracle导出 2
  • 因 Informatica 的 bug,转而使用 Kettle。今天第一次使用,找了一下才知道 Kettle 的主程序启动方式:运行 data-integration\Spoon.bat。...于是我把 Oracle 的 JDBC 驱动 ojdbc5.jar/ojdbc6.jar...
  • python etl oracle导出 1

    千次阅读 2016-01-08 15:27:05
    python elt oracle 导出
  • Oracle迁移到MySQL

    2021-01-20 03:58:11
    Oracle不提供开箱即用的卸载实用程序。请记住,如果没有有关您的环境的全面信息(Oracle版本?服务器平台?多少数据?什么数据类型?),这里的所有内容都是YMMV,您可能希望在系统上使用它来提高性能和计时。我的观点...
  • 本文要回答几个问题,BI、ETL、数据分析都是什么意思?怎么做数据分析?他们之间的关系是什么?数据分析是什么?简言之,数据分析是从大量数据中,用适当的统计分析方法,提取出有用信息的过程。数据分析在企业里...
  • Oracle9i—商务智能平台 Oracle9i 在提供企业级的性能、可伸缩性和可管理性方面继续独占业 界鳌头,并且在这些领域提供许多新特性。不过,Oracle9i 还拓宽了 用于数据仓库的关系数据库的功能。 Oracle9i 是业界第一...
  • oracle etl

    2020-12-22 14:04:14
    Oracle数据仓库的体系结构Oracle数据仓库的体系结构可以分成三个层次: 数据获取层:Oracle Database Enterprise ETL Option + Oracle Database Data Quality Option 在Oracle Database 10g 同一个软件中实现了从...
  • DW_ETL DW,OracleETL,SQL,Teradata和ETL测试概念
  • pentahokettle数据同步教程,从基础环境配置到实践操作,从转换到作业调度,再到服务器部署随机启动调度整体讲解,如需安装包,请找pentahokettle数据同步教程同步安装包下载

空空如也

空空如也

1 2 3 4 5 ... 20
收藏数 16,897
精华内容 6,758
关键字:

etl oracle