ETL

      ETL,是英文 Extract-Transform-Load 的缩写,用来描述将数据从来源端经过抽取(extract)、转换(transform)、加载(load)至目的端的过程。ETL一词较常用在数据仓库,但其对象并不限于数据仓库。 ETL是构建数据仓库的重要一环,用户从数据源抽取出所需的数据,经过数据清洗,最终按照预先定义好的数据仓库模型,将数据加载到数据仓库中去。

0
推荐
2250
阅读

Odi第5节-使用(三):设计器(项目)

打开设计器标签,点开新建项目的图标 在弹出窗口中,"定义"选项下设置项目名称,如zc_bilocal 保存后生成新的项目文件夹,名称即zc_bilocal ...
0
推荐
2384
阅读

ODI第9节-变量(三):全局变量

上一篇说明了项目变量的创建,接下来演示一下如何创建一个全局变量: 创建项目变量的时候,首先要创建一个项目,之后在其中创建变量。 而全局变量...
0
推荐
2527
阅读

ODI第10节-变量(四):变量使用

此篇介绍的是项目变量用于接口的情况,在使用变量之前,可先建立一个项目变量。由于只用于演示,此变量可取固定值,如下图所示: 新建接口如下: ...
0
推荐
2090
阅读

ETL高级教程学习笔记

在导异构数据的过程中,最好加入一个派生列标识这行数据是从哪个数据系统里来的,这样在导的时候发生错误可以确定是哪个业务系统发生了问题. ODS的定义似...
0
推荐
4286
阅读

白话数据仓库 ETL 搭建全过程

经过多年来企业信息化建设,大部分都拥有了自己的财务,OA,CRM 等软件。这些系统都有自己的独立数据库,记录着企业运行情况某个方面的数据。但是单独看这些...
0
推荐
4903
阅读

ETL 数据增量抽取方案

一、 ETL 简介数据集成是把不同来源、格式和特点的数据在逻辑上或物理上有机地集中,从而提供全面的数据共享,是企业商务智能、数据仓库系统的重要组成部分。...
0
推荐
1567
阅读

BI项目中ETL设计与思考

ETL是将业务系统的数据经过抽取、清洗转换之后加载到数据仓库的过程,目的是将企业中的分散、零乱、标准不统一的数据整合到一起,为企业的决策提供分析依据。...
0
推荐
1595
阅读

维度模型数据仓库(四)- 实现xml文件转换成数据表格式

 前面已经讲到了kettle的初始数据以及定时数据加载的sql以及kettle实现方式,这一节将聊聊xml转换成数据表格式数据。  用Get date from XML组件加...
0
推荐
1314
阅读

Kettle (一)——安装

Kettle是一个利用JAVA编写的ETL开源工具,并且是免安装版本,非常方便。由于其是JAVA代码编写,所以要运行Kettle必须基于JDK环境。因此在运行Kettle前须先安...
0
推荐
1680
阅读

Kettle (二)——第一个JOB设计及其调用

 Kettle是个好工具,他的开源性以及免安装性决定其用起来的方便。在这篇文章当中不细说ETL过多的理论,直接上手。 第一次编写Kettle小JOb,首先要说一说...
0
推荐
1852
阅读

DataStage作业锁的问题

方法一:用管理员用户登录DataStage Administrator ,打开对应PROJECT的【命令(M】,执行 LIST.READU 查看Locks ,通过最后一列item id找到被锁的对应的作...
0
推荐
1803
阅读

关于ODI逆向程序视图显示不出来字段问题处理

       本人近期在做ODI抽取数据过程中遇到一个问题:       在做逆向程序的时候,首先逆向一张同义词,...
0
推荐
2034
阅读

SSIS2012 数据提取容易忽略的细节与不起眼的小技巧——总结

总结根据以往工作学习中没有太在意或者说没意识到的地方,做一个关于SSIS数据提取的细节技巧总结。(这是一篇没有图的文章)1.禁忌的select *   &n...
0
推荐
3029
阅读

kettle之旅--kettle/pdi的发展史简述

简述kettle(Pentaho Data Integratio)是一套开源的ETL解决方案,诞生于2003年(完成第一个版本的开发),由比利时BI工程师Matt Casters(马特.卡斯特)完成...
0
推荐
4059
阅读

kettle之旅--下载获取kettle/pdi

获取kettle,这个文章很多小伙伴都觉得没必要,其实我想说,既然研究这个解决方案,那知其然知其所以然。kettle源码kettle是开源的,所以开源的地址在哪里呢...

1040 人关注

最佳回复者

改版

反馈