欢迎您访问程序员文章站本站旨在为大家提供分享程序员计算机编程知识!
您现在的位置是: 首页

kettle教程1(转换)

程序员文章站 2024-03-22 12:25:28
...

kettle下载和运行(windows)

http://jaist.dl.sourceforge.net/project/pentaho/Data%20Integration/
本教程以下载pdi-ce-7.0.0.0-25.zip为例

解压后如下
kettle教程1(转换)

双击spoon.bat进入kettle,成功进入后如下图
kettle教程1(转换)

创建作业和转换

在主对象树下面分别双击作业和转换,即可创建作业和转换
kettle教程1(转换)
比如我们双击转换,就成功创建了一个转换如下图
kettle教程1(转换)

给转换配置db连接

上面的例子我们已经创建了一个转换,接下来双击创建的转换中的db连接(上图中选中的部分),创建一个db连接
以oracle为例,弹出来的界面这样配置
kettle教程1(转换)
kettle教程1(转换)

表输入

表输入首先要有一张表,我们就创建一张测试表,在刚才上一步配置的数据库连接的数据库中创建一张表reader

create table reader(
    rdid varchar2(50),
    rdname varchar2(50)
) ;

然后在核心对象的输入中,找到表输入,拖到右边的画布中
kettle教程1(转换)

双击拖到画布中的表输入进行编辑,在弹出来的界面:
1. 数据库连接选择上一步配置的数据库连接
2. 输入sql 语句 select rdid,rdname from reader

插入/更新

创建要插入更新的表,还是在刚才配置的数据库连接的数据库中创建一张表reader_new

create table reader_new(
    rdid_new varchar2(50),
    rdname_new varchar2(50)
) ;

然后找到插入/更新,拖到画布中
kettle教程1(转换)

先点住刚才创建的表输入,按住shift拖动鼠标会出现一根线,将这根线牵到现在创建的 插入\更新 中,连好了是这种效果
kettle教程1(转换)

双击对 插入/更新 进行编辑
1. 目标表选择reader_new
2. 关键字和更新字段像图中这样配置,更新字段可以通过编辑映射和获取和更新字段快速配置
3. 这样配置会根据rdid_new来插入或更新rdname_new
kettle教程1(转换)

测试转换的效果

我们先往reader表随机插入一些数据,我们这边用代码往随机生成了一些数据
然后点击运行转换按钮开始运行
kettle教程1(转换)

运行的日志可以在这里看
kettle教程1(转换)

运行完成后,reader表的数据就全部同步到reader_new表中了