kettle教程1(转换)
kettle下载和运行(windows)
http://jaist.dl.sourceforge.net/project/pentaho/Data%20Integration/
本教程以下载pdi-ce-7.0.0.0-25.zip为例
解压后如下
双击spoon.bat进入kettle,成功进入后如下图
创建作业和转换
在主对象树下面分别双击作业和转换,即可创建作业和转换
比如我们双击转换,就成功创建了一个转换如下图
给转换配置db连接
上面的例子我们已经创建了一个转换,接下来双击创建的转换中的db连接(上图中选中的部分),创建一个db连接
以oracle为例,弹出来的界面这样配置
表输入
表输入首先要有一张表,我们就创建一张测试表,在刚才上一步配置的数据库连接的数据库中创建一张表reader
create table reader(
rdid varchar2(50),
rdname varchar2(50)
) ;
然后在核心对象的输入中,找到表输入,拖到右边的画布中
双击拖到画布中的表输入进行编辑,在弹出来的界面:
1. 数据库连接选择上一步配置的数据库连接
2. 输入sql 语句 select rdid,rdname from reader
插入/更新
创建要插入更新的表,还是在刚才配置的数据库连接的数据库中创建一张表reader_new
create table reader_new(
rdid_new varchar2(50),
rdname_new varchar2(50)
) ;
然后找到插入/更新,拖到画布中
先点住刚才创建的表输入,按住shift拖动鼠标会出现一根线,将这根线牵到现在创建的 插入\更新 中,连好了是这种效果
双击对 插入/更新 进行编辑
1. 目标表选择reader_new
2. 关键字和更新字段像图中这样配置,更新字段可以通过编辑映射和获取和更新字段快速配置
3. 这样配置会根据rdid_new来插入或更新rdname_new
测试转换的效果
我们先往reader表随机插入一些数据,我们这边用代码往随机生成了一些数据
然后点击运行转换按钮开始运行
运行的日志可以在这里看
运行完成后,reader表的数据就全部同步到reader_new表中了
上一篇: Linux 之 数据库基本操作
下一篇: kettle进行数据的简单处理