欢迎您访问程序员文章站本站旨在为大家提供分享程序员计算机编程知识!
您现在的位置是: 首页

Kettle入门篇

程序员文章站 2024-02-14 09:54:34
...


Kettle是一款国外开源的ETL工具,纯java编写,可以在Window、Linux、Unix上运行,数据抽取高效稳定。Kettle 中文名称叫水壶,该项目的主程序员MATT 希望把各种数据放到一个壶里,然后以一种指定的格式流出。Kettle这个ETL工具集,它允许你管理来自不同数据库的数据,通过提供一个图形化的用户环境来描述你想做什么,而不是你想怎么做。Kettle中有两种脚本文件,transformation和job,transformation完成针对数据的基础转换,job则完成整个工作流的控制。

kettle的最新下载地址:http://jaist.dl.sourceforge.net/project/pentaho/Data%20Integration/6.0/pdi-ce-6.0.1.0-386.zip

  1. 此软件运行需要JDK环境,所以电脑没装JDK的话,先下载安装。
  2. Kettle解压到英文路径的文件夹中就可以了,不需要安装。
  3. 点击data-integration文件夹中的Spoon.bat就能打开了。

下面是图文教程:

进入解压的目录,找到Spoon.bat,先别着急双击打开,如果你本机的数据库是oracle,就先把oracle的驱动放进spoon解压目录的lib目录下;如果本机装的是mysql数据库,同理把mysql的驱动放到lib目录下,然后再启动spoon。否则当你启动的时候会报如下错误

Driver class 'oracle.jdbc.driver.OracleDriver' could not be found, make sure the 'Oracle' driver (jar file) is installed.
oracle.jdbc.driver.OracleDriver

Kettle入门篇

Kettle入门篇

打开spoon后点击左上角的主对象树,右键DB连接新建。

Kettle入门篇

输入数据库连接信息

Kettle入门篇

输入完成后先点击测试一下,看看连接是否正常。

Kettle入门篇

下面开始新建转换。

Kettle入门篇

点开左侧栏的输入,找到表输入,并用鼠标把表输入拖向右边空白区域。

Kettle入门篇

Kettle入门篇

双击拖进来的表输入,编辑表输入里面的信息。

Kettle入门篇

点开左侧栏的输出,找到插入/更新,并用鼠标把插入/更新拖向右边空白区域。
Kettle入门篇

摁住shift键不放,鼠标点击表输入,然后拖向旁边的插入/更新,这样就把两个动作连接起来了。

Kettle入门篇

双击插入/更新,编辑插入/更新里面的信息。最后把该转换保存,这里保存成test.ktr。

Kettle入门篇

接下来开始创建作业

Kettle入门篇

创建作业和创建转换操作都差不多。

Kettle入门篇

双击START,对START进行编辑,可以让作业按每天、每周、每月定时调用。

Kettle入门篇

双击装换进行编辑,找到前面保存的test.ktr 转换文件。

Kettle入门篇

到这一步就可以开始点击运行了

Kettle入门篇

下图是运行结果

Kettle入门篇

tb_user是源表

Kettle入门篇

tb_user2是目标表,没运行作业前它是没有数据的。

Kettle入门篇

运行作业后,数据成功导入到tb_user2表里。
Kettle入门篇

根据上面的教程,可以尝试着把oracle数据库中的表的数据插入到mysql等其它数据库中的表里面去。

相关标签: kettle