Kettle入门篇
Kettle是一款国外开源的ETL工具,纯java编写,可以在Window、Linux、Unix上运行,数据抽取高效稳定。Kettle 中文名称叫水壶,该项目的主程序员MATT 希望把各种数据放到一个壶里,然后以一种指定的格式流出。Kettle这个ETL工具集,它允许你管理来自不同数据库的数据,通过提供一个图形化的用户环境来描述你想做什么,而不是你想怎么做。Kettle中有两种脚本文件,transformation和job,transformation完成针对数据的基础转换,job则完成整个工作流的控制。
kettle的最新下载地址:http://jaist.dl.sourceforge.net/project/pentaho/Data%20Integration/6.0/pdi-ce-6.0.1.0-386.zip
- 此软件运行需要JDK环境,所以电脑没装JDK的话,先下载安装。
- Kettle解压到英文路径的文件夹中就可以了,不需要安装。
- 点击data-integration文件夹中的Spoon.bat就能打开了。
下面是图文教程:
进入解压的目录,找到Spoon.bat,先别着急双击打开,如果你本机的数据库是oracle,就先把oracle的驱动放进spoon解压目录的lib目录下;如果本机装的是mysql数据库,同理把mysql的驱动放到lib目录下,然后再启动spoon。否则当你启动的时候会报如下错误
Driver class 'oracle.jdbc.driver.OracleDriver' could not be found, make sure the 'Oracle' driver (jar file) is installed.
oracle.jdbc.driver.OracleDriver
打开spoon后点击左上角的主对象树,右键DB连接新建。
输入数据库连接信息
输入完成后先点击测试一下,看看连接是否正常。
下面开始新建转换。
点开左侧栏的输入,找到表输入,并用鼠标把表输入拖向右边空白区域。
双击拖进来的表输入,编辑表输入里面的信息。
点开左侧栏的输出,找到插入/更新,并用鼠标把插入/更新拖向右边空白区域。
摁住shift键不放,鼠标点击表输入,然后拖向旁边的插入/更新,这样就把两个动作连接起来了。
双击插入/更新,编辑插入/更新里面的信息。最后把该转换保存,这里保存成test.ktr。
接下来开始创建作业
创建作业和创建转换操作都差不多。
双击START,对START进行编辑,可以让作业按每天、每周、每月定时调用。
双击装换进行编辑,找到前面保存的test.ktr 转换文件。
到这一步就可以开始点击运行了
下图是运行结果
tb_user是源表
tb_user2是目标表,没运行作业前它是没有数据的。
运行作业后,数据成功导入到tb_user2表里。
根据上面的教程,可以尝试着把oracle数据库中的表的数据插入到mysql等其它数据库中的表里面去。
上一篇: HTML CSS字体图标库的引用及使用 SVG文件
下一篇: 阿里图标库iconfont前端使用