kettle的简单使用

kettle工具的下载与部署  参考点击打开链接

启动时点击spoon.bat 窗口会一闪而过 耐心等几秒钟,真正的界面会慢慢出来



目前的简单需求就是将cccc库里的基础数据导入到自己库中,但是这些数据只有省份的id,需要与ddd库中的basic表进行连接得到省份名字,所以以下会看到如何在kettle中使用记录集连接


1、在主对象树立新建一个转换   crtl+s输入名字保存(保证中间做变动时可随时保存,前功尽弃是很烦躁的....)

     使用中所有的连线都是 按住shift键 拉出一条带箭头的线


2、首先建立所需的DB连接,为防止数据输出时乱码,两个DB连接都要进行编码设置




3、切换到核心对象树里边,选择输入下的表输入,我只截了一个简单表(省份--ddd库)的输入


4、现在基础数据和省的数据都已经输入,进行记录集连接,需要对进行连接的关键字段做排序处理,否则执行时会报错



5、对排序好的数据进行记录集连接



6、若连接出来的数据有未匹配上的需要过滤,则可以选择过滤掉



7、选择表输出,将数据进行映射输出到目标库表中



8、启动测试