身为一名刚刚踏入程序员世界的小白,刚毕业进入公司的第一个项目即是负责ETL部分的开发也就是使用开源工具Kettle(我是Java后台方向的XD),原本就不期望给个小白分配什么重要的业务去作,又是纯图形界面的托拉拽开发,前期自学起来真的是很无聊的。最近这个项目即将结束,准备写个文章来整理下开发过程当中遇到的坑,第一次写文章还请多多指教。程序员
ps:顺便说一句,Kettle我用的是7.1开源版本的,开源版里面的坑还真的不是通常的深。工具
先说说Kettle这东西,翻译过来的意思就是水壶,很符合其做者对其的定义,将数据“倒入”到壶中,通过筛选过滤,以指定的格式输出来。感受就想是在泡茶通常,选上好泉水,配上好茶,煮上几分钟,就能倒出来一杯好茶。其主要用于数据迁移、清洗即ETL过程,但Kettle还支持不少脚本语言Javascript等和不少插件,可谓是功能十分强大了,那么有多强大呢,这么说吧,里面近乎三分之二的插件我都还没用过,就完成了项目的业务,Kettle要想学深仍是有很大难度和挑战的。插件
附一个Kettle 7.1版本的官方开发文档地址,里面讲的仍是比较详细的,本人英文很差就很少说了 -> Chrome -> 翻译翻译