今天先来作一个简单的kettle的例子。sql
打开输入,选择CSV文件输入。数据库
双击CSV文件输入图标,能够看见以下:测试
步骤名称:就是你这一步的名字,能够任意取,原则就是要明白,清楚这一步是作了什么操做。3d
文件名:是你要选取的这个.CSV结尾的文件的名称。日志
列分隔符:每一个CSV文件都是有必定的规则的,要么是分号是分隔符,要么是逗号是分隔符等等。orm
包含列头行:这个是针对你的这个CSV是否具备表头,若是有就勾上,不然他就把第一行的表头当成数据导入了。blog
这样选择一个CSV格式的文件以后就能够了,接下来点击一下获取字段,获得以下图所示:io
点击一下预览,会提示要预览的行数没输入你要预览的行数就好了。form
以上就是预览的内容了。transform
以后点击肯定就OK了。
以后再来讲说输出的操做。
此次输出的操做咱们选择的是MySQL数据库,首先须要文件---->新建------->数据库链接。
填写上基本的数据库信息就OK了,点击测试出现
说明你的连库信息是正确的,点击肯定就能够了。这一步的链接数据库只是针对于这个装换的。对于其余转换咱们须要从新制定数据库!
双击表输出:
数据库链接就是咱们刚才建立的数据库链接,若是不是咱们想要的,能够另外再建立一个链接。
目标数据库若是没有建立的话,咱们能够先写一个名字,而后再点击SQL,就出现了一个执行建立的sql的界面:
里面有些字段的类型是能够改的,改为你须要的字段的类型。以后点击执行就好了。这一次咱们再查看一下咱们数据库里面的表,就有字段了。
下面咱们点击Run,
输出日志以下:
步骤度量以下:
以前表里面有2823个数据,因此这一次执行成功了!
可是!!!
这里面有一个问题,咱们能够再Run一下这个转换,发现又导入了2823条记录。再来看看数据库里面的数据:
纳尼,怎么是5646???
怎么解决???
这中间是须要一个过滤的操做的,基本的思想就是:ID同样的就是Update,ID不同的就是插入就去就能够了。
这就须要另一个输出的功能了,就是插入/更新。
在这里面设置须要过滤的条件就能够了。
至此一个transformation就能够了。