pentaho之kettle篇---kettle基本操做

 

 

 

 

今天先来作一个简单的kettle的例子。sql

打开输入,选择CSV文件输入。数据库

双击CSV文件输入图标,能够看见以下:测试

步骤名称:就是你这一步的名字,能够任意取,原则就是要明白,清楚这一步是作了什么操做。3d

文件名:是你要选取的这个.CSV结尾的文件的名称。日志

列分隔符:每一个CSV文件都是有必定的规则的,要么是分号是分隔符,要么是逗号是分隔符等等。orm

包含列头行:这个是针对你的这个CSV是否具备表头,若是有就勾上,不然他就把第一行的表头当成数据导入了。blog

这样选择一个CSV格式的文件以后就能够了,接下来点击一下获取字段,获得以下图所示:io

点击一下预览,会提示要预览的行数没输入你要预览的行数就好了。form

以上就是预览的内容了。transform

以后点击肯定就OK了。

以后再来讲说输出的操做。

此次输出的操做咱们选择的是MySQL数据库,首先须要文件---->新建------->数据库链接。

 

 填写上基本的数据库信息就OK了,点击测试出现

说明你的连库信息是正确的,点击肯定就能够了。这一步的链接数据库只是针对于这个装换的。对于其余转换咱们须要从新制定数据库!

 双击表输出:

数据库链接就是咱们刚才建立的数据库链接,若是不是咱们想要的,能够另外再建立一个链接。

目标数据库若是没有建立的话,咱们能够先写一个名字,而后再点击SQL,就出现了一个执行建立的sql的界面:

里面有些字段的类型是能够改的,改为你须要的字段的类型。以后点击执行就好了。这一次咱们再查看一下咱们数据库里面的表,就有字段了。

下面咱们点击Run,

输出日志以下:

步骤度量以下:

以前表里面有2823个数据,因此这一次执行成功了!

可是!!!

这里面有一个问题,咱们能够再Run一下这个转换,发现又导入了2823条记录。再来看看数据库里面的数据:

纳尼,怎么是5646???

怎么解决???

这中间是须要一个过滤的操做的,基本的思想就是:ID同样的就是Update,ID不同的就是插入就去就能够了。

这就须要另一个输出的功能了,就是插入/更新。

在这里面设置须要过滤的条件就能够了。

至此一个transformation就能够了。

相关文章
相关标签/搜索