数据预处理之文件转换kettle:用Kettle生成测试数据

【实验目的】

利用Kettle生成随机数“JavaScript代码组件,生成测试数据。

【实验原理】

通过生成随机数生成随机0~1的小数,随机的字符串,随机的整数。再利用“JavaScript代码编写代码处理随机的数或字符串,输出一定范围的小数,日期和有一定规律形式的整数。

【实验环境】

操作系统:Windows10 

kettle版本:7.0.1或以上版本

【实验步骤】

一、创建转换

1.点击,在下拉菜单中点击选择,这样创建了一个转换文件。我们点击,重命名该转换文件,保存在某个指定的路径。

2.我们在新建的转换文件上开始可视化编程。需要的组件如下图所示。选择好组件好,按下图所示连接好组件。主要组件为Generate random value,Modified Java Script Value,excel writer。组件支持自定义命名。

二、可视化编程

1.“生成随机数”的配置:

其中,Type为Random number,生成的随机数在0~1范围的小数; Type为Random integer,生成随机的正负整数;Type为Random string,生成随机的字符串。

然后右键点击“生成随机数”的组件,选择生成多少份相同的数据,在这里,我们选择了生成100份相同的数据。

 

2.“JavaScript代码”的配置:

在此代码上,对于“数字”字段,配置为0~50范围的小数。

对于“字符串”字段,配置为选取随机字符串的前5个字符。

对于“整数”字段,配置为50的倍数。

对于“日期”字段,配置为2000年的日期。

3.“Microsoft Excel 输出”的配置:

 

 

三.运行程序:

点击开始运行程序,在弹出的对话框中,选择运行该程序。

 运行结果:

 

四.实验结果

输入数据

(1)“生成随机数”组件生成随机数。(注意:因为是随机生成,每次生成的数据都不一样,以下的仅作参考)

  “JavaScript代码”输出数据:

 “Microsoft Excel 输出”输出数据: