数据预处理之文件转换kettle:合并多个excel文件

【实验名称】

合并多个excel文件

【实验目的】

利用Kettle“Excel输入等组件,完成合并多个Excel文件。

 

【实验原理】

通过使用正则表达式配置“Excel输入组件中的通配符,实现多个Excel文件合并。

【实验环境】

操作系统:Windows10 

kettle版本:7.0.1或以上版本

一、创建转换

1.点击,在下拉菜单中点击选择,这样创建了一个转换文件。我们点击,重命名该转换文件,保存在某个指定的路径。

2.我们在新建的转换文件上开始可视化编程。需要的组件如下图所示。选择好组件好,按下图所示连接好组件。主要组件为excel input,excel output。组件支持自定义命名。

二、可视化编程

在画布上右键选择“属性”,设置转换属性,配置命名参数input_file为输入文件夹的路径。

 1.“Excel输入”的配置:

 

2. “Microsoft Excel Writer”的配置

 

三.运行程序:

点击开始运行程序,在弹出的对话框中,选择运行该程序。

运行结果:

四.实验结果

输入数据

(1) 课程信息表目录及文件见以下截图。

输出数据:

当选择不含子目录时,输出数据为:

当选择含有子目录时,输出数据为: