KETTLE实现Hadoop文件数据抽取及输出（超详细，图文并茂）

时间 2021-07-12

原文原文链接

一、需求说明将源表（T_USER）中的用户信息同步到Hadoop中，然后再抽取Hadoop文件中数据到文本文件中。二、启动kettle 双击 Spoon.bat 就能启动 kettle 。三、创建转换 Hadoop集群配置说明首先需要从hadoop集群中（/../hadoop-3.1.2/etc/hadoop）复制core-site.xml，hdfs-site.xml，yarn-site.