kettle连接hbase

spoon下载安装地址:http://www.pentaho.com/download

选择  Download Windows ,只有windows 版的才是spoon,下载解压后即可使用,无需安装。

spoon是纯java编写的,所以使用前必需安装java的jdk包

下载地址:http://www.oracle.com/technetwork/java/javase/downloads/index.html

连接HBase需要配置(实际连接HBase是通过zookeeper服务)

进入spoon解压目录,打开 plugins\pentaho-big-data-plugin\plugin.properties 文件

wKiom1V6T1zhI5tvAANfk5HrmEA064.jpg

修改  active.hadoop.configuration 配置项(配置驱动集目录名),默认这里为空。当前已经修改好。

进入目录 plugins\pentaho-big-data-plugin\hadoop-configurations 查看当前可用驱动集目录

wKioL1V6Uw6Bn4SVAAHNZD0BLoo146.jpg

里面的4个目录均为 hadoop-configurations 驱动集,链接HBase 需要 zookeeper-*.jar 文件

如在cdh52目录 lib 下:

wKioL1V6VAaSbHIBAANfL7yknK0523.jpg

那么 cdh52 就驱动集可以使用。

 

 

HBase启动时会绑定服务器的hostname值,所以在spoon机器中需要绑定相同的host否则无法连接。

在HBase机器上输入命令:

1

hostname

如:

1

2

[email protected]:~# hostname

ubuntu

然后修改spoon机器上的hosts

打开 C:\Windows\System32\drivers\etc\hosts 文件

如HBase服务器的IP是 192.168.0.10

则在 hosts 文件中新加一行,并保存。

1

192.168.0.10 ubuntu

 

打开spoon,进入spoon解压目录双击 Spoon.bat 文件

注:其实在linux下也可以运行(远程连接不行)只要打开spoon.sh脚本即可

新建转换,并且点击 Big Data > HBase Input

wKiom1V6WRmgKrRxAAKWkYZubnc066.jpg

 

双击 HBase Input 图标 >  点击New 弹出编辑 Hadoop cluster窗口

wKioL1V6amHBCVRlAAFtH6esi2I084.jpg

修改Cluster Name 值(即这个HBase 连接别名),修改ZooKeeper 如HBase所在服务器IP为192.168.0.10 默认HBase 端口号为 2182

wKiom1V6aYegtVpfAAFta83RSCU163.jpg

确定,然后在 Hadoop Cluster 选中 hbase-test

wKiom1V6bBOzHgaiAAHheCcZuRc636.jpg

 

进入Create/Edit mappings选择卡,按以下步骤操作

wKioL1V6cuODaaDpAAOHv_6i7Q0379.jpg

然后返回 Configure query 选项卡,按步骤操作

wKioL1V6fbvzD5a6AASY4jt-GQI436.jpg

 

然后鼠标右键HBase Input > 选择Preview  > 快速启动

即可查看数据。

 

spoon下载安装地址:http://www.pentaho.com/download

选择  Download Windows ,只有windows 版的才是spoon,下载解压后即可使用,无需安装。

spoon是纯java编写的,所以使用前必需安装java的jdk包

下载地址:http://www.oracle.com/technetwork/java/javase/downloads/index.html

连接HBase需要配置(实际连接HBase是通过zookeeper服务)

进入spoon解压目录,打开 plugins\pentaho-big-data-plugin\plugin.properties 文件

wKiom1V6T1zhI5tvAANfk5HrmEA064.jpg

修改  active.hadoop.configuration 配置项(配置驱动集目录名),默认这里为空。当前已经修改好。

进入目录 plugins\pentaho-big-data-plugin\hadoop-configurations 查看当前可用驱动集目录

wKioL1V6Uw6Bn4SVAAHNZD0BLoo146.jpg

里面的4个目录均为 hadoop-configurations 驱动集,链接HBase 需要 zookeeper-*.jar 文件

如在cdh52目录 lib 下:

wKioL1V6VAaSbHIBAANfL7yknK0523.jpg

那么 cdh52 就驱动集可以使用。

 

 

HBase启动时会绑定服务器的hostname值,所以在spoon机器中需要绑定相同的host否则无法连接。

在HBase机器上输入命令:

1

hostname

如:

1

2

[email protected]:~# hostname

ubuntu

然后修改spoon机器上的hosts

打开 C:\Windows\System32\drivers\etc\hosts 文件

如HBase服务器的IP是 192.168.0.10

则在 hosts 文件中新加一行,并保存。

1

192.168.0.10 ubuntu

 

打开spoon,进入spoon解压目录双击 Spoon.bat 文件

注:其实在linux下也可以运行(远程连接不行)只要打开spoon.sh脚本即可

新建转换,并且点击 Big Data > HBase Input

wKiom1V6WRmgKrRxAAKWkYZubnc066.jpg

 

双击 HBase Input 图标 >  点击New 弹出编辑 Hadoop cluster窗口

wKioL1V6amHBCVRlAAFtH6esi2I084.jpg

修改Cluster Name 值(即这个HBase 连接别名),修改ZooKeeper 如HBase所在服务器IP为192.168.0.10 默认HBase 端口号为 2182

wKiom1V6aYegtVpfAAFta83RSCU163.jpg

确定,然后在 Hadoop Cluster 选中 hbase-test

wKiom1V6bBOzHgaiAAHheCcZuRc636.jpg

 

进入Create/Edit mappings选择卡,按以下步骤操作

wKioL1V6cuODaaDpAAOHv_6i7Q0379.jpg

然后返回 Configure query 选项卡,按步骤操作

wKioL1V6fbvzD5a6AASY4jt-GQI436.jpg

 

然后鼠标右键HBase Input > 选择Preview  > 快速启动

即可查看数据。