使用apache pig 处理chukwa收集的数据

时间 2019-11-20

标签使用 apache pig 处理 chukwa 收集数据栏目 Apache 繁體版

原文原文链接

公司使用chukwa收集每一个服务器数据的，数据收集到的hdfs之后被写成sequencefile,想用pig处理这些数据，pig自己不支持这种数据结构的，查看chukwa源码发现，自己有带有pig脚本，是hicc用来作数据统计的脚本，hicc一直很差使，也懒得搭理这玩意。apache

一、chukwa/script/pig/DF.pig服务器

define chukwaLoader org.apache.hadoop.chukwa.pig.ChukwaLoader();数据结构

源码在：chukwa/contrib/chukwa-pig下边oop

自己chkwa支持的pig版本比较老，使用pig脚本加载这个jar包，执行压根很差使,把代码放到pig下进行编译，就能够直接使用了。
ip